Algorithme de recommandation, Machine Learning, Zestedesavoir

Le problème exposé dans ce sujet a été résolu.

Plop :)

Petit sujet pour voir votre avis à essayer d’implémenter un algorithme de machine learning qui recommande automatiquement des articles en fonction des goûts d’un utilisateur précis, un peu comme netflix, youtube mais sur zeste de savoir.

Qu’en pensez-vous ?

Pour des raisons que je vais détailler, je ne pense pas que ce soit une bonne idée pour Zeste de Savoir. Je trouve que ce genre d’algorithmes de recommandation à tendance à nous maintenir dans notre bulle de confort et ce n’est à mon avis pas souhaitable pour Zeste de Savoir. Actuellement il y a un système de recommandation manuel qui permet de lier des contenus qui a priori (d’après leur titre, leur description, leur catégorie, etc.) n’ont aucun lien mais en réalité en ont un. Je pense que contrairement à Youtube ou Netflix on a la chance d’avoir un nombre assez restreint de contenus et pas d’objectif de rentabilité, ce qui nous permet de faire un travail d’éditorialisation plus fin et juste. Cela dit, beaucoup de nos contenus n’ont encore pas de recommandation, donc il reste encore pas mal de travail là dessus.

+9 -0

À ma connaissance, les algorithmes de recommandation tels que ceux de Netflix ne cherchent pas à reconnaître les goûts des utilisateurs, mais font des groupes d’utilisateurs "similaires" à partir de leur comportement. Ça peut marcher assez bien, ou se foirer catastrophiquement, tout en créant potentiellement des bulles, comme déjà mentionné. Pour ma part, je n’ai pas trop de soucis avec celui de Netflix vu que je ne m’en sers pas vraiment. Celui de Youtube est assez naze à moyen terme, même si à court-terme il arrive bien à voir ton humeur du moment.

Je préfère en général des recommandations choisies avec soin. Pour mon usage personnel, je trouve que les sites de partages thématiques (à la lobste.rs) sont un bon compromis entre focus sur un sujet et découverte. Sur Zeste de Savoir, nos recommandations manuelles jouent ce rôle, ainsi que les tags dans une certaine mesure.

Je suis un lecteur plutôt assidu des contenus de ZdS et je ne rate en général aucun billet ou article. Je suis particulièrement satisfait après avoir lu un contenu qui me sort un peu la tête de mes domaines de prédilection (et pour lesquels je pratique une veille soutenue de toute façon, avec ou sans ZdS). Éviter l’effet bulle selon « mes goûts » est un aspect primordial, pour moi.

Ainsi, on peut quand même implémenter l’algo, mais juste en changeant son but pour recommander des choses nouvelles :D 1


  1. Blague à part, YouTube a implémenté quelque chose de similaire, sous le nom de New to You ou encore de Looking for something different?
+0 -0

Si tu t’intéresses aux algoritmes alors pourquoi pas.
Pour Zeste de Savoir par-contre ça n’a pas d’intérêt je pense, ce n’est pas un besoin utilisateur.

Si tu veux t’intéresser à ce type d’algorithme, je peux te proposer d’étudier mangaki. Sur leur blog, tu retrouveras une explication détaillée de ce type d’algorithme.

+0 -0

Dans tous les cas, je ne suis pas sûr que cela nécessite du machine learning, si ?

Moté

En supposant que les contenus soient tagués correctement et sur un niveau hiérarchique cohérent, je pense qu’on peut déjà faire des choses pas mal. Quitte à devoir définir des distances entre les différents tags : par exemple, en définissant une échelle dans laquelle le distance entre les tags physique et chimie est plus basse qu’entre mathématiques et couture.

Alors, entre s’habiller dans le bon ordre, et La physique des trucs qui gonflent et se mangent, on a un peu trop de contenus un peu en vrac… Ensuite, un cours de thermo devrait référencer un cours de maths sur les différentielles, mais pas celui de trigo.

Ça devient vite compliqué.

+0 -0

Alors, entre s’habiller dans le bon ordre, et La physique des trucs qui gonflent et se mangent, on a un peu trop de contenus un peu en vrac… Ensuite, un cours de thermo devrait référencer un cours de maths sur les différentielles, mais pas celui de trigo.

Ça devient vite compliqué.

Gabbro

C’est pas tout à fait la même chose : tu sembles parler de repérer des sujets connexes (avec la distance qui en encoderait le niveau), tandis que pensais plutôt à une distance qui encode une probabilité qu’un membre aime le contenu tagué t1 s’il aime déjà t2 (observés par ses consultations passées).

Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte