Chouette ! Je ne me concentrerai ici que sur le fond. À mon plus grand désarroi, je ne t'assommerai pas, cher poupou, de remarques vicieuses sur l'orthographe et le style.
Pour me positionner par rapport à l'article et t'aider à mettre mon retour en perspective, j'ai une petite idée de ce qu'est le ML mais ignore tout des concepts sous-jacents. J'ai par contre quelques bases mathématiques.
Introduction au machine learning
À la conclusion que le machine learning n'est pas de toute jeunesse et constitue donc une branche de l'IA qui a eu largement (à son échelle) le temps de s'étendre et de se remplir. À nouveau, cet article n'est qu'une introduction au domaine et pas un cours à part entière !
Il me semble que les deux phrases ne se suivent pas très bien.
Définition
Tu n'as pas revu cette partie, mais je la commente tout de même, en prenant en compte ce que j'avais relevé précédemment : ainsi, tu auras tous mes commentaires dans ce message.
Le machine learning (souvent abrégé ML) est une branche de l'IA
Dis poupou, c'est qui Lyha ?
Maintenant, voyons un peu comment il est possible de hiérarchiser, de classer les différents sous-domaines du ML.
Je crois que cette partie est un peu courte. J'ignore s'il est possible de la rendre plus concrète sans parler des trois types d'apprentissage, et comme je n'y connais rien, je ne peux malheureusement pas te conseiller judicieusement à ce propos.
Peut-être pourrais-tu donner un exemple de problème qu'on peut (doit ?) résoudre via le ML ? Notamment, il me paraît intéressant de détailler ce que tu appelles « algorithmes classiques ».
Les trois grands types d'apprentissage
L'apprentissage supervisé
le terme régression signifie que nous nous trouvons dans les mathématiques continues, à savoir les ensembles tels que [0,1], [−π,21.5], R, etc.
Ca paraît évident, mais tu pourrais peut-être indiquer (en expliquant brièvement) que le problème de tennis ne fait intervenir que des données continues, nécessaires à la régression.
où chaque point correspond à un couple (x,y) comme expliqué ci-dessus.
Peut-être le $(x,y)$ pourrait-il en perturber certains, lesquels croiraient que $x$ désigne l'abscisse et $y$ l'ordonnée.
D'autre part, je suis un peu sceptique sur le "à un point". Avec ce graphique, tu ne regardes que deux composantes de ton vecteur $x$. S'il en a plus, ce qui me semble être le cas vu que tu parles plus haut de $x_3$, cela ne permet pas de le caractériser.
D'ailleurs, on pourrait se demander pourquoi tu ne considères que deux composantes, et non pas aussi le taux d'humidité, etc.
Mon objectif ici n'est pas de vous apprendre à le faire, mais juste de vous montrer à quoi cela peut ressembler.
Le problème c'est qu'une personne ignorant tout de la régression ne comprendra pas d'où sort cette droite, ni même si elle a un rapport avec les points. Tu le dis un peu avec "L'objectif de notre régression est de trouver un lien entre ces deux valeurs", mais il serait peut-être judicieux d'expliciter brièvement. Pour ce faire, il me semble intéressant d'employer le terme "approcher".
Régression quadratique
Peut-être pourrais-tu développer la fonction mentionnée dans "Par exemple une fonction comme celle-ci peut sembler un peu plus précise.". Sinon, le lecteur pourrait ne pas comprendre le terme "quadratique" de la légende.
Le travail de la personne chargée d'implémenter un système de machine learning est à ce niveau de trouver quelle(s) hypothèse(s) convient/conviennent le mieux.
J'ai buté sur le terme "hypothèse". Il me paraît plus clair de parler directement de fonction.
On a alors au moins quatre attributs, ce que l'on ne peut donc plus simplement représenter sur un graphique.
J'ai peur que ce passage paraisse complexe à des personnes n'ayant jamais vu la régression en dimension supérieure à 2. Peut-être pourrais-tu y aller plus progressivement en ajoutant un attribut, de sorte à être en dimension 3, ce qui est relativement représentable, avant de généraliser.
Voilà ce qu'a dit Rana el Kaliouby
Peut-être proposer une traduction de la citation ?
Rana el Kaliouby: This app knows how you feel — from the look on your face, TED talk
Je pense que ce serait une bonne idée d'indiquer la license de la vidéo.
Le ML se situe au cœur du programme qui doit être pré-traité.
Je préciserais cela : il s'agit ici d'analyser l'image. J'ignore si on a accès au code source, mais donner un exemple d'analyse serait chouette (par exemple, on regarderait l'écartement des coins des lèvres).
et leur moyenne tout au long de l'année
"sur l'année", comme tu l'emploies plus bas, me semble plus clair. Au début, j'ai cru qu'on effectuait un suivi de l'élève (par exemple, tous les trimestres).
Le but est à nouveau de déterminer un moyen de prédire si l'élève
Je dirais plutôt "un élève".
Nous pouvons tenter cette fois de trouver une courbe (une fonction) qui séparera nos deux classes.
Si tu pouvais expliquer simplement comment faire ça, ce serait génial. S'il existe plusieurs méthode, ce que j'imagine, peut-être pourrais-tu en fournir des références ?
le résultat attendu pour la valeur de y est appelée classe
Je ne comprends pas cela. La classe (par exemple, "réussite") dépend également de $x$ (de tous les attributs en fait), non ?
Imaginons maintenant que nous partions forcément de la racine
Le "maintenant" semble ne pas très bien suivre le "Comment faire pour avoir notre réponse ?".
Nous avons donc réussi à classifier notre exemple : la valeur que doit prendre notre valeur y (à savoir la classe) est non.
Malheureusement, ce paragraphe n'est pas très clair pour une personne ignorant l'algorithme ID3, comme moi. Il me semble par exemple étrange de pouvoir jouer au tennis alors qu'il pleut ou qu'il y a un vent fort. Le problème est qu'on travaille alors sur quelque chose qu'on ne comprend pas (l'arbre).
En fait, c'est un peu comme si tu disais directement, pour la régression logique "on place notre point et regarde de quel côté de la droite il se situe", sans expliquer d'où sortent les losanges, les croix et la droite.
Cette UL a été explicitement décomposée en trois parties :
Les daltoniens risquent d'avoir un peu de mal avec le mauve et le bleu.
Il est compliqué pour moi de continuer de détailler les RNA
Un exemple serait vraiment le bienvenu. Est-il possible d'en faire un simplement ?
(de plus, j'ai promis au loup, alors vous comprenez…)
Un beefsteak devrait régler le problème !
Pour récapituler ceci, si l'ensemble des prédictions possibles est fini, nous avons affaire à un problème de classification et si à l'inverse il est infini, nous avons affaire à un problème de régression.
J'étais sur le point de poser une question témoignant du fait que je n'avais pas assimilé que c'était l'ensemble des prédictions qui devait être fini ou infini, et non celui des attributs (une moyenne est en quelque sorte continue, mais on fait de la classification avec).
Du coup, peut-être serait-il judicieux d'insister sur ce point, en mettant par exemple en italique le mot "prédictions" ici, mais également en explicitant les introductions aux deux types de problèmes (régression et classification).
Tu pourrais également expliciter en quoi le problème de Rana el Kaliouby est bien continu. Et, si je puis me permettre, ça pourrait même te fournir une transition vers le discret : "mais ne pourrait-on pas chercher à déterminer si la personne est heureuse ou non (discret), plutôt que quantifier ses émotions (continu). Justement, la classification…".
Cependant, l'overfitting peut être plus que nocif pour l'exactitude du programme car la courbe pourrait devenir très irrégulière, très courbée pour parvenir à coller au mieux à l'ensemble d'entrainement.
On ne comprend pas trop en quoi c'est un problème. Je suis désolé, je ne peux pas te conseiller là-dessus vu que je ne suis pas très au point sur cette notion, mais l'idéal serait d'expliciter cela et de montrer le problème sur le schéma (il fournit actuellement un exemple d'overfitting, mais ne montre pas trop en quoi c'est problématique).
L'apprentissage non-supervisé
Ensuite, il y a deux couleurs : le rouge et le bleu, qui tentent de déterminer deux types d'utilisateurs différents.
D'où vient ce chiffre ? Plus haut, tu dis "sans qu'aucune information sur le nombre de classes attendues ou sur les propriétés de classification ne soit données".
puis trouve où placer ces foyers au mieux pour partitionner les données selon la ligne bleue continue
Ce que je ne comprends pas, c'est d'où sort cette ligne.
Partitionnement (ou clustering)
L'animation est un peu trop rapide. En fait, il serait peut-être préférable de mettre des images (agencées comme dans une BD).
qui est donc relatif aux exemples étiquetés que l'on donne à l'algorithme.
J'expliciterais un petit peu cela.
Cependant, le résultat obtenu reste tout à fait cohérent par rapport à l'algorithme et à ce que l'on lui demande !
Je ne comprends pas cela. Autant sur l'autre image, il y avait un grand vide qui nous donnait immédiatement la frontière, autant là, la limite n'est pas claire.
Si j'ai bien compris, "non-supervisé" signifie "classification sans étiquette". Mais existe-t-il une régression sans étiquette ?
L'apprentissage par renforcement
il est maintenant mondialement reconnu que le comportement d'un être vivant peut être conditionné, donc modifié à l'aide d'un stimulus associé à une action
Au début, je n'avais pas compris ce que tu dis plus bas ("Il aura donc appris à jouer avec l'expérience.") mais un truc du genre manipulation.
L'apprentissage par renforcement permet donc d'améliorer un comportement en le répétant, en s'entrainant à le faire et surtout en apprenant de ses erreurs.
C'est marrant, pour moi, le ML se résumait à cela.
Du coup, on peut très bien avoir un apprentissage (non-)supervisé puis par renforcement, non ?
Serait-il possible de développer simplement cette partie ? Pour la comparer à l'apprentissage supervisé, c'est comme si tu t'arrêtais après avoir dit qu'il s'agissait de construire un modèle à partir d'exemples étiquettés (sans parler de régression par exemple).
Le machine learning dans notre monde d'aujourd'hui
On le retrouve par exemple dans les situations suivantes :
Cette liste est une très bonne idée : elle permet de donner du recul par rapport aux types d'apprentissage. La placer à la fin est très judicieux : cela permet au lecteur de tout reprendre et de confronter les différentes méthodes.
Seulement, j'ai eu l'impression de mieux comprendre les différents types d'apprentissage avec cette liste, ce qui est un peu gênant vu qu'elle apparaît à la fin de l'article. Comme dit juste au-dessus, confronter des exemples de cette façon est une fort bonne idée, mais peut-être serait-il judicieux d'en ajouter plusieurs au fur et à mesure du texte ?
J'espère également que cela vous a donné envie d'en savoir plus sur ce qu'il y a moyen de faire, et comment.
Tu sais ce qu'il te reste à faire !
Merci pour ce contenu !
PS : tu cloues le bec à certaines remarques plus tard dans le texte. Je les garde toutefois afin que tu te rendes compte de ce que pourrait penser un lecteur à tel moment de la lecture.