Tutoriel sur le Machine Learning

suite de la discussion du thread des propositions

a marqué ce sujet comme résolu.

Je suis totalement novice dans le domaine, mais c'est un article très intéressant ! Vivement la suite !

PS : personnellement, je ne serais pas contre un peu plus de mathématiques, même si je concède bien évidemment que ce ne doit pas être le cas de tout le monde.

on remarque vite que c'est devenu une discipline

qu'elle est devenue

Ou alors :

Quand on s'intéresse un peu à la discipline qu'est l'intelligence artificielle (IA en français ou AI en anglais pour Artificial Intelligence), on remarque vite qu'elle est devenue tellement vaste qu'elle est maintenant subdivisée en plusieurs sous-domaines.

qu'elle est maintenant subdivisée en plusieurs sous-domaines

"qu'il est nécessaire de la subdiviser en en plusieurs sous-domaines" ?

Un de ces domaines qui existe depuis déjà longtemps, mais qui ne cesse de se compléter, et qui est celui qui nous intéresse ici est le domaine de l'apprentissage.

Un de ces domaines existe depuis déjà longtemps et ne cesse de se compléter : le domaine de l'apprentissage, auquel nous nous intéressons dans cet article.

Je tiens tout d'abord à préciser que vous n'allez pas apprendre à faire un robot qui apprend à parler en vous regardant faire à la fin de cet article.

Ca ne me semble pas nécessaire, voire même un peu rebutant. Tu dis clairement juste après que l'article donne un avant-goût (de toute manière, c'est un article, pas un tutoriel) et je pense que ça suffit. :)

Cet article a pour objectif de donner un avant-goût de ce qu'est le machine learning

Si on n'a aucune idée de ce que c'est, on ne comprend pas le rapport avec le paragraphe précédent. D'ailleurs, ne connaissant que de nom, je me demande si "machine learning" = "le domaine de l'apprentissage". Le cas échéant, tu pourrais compléter la dernière phrase du paragraphe précédent :

qui nous intéresse ici est le domaine de l'apprentissage, plus communément appelé machine learning.

Ou, si tu prends en compte ma remarque ci-dessus :

: le domaine de l'apprentissage, ou machine learning, auquel nous nous intéressons dans cet article.

une des manières de traiter l'apprentissage

"de gérer l'apprentissage" ?

le hiérarchiser, etc.

Tu peux enjoliver le "etc" : "et autres joyeusetés".

Bien que le machine learning repose sur des bases mathématiques d'analyse, d'algèbre linéaire, etc.,

La virgule après le "etc." ne fait pas très joli. Du coup, je reformulerais :

Bien que le machine learning repose sur des bases mathématiques d'analyse et d'algèbre linéaire entre autre,

le but ici n'est pas d'expliciter tous ces calculs longs et relativement compliqués pour certains

Plutôt :

le but ici n'est pas d'expliciter tous ces calculs longs et parfois relativement compliqués

Les détails des algorithmes et leur démonstrations

Je crois qu'il y a un "s" à "leur".

Pour mon plus grand désarroi

"À mon plus grand" ?

je ne vous assommerai pas, chers lecteurs, d'équations vicieuses

Nananère ! :P

Introduction au machine learning

Il est ici question de la logique des logiciens comme De Morgan, Boole, Gödel, Hilbert, etc.,

C'est une note.

"la logique des logiciens" fait bof.

Même remarque sur le "etc.,". Plutôt "Gödel, Hilbert et compagnie" ?

ayant une intuition importante pour les maths

Toujours dans la note.

Le "pour" me paraît bizarre. Mais j'avoue ne pas trop savoir quoi mettre d'autre.

En 1939, la machine Bombe créée par l'équipe d'Alan Turing a été mise au point.

Tu devrais faire le rapport avec la logique mathématique dont tu parles dans la phrase précédente :

Cette logique a fait décoller la construction de machines (le terme est bof) : en 1939…

Sept ans plus tard, à savoir en 1946

Le "à savoir" fait un peu lourd. Juste : "Sept ans plus tard, en 1946".

Près d'une dizaine d'année plus tard

années

Je préciserais la date : est-ce en 1949 ou en 1956 ?

au Dartmouth College, une université plus que réputée (membre de l'Ivy League) aux États-Unis

Le "une" me semble de trop : on a l'impression que c'est le sujet de ta phrase. Plutôt un truc du genre :

au Dartmouth College, université membre de l'Ivy League plus que réputée aux États-Unis

est apparu pour la première fois le terme Intelligence Artificielle

J'imagine qu'ils ne parlaient pas français ? :P

se mettent à rêver d'une fantasme de machine intelligente.2

une fantasme ? oO

D'ailleurs, ça fait bizarre de rêver d'un fantasme de machine intelligente. Peut-être ai-je mal compris, mais "à rêver de machines intelligentes" me semble plus correct.

Je mettrais la note avant le point.

Il faut savoir que le problème d'une machine pensante avait déjà été émise

C'est une note.

Ou bien "l'idée d'une machine" ou bien "été émis". J'opterais pour la première option.

mais il faut savoir qu'il n'a pas fallu longtemps

"il n'a pas fallu longtemps" répète un peu "'il n'a pas fallu beaucoup de temps pour que les esprits".

l'algorithme Perceptron a été inventé vers 1957 et est une implémentation

Le "et est une implémentation" me paraît peu élégant. Plutôt :

l'algorithme Perceptron, inventé vers 1957, est une implémentation

domaine du machine learning qui sera présenté d'ici peu

Le "d'ici peu" porte un peu à confusion. Vu que tu es dans un historique, on ignore un peu si tu dis "d'ici peu après la conférence au Dartmouth College" ou "d'ici peu dans l'article". On devine que c'est le second, mais ça ne coûte pas grand chose de se débarrasser de l'ambiguité. ^^

n'est pas de toute jeunesse et que c'est donc une

Le "et que c'est" n'est pas très élégant :

n'est pas de toute jeunesse et constitue donc une

À nouveau, cet article n'est qu'une introduction au domaine et pas un cours à part entière !

J'expliciterais le lien avec la phrase précédente avec un truc du genre :

Faire un cours à part entière sur la question est donc une lourde tâche et je rappelle que cet article n'est qu'une introduction au domaine.

Avant d'aller plus loin, je propose que nous tentions de définir ce terme présent dans le titre et dans l'introduction

La formulation est étrange. Pourquoi pas simplement "Avant d'aller plus loin, je propose que nous tentions de définir le terme machine learning" ?

(ou dirais-je "pas suffisamment explicite")

C'est une broutille, mais pourquoi ne pas simplement dire "ce terme présent dans le titre et dans l'introduction qui n'est pas suffisamment explicite" ? :)

Le machine learning (souvent abrégé ML)

Comment as-tu fait ce bloc ? oO

et ce, de manière automatique (autonome).

La virgule me semble de trop.

le ML n'est pas une manière magique de créer

le ML n'est pas une méthode magique pour créer

C'est en réalité un regroupement de

Le "c'est" n'est pas très élégant. Je ne mettrais pas de point en fait :

une IA forte en lui apprenant à tout faire, mais un regroupement

qui peuvent être appliqués, ou non

La virgule me semble de trop.

Maintenant, voyons un peu comment il est possible de hiérarchiser, de classer

La seconde virgule n'est pas excellente. Je ne mettrais qu'un seul des deux termes.


J'ignore s'il faut mettre "machine learning" en italique à chaque fois ou pas.

Il pourrait être intéressant de mettre certains liens : la machine Bombe, l'ENIAC…

De plus, les guillemets anglais gagneraient à devenir français.

Certaines remarques sont des broutilles et je te laisse juger de leur pertinence. ^^

Je continue la relecture d'ici peu. J'en suis à "Les trois grands types d'apprentissage".

Merci beaucoup pour cet article ! :)

+0 -0

Je suis totalement novice dans le domaine, mais c'est un article très intéressant ! Vivement la suite !

PS : personnellement, je ne serais pas contre un peu plus de mathématiques, même si je concède bien évidemment que ce ne doit pas être le cas de tout le monde.

Emeric

Salut,

merci pour le retour ! :)

Pour les maths, il est, je pense, essentiel de comprendre ce que l'on fait pour pouvoir le développer et/ou l'utiliser correctement. Cependant, ici mon but n'est pas d'expliquer comment faire mais vraiment de donner un avant-goût. Si cela peut te rassurer, lorsqu'il y aura des tutos sur différents algorithmes de ML (ce que j'aimerais faire, si possible), les maths seront bien présents ! ;) Mais je pense vraiment que dans un petit article d'introduction comme celui-ci, les maths n'apporteraient rien car pour que l'apport soit notable, il faudrait à chaque fois expliquer tout l'algorithme qui va avec et donc l'article d'introduction se changerait en big-tuto.

@Vayel, je lis tout ça… Merci pour le retour plus que complet ! :)

+0 -0

Je ne suis pas trop fan du fait d'enjoliver les "etc." par des termes vraiment pas rigoureux comme "et compagnie"

D'ailleurs, ne connaissant que de nom, je me demande si "machine learning" = "le domaine de l'apprentissage"

Non : je le dis directement après : le machine learning, une des manières de traiter l'apprentissage […]

Je crois qu'il y a un "s" à "leur".

Il n'y a surtout pas de "s" à démonstration. :-°

Tu devrais faire le rapport avec la logique mathématique dont tu parles dans la phrase précédente

Je ne sais pas, le but n'est pas de parler de la logique mathématique dans laquelle le ML n'entre pas. Je retrace un tout petit historique de l'informatique, je ne m'attarde pas du tout dessus.

J'imagine qu'ils ne parlaient pas français ? :P

Vayel, ne sois pas de mauvaise foi, je te prie ! :D

Le terme apparu au DC était Artificial Intelligence qui se traduit littéralement en Intelligence Artificielle. Je pense qu'on peut donc également considérer que c'est l'apparition du terme Intelligence Artificielle. :) Mais pour te faire plaisir, je vais le préciser ;)

une fantasme ? oO

typo ^^

ça fait bizarre de rêver d'un fantasme

Je suis d'accord, je corrige :)

Je mettrais la note avant le point.

Mettre la note avant le point voudrait dire que la note porte sur le dernier mot ou dernier concept avant la note, or la note porte sur la phrase et l'entièreté de son sens, donc elle se place après le point. :)

Comment as-tu fait ce bloc ? oO

quote me if you want to know, young padawan !

La virgule me semble de trop.

Nope

Pour le reste, j'ai soit changé par ce que tu donnais, soit gardé, soit fais des compromis. ;)

+0 -0

Je ne sais pas, le but n'est pas de parler de la logique mathématique dans laquelle le ML n'entre pas. Je retrace un tout petit historique de l'informatique, je ne m'attarde pas du tout dessus.

Justement, il faudrait brièvement expliquer quel est le rapport en logique mathématique et informatique. Même si c'est évident. Tu pourrais faire :

Le début du XXe siècle a connu une grande avancée de la logique mathématique, laquelle a permis le développement de l'informatique.

Le terme apparu au DC était Artificial Intelligence qui se traduit littéralement en Intelligence Artificielle. Je pense qu'on peut donc également considérer que c'est l'apparition du terme Intelligence Artificielle. :) Mais pour te faire plaisir, je vais le préciser ;)

Pas la peine, il ne faudrait pas que ça fasse trop lourd. :)

Mettre la note avant le point voudrait dire que la note porte sur le dernier mot ou dernier concept avant la note, or la note porte sur la phrase et l'entièreté de son sens, donc elle se place après le point. :)

Fort juste.

PS : n'oublie pas de mettre à jour le premier post. ^^

+0 -0

Justement, il faudrait brièvement expliquer quel est le rapport en logique mathématique et informatique. Même si c'est évident. Tu pourrais faire :

Le début du XXe siècle a connu une grande avancée de la logique mathématique, laquelle a permis le développement de l'informatique.

Je vais me pencher là-dessus :)

PS : n'oublie pas de mettre à jour le premier post. ^^

Vayel

J'attendais la suite de tes remarques pour donner un contenu qui a tout de mêmpe changé, pas juste deux trois reformulations. :)

+0 -0

Les trois grands types d'apprentissage

omme dit juste avant, le grand principe ici est d'apprendre.

Plutôt que "ici", je dirais "du machine learning". Au début, j'ai cru que tu faisais référence à l'article.

Cependant, il n'y a pas qu'une seule méthode qui a été trouvée.

La phrase est un peu lourde. Simplement :

Cependant, plusieurs méthodes ont été élaborées.

Mais, du coup, je reformulerais plus d'éléments :

Cependant, plusieurs méthodes ont été élaborées, énormément même. Pour des questions de simplicité, elles ont été regroupées en familles, que l'on appelle les types d'apprentissage (automatique).

en familles que l'on appelle les types

en familles, que l'on appelle les types

Les voici :

Question de goût personnel : je préfère "Ces types sont les suivants :". Ou alors : "On recense :".

mais comme j'ai parlé des trois types ci-dessus, nous allons laisser ce dernier de côté.

Je ne comprends pas.

L'apprentissage supervisé

toute ressemblance avec l'exemple de Ross Quinlan

C'est une note. Majuscule.

quel a été le temps et si il

s'il

Ce qui a été fait ici est un bel exemple

On n'a pas fait grand chose. :P

D'autant plus que tu utilises le futur dans le paragraphe précédent, laissant penser qu'on va mettre les mains dans le cambouis.

Au passage, l'exemple ne me semble pas très adapté, ou alors pas assez explicité. En principe, je n'ai pas besoin d'un algo pour savoir si je vais faire du tennis ou non selon la météo, si ?

du matériel pour pouvoir travailler et donc prédire

Je ne crois pas que le ML ne serve qu'à faire des prévisions. Ce n'est par exemple pas trop le cas en analyse d'image.

exemple étiquetés car leur a donné

on leur

on note les conditions météorologiques x (avec x1, la température, x2, le temps d'ensoleillement, x3, le taux d'humidité, etc.)

C'est quoi x1, x2, etc. ? x est un n-uplet ?

L'apprentissage supervisé peut tout de même être une fois de plus subdivisé.

Le gras ne me semble pas nécessaire.

Certains ont probablement déjà entendu ce terme, régression à un cours de math.

La virgule fait bizarre. Plutôt :

Certains ont probablement déjà entendu le terme régression durant un cours de math.

Et "maths", non ?

mais sachez qu'ici, le terme régression signifie

ce terme signifie

(pas forcément consécutifs)

"nécessairement" ?

Ici, sur l'axe x (axe des abscisses ou axe horizontal), c'est le nombre d'heures d'ensoleillement qui est représenté, et sur l'axe y (axe des ordonnées ou axe vertical), c'est la température moyenne qui est représentée.

Ici, on représente sur l'axe x (axe des abscisses ou axe horizontal) le nombre d'heures d'ensoleillement, et sur l'axe y (axe des ordonnées ou axe vertical), la température moyenne.

Voici à quoi ressemble ce graphique

Toujours une question de goût personnel : Ce graphique ressemble à cela

(qui est très dépendant des données mesurées et fictif qui plus est)

(il est très dépendant des données mesurées, lesquelles sont ici fictives)

Ensemble d'entrainement Régression

Tu n'as pas défini l'expression "ensemble d'entrainement".

Sinon, l'image est un peu grande et pas excellente. Je peux essayer un truc si tu me fournis les données.

On y voit donc un ensemble de points où chaque point

où chacun

lien entre ces deux valeurs. Donc

Plutôt une virgule, non ?

(que nous allons appeler h(x) pour hypothèse)

appeler h, pour "hypothèse" (avec des guillemets french).


Je suis resté sur ma faim concernant la régression. Il pourrait être intéressant d'en faire un article à part, un poil plus complet, et de dédier celui-ci à une introduction et définition précise du ML (par exemple, il n'est ici pas très clair si c'est seulement de la prédiction ou non). Qu'en penses-tu ? Je peux aider si besoin.

Dans le cas contraire, je reviendrai sur les formulations. :)

Tchou !

+0 -0

C'est quoi x1, x2, etc. ? x est un n-uplet ?

exactement, les indices (1 à n) sont les n attributs du problème.

Tu n'as pas défini l'expression "ensemble d'entrainement".

Très juste !

Sinon, l'image est un peu grande et pas excellente

Pourquoi pas excellente ?

par exemple, il n'est ici pas très clair si c'est seulement de la prédiction ou non

De manière générale, oui. Ça reste de la prédiction même si le but est d'apprendre à une voiture à conduire (prédire l'angle de rotation $\in [-\pi, \pi]$), écrire une histoire (prédire quel thème est le plus adapté avec telle ou telle partie de l'histoire), etc.

Je ferai mes corrections tantôt. :)

+0 -0

Pourquoi pas excellente ?

Pardon, j'aurais dû être plus explicite. L'image n'est pas d'une qualité excellente. On pourrait aisément faire mieux en utilisant matplotlib par exemple. :)

+0 -0

En principe, je n'ai pas besoin d'un algo pour savoir si je vais faire du tennis ou non selon la météo, si ?

Pas particulièrement, mais tu peux déléguer. Tu n'as pas non plus besoin d'un algo pour conduire pourtant on a des voitures qui se conduisent toutes seules.

Sinon, je regarde comment rendre l'image plus agréable et un peu améliorer le chapitre sur la régression. :)

+0 -0

Je poste ici le MP que je t'ai envoyé, en le complétant selon les remarques que tu as faites :

J'ai poursuivi ma lecture et j'en suis venu à la conclusion que l'article était trop introductif.

Premièrement, tu n'expliques pas assez en détail ce qu'est le ML. Tu parles de prédiction, mais cela veut-il dire que l'analyse d'un signal avec la transformée de Fourier ou le modèle ARMA sont du ML ? Quid de l'analyse d'image ? Tu passes un peu trop rapidement aux types de ML, sans qu'on ait eu l'intuition de ce que c'était. Tu n'insistes pas assez, je pense, sur l'aspect apprentissage : la partie "Introduction au machine learning/Définition" est très courte.

Deuxièmement, tu restes trop en surface concernant les méthodes, sur la régression par exemple. Tu expliques ce qu'est une régression (seulement en dimension 2) mais pas énormément comment elle intervient dans le ML. Peut-être me fais-je une mauvaise idée de ce qu'est cette discipline, mais j'ai du mal à voir où intervient la régression ici ou . Autrement dit, une personne ayant connaissance de cette méthode (elle est sacrément utilisée en physique, beaucoup de post-bacs la connaissent) n'aura pas appris grand chose. Ou alors si c'est juste ça, le ML perd de sa superbe. :P

Il va de soi que c'est ton article et que tu le mènes comme tu veux, mais je te conseille de le scinder en plusieurs parties :

  • Une à la définition du ML, à son introduction, à ses interventions dans la vie courante, à ses sous-domaines… ;
  • Une pour chaque type d'apprentissage, comme tu le fais déjà, mais en approfondissant.

L'avantage du découpage est que tu pourras un peu plus t'étendre et intégrer un peu de mathématiques (expliquer ce qu'est une régression, ce n'est pas non plus couvrir le lecture de formules). Mais du coup, peut-être un petit tutoriel serait plus approprié.

Dans le cas d'une série d'articles, je n'aborderais pas les différents types dans le premier. Du moins, pas comme ça. Ici, on a l'impression d'être à mi-chemin : tu veux nous fournir une intuition (c'est le et le pourquoi), mais également étayer ton propos avec des aspects mathématiques (le comment). Et du coup tu ne prends pas assez parti pour l'une des deux approches. Ce que j'expliquerais dans le premier article, ce n'est pas ce qu'est l'apprentissage supervisé, par exemple, mais où on le rencontre et ce qu'on attend de lui. Et dans un autre, tu aborderais les aspects mathématiques. :)

Autrement dit, il faudrait, à la fin de l'article, pouvoir choisir entre "ML" et "méthode classique" puis entre "supervisé", "non-supervisé" et "par renforcement". AMHA, pas besoin de savoir comment chacune des méthodes fonctionne pour commencer.

Comme dit en MP, je te remercie pour la prise en compte de mes remarques. :)

+0 -0

Bonjour, Je suis en train de découvrir le machine learning et pour ce faire, je vais essayer de faire quelque chose qui "apprend" à résoudre un rubik's cube

Je pensais proposer du coup d'écrire un fil rouge qui pourrait être intégré dans un tuto, sachant que je vais probablement utilisé plusieurs méthodes pour en apprendre un maximum, ce serait pas compliqué d'élargir à différents tutos.

Dites moi si ça vous interesse (et si le problème vous semble trop compliqué pour commencer, dites moi que je change ^^)

Je suis pas sûrs que ce soit un bon exemple car fondamentalement résoudre un rubik's cube est un problème solvable. Ce n'est pas le genre d'application où est l'interet du maching learning. Du coup, même si tu peux probablement faire quelque chose avec, c'est pas une bonne illustration je pense.

Salut à tous !!

J'ai été absent pendant un moment, mais j'ai tout de même apporté quelques modifications de temps en temps. J'ai mis à jour le post initial avec la version actuelle de l'article. Tous les commentaires et toutes les remarques sont à nouveaux les bienvenus afin d'améliorer cet article dans la mesure du possible.

Concernant les remarques de Vayel :

  • j'ai laissé l'entièreté de l'article ici, une fois qu'il sera fini, nous verrons si une scission s'impose mais en attendant, je préfère tout rédiger en une fois (tout comme je l'avais fait pour la crypto) ;
  • je n'ai pas encore amélioré le passage de définition ;
  • Ce que j'expliquerais dans le premier article, ce n'est pas ce qu'est l'apprentissage supervisé, par exemple, mais où on le rencontre et ce qu'on attend de lui

Je vais voir comment intégrer cela dans les introductions aux sous-sections.

Merci à tous d'avance,

poupou9779.

+1 -0

Chouette ! Je ne me concentrerai ici que sur le fond. À mon plus grand désarroi, je ne t'assommerai pas, cher poupou, de remarques vicieuses sur l'orthographe et le style. :P

Pour me positionner par rapport à l'article et t'aider à mettre mon retour en perspective, j'ai une petite idée de ce qu'est le ML mais ignore tout des concepts sous-jacents. J'ai par contre quelques bases mathématiques.

Introduction au machine learning

À la conclusion que le machine learning n'est pas de toute jeunesse et constitue donc une branche de l'IA qui a eu largement (à son échelle) le temps de s'étendre et de se remplir. À nouveau, cet article n'est qu'une introduction au domaine et pas un cours à part entière !

Il me semble que les deux phrases ne se suivent pas très bien.

Définition

Tu n'as pas revu cette partie, mais je la commente tout de même, en prenant en compte ce que j'avais relevé précédemment : ainsi, tu auras tous mes commentaires dans ce message.

Le machine learning (souvent abrégé ML) est une branche de l'IA

Dis poupou, c'est qui Lyha ?

Maintenant, voyons un peu comment il est possible de hiérarchiser, de classer les différents sous-domaines du ML.

Je crois que cette partie est un peu courte. J'ignore s'il est possible de la rendre plus concrète sans parler des trois types d'apprentissage, et comme je n'y connais rien, je ne peux malheureusement pas te conseiller judicieusement à ce propos. :(

Peut-être pourrais-tu donner un exemple de problème qu'on peut (doit ?) résoudre via le ML ? Notamment, il me paraît intéressant de détailler ce que tu appelles « algorithmes classiques ».

Les trois grands types d'apprentissage

L'apprentissage supervisé

le terme régression signifie que nous nous trouvons dans les mathématiques continues, à savoir les ensembles tels que [0,1], [−π,21.5], R, etc.

Ca paraît évident, mais tu pourrais peut-être indiquer (en expliquant brièvement) que le problème de tennis ne fait intervenir que des données continues, nécessaires à la régression.

où chaque point correspond à un couple (x,y) comme expliqué ci-dessus.

Peut-être le $(x,y)$ pourrait-il en perturber certains, lesquels croiraient que $x$ désigne l'abscisse et $y$ l'ordonnée.

D'autre part, je suis un peu sceptique sur le "à un point". Avec ce graphique, tu ne regardes que deux composantes de ton vecteur $x$. S'il en a plus, ce qui me semble être le cas vu que tu parles plus haut de $x_3$, cela ne permet pas de le caractériser.

D'ailleurs, on pourrait se demander pourquoi tu ne considères que deux composantes, et non pas aussi le taux d'humidité, etc.

Mon objectif ici n'est pas de vous apprendre à le faire, mais juste de vous montrer à quoi cela peut ressembler.

Le problème c'est qu'une personne ignorant tout de la régression ne comprendra pas d'où sort cette droite, ni même si elle a un rapport avec les points. Tu le dis un peu avec "L'objectif de notre régression est de trouver un lien entre ces deux valeurs", mais il serait peut-être judicieux d'expliciter brièvement. Pour ce faire, il me semble intéressant d'employer le terme "approcher".

Régression quadratique

Peut-être pourrais-tu développer la fonction mentionnée dans "Par exemple une fonction comme celle-ci peut sembler un peu plus précise.". Sinon, le lecteur pourrait ne pas comprendre le terme "quadratique" de la légende.

Le travail de la personne chargée d'implémenter un système de machine learning est à ce niveau de trouver quelle(s) hypothèse(s) convient/conviennent le mieux.

J'ai buté sur le terme "hypothèse". Il me paraît plus clair de parler directement de fonction.

On a alors au moins quatre attributs, ce que l'on ne peut donc plus simplement représenter sur un graphique.

J'ai peur que ce passage paraisse complexe à des personnes n'ayant jamais vu la régression en dimension supérieure à 2. Peut-être pourrais-tu y aller plus progressivement en ajoutant un attribut, de sorte à être en dimension 3, ce qui est relativement représentable, avant de généraliser.

Voilà ce qu'a dit Rana el Kaliouby

Peut-être proposer une traduction de la citation ?

Rana el Kaliouby: This app knows how you feel — from the look on your face, TED talk

Je pense que ce serait une bonne idée d'indiquer la license de la vidéo.

Le ML se situe au cœur du programme qui doit être pré-traité.

Je préciserais cela : il s'agit ici d'analyser l'image. J'ignore si on a accès au code source, mais donner un exemple d'analyse serait chouette (par exemple, on regarderait l'écartement des coins des lèvres).

et leur moyenne tout au long de l'année

"sur l'année", comme tu l'emploies plus bas, me semble plus clair. Au début, j'ai cru qu'on effectuait un suivi de l'élève (par exemple, tous les trimestres).

Le but est à nouveau de déterminer un moyen de prédire si l'élève

Je dirais plutôt "un élève".

Nous pouvons tenter cette fois de trouver une courbe (une fonction) qui séparera nos deux classes.

Si tu pouvais expliquer simplement comment faire ça, ce serait génial. S'il existe plusieurs méthode, ce que j'imagine, peut-être pourrais-tu en fournir des références ?

le résultat attendu pour la valeur de y est appelée classe

Je ne comprends pas cela. La classe (par exemple, "réussite") dépend également de $x$ (de tous les attributs en fait), non ?

Imaginons maintenant que nous partions forcément de la racine

Le "maintenant" semble ne pas très bien suivre le "Comment faire pour avoir notre réponse ?".

Nous avons donc réussi à classifier notre exemple : la valeur que doit prendre notre valeur y (à savoir la classe) est non.

Malheureusement, ce paragraphe n'est pas très clair pour une personne ignorant l'algorithme ID3, comme moi. Il me semble par exemple étrange de pouvoir jouer au tennis alors qu'il pleut ou qu'il y a un vent fort. Le problème est qu'on travaille alors sur quelque chose qu'on ne comprend pas (l'arbre).

En fait, c'est un peu comme si tu disais directement, pour la régression logique "on place notre point et regarde de quel côté de la droite il se situe", sans expliquer d'où sortent les losanges, les croix et la droite.

Cette UL a été explicitement décomposée en trois parties :

Les daltoniens risquent d'avoir un peu de mal avec le mauve et le bleu. :P

Il est compliqué pour moi de continuer de détailler les RNA

Un exemple serait vraiment le bienvenu. Est-il possible d'en faire un simplement ?

(de plus, j'ai promis au loup, alors vous comprenez…)

Un beefsteak devrait régler le problème ! :D

Pour récapituler ceci, si l'ensemble des prédictions possibles est fini, nous avons affaire à un problème de classification et si à l'inverse il est infini, nous avons affaire à un problème de régression.

J'étais sur le point de poser une question témoignant du fait que je n'avais pas assimilé que c'était l'ensemble des prédictions qui devait être fini ou infini, et non celui des attributs (une moyenne est en quelque sorte continue, mais on fait de la classification avec).

Du coup, peut-être serait-il judicieux d'insister sur ce point, en mettant par exemple en italique le mot "prédictions" ici, mais également en explicitant les introductions aux deux types de problèmes (régression et classification).

Tu pourrais également expliciter en quoi le problème de Rana el Kaliouby est bien continu. Et, si je puis me permettre, ça pourrait même te fournir une transition vers le discret : "mais ne pourrait-on pas chercher à déterminer si la personne est heureuse ou non (discret), plutôt que quantifier ses émotions (continu). Justement, la classification…".

Cependant, l'overfitting peut être plus que nocif pour l'exactitude du programme car la courbe pourrait devenir très irrégulière, très courbée pour parvenir à coller au mieux à l'ensemble d'entrainement.

On ne comprend pas trop en quoi c'est un problème. Je suis désolé, je ne peux pas te conseiller là-dessus vu que je ne suis pas très au point sur cette notion, mais l'idéal serait d'expliciter cela et de montrer le problème sur le schéma (il fournit actuellement un exemple d'overfitting, mais ne montre pas trop en quoi c'est problématique).

L'apprentissage non-supervisé

Ensuite, il y a deux couleurs : le rouge et le bleu, qui tentent de déterminer deux types d'utilisateurs différents.

D'où vient ce chiffre ? Plus haut, tu dis "sans qu'aucune information sur le nombre de classes attendues ou sur les propriétés de classification ne soit données".

puis trouve où placer ces foyers au mieux pour partitionner les données selon la ligne bleue continue

Ce que je ne comprends pas, c'est d'où sort cette ligne.

Partitionnement (ou clustering)

L'animation est un peu trop rapide. En fait, il serait peut-être préférable de mettre des images (agencées comme dans une BD).

qui est donc relatif aux exemples étiquetés que l'on donne à l'algorithme.

J'expliciterais un petit peu cela. :)

Cependant, le résultat obtenu reste tout à fait cohérent par rapport à l'algorithme et à ce que l'on lui demande !

Je ne comprends pas cela. Autant sur l'autre image, il y avait un grand vide qui nous donnait immédiatement la frontière, autant là, la limite n'est pas claire.


Si j'ai bien compris, "non-supervisé" signifie "classification sans étiquette". Mais existe-t-il une régression sans étiquette ?

L'apprentissage par renforcement

il est maintenant mondialement reconnu que le comportement d'un être vivant peut être conditionné, donc modifié à l'aide d'un stimulus associé à une action

Au début, je n'avais pas compris ce que tu dis plus bas ("Il aura donc appris à jouer avec l'expérience.") mais un truc du genre manipulation.

L'apprentissage par renforcement permet donc d'améliorer un comportement en le répétant, en s'entrainant à le faire et surtout en apprenant de ses erreurs.

C'est marrant, pour moi, le ML se résumait à cela. ^^

Du coup, on peut très bien avoir un apprentissage (non-)supervisé puis par renforcement, non ?

Serait-il possible de développer simplement cette partie ? Pour la comparer à l'apprentissage supervisé, c'est comme si tu t'arrêtais après avoir dit qu'il s'agissait de construire un modèle à partir d'exemples étiquettés (sans parler de régression par exemple).

Le machine learning dans notre monde d'aujourd'hui

On le retrouve par exemple dans les situations suivantes :

Cette liste est une très bonne idée : elle permet de donner du recul par rapport aux types d'apprentissage. La placer à la fin est très judicieux : cela permet au lecteur de tout reprendre et de confronter les différentes méthodes.

Seulement, j'ai eu l'impression de mieux comprendre les différents types d'apprentissage avec cette liste, ce qui est un peu gênant vu qu'elle apparaît à la fin de l'article. Comme dit juste au-dessus, confronter des exemples de cette façon est une fort bonne idée, mais peut-être serait-il judicieux d'en ajouter plusieurs au fur et à mesure du texte ?

J'espère également que cela vous a donné envie d'en savoir plus sur ce qu'il y a moyen de faire, et comment.

Tu sais ce qu'il te reste à faire ! :P

Merci pour ce contenu !

PS : tu cloues le bec à certaines remarques plus tard dans le texte. Je les garde toutefois afin que tu te rendes compte de ce que pourrait penser un lecteur à tel moment de la lecture.

+1 -0

Salut, personnellement, je considère le projet comme maintenu car je voudrais continuer cet article et puis qu'on ait des cours sur le sujet, cependant je n'ai pas avancé depuis mes derniers posts ici. La raison étant comme toujours études = manque de temps.

Cependant, il me semble que Vayel avait débuté quelque chose de son côté, il faudrait voir où c'en est, et sinon, il y a un sujet discutant le ML ici.

+1 -0
Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte