Stats: Coefficient de détermination

a marqué ce sujet comme résolu.

Bonjour,

Sur beaucoup de graphiques avec des régressions linéaires que je rencontre dans mes cours, y a une valeur de R2 qui est d’ailleurs calculée quand on fait des graphiques sur Excel par exemple.

J’ai vu sur Wikipedia les formules associée mais je comprends pas vraiment ce que ça représente en vrai. Pourquoi une valeur proche de 1 pour R2 est bien ou pas ?

Merci

Lorsque tu aligne des points sur une droite, ce cœfficient $R^2$ symbolise la justesse d’une régression linéaire.

Tes points sont plus ou moins alignés correctement, et l’écart entre ces points et l’alignement (que tu trouve pas une régression) servent à calculer de $R^2$. Sur ce dessin tu as en bleu la droite issue de la régression linéaire. Et en vert tu as l’écart entre les valeurs expérimentales et la droite.

Exemple

Certains des écarts sont négatifs (descendent) et d’autre sont positif (montent). Pour des bonnes valeurs expérimentales et une bonnes équation de régression linéaire tu obtiens une somme des ces écart qui devient nul.

$$ \sum_{vert} \left( \text{écart}^{+}_{vert} - \text{écart}^{-}_{vert} \right) = 0 $$

Cela nous donne un $\mathrm{R=1}$.

A l’inverse si la somme est supérieur à zéro, alors $R$ tend vers $0$.

$$ \sum_{vert} \left( \text{écart}^{+}_{vert} - \text{écart}^{-}_{vert} \right) > 0 $$
+1 -0

Merci ! Est-ce qu’il existe des valeurs limites à partir desquelles on peut dire que notre expérience ne vaut rien du tout (par exemple si R = 0.3 je suppose que c’est mauvais) ?

Mais pour faire simple c’est pas juste l’écart-type par hasard ou c’est différent?

+0 -0

Je laisse les spécialistes t’en dire plus. Mais si tu veux voir comment on l’interprète cela dépend du domaine dans lequel tu travail. Ici il y a eu une bonne discussion autour de $R^2$. Personnellement j’ai jamais eu en dessous de $0.95$ en analytique universitaire.

Donc un $R^2 = 0.3$ vient à dire que tu as trouver l’équation $y = ax+b$ alors que tes points forment un cosinus :lol: .

+0 -0

Ce n’est pas directement l’écart-type, mais ça s’en inspire.

Je te dis tout ça de mémoire, il peut y avoir des approximations. Déjà, je pense que tu connais la relation entre Variance et écart-type.

Je m’appuie sur le dessin de Blackline.

Notons V1 la variance des ordonnées des points rouges. On l’appelle la variance totale.

Considérons ensuite les différents segments verts, la longueur de ces segments, et la variance des longueurs de ces segments. Notons V2 cette variance. On peut l’appeler la Variance résiduelle.

Forcément, V1>V2. Soit V3=V1-V2. V3 s’appelle la variance expliquée.

Variance totale = Variance expliquée + Variance résiduelle.

Et R², c’est R²=V3/V1 ; R², c’est la proportion de la variance qu’on arrive à expliquer.

Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte