Intervalle de confiance

Le problème exposé dans ce sujet a été résolu.

Bonjour!

J’ai dû demander à quelqu’un de plutôt calé en stats (enfin, du moins bien plus que moi) pour effectuer une régression non-linéaire sur des données que j’ai généré. Il m’a aussi mis des intervalles de confiance (d’après ce que j’ai compris ce sont des IC à 95%). Le résultat graphique le voilà:

IC

Y a deux courbes avec deux IC (apparemment à 95%) car ce sont deux modèles différents pour comparer lequel était le meilleur (rouge bien mieux).

Une question que je me demande c’est: pourquoi dans les deux cas des régressions les intervalles de confiances ne contiennent pas 95% des données (les points, ou alors je vois mal…) ? Peut-être que ça ne doit pas être le cas, je sais pas… :-) Pour info, ça a été fait avec des fonctions en R.

Si vous avez des idées, merci de partager vos connaissances là-dessus :p

+0 -0

Salut :)

L’intervalle de confiance dans le cas présent est l’intervalle de confiance des paramètres du modèle. A priori ta régression ressemble à une régression logarithmique de la forme $y = a+b ln x + \epsilon$.

Intervalle de confiance à 95% signifie que tu as 95% d’avoir les vraies valeurs de a et b dans cet intervalle (un par paramètre). On à partir de là construire l’intervalle de confiance de la courbe, qui est l’intervalle tel que tu as 95% d’avoir la vraie courbe dedans.

C’est bien la courbe qui est dans l’intervalle, pas les points (même par construction les points sont plus ou moins proches de la courbe et dont plus ou moins compris dans l’intervalle selon la qualité de la régression).

PS : La régression verte est probablement un polynôme plutôt qu’un log mais le raisonnement reste le même. Dans tous les cas il s’agit de l’intervalle dans lequel se trouve la fonction de régression trouvée. Voilà :)

+1 -0

Salut,

J’ajouterais juste une précision par rapport à ce qu’à dit Demandred : cet intervalle à 95% n’a de sens que si la fonction que tu utilises pour la régression est la vraie fonction décrivant le phénomène derrière les observations. Si tu ne prends pas la bonne fonction, l’intervalle représenté est en fait à une confiance plus basse parce que tu dois rajouter par dessus l’erreur que tu fais en faisant l’hypothèse fausse que la fonction est la bonne.

+2 -0

Merci à vous deux! En soit, on peut jamais être sûr que notre fonction est la bonne non? :)

sotibio

Ben ça dépend. Si tu étudies un phénomène physique simple comme par exemple une chute en milieu visqueux, on connait mathématiquement le problème, il n’y a plus qu’à ajuster par exemple les frottements à partir de plusieurs mesures de la position en fonction du temps. Les erreurs théoriques (un milieu purement visqueux, ça n’existe pas) seront négligeables complètement devant les mesures.

Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte