Introduction aux statistiques inférentielles

L'art de manipuler les chiffres et de ne plus se faire avoir par les autres.

a marqué ce sujet comme résolu.

Je n'ai pas lu parce que je pense pas m'y connaître suffisamment. Mais j'ai juste remarqué que ça pourrait être sympa que tu définisses rapidement ce que c'est qu'un espace de probabilités, une variable aléatoire, la loi d'une variable aléatoire, etc.

Ça permettrait d'avoir un cours un peu plus accessible, et faire un petit échauffement est jamais mauvais :-)

+2 -1

Tu ne peux pas donner ce genre de definition sans attendre du lecteur de connaitre pleinement la theorie de la mesure. Le formalisme rigoureux des probabilites, et en partie, des statistiques se basent entierement la dessus.

Au final, si c'est pour dire qu'un espace de probabilite c'est un espace probabilisable muni d'une mesure de probabilite, on n'est pas bien avance sans definir ensuite mesure de probabilite, et donc mesure, etc.

Ce n'est pas pour rien que l'on separe tres nettement les probabilites elementaires, qui ont occupes les mathematiciens pendant 1900 ans, et les probabilites dont le formalisme n'a pu etre fait qu'au debut des annees 1900 avec les travaux de Lebesgue et Borel notamment. C'est aussi pour cela que l'on va enseigner les probabilites qu'apres theorie de la mesure et construction de l'integrale de Lebesgue puisque sans ca, impossible de definir formellement toute notion de probabilite.

Je vais lire le tutoriel plus tard et editer au fur et a mesure de mes remarques:

  • C'est tres abrupte. Je m'attendais a avoir une petite introduction sur les differentes branches de la statistiques pour resituer la statistique inferentiel par rapport a la statistique descriptive.
  • Je m'attendais a avoir une descripte d'une statistique dans le paragraphe "Qu'appelle-t-on statistiques ?". Rien de tout ca.
  • Toujours dans ce que je m'attendais a voir : pas une fois le mot parametre n'est apparu alors qu'on est clairement dans un tutoriel sur de l'inference de modeles parametriques (et au passage, on pourrait rajouter cela pour situer un peu ton cours au sein des statistiques)
  • La partie des tests est affreuse dans les explications, a se demander si l'auteur a compris ce qu'impliquait le rejet de l'hypothese $H_0$. La notion clef a expliquer et qui n'est pas presente c'est ce qu'implique ou non le rejet de l'hypothese initiale.
+1 -0

Ha ? Avec un vrai formalisme comme tu le demandes ? Autant je concois qu'on peut cacher des details techniques inutile pour les objectifs que l'on se fixe (type filtration d'un processus pour une premiere etude de chaine de Markov ou de processus stochastique en general), autant la j'ai du mal a voir.

Je suis d'accord qu'il manque de toute maniere des definitions (notamment VA, population, parametre) mais qui devraient etre celles de probabilites elementaires.

+1 -0

Je suis d'accord qu'il manque de toute maniere des definitions (notamment VA, population, parametre) mais qui devraient etre celles de probabilites elementaires.

Höd

Ofc. Je demande pas forcément les définitions les plus générales, mais au moins mettre des mots sur les notions les plus utilisées.

Salut,

(De retour sur un azerty !)

Justement, le dilemme en statistique c'est que si l'on veut faire du théorique, qui est très intéressant par ailleurs, il faut de bonnes bases en probabilités (non élémentaires) ce qui est difficile à aborder (à cause de la multitude des théories sous-jacentes qui doivent être comprises et qui sont pourtant loin d'être triviales). Il y a aussi l'approche pratique, qui à le mérite ne reposer que sur quelques concepts de probabilités non-élementaires qui peuvent être expliqués avec des probabilités élémentaires sans en distordre l'essence.

Les deux approches sont différentes et complémentaires. Et je t'avoue que j'ai moi même du mal à trouver la bonne formule pédagogique qui permettent d'aborder des fondements théoriques sans trop dénaturer le propos.

Une erreur souvent commise par des statisticiens en herbe, les étudiants ou encore pire, des gens en dehors du domaine, c'est que l'acceptation de $H_0$ veut dire que le phénomène n'est pas significatif ou n'existe pas sous prétexte que si on l'accepte on conclue à l'importe significative du phénomène. C'est fondamentalement faux. Cela veut dire que des données que nous avons, il n'y a pas assez d'évidence, de preuve, pour conclure à l'importance significative du phénomène. Il faut vraiment insister sur cette notion et prendre les plus grandes précautions dans la formulation pour ne pas faire comprendre l'inverse ou donner une vision erronée de la chose (c'est à mon sens vraiment le point crucial de la chose).

Je n'ai aucune intention de te décourager, au contraire ! :)

Donc pour résumer ce qu'il faudrait faire :

  • insister sur le fait que ne pas rejeter H0 peut venir d'un manque de puissance du test, je pense le faire dans la partie "une overdose de test"
  • rappeler 2-3 notions probabilistes de bases
  • resituer le but dans l'introduction des stats inférentielles par rapport aux stats descriptives

ça doit pouvoir se faire. Merci des conseils :) !

+0 -0
Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte