P<0,05 OU COMMENT CRIER VICTOIRE TROP TÔT

Cet article est écrit en réaction à un post publié par David Louapre (Science étonnante).

Pourquoi, sur les résultats d’études scientifiques relayé par les médias, on entend tout et son contraire ?
Les mathématiques statistiques ne sont vraies qu’une fois sur deux ?

L’ultra norme de la différence significative si p-value < 5%

Lorsqu’on applique un test statistique entre deux observations, on s’intéresse surtout à la p-value. Si on a mené une étude avec des sujets pendant une certaine période, on a qu’une envie. L’envie de montrer l’impact significatif d’un phénomène sur un autre.

En effet, selon les tests paramétriques classiques des outils de statistique, une valeur de p inférieur à 5 % indique le phénomène est significatif. Cela signifie qu’en obtenant 4,99 %, on peut chanter à la gloire du statisticien et à 5,01 %, on le renie ?

Cette « dictature du petit p », si bien décrit dans l’article de notre ami, peut mener à bien des soucis. D’après un statisticien américain, près de 25 % des résultats publiés seraient faux.

Mais alors quelles sont les alternatives ?

Une solution à ce problème serait de baisser ce seuil de tolérance d’acceptation de différence significative. De manière à ce que même si nous répétons l’expérience n fois, on obtient toujours cette valeur de p bien inférieur à 5 %.

Les médias n’aident pas non plus à la bonne communication de l’étude. En effet, l’article, pour toujours et attirer l’attention du public doit avoir un titre ou une tournure un peu exagérer, qui sort de l’ordinaire et aspire la méfiance. Ce qui peut amener à déformer le message de l’étude. De plus, les relais médiatiques sont rarement des scientifiques. La confusion de corrélation et causalité est aussi que l’amalgame peut s’avérer très faux.

Pour rappel, la corrélation et le lien d’une variable avec une autre, elle peut être négative et positive et est comprise entre -1 et 1. La droite d’équation de corrélation est de type affine : y = ax + b.

La causalité, elle définit n’est pas un principe mathématique pur, mais signifie juste la cause d’un phénomène dû à un autre. Seule une étude sur des échantillons appariés permet de mettre une lumière une causalité.

Soyez donc très attentif la prochaine fois que sur votre fil d’actualité vous voyez une phrase résumant le cas d’une étude et ne criez pas victoire trop vite après une p-value obtenue de 4,95 %. 

J’espère que cet article vous a plu n’hésitez donc pas à aller checker le post qui de David qui m’a inspiré: ici.

Publié par

Louis Aldebert

Je suis Louis Aldebert, ingénieur informatique et mathématiques appliquées. J'ai toujours aimé les mathématiques et c'est certainement cela qui m'a amené à étudier à la Sorbonne. Où j'ai eu la chance d'étudier les statistiques avec R et Python. Je travaille maintenant pour une assurance où je réalise les modèles statistiques et probabilistes. J'ai eu l'idée de ce blog suite à des personnes qui m'ont contacté en rapport avec leur statistiques de mémoire. Je me suis alors lancé pour mission de créer un outil permettant aux personnes de tester simplement leur données sans travailler en rond pendant des heures leur cours de stats. N'hésitez pas à aller voir le site: https://plizdomystatz.shinyapps.io/PlizDoMyStatz/ et à me faire vos retours ! :) À bientôt sur mon blog les amis !

Répondre

Choisissez une méthode de connexion pour poster votre commentaire:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Google

Vous commentez à l'aide de votre compte Google. Déconnexion /  Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s