ga

** skip to content **

Mes fichiers [0]

Ce sont les fichiers que vous avez ajouté à votre collection.

  • ** cart_no_document_in_cart **

Pour ou contre P?

Tester les hypothèses a toujours été un élément fondamental de la recherche expérimentale qui fait partie intégrante de la recherche médicale également.

Sur le plan statistique, la définition technique de la valeur P sème la confusion chez nombre de chercheurs. Nous n’aborderons pas cette définition dans les détails ici, disons simplement que la valeur P dans un essai clinique comparatif et randomisé classique comparant les interventions A et B peut être vue comme la valeur, se situant entre 0 et 1, de la probabilité que l’une de deux hypothèses concurrentes s’avère fondée. Ces deux hypothèses concurrentes sont l’hypothèse nulle (selon laquelle il n’y a pas de différence entre A et B quant à l’efficacité clinique relative du point de vue du critère de jugement clinique adopté) et l’hypothèse alternative (indiquant qu’il y a une différence quelconque entre A et B).

La démarche classique de test d’hypothèses suppose la détermination du test statistique approprié qui évaluera le couple d’hypothèses. Ce test produit habituellement une valeur P, utilisée souvent par les chercheurs dans l’interprétation de leurs constatations. L’exercice du test d’hypothèses et la place des valeurs P font l’objet d’un débat de longue date. Les chercheurs, en se fixant en général comme objectif principal d’obtenir la signification statistique (établie habituellement lorsque la valeur P est inférieure à 0,05), perdent de vue le but premier qui est d’estimer la différence d’intérêt, et c’est là que ça devient problématique.

D’abord, dans l’optique de l’exercice courant du test d’hypothèses, la question de savoir si le taux de réponse est exactement le même dans le groupe de patients soumis à l’intervention A et dans le groupe de patients ayant subi l’intervention B (comme le veut l’hypothèse nulle) est une question dont la réponse est en somme connue avant même de commencer : c’est « non », étant donné que la probabilité que la réponse soit identique dans les deux groupes est infinitésimale.

La question pertinente à poser compte tenu de son importance clinique est celle de savoir si les taux de réponse, celui dans le groupe A et celui dans le groupe B, sont suffisamment différents. Quant au fait de s’en remettre aux valeurs P, celles-ci indiquent seulement que la différence entre A et B n’est pas de zéro; cette information revêt moins d’intérêt que l’estimation de l’ampleur de la différence, information beaucoup plus utile dans l’interprétation clinique. 

Quand seules les valeurs P sont présentes, le lecteur n’a pas de précision sur l’ampleur de la différence entre la réponse clinique du groupe A et celle du groupe B, il ne sait pas la direction qu’emprunte la différence entre A et B, et il départage les résultats « importants » des résultats « sans importance » sur la seule foi du seuil courant (habituellement 0,05) d’une façon simpliste qui risque de fausser l’interprétation des résultats.

En outre, la taille de l’échantillon de l’étude exerce une grande influence sur les valeurs P. L’étude comptant un grand nombre de patients pourra déboucher sur des valeurs P indicatrices d’une différence statistiquement significative entre A et B, mais négligeable en pratique clinique. À l’opposé, l’étude avec un échantillon de petite taille peut cerner des différences d’importance clinique, qui ne franchiront pas le seuil de la signification statistique d’après la valeur P en raison du petit nombre de participants ou d’autres aspects.

Des revues scientifiques de renom ont proposé à de multiples reprises de remplacer les valeurs P dans l’interprétation des résultats de la recherche par les intervalles de confiance. L’intervalle de confiance illustre l’ampleur de la différence, telle qu’il est mentionné ci-dessus; il s’accompagne de « l’estimation la plus juste possible » de la différence entre A et B et offre une gamme de valeurs plausibles englobant la valeur réelle de A et celle de B.

Ce choix rend possible l’interprétation clinique des résultats sans priver le lecteur de l’information pertinente. La direction de l’effet est tout de suite évidente, et l’importance des résultats ne se détermine plus par un « oui » ou un « non », mais bien par l’examen approfondi des données. Ces avantages favorisent la transparence dans la présentation des constatations cliniques qui sont celles qui revêtent le plus d’intérêt pour les professionnels de la santé, et amènent les chercheurs à interpréter de plus en plus judicieusement leurs résultats.

Confidence intervals rather than P values: estimation rather than hypothesis testing. Gardner MJ, Altman DG. BMJ(1986); 292: 746-750.

Confidence interval or p-value? Du Prel JB, Hommel G, Rohrig B, Blettner M. Dtsch Arztebl Int 2009; 106(19): 335–9.

P values: what they are and what they are not. Schervish MJ. Am Stat 1996;50(3):203-6.

That confounded p-value.  Lang JM, Rothman KJ, Cann CI. Epidemiology 1998;9(1):7-8.