Corrélation et causalité
Dans cet épisode nous allons nous interroger sur la différence entre corrélation et rapport de cause à effet
Dans cet épisode nous allons nous interroger sur la différence entre corrélation et rapport de cause à effet.
Savez-vous qu’il y a une corrélation de 99,79% entre les dépenses des Etats-Unis dans les domaines de la science, de l’espace et des technologies et les suicides par pendaison, strangulation et étouffement ?
Et une corrélation de 99,26% entre la consommation de margarine et le taux de divorce dans le Maine… ou de 97% entre la consommation de lait aux Etats-Unis et le taux de divorce en Alabama.
C’est ce que nous révèle un site Internet qui répertorie des « spurious correlations » ou des corrélations spécieuses… ou en d’autres termes des corrélations mathématiques qui, vous l’avez compris, ne doivent pas conduire à conclure à une relation de cause à effet. Mais alors, entre corrélation et rapport de causalité, c’est quoi l’histoire ?
Pour résumer l’histoire on peut prendre une image simple et parlante. J’ai constaté qu’à chaque fois que je sortais de chez moi, il pleuvait. Ça ne veut pas dire pour autant que je suis la cause de la pluie …
Non ça veut peut-être dire que tu n’as pas de bol ou que tu habites une région pluvieuse ou que tu n’aimes pas le soleil et que tu ne sors donc pas quand il fait beau.
Cet exemple montre simplement qu’établir un lien entre deux phénomènes, lien dont on peut parfois mesurer l’intensité avec un coefficient de corrélation, ne signifie pas nécessairement qu’il y a un lien de causalité entre eux.
En d’autres termes, montrer l’existence d’une relation mathématique entre 2 séries de données ne suffit pas à prouver que l’une est la cause de l’autre !
On peut prendre un exemple simple dans les Ressources Humaines. J’ai constaté dans mon entreprise un important turn-over subi sur les consultants de moins de 30 ans et ce taux augmente constamment depuis 5 ans.
Et dans le même temps je constate qu’on a significativement décroché sur les salaires par rapport à la concurrence sur cette tranche d’âge et là aussi de manière progressive et constante depuis 5 ans aussi.
De là à conclure rapidement qu’ils ou elles partent à cause d’une politique de rémunération insuffisamment compétitive, il n’y a qu’un pas qu’on peut franchir un peu trop vite.
En creusant les entretiens de départ on s’aperçoit toujours dans cet exemple qu’une bonne partie de celles et ceux qui ont démissionné fustigeaient l’absence de déontologie de leur manager qui se comporte en petit cow-boy du business …
Il y a là de quoi tempérer l’analyse sur les salaires, sans pour autant infirmer l’hypothèse. Bref, là encore, comme en toutes choses, il convient d’être prudent et de faire preuve d’esprit critique et de nuance dans l’analyse.
La confusion entre corrélation et causalité est une erreur malheureusement très fréquente qui témoigne en effet de la difficulté de l’interprétation des données statistiques que l’on observe.
Un peu à l’image de la souris qui court à côté d’un éléphant dans le désert et qui, en se retournant, s’étonne de la poussière qu’ils produisent tous les deux en courant ainsi, nos biais sont nombreux mais c’est un autre sujet.
Et ils constituent autant de raison de se tromper ! Ils sont de nature à tromper le regard que l’on porte sur un phénomène que l’on cherche à comprendre et expliquer.
Et en la matière, il faut même parfois accepter qu’il y a des réalités qui sont contre-intuitives. C’est par exemple ce que nous enseigne le paradoxe de Simpson qui, avec exactement les mêmes données, permet de formuler 2 conclusions opposées mais toutes les 2 justes selon la manière dont on les étudie.
Parfois les faits sont têtus et heurtent notre bon sens qui n’est donc pas toujours si… bon.
Interpréter c’est en effet faire preuve de discernement. Ainsi, une corrélation n’est qu’un indicateur qui nous invite à aller creuser pour comprendre. En l’occurrence exercer notre discernement pour interpréter ce que signifie cette corrélation, avant de conclure à une éventuelle relation de cause à effet.
En résumé, une corrélation entre deux phénomènes indique une probabilité de relation de cause à effet mais pas une certitude. Cette corrélation peut aussi être le fruit du hasard par exemple. Il faut donc étudier cette relation en profondeur pour le cas échéant conclure, ou non, à une relation de causalité entre les deux.
J’ai bon cheffe ?
Oui tu as bon mais on ne va pas en faire tout une histoire