L’inférence bayésienne vue par Nate Silver

Imprimer la pageImprimer la page || VERSION PDF: Enregistrer au format PDF

Nate Silver est un statisticien américain rendu célèbre par ses prédictions correctes de la réélection du Président Obama sur son blog FiveThirtyEight.

Dans son livre The Signal and the Noise, il présente l’inférence bayésienne de manière surprenante.

Supposons une jeune femme [que je vais baptiser Sophie] qui vit en couple avec son partenaire. Sophie revient d’un voyage d’affaires et découvre dans son armoire une petite culotte qui ne lui appartient pas. Elle se demande quelle est la probabilité que son partenaire la trompe.

La condition est d’avoir découvert la petite culotte. L’hypothèse qu’elle souhaite évaluer est la probabilité d’être trompée. Le théorème de Bayes permet de répondre à la question de Sophie.

- Il faut d’abord estimer la probabilité d’apparition de la petite culotte à condition que l’hypothèse soit vraie — dans le cas de Sophie, qu’elle soit trompée par son partenaire. Si celui-ci trompe Sophie, il est assez facile d’imaginer comment la petite culotte est parvenue dans l’armoire. Cependant, dans le cas où il trompe Sophie, on pourrait supposer qu’il est plus prudent. Attribuons 50% à la probabilité d’apparition de la petite culotte dans l’armoire à la condition qu’il trompe Sophie.

- Il faut ensuite estimer la probabilité d’apparition de la petite culotte dans l’armoire à condition que l’hypothèse soit fausse. Si le partenaire de Sophie ne la trompe pas, y a-t-il des explications plausibles de l’arrivée de la petite culotte dans l’armoire de Sophie ? Cela pourrait être un sous-vêtement à lui. Une autre jeune femme, avec qui il a une amitié platonique et en qui Sophie a confiance, aurait passé la nuit chez lui et la petite culotte serait parvenue dans l’armoire. La petite culotte pourrait être un cadeau destiné à Sophie, mais que le partenaire a oublié d’emballer. Aucune de ces théories n’est complètement invraisemblable mais chacune ressemble furieusement à une excuse du genre "Le chien a mangé mon devoir". Sophie décide d’estimer la probabilité à 5%.

- Il faut aussi disposer de ce que les bayésiens appellent la probabilité a priori. Quelle est la probabilité que Sophie attribue au fait que son partenaire la trompe avant qu’elle ait découvert la petite culotte ? Sophie a sans doute du mal à être objective, maintenant qu’elle a découvert cette petite culotte. Idéalement, elle aurait dû estimer cette probabilité avant cette découverte. Il est cependant possible d’établir cette estimation empiriquement. Des études ont montré qu’environ 4% des partenaires mariés trompent leur conjoint. C’est ce que nous choisirons comme probabilité a priori.

JPG - 152.7 ko

- Cliquer sur le tableau ci-dessus

Finalement la probabilité a posteriori (29%) est assez faible. Cela semble contre-intuitif. Cela provient du fait que Sophie a attribué une probabilité très faible à l’hypothèse a priori que son partenaire la trompe. Même si un partenaire innocent a moins d’explications plausibles pour l’apparition de la petite culotte dans l’armoire de Sophie qu’un partenaire coupable, Sophie a d’abord pensé que son partenaire était innocent et cela pèse fortement dans l’équation de Bayes.

Quand nos hypothèses a priori sont fortes, elles peuvent avoir une influence tout à fait déterminante face à de nouvelles évidences.


Pour aller plus loin :
- la conférence TED de Nate Silver : Does racism affect how you vote ? - Nate Silver
- le professeur Thomas Bruss (ULB) nous autorise à joindre son article à propos de Thomas Bayes, publié dans le Zentralblatt fuer Mathematik

Mis en ligne le 26 février 2013 par Charlotte BOUCKAERT