L'approche bayesienne

Discussions libres mais portant sur le thème général de la déplétion.

Modérateurs : Rod, Modérateurs

Avatar de l’utilisateur
GillesH38
Hydrogène
Hydrogène
Messages : 27336
Inscription : 10 sept. 2005, 17:07
Localisation : Berceau de la Houille Blanche !
Contact :

L'approche bayesienne

Message par GillesH38 » 07 mai 2021, 08:35

Bonjour

dans la partie discussion libre, j'aimerais exposer et lancer une discussion sur l'approche bayesienne. Personnellement j'ai réalisé assez récemment à quel point c'était fondamental de comprendre cette approche quand on parle des différents avis et théories qu'on se fait sur le monde, parce qu'en réalité ce qui est au départ une théorie mathématique un peu absconse décrit le fonctionnement général du cerveau et la formation des croyances, et est par exemple la base de l'intelligence artificielle. On peut même dire que l'emploi correct de cette approche peut etre prise comme une définition de la "rationalité". Donc elle concerne toutes les discussions sur tous les sujets où des avis différents s'expriment ... ce qui est en fait toutes les discussions quoi :). Si on a des avis différents sur l'effondrement, les réserves de pétrole, l'astrologie, le climat, les vaccins, etc... c'est qu'on applique différemment des formules de Bayes, comme je vais tenter d'expliquer.


La théorie de Bayes est une partie de la théorie des probabilités qui prend le problème un peu inverse de celui qui est traité habituellement par l'approche "fréquentiste" . Dans la théorie des probabilités, on se donne une loi de probabilité supposée parfaitement connue et on calcule avec ça la probabilité d''occurence de certains faits X (par exemple : si on a un dé parfaitement équilibré et qu'on le lance 3 fois de suite, quelle est la probabilité d'obtenir 3 fois un chiffre pair ? la réponse est 1/8e , mais on a supposé que le dé soit parfaitement équilibré.

. Dans l'approche de Bayes, on fait le contraire : on part de l'existence de faits X connus et on essaie d'en déduire la "probabilité", qui est plutot une "vraisemblance" des théories. Autrement dit on construit une théorie du monde à partir de faits. Un exemple serait plutot : on lance 3 fois le dé et on trouve 3 fois un chiffre pair, quelle est la probabilité qu'il soit parfaitement équilibré ?

Les études du cerveau montrent que c'est comme ça que le cerveau fonctionne "naturellement", il passe son temps à échafauder des théories du réel à partir de faits connus. Attention le "fait" peut etre simplement : il y a une video sur le net qui dit ça. C'est un fait attesté, que la video ait raison ou pas. Savoir si elle est juste ou pas, c'est déjà une théorie. Autrement dit le fait de supposer que les faits relatés par la video sont justes est déjà l'application d'une théorie de Bayes.

Mathématiquement, la théorie de Bayes ne permet pas de calculer la vraisemblance des théories à partir des faits. Elle calcule la VARIATION de probabilité lorsque qu'on incorpore un nouveau fait. Mais pour ça elle a besoin d'avoir une probabilité "initiale" , qu'on appelle un "prior" , et elle donne la formule qu'il faut utiliser pour modifier ce prior quand on constate un fait X .

Pour ne pas faire trop long j'arrête la et j'écris la suite dans un nouveau post.
Zan, zendegi, azadi. Il parait que " je propage la haine du Hamas".

Avatar de l’utilisateur
GillesH38
Hydrogène
Hydrogène
Messages : 27336
Inscription : 10 sept. 2005, 17:07
Localisation : Berceau de la Houille Blanche !
Contact :

Re: L'approche bayesienne

Message par GillesH38 » 07 mai 2021, 08:52

La formule de Bayes permet de calculer une probabilité du genre "quelle est la probabilité qu'une hypothèse A soit juste étant donné qu'on a constaté un fait X". Par exemple vous partez de chez vous en oubliant parfois de fermer la fenêtre du garage, une fois sur 3. Vous sortez le chat chaque fois que vous partez, mais vous avez constaté que quand vous laissez la fenêtre du garage ouverte , vous retrouvez le chat dans la maison une fois sur deux. Alors que quand elle est fermée, ça n'arrive qu'une fois sur 10, parce qu'il trouve parfois une autre façon de rentrer (quelqu'un d'autre de la famille est rentré plus tôt et lui a ouvert par exemple, mais ça n'arrive pas souvent).

Vous rentrez un soir chez vous et vous constatez que le chat est là. Quelle est la probabilité que vous ayez laissé la fenêtre du garage ouverte ? On voit que c'est du type de ce que je disais plus haut, au lieu de calculer la probabilité d'un fait, si une hypothèse est connue (ce qui est le cas des probabilités ci-dessus) , on calcule cette fois la probabilité d'une hypothèse si un fait est connu.

Mais en fait tout ça est lié par la formule de Bayes. Si on note p(A) la probabilité d'un fait ou d'une hypothèse, et p(A|B) la probabilité de l'hypothèse A dans le cas où l'hypothèse B est vérifiée, la théorie des probabilités permet d'écrire de deux façons différentes la probabilité que A soit vraie ET qu'un fait X soit constaté

p(A et X) = p(A) p(X|A) = p(X) p(A|X]

cette formule exprime simplement que pour dire que A et X soient tous les deux vrais en même temps, vous pouvez soit dire que A doit etre vrai et que X doit etre aussi vrai sachant que A est vrai, ou que X doit etre vrai et que A doit aussi etre vrai sachant que X est vrai. C'est symétrique et équivalent.

Mais cette formule permet donc de calculer que la probabilité qu'une hypothèse A soit vraie si X est vraie p(A|X) est égale à
p(A|X) = p(A) p(X|A) / p(X)

c'est la formule fondamentale de Bayes. Elle permet de répondre à la question précédente. Si A = l'hypothèse que la fenêtre est ouverte, et X est = le chat est dans la maison, on a

p(A) = 1/3 (vous laissez la fenêtre ouverte une fois sur 3

p(X|A) = 1/2 (quand vous laissez la fenêtre ouverte , le chat est la une fois sur deux)

p(X) = c'est la plus compliquée, c'est la probabilité totale que le chat soit là, qui est la somme des probabilités suivant que la fenêtre est ouverte ou pas. En tenant compte des deux cas p(X) = 1/3*1/2 + 2/3 * 1/10 = 1/6 +, 2/30 = 5/30 +2/30 = 7/30.

du coup la réponse est p(A|X ) = 1/3 * 1/2 / (7/30) = 5/7 = 71 % environ. La probabilité que la fenêtre soit ouverte a été "réévaluée" à 70 % alors qu'initialement elle n'était que de 33 %, par le fait que le chat était là.
Zan, zendegi, azadi. Il parait que " je propage la haine du Hamas".

Avatar de l’utilisateur
GillesH38
Hydrogène
Hydrogène
Messages : 27336
Inscription : 10 sept. 2005, 17:07
Localisation : Berceau de la Houille Blanche !
Contact :

Re: L'approche bayesienne

Message par GillesH38 » 07 mai 2021, 08:57

j'écrirai la suite plus tard ...
Zan, zendegi, azadi. Il parait que " je propage la haine du Hamas".

Avatar de l’utilisateur
LeLama
Hydrogène
Hydrogène
Messages : 4604
Inscription : 08 août 2006, 23:12
Localisation : Angers, France
Contact :

Re: L'approche bayesienne

Message par LeLama » 07 mai 2021, 10:55

GillesH38 a écrit :
07 mai 2021, 08:57
j'écrirai la suite plus tard ...


Une question a laquelle tu pourras repondre au milieu de ta redaction: est-ce une simple analogie, ou est-ce qu'on a des exemples vraiment modelisés et cohérents, avec des chiffrages ? Parce que j'ai toujours cru que c'etait le genre d'explication un peu scientiste qui mettait un vocabulaire sophistiqué et mathematique pour dire en fait qu'on integre une theorie plus ou moins dans notre cerveau, en fonction du degré de coherence avec les informations passée, ce qui est une evidence. Tous les litteraires savent ça depuis longtemps. Par exemple, Saint-Exupery écrit que "La mue est douloureuse" pour signifier combien il est difficile de passer d'un systeme de pensee cohérent à un autre système de pensée.

Apres, je comprends que ca puisse néanmoins permette de decrire le meme phenomene avec des mots qui parlent davantage a un scientifique, mais je me demande s'il y a plus qu'une analogie formalisee en termes scientifiques ?

Il y a d'autres cas ou pour ma part j'utilise ce genre d'analogies scientifiques, tout en sachant que ca ne vaut pas forcement tripette, mais parce que ca m'aide a avancer ( toujours l'idee que la seule valeur d'un savoir est qu'il soit operatoire). Par exemple, a force d'ecouter le piano ( que j'ai commencé tres adulte apres 40 ans), j'entends maintenant plein de sons tres distincts là ou j'entendais auparavant une masse sonore informe. On sait qu'on peut faire des analyses sonores differentes en fonction de la fenetre temporelle choisie pour la transformee de Fourier et du filtre qu'on applique. Mon impression est que le cerveau a force d'ecouter est capable de mettre en place differentes transformées de Fourier et filtre, de les doser, tout comme on dose notre force pour lancer un objet. C'est operatoire au sens ou cette croyance m'incite a davantage de travail de perception, plutôt que davantage de travail d'habileté mécanique dans les doigts. Mais je considere que c'est une simple analogie, et je ne dirais pas vraiment que le cerveau fait ca. C'est juste mon chemin a moi, parce que je connais un peu de theorie du signal et qu'il m'est facile de penser dans ce contexte. Mais je crois que des personnes non scientifiques peuvent aboutir a la meme conclusion de l'importance de la perception par des chemins differents, tout comme Saint Exupery qui comprend bien sans analogie bayesienne que la pensee s'inscrit dans un cadre de croyances passées et d'habitudes.

Avatar de l’utilisateur
GillesH38
Hydrogène
Hydrogène
Messages : 27336
Inscription : 10 sept. 2005, 17:07
Localisation : Berceau de la Houille Blanche !
Contact :

Re: L'approche bayesienne

Message par GillesH38 » 07 mai 2021, 12:03

LeLama a écrit :
07 mai 2021, 10:55
GillesH38 a écrit :
07 mai 2021, 08:57
j'écrirai la suite plus tard ...


Une question a laquelle tu pourras repondre au milieu de ta redaction: est-ce une simple analogie, ou est-ce qu'on a des exemples vraiment modelisés et cohérents, avec des chiffrages ? Parce que j'ai toujours cru que c'etait le genre d'explication un peu scientiste qui mettait un vocabulaire sophistiqué et mathematique pour dire en fait qu'on integre une theorie plus ou moins dans notre cerveau, en fonction du degré de coherence avec les informations passée, ce qui est une evidence. Tous les litteraires savent ça depuis longtemps. Par exemple, Saint-Exupery écrit que "La mue est douloureuse" pour signifier combien il est difficile de passer d'un systeme de pensee cohérent à un autre système de pensée.
j'expose d'abord la théorie, et après je dirai en quoi je considère que c'est pertinent pour comprendre les discussions, et en particulier pourquoi les gens ne sont pas d'accord sur les conclusions à tirer à partir des mêmes faits. L'idée générale est que la quantification précise de ces probabilités est bien sur souvent impossible ou entachée de grosses incertitudes, mais que le mécanisme mental est le même pour tout le monde, simplement les gens diffèrent dans son application, et c'est interessant de voir le genre d'erreurs de raisonnement qu'on fait souvent quand on applique cette méthode, consciemment ou inconsciemment.
Zan, zendegi, azadi. Il parait que " je propage la haine du Hamas".

Avatar de l’utilisateur
GillesH38
Hydrogène
Hydrogène
Messages : 27336
Inscription : 10 sept. 2005, 17:07
Localisation : Berceau de la Houille Blanche !
Contact :

Re: L'approche bayesienne

Message par GillesH38 » 07 mai 2021, 12:08

suite donc ...


la "réévaluation bayesienne" qui permet de changer une estimation d'une probabilité avant d'avoir constaté un fait X (le "prior p(A) " ) , en une probabilité réévaluée après avoir constaté le fait X , p(A|X) prend une forme particulièrement éclairante si on considère plutot le rapport de la probabilité que A soit vraie à celle qu'elle soit fausse

f(A) = p (A) / p (non A) = p(A) / (1- p(A) )

contrairement à p(A) qui varie de 0 à 1, f(A) varie de 0 à l'infini. La formule de Bayes montre qu'on peut écrire

f(A|X) = f(A) * p (X|A) / p(X|non A)

ce qui montre que f(A) est juste multipliée par un facteur qui est simplement le rapport des probabilités que l'évènement X arrive dans l'hypothèse où A est vraie, à celui qu'il arrive dans l'hypothèse où A est fausse.

On comprend très bien le sens de cette formule : si X a la même chance d'arriver que A soit vraie ou fausse, le fait de constater X ne change pas l'évaluation de A.

Si en revanche il a plus de chance d'arriver si A est vrai que si A est faux, il revalorise l'hypothèse A (comme dans l'exemple du chat). C'est très naturel.

On peut encore faire mieux en considérant une quantité qu'on appelle "l'évidence" qui est le logarithme de f

E(A) = ln (f) = ln[ p(A) / 1-p(A) ]

ceux qui connaissent les propriétés du logarithme voient que l'évidence varie entre - l'infini et + l'infini , donc peut prendre n'importe quelle valeur réelle. Elle mesure la confiance qu'on donne à l'hypothèse A sur un axe allant de - l'infini à plus l'infini.

E= 0 correspond à p(A) = 1- p(A) = 1/2, autrement dit aucune information sur A, c'est aussi probable que A soit vraie que fausse

E> 0 signifie A plus probablement vrai que fausse, et plus E est grand plus la confiance en A est grande. E infinie signifie une certitude absolue que A soit vraie. Inversement E< 0 signifie A plus vraisemblablement fausse que vraie, et E = - l'infini signifie une certitude que A soit fausse.

La formule de Bayes montre que E(A|X) = E(A) + ∆E où ∆E est appelée la "translation d'évidence" , qui vaut mathématiquement ln (p(X|A) /p(X|non A) ) . Ca donne une image particulièrement simple de ce que produit la constatation d'un nouveau fait X . En quelque sorte il "déplace le curseur" de notre confiance en l'hypothèse A, sur une échelle allant de - l'infini à + l'infini. On part d'une évidence initiale E(A) , et un fait X va "bouger " cette évidence de ∆E.

on peut se le représenter mentalement assez simplement comme le déplacement d'un curseur sur une échelle d'évidence, translation se faisant suivant le ∆E, qui dépend de l'estimation de la probabilité que X se produise dans le cas A et dans le cas non(A). Plus les probabilités sont différentes, plus cette translation est grande

On peut le représenter comme ça graphiquement

Image

il y a déjà des choses intéressantes à dire en regardant ce graphique ...
Zan, zendegi, azadi. Il parait que " je propage la haine du Hamas".

Avatar de l’utilisateur
GillesH38
Hydrogène
Hydrogène
Messages : 27336
Inscription : 10 sept. 2005, 17:07
Localisation : Berceau de la Houille Blanche !
Contact :

Re: L'approche bayesienne

Message par GillesH38 » 07 mai 2021, 12:40

le graphique ci-dessus montre bien que l'estimation de la vraisemblance de A après avoir constaté X dépend de deux choses :

* du prior qu'on met à l'hypothèse A

* de la translation d'évidence qu'on estime ∆E

évidemment si des individus donnent des valeurs différentes à ces deux quantités, leurs conclusions seront différentes...

L'importance du prior peut être illustré par exemple par cette planche humoristique tirée du site xkcd qui donnent des illustrations assez drôles des théories scientifiques et des biais de raisonnement : c'est les "fréquentistes contre les bayesiens"

https://xkcd.com/1132/

Image

traduction :

Le Soleil a-t-il explosé en nova ? (il fait nuit, donc on n'est pas sur)


cette machine est équipée d'un détecteur de neutrinos capable de dire si le Soleil a explosé en nova . ensuite elle tire deux dés, et si elle tombe sur un double 6, elle ment, sinon elle dit la vérité .

Essayons .."Détecteur, est ce que le soleil a explosé en nova ? "

La machine : "rrrrr... oui !"

Fréquentiste : il y a une chance sur 36 que la machine mente, soit moins de 5 %. Donc on peut affirmer à 95 % que le Soleil a explosé.

Bayesien : je te parie 50 $ que non.

Évidemment c'est le Bayesien qui a raison : parce qu'en fait ce que dit le résultat de la machine, c'est que l'hypothèse que le Soleil a explosé doit etre réévaluée par un facteur 35 environ. Mais la physique connue nous dit que c'est tout à fait impossible qu'il explose, avec une probabilité bien moins que 1/35 ! donc le prior est extrêmement faible, l'évidence est presque moins l'infini initialement (il faudrait que toute la physique stellaire soit fausse ...). revaloriser par un facteur 35 ne change pas la conclusion : il reste bien plus probable que le Soleil n'a PAS explosé et que par hasard on est tombé sur un double 6 !!


Donc le prior est important. Si il est très faible initialement, il faut une très grande translation d'évidence pour la ramener au-dessus de zéro. C'est la traduction rigoureuse de "extraordinary claims require extraordinary evidence" : des affirmations extraordinaires exigent des preuves extraordinaires.
Zan, zendegi, azadi. Il parait que " je propage la haine du Hamas".

Avatar de l’utilisateur
GillesH38
Hydrogène
Hydrogène
Messages : 27336
Inscription : 10 sept. 2005, 17:07
Localisation : Berceau de la Houille Blanche !
Contact :

Re: L'approche bayesienne

Message par GillesH38 » 07 mai 2021, 13:06

Une deuxième remarque porte sur la translation d'évidence ∆E = ln ( p(X|A)/p(X|non A) )

Il est fondamental de comprendre que cette translation d'évidence (qui est ce qui fait "changer d'opinion" ) , c'est que ça dépend du rapport de la probabilité que X se produise si A est vrai à celui de la probabilité que X se produise si A est fausse.

Attention ces probabilités ne sont nullement complémentaires , au sens qu'elles seraient anticorrélées. On a bien p(A) + p (non A) = 1, donc si l'une est grande, l'autre est petite. En revanche rien ne lie p(X|A) et p(X|non A) elles peuvent très bien etre toutes les deux grandes ou meme égales à 1, ou toutes les deux petites et même égales à zéro. Mais on voit que pour avoir une grande translation d'évidence il faut qu'elles soient TRES DIFFERENTES.

Mais ça exige aussi qu'il faut qu'une des deux soit TRES PETITE. Plus spécifiquement pour que X "prouve" l'hypothèse A , il ne suffit pas que X soit tres probable d'arriver si A est juste. Il faut aussi que X soit très improbable si A est fausse.

C'est tres souvent ce qui est oublié dans les raisonnements : on se focalise sur une hypothèse A à partir d'un fait X en justifiant seulement que si A était vrai, X aurait de grandes chances de se produire. Ca ne suffit pas, il faut justifier aussi que X est très improbable si A est fausse. Si X ne peut pas faire de grande différence entre A et non A, alors la translation d'évidence est faible, et X ne peut pas être utilisé comme "preuve".

Exemple : on trouve une tache de sang de la petite Maylis dans le coffre de la voiture de Nordahl Lelandais. Ca prouve quasiment qu'il est coupable, non pas parce que c'est très probable qu'il y ait une tache de sang dans le coffre si il la tuée (ça ne l'est pas), mais parce que c'est très improbable qu'elle s'y trouve si il ne l'a pas tuée. Les preuves les plus fortes sont des preuves "en creux", qui sont fondé non pas sur la probabilité que les faits arrivent dans l'hypothèse qu'on veut prouver, mais sur l'improbabilité qu'ils arrivent si elle est fausse.
Zan, zendegi, azadi. Il parait que " je propage la haine du Hamas".

sceptique
Hydrogène
Hydrogène
Messages : 6616
Inscription : 21 nov. 2005, 17:42
Localisation : versailles

Re: L'approche bayesienne

Message par sceptique » 07 mai 2021, 17:17

Intéressant tout cela. En tout cas plus facile à digérer que mes cours datant de plus de 50 ans... Quoique encore bien trapu.

Avatar de l’utilisateur
GillesH38
Hydrogène
Hydrogène
Messages : 27336
Inscription : 10 sept. 2005, 17:07
Localisation : Berceau de la Houille Blanche !
Contact :

Re: L'approche bayesienne

Message par GillesH38 » 07 mai 2021, 20:41

sceptique a écrit :
07 mai 2021, 17:17
Intéressant tout cela. En tout cas plus facile à digérer que mes cours datant de plus de 50 ans... Quoique encore bien trapu.
merci, j'essaye d'être le plus simple possible, c'est pas pour faire un cours technique de comment on calcule une probabilité bayesienne , juste pour réfléchir sur "comment on pense" ;).

De fait les neurologues modernes comme Stanislas Dehaene développent l'idée que le cerveau marche par réévaluations bayesiennes continuelles. Pour répondre au Lama, c'est pas un truc "exotique" ou "artificiel", c'est comme ça qu'on traite l"information en permanence. Si avant de sortir vous jetez un coup d'oeil par la fenêtre et que vous voyez des nuages, vous prenez un vêtement de pluie parce que vous avez réévalué l'hypothèse qu'il pourrait pleuvoir. Si vous traversez la rue et que vous entendez un crissement de pneus, vous allez vous jeter en arrière car même sans l'avoir vue, vous réévaluez l'hypothèse qu'une voiture est près de vous écraser. La réévaluation bayesienne est une condition de notre survie, car nous devons continuellement faire des hypothèses sur ce qu'il risque de se passer et évaluer leur probabilité.

Tous les avis que vous exprimez, que vous avez sur les choses, toutes les théories qu'elles soient justifiées ou pas, viennent de réévaluations bayesiennes provenant d'informations sensorielles, qui conduisent à vous demander, consciemment ou inconsciemment "quel est la probabilité que ce que j'ai observé arrive dans l'hypothèse où A est vraie ou A est fausse" ?

De même les IA ne peuvent fonctionner que par réévaluations bayesiennes. Une voiture autonome doit constamment évaluer si ce qu'elle détecte autour d'elle est quelque chose qui mérite de s'arrêter (un passant ) ou d'inoffensif (un tas de feuilles mortes). Tous les logiciels d'IA utilisent des inférences bayesiennes alimentées par les probabilités déduites des observations.

En fait on peut définir la rationalité comme l'évaluation correcte des probabilités bayesiennes. Toute mauvaise évaluation est un biais qui fait s'écarter du comportement le plus rationnel possible. Du coup les différences d'avis et de comportements entre individus peuvent être attribués à des différences d'application des réévaluations bayesiennes. C'est particulièrement apparent avec les théories complotistes: par exemple celles qui prétendent que l'homme n'est jamais allé sur la Lune parce qu'ils "surinterprètent" des images et concluent que "c'est très improbable que le drapeau ne retombe pas si ils étaient sur la Lune car il n'y a pas d'atmosphère" (alors que le drapeau est rigide pour donner l'impression de flotter t donc ce n'est pas improbable du tout). Ou "c'est très improbable que les tours du 11 septembre soient tombées comme ça si il n'y avait pas eu des explosifs à l'intérieur" (alors qu'en réalité ils ne savent pas évaluer cette probabilité) etc ...
Zan, zendegi, azadi. Il parait que " je propage la haine du Hamas".

Avatar de l’utilisateur
LeLama
Hydrogène
Hydrogène
Messages : 4604
Inscription : 08 août 2006, 23:12
Localisation : Angers, France
Contact :

Re: L'approche bayesienne

Message par LeLama » 07 mai 2021, 21:50

GillesH38 a écrit :
07 mai 2021, 20:41
Pour répondre au Lama, c'est pas un truc "exotique" ou "artificiel", c'est comme ça qu'on traite l"information en permanence.
Ca ne repond pas a ma question. Ma question, c'est: est ce que t'a une experience precise formalisée qui montre que c'est exactement comme ca, avec des probas qu'on peut evaluer et qui sont constantes sur des groupes de populations bien definis ? Ca m'a l'air juste une heuristique, interessante, mais pas du tout scientifique.

Si y'a rien de precisément formalisable, je pense que la pensée litteraire, avec ses nuances, est bien plus subtile que ce modele probabiliste grossier.

Avatar de l’utilisateur
kercoz
Hydrogène
Hydrogène
Messages : 12971
Inscription : 18 nov. 2007, 21:46
Localisation : SUD GIRONDE GRAVE DE GRAVE

Re: L'approche bayesienne

Message par kercoz » 07 mai 2021, 22:25

Sur Wiki, j'ai trouvé ça....je n'ai pas tout compris et n'ai pas le temps de m' y pencher, mais ça me semble inquiétant:
""""""https://fr.wikipedia.org/wiki/Th%C3%A9o ... e_de_Bayes""""

« Faux positifs » médicaux
Article détaillé : Faux positif.

Les faux positifs sont une difficulté inhérente à tous les tests : aucun test n’est parfait. Parfois, le résultat sera positif à tort, ce que l’on nomme parfois risque du premier ordre ou risque alpha.

Par exemple, quand on teste une personne pour savoir si elle est infectée par une maladie, il y a un risque, généralement infime, que le résultat soit positif, alors que le patient n’a pas contracté la maladie. Le problème alors n’est pas de mesurer ce risque dans l’absolu (avant de procéder au test), il faut encore déterminer la probabilité qu’un test positif le soit à tort. Nous allons montrer comment, dans le cas d’une maladie très rare, le même test, par ailleurs très fiable, peut aboutir à une nette majorité de positifs illégitimes.

Imaginons un test extrêmement fiable :

si un patient a contracté la maladie, le test le fait remarquer, c’est-à-dire est positif, presque systématiquement, 99 % des fois, soit avec une probabilité 0,99 ;
si un patient est sain, le test est correct, c’est-à-dire négatif dans 95 % des cas, soit avec une probabilité 0,95.

Imaginons que la maladie ne touche qu’une personne sur mille, soit avec une probabilité 0,001. Cela peut paraître peu, mais dans le cas d’une maladie mortelle, c’est considérable. Nous avons toutes les informations nécessaires pour déterminer la probabilité qu’un test soit positif à tort, ce qui peut causer un surdiagnostic.

Désignons par A l’événement « Le patient a contracté la maladie » et par B l’événement « Le test est positif ». La seconde forme du théorème de Bayes dans le cas discret donne alors :

P ( A | B ) = P ( B | A ) P ( A ) P ( B | A ) P ( A ) + P ( B | A ¯ ) P ( A ¯ ) = 0 , 99 × 0,001 0 , 99 × 0,001 + 0 , 05 × 0,999 ≈ 0,019. {\displaystyle \mathbf {P} (A|B)={\frac {P(B|A)P(A)}{P(B|A)P(A)+P(B|{\bar {A}})P({\bar {A}})}}={\frac {0{,}99\times 0{,}001}{0{,}99\times 0{,}001+0{,}05\times 0{,}999}}\approx 0{,}019.} {\displaystyle \mathbf {P} (A|B)={\frac {P(B|A)P(A)}{P(B|A)P(A)+P(B|{\bar {A}})P({\bar {A}})}}={\frac {0{,}99\times 0{,}001}{0{,}99\times 0{,}001+0{,}05\times 0{,}999}}\approx 0{,}019.}

Traduit en langage courant, cette équation signifie que « la probabilité que le patient ait réellement contracté la maladie, quand le test est positif, n'est que de 1,9 % ». Sachant que le test est positif, la probabilité que le patient soit sain vaut donc environ : (1 − 0,019) = 0,981. Du fait du très petit nombre de malades, en effet,

pratiquement tous les malades présentent un test positif, mais aussi
pratiquement tous les tests positifs désignent des personnes saines.

Si le traitement est très lourd, coûteux ou dangereux pour un patient sain, il peut être alors opportun de faire subir, à tous les patients positifs, un test complémentaire (qui sera sans doute plus précis et plus coûteux, le premier test n’ayant servi qu’à écarter les cas les plus évidents).

On a tout de même réussi, avec le premier test, à isoler une population vingt fois moindre, qui contient pratiquement tous les malades. En effet, en enlevant les patients dont le test est négatif et qui sont donc supposés sains, on a ramené le rapport des malades sur la population étudiée d'un individu sur mille à un individu sur cinquante (P(A|B) est proche de 1/50). En procédant à d’autres tests, on peut espérer améliorer la fiabilité de la détection.

Le théorème de Bayes nous montre que dans le cas d’une probabilité faible de la maladie recherchée, le risque d’être déclaré positif à tort a un impact très fort sur la fiabilité. Le dépistage d'une maladie rare, telle que le cancer, peut causer le surdiagnostic.

Cette erreur intuitive, commune, d'estimation est un biais cognitif appelé "oubli de la fréquence de base"[réf. nécessaire].
L'Homme succombera tué par l'excès de ce qu'il appelle la civilisation. ( Jean Henri Fabre / Souvenirs Entomologiques)

Avatar de l’utilisateur
LeLama
Hydrogène
Hydrogène
Messages : 4604
Inscription : 08 août 2006, 23:12
Localisation : Angers, France
Contact :

Re: L'approche bayesienne

Message par LeLama » 07 mai 2021, 22:51

GillesH38 a écrit :
07 mai 2021, 20:41
En fait on peut définir la rationalité comme l'évaluation correcte des probabilités bayesiennes.
Comme il n'y a pas moyen de le verifier, c'est une definition creuse selon moi. Une definition doit etre operatoire, au moins dans certains cas.

Tout ca me semble terriblement capillotracté. Plein de choses qui se passent dans la vraie vie sont oubliées ( notion de volonté, de peur, d'affect, de temps, de stratégie pour se protéger....). Et a l'inverse, on presente des exemples deconnants pour savoir si le soleil a explosé en nova avec une machine qui ment ](*,) Je dois avouer que pedagogiquement, je lutte contre ces pseudo-modeles qui donnent l'impression aux etudiants qu'on peut ecrire n'importe quoi sans se demander si c'est conforme au reel. Je pense que la pseudo-science qui est publiée dans les grandes revues avec les modeles a mille variables vient en partie de cette formation. On ecrit des modeles idiots et capillotractés en faisant semblant qu'ils nous disent qq chose du monde.

A l'inverse, la (bonne) modelisation est une discipline tres difficile et ancree dans le réel. Il faut bien peser le pour et le contre, choisir une formalisation qui nous permet d'avoir des donnees accessibles dans la litterature, esperer que le choix du modele ne dénature pas trop la réalité... Souvent, pas de choses tres difficiles sur le plan formel. La difficulté est dans le bon dosage de la pertinence et de la calculabilité du modele. Le modele que tu proposes me semble tres loin des qualités que je demande a une bonne modelisation : il ne parle pas d'emotion alors que c'est le coeur de l'activité cerébrale et de nos prises de decision me semble-t-il. Et je n'ai vu dans ce que tu as exposé aucun exemple reel sur lequel il pourrait eclairer mes choix. Ca me semble difficilement operatoire.

Un bon texte litteraire discutant de mes affects m'eclaire bien mieux sur mes prises de décision, je crois que ce modele issu des sciences dures. On en revient a la critique que j'avais sur Freud. En essayant de mettre des "verités generales", en essayant de se rapprocher des sciences dures pour decrire la vie de l'esprit, ca donne des presentations qui me semblent dramatiquement simplistes. On croirait un truc pour un etudiant de 18 ans qui pense decrire le monde entier avec qq equations.

Avatar de l’utilisateur
Glycogène
Hydrogène
Hydrogène
Messages : 3486
Inscription : 05 oct. 2005, 00:06
Localisation : Grenoble

Re: L'approche bayesienne

Message par Glycogène » 07 mai 2021, 22:59

GillesH38 a écrit :
07 mai 2021, 08:35
Les études du cerveau montrent que c'est comme ça que le cerveau fonctionne "naturellement", il passe son temps à échafauder des théories du réel à partir de faits connus.
J'ai compris assez tôt étant gamin que le cerveau fonctionnait comme ça, bien sûr pas aussi formellement que la formule de Bayes.
Mais j'avais pigé que le cerveau est une machine à créer des théories décrivant les données qu'on lui donne.
Dès lors, je m'en suis servi à grande échelle !
Par exemple je veux trouver une théorie sur un sujet précis, pour expliquer certains faits. J'ai une petite idée de théorie, je vais partir de là, et je souhaite tester cette idée sur des milliers de données pour voir si ça fonctionne, et si ça ne fonctionne pas, faire varier cette idée pour qu'elle tende vers un truc qui fonctionne.
Si je veux faire ça à la main en écrivant ou parlant, ou même en y pensant consciemment, ça prendrait des semaines ou des mois.
Je fais autrement. Je passe 10 min à tester la théorie sur une dizaine de données. Je laisse reposer 24h à une semaine.
Pendant les 10 min, le cerveau a appris comment tester la théorie. Ensuite, il code en "dur" l'algo de test. Mais il ajoute une plasticité sur tous les paramètres, et aussi de l'aléatoire pour des paramètres en plus/en moins, etc.
Quand il a fini, je fais passer dans cet algo toutes les données que je connais (qui doivent être dans le cerveau, forcément le champ des sujets possibles est limité).
Ca prends moins de 10s pour ~10000 données (c'est surement du massivement parallèle).
On obtient 2 résultats :
- La théorie apprise est valable ou non sur ces données.
- La théorie a été modifiée pour s'adapter aux données.
En fait on a juste le 2e résultat, et en comparant (à la main ce coup ci) avec la théorie initiale, on voit les modifs, et s'il y en a eu beaucoup, c'est que la théorie initiale était fausse. Bien que ce ne soit jamais tout ou rien, c'est un continuum, la notion de théorie vraie ou fausse n'a pas de sens. Le cerveau ne dira donc pas vrai ou faux, juste une décalage par rapport à la théorie initiale, et c'est à nous à décider si ce décalage prouve que la théorie est vrai ou fausse.
En pratique, comme ça me fournit une théorie garantie plus juste ou égale à l'originale, je n'ai rien à faire de connaitre la qualité de la théorie initiale, je me contente de remplacer l'ancienne théorie par la nouvelle qui vient d'être calculée.
Bien sûr le gros défaut est qu'il faut avoir les données dans le cerveau. Mais pour les sujets du quotidien, qui nous remplissent le cerveau de données sans qu'on le veuille, ça fonctionne. Ou alors accepter de prendre des années pour engranger des données via la lecture, l'image le son, ce qui est bien plus lent que le temps d'accès des données déjà stockées dans le cerveau.

J'ai fini par comprendre que le cerveau "inconscient" ne fait que ce genre de chose, sans qu'on puisse rien y faire, mais sans but, juste parce qu'il sait juste faire ça. Et dans le tas de théories débiles qu'il pond, il y a en a qq unes qui servent pour de vrai. Et qq autres qui empoisonnent la vie de la personne.
C'est quand même plus efficace de l'utiliser directement pour des sujets "utiles", au lieu d'attendre qu'il s'y mette par hasard. Le problème est qu'on ne sait pas d'avance ce qui sera utile ou non à l'avenir.
Et heureusement qu'il y a beaucoup d'aléatoire et qu'on ne maitrise pas tout ce que fait le cerveau en cherchant à l'utiliser uniquement pour des choses qu'on juge utile (bien que ce soit possible), car sinon on serait tous des robots.

Avatar de l’utilisateur
LeLama
Hydrogène
Hydrogène
Messages : 4604
Inscription : 08 août 2006, 23:12
Localisation : Angers, France
Contact :

Re: L'approche bayesienne

Message par LeLama » 07 mai 2021, 23:11

Glycogène a écrit :
07 mai 2021, 22:59
J'ai compris assez tôt étant gamin que le cerveau fonctionnait comme ça, bien sûr pas aussi formellement que la formule de Bayes.
Mais j'avais pigé que le cerveau est une machine à créer des théories décrivant les données qu'on lui donne.
Dès lors, je m'en suis servi à grande échelle !
Par exemple je veux trouver une théorie sur un sujet précis, pour expliquer certains faits. J'ai une petite idée de théorie, je vais partir de là, et je souhaite tester cette idée sur des milliers de données pour voir si ça fonctionne, et si ça ne fonctionne pas, faire varier cette idée pour qu'elle tende vers un truc qui fonctionne.
Si je veux faire ça à la main en écrivant ou parlant, ou même en y pensant consciemment, ça prendrait des semaines ou des mois.
Je fais autrement. Je passe 10 min à tester la théorie sur une dizaine de données. Je laisse reposer 24h à une semaine.
Pendant les 10 min, le cerveau a appris comment tester la théorie. Ensuite, il code en "dur" l'algo de test. Mais il ajoute une plasticité sur tous les paramètres, et aussi de l'aléatoire pour des paramètres en plus/en moins, etc.
Quand il a fini, je fais passer dans cet algo toutes les données que je connais (qui doivent être dans le cerveau, forcément le champ des sujets possibles est limité).
Ca prends moins de 10s pour ~10000 données (c'est surement du massivement parallèle).
On obtient 2 résultats :
- La théorie apprise est valable ou non sur ces données.
- La théorie a été modifiée pour s'adapter aux données.
Tu vois, ce que tu décris, je le comprends bien. Ca me semble operatoire, et plus simple que ce que Gilles nous a expliqué avec Bayes. C'est pour ca que je suis tres sceptique sur ce genre de formalisme de sciences dures. Finalement, avec un langage litteraire en qq lignes, tu nous as expliqué un fonctionnement qui est plus proche du cerveau humain reel. Il y a des donnees correspondant au fonctionnement reel, le temps pour lequel tu laisses reposer, le temps pendant lequel tu testes...

Répondre