Bayes regel

I artikkelen om betinget sannsynlighet så vi hvordan vi ved hjelp av regelen for betinget sannsynlighet kan finne den betingede sannsynligheten P(B|A) hvis vi kjenner P(AB) og P(A).

Hvis vi kjenner den betingede sannsynligheten P(B|A), kan vi ved hjelp av Bayes regel finne den «omvendte» betingede sannsynligheten, P(A|B):

$\fbox{Bayes regel: $P(A | B) = \frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)}$}$

Bayes regel ble formulert av presten Thomas Bayes.

Vi ser at for å bruke Bayes regel må vi i tillegg til P(B|A) kjenne P(A) og P(B), men vi trenger ikke kjenne P(AB).

Eksempel 1:

I eksempel 2 i artikkelen om betinget sannsynlighet hadde vi en situasjon der sannsynligheten for hendelse A, at en gamer spilte WoW, var 80 %, at sannsynligheten for hendelse B, at en gamer spilte CoD, var 30 %, og vi regnet ut at sannsynligheten for (B|A) var 25 %. Da kan vi ved hjelp av Bayes regel regne ut sannsynligheten for (A|B), altså at en gamer som spiler CoD, også spiller WoW:

$P(A | B) = \frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)} = {\large \frac{0{,}8 \cdot 0{,}25 }{0{,}3}}\approx 0{,}6667$. Gitt at en gamer spiller CoD, er det om lag 67 % sannsynlig at vedkommende også spiller WoW. Vi ser av Venn-diagrammet under at dette stemmer, fordi $ {\large \frac{2}{3}}$ av alle gamerne i B også ligger i A.

P(A) = 80/100, P(A|B) = 20/100

Oppgave 1:

I eksempel 1 i artikkelen om betinget sannsynlighet så vi på et spill der vi kastet to terninger og vant hvis vi fikk sum 11 eller 12. Vi da hadde følgende sannsynligheter:

Sannsynlighet for «sum 11 eller 12»: $P(B) = {\large \frac{1}{12}}$.

Sannsynlighet for «seks på første terning»: $P(A) = {\large \frac{1}{6}}$.

Sannsynlighet for å vinne, gitt at vi har fått seks på første terning: $P(B | A) = {\large \frac{1}{3}}$.

Bruk Bayes regel til å finne den «omvendte», betingede sannsynligheten, det vil si sannsynligheten for at første terning var 6 hvis vi har vunnet, altså P(A|B).

Se løsningsforslag

I eksempel 1 kunne vi klart oss uten Bayes regel fordi vi fra eksempel 2 i artikkelen om betinget sannsynlighet visste at P(AB) = 0,2, og kunne regnet ut (A|B) ved å bytte om A og B i formelen for betinget sannsynlighet:

$P(A | B) = \frac{\displaystyle P(B \cap A)}{\displaystyle P(B)} = {\large \frac{0{,}2}{0{,}3}} \approx 0{,}6667$.

Men det er ikke alltid vi kjenner P(AB), slik som i eksempel 2.

Eksempel 2:

På en smerteklinikk får 10 % av pasientene narkotiske tabletter. Generelt er 5 % av pasientene narkomane. Av de som får narkotiske tabletter, er 8 % narkomane. Så skal vi regne ut hvor sannsynlig det er at en narkoman pasient får narkotiske tabletter.

Kaller vi hendelsen at en pasient får narkotiske tabletter for A, har vi at P(A) = 0,1.

Kaller vi hendelsen at en pasient er narkoman for B, har vi at P(B) = 0,05.

Hendelsen at en pasient er narkoman, gitt at vedkommende får narkotiske tabletter, blir da B|A, og vi har at P(B|A) = 0,08.

Sannsynligheten for at en narkoman pasient får narkotiske tabletter blir da P(A|B), og Bayes regel gir oss at

$P(A | B) = \frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)} = {\large \frac{0{,}1 \cdot 0{,}08}{0{,}05}} = 0{,}16$.

Det er 16 % sannsynlig at en narkoman pasient får narkotiske tabletter.

Eksempel 3:

$ {\large \frac{1}{10 \, 000}}$ av innbyggerne i et land har en sykdom. Velger vi personer tilfeldig, og lar hendelse A være at en vilkårlig person er syk, vil vi ha $P(A) = {\large \frac{1}{10 \, 000}} = 0{,}0001$.

Det finnes en test for sykdommen, som i snitt gir utslag i 1,0098 % av tilfellene den brukes. Lar vi hendelse B være at testen gir utslag, vil vi ha $P(B) = 0{,}010098$.

Testen er 99 % sikker, det vil si at hvis en syk person testes, vil den slå ut med 99 % sikkerhet. Vi har derfor at sannsynligheten for «utslag, gitt syk» er $P(B|A) = 0{,}99$.

Ved hjelp av Bayes regel kan vi så finne sannsynligheten for at en vilkårlig person som får positivt utslag, faktisk er syk, altså «syk, gitt utslag», $ P(A|B)$:

$P(A|B) =\frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)} = {\large \frac{0,0001 \cdot 0{,}99}{0{,}010098}} \approx 0{,}0098$.

Det er om lag 0,98 % sannsynlig at en vilkårlig person som får positivt utslag, faktisk er syk.

Tallene i eksempel 3 er hentet fra oppgave 3 i artikkelen med introduksjon til sannsynlighet, der vi skulle tippe hvor sannsynlig det var at vi, med positivt utslag på en 99 % sikker test, hadde en sykdom som rammet hver ti-tusende innbygger. P(B), altså hvor ofte testen i snitt ga utslag, var imidlertid ikke oppgitt, men dette kan vi regne oss fram til. Positiv test får vi i 99 % av tilfellene for syke personer og 1 % av tilfellene for friske personer. Av 10 000 er 1 syk og 9999 friske, så vi får

$P(B) = {\large \frac{1}{10 \, 000}} \cdot 0{,}99 + {\large \frac{9999}{10 \, 000}} \cdot 0{,}01 = 0{,}010098$

At en vilkårlig person er frisk, er den komplementære hendelsen til A, altså AC, så vi ser at vi regner ut P(B) som P(A) · P(B|A) + P(AC) · P(B|AC).

Ofte vil vi måtte regne oss fram til P(B) på denne måten. En sykdomstest vil i praksis også gjerne ha forskjellig nøyaktighet for syke og friske.

Eksempel 4:

        • 1 % av en befolkningen i et land har en sykdom.
        • En test påviser sykdommen i 90 % av tilfellene hos de syke.
        • 9,6 % av testene er falske positive, det vil si at de feilaktig påviser sykdommen hos friske.

Så skal vi beregne sannsynligheten for at en person som tester positivt, faktisk har sykdommen.

Kaller vi hendelsen «syk person» for A og hendelsen «positiv test» for B, har vi:

        • P(A) = 0,01. Sannsynligheten for at en person er syk, er 0,01.
        • P(AC) = 1 − 0,01 = 0,99. Sannsynligheten for at en person er frisk, er 0,99.
        • P(B|A) = 0,9. Sannsynligheten for positiv test hos en syk person er 0,9.
        • P(B|AC) = 0,096. Sannsynligheten for positiv test hos en frisk person er 0,096.

Og vi får P(B) = P(A) · P(B|A) + P(AC) · P(B|AC) = 0,01 · 0,9 + 0,99 · 0,096 = 0,10404.

Ved hjelp av Bayes regel kan vi så beregne sannsynligheten for at en person har sykdommen, gitt en positiv test:

$P(A | B) = \frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)} = {\large \frac{0{,}01 \cdot 0{,}9}{0{,}10404}}\approx 0{,}0865$

Sannsynligheten for sykdom, gitt positiv test, er ca. 8,65 %.

Oppgave 2:

        • Katteallergi forekommer hos 10 % av en befolkningen.
        • En test påviser allergi hos 80 % av de allergiske.
        • 15 % av testene er falske positive, det vil si at de feilaktig påviser allergi hos friske.

Beregn sannsynligheten for at en person som tester positivt, faktisk har allergi.

Se løsningsforslag

Kilder

    • Hinna, K.R.C., Rinvold, R.A., Gustavsen, TS. (2011). QED 5-10, bind 1. Høyskoleforlaget
    • Ubøe, J. (2011). Statistikk for økonomifag. Gyldendal akademisk
    • Hagen, Per C. (2000). Innføring i sannsynlighetsregning og statistikk. Cappelen akademisk