I artikkelen om betinget sannsynlighet så vi hvordan vi ved hjelp av regelen for betinget sannsynlighet kan finne den betingede sannsynligheten P(B|A) hvis vi kjenner P(A∩B) og P(A).
Hvis vi kjenner den betingede sannsynligheten P(B|A), kan vi ved hjelp av Bayes regel finne den «omvendte» betingede sannsynligheten, P(A|B):
$\fbox{Bayes regel: $P(A | B) = \frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)}$}$
Bayes regel ble formulert av presten Thomas Bayes.
Vi ser at for å bruke Bayes regel må vi i tillegg til P(B|A) kjenne P(A) og P(B), men vi trenger ikke kjenne P(A∩B).
Eksempel 1:
I eksempel 2 i artikkelen om betinget sannsynlighet hadde vi en situasjon der sannsynligheten for hendelse A, at en gamer spilte WoW, var 80 %, at sannsynligheten for hendelse B, at en gamer spilte CoD, var 30 %, og vi regnet ut at sannsynligheten for (B|A) var 25 %. Da kan vi ved hjelp av Bayes regel regne ut sannsynligheten for (A|B), altså at en gamer som spiler CoD, også spiller WoW:
$P(A | B) = \frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)} = {\large \frac{0{,}8 \cdot 0{,}25 }{0{,}3}}\approx 0{,}6667$. Gitt at en gamer spiller CoD, er det om lag 67 % sannsynlig at vedkommende også spiller WoW. Vi ser av Venn-diagrammet under at dette stemmer, fordi $ {\large \frac{2}{3}}$ av alle gamerne i B også ligger i A.
I eksempel 1 i artikkelen om betinget sannsynlighet så vi på et spill der vi kastet to terninger og vant hvis vi fikk sum 11 eller 12. Vi da hadde følgende sannsynligheter:
Sannsynlighet for «sum 11 eller 12»: $P(B) = {\large \frac{1}{12}}$.
Sannsynlighet for «seks på første terning»: $P(A) = {\large \frac{1}{6}}$.
Sannsynlighet for å vinne, gitt at vi har fått seks på første terning: $P(B | A) = {\large \frac{1}{3}}$.
Bruk Bayes regel til å finne den «omvendte», betingede sannsynligheten, det vil si sannsynligheten for at første terning var 6 hvis vi har vunnet, altså P(A|B).
I eksempel 1 kunne vi klart oss uten Bayes regel fordi vi fra eksempel 2 i artikkelen om betinget sannsynlighet visste at P(A∩B) = 0,2, og kunne regnet ut (A|B) ved å bytte om A og B i formelen for betinget sannsynlighet:
$P(A | B) = \frac{\displaystyle P(B \cap A)}{\displaystyle P(B)} = {\large \frac{0{,}2}{0{,}3}} \approx 0{,}6667$.
Men det er ikke alltid vi kjenner P(A∩B), slik som i eksempel 2.
Eksempel 2:
På en smerteklinikk får 10 % av pasientene narkotiske tabletter. Generelt er 5 % av pasientene narkomane. Av de som får narkotiske tabletter, er 8 % narkomane. Så skal vi regne ut hvor sannsynlig det er at en narkoman pasient får narkotiske tabletter.
Kaller vi hendelsen at en pasient får narkotiske tabletter for A, har vi at P(A) = 0,1.
Kaller vi hendelsen at en pasient er narkoman for B, har vi at P(B) = 0,05.
Hendelsen at en pasient er narkoman, gitt at vedkommende får narkotiske tabletter, blir da B|A, og vi har at P(B|A) = 0,08.
Sannsynligheten for at en narkoman pasient får narkotiske tabletter blir da P(A|B), og Bayes regel gir oss at
$P(A | B) = \frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)} = {\large \frac{0{,}1 \cdot 0{,}08}{0{,}05}} = 0{,}16$.
Det er 16 % sannsynlig at en narkoman pasient får narkotiske tabletter.
Eksempel 3:
$ {\large \frac{1}{10 \, 000}}$ av innbyggerne i et land har en sykdom. Velger vi personer tilfeldig, og lar hendelse A være at en vilkårlig person er syk, vil vi ha $P(A) = {\large \frac{1}{10 \, 000}} = 0{,}0001$.
Det finnes en test for sykdommen, som i snitt gir utslag i 1,0098 % av tilfellene den brukes. Lar vi hendelse B være at testen gir utslag, vil vi ha $P(B) = 0{,}010098$.
Testen er 99 % sikker, det vil si at hvis en syk person testes, vil den slå ut med 99 % sikkerhet. Vi har derfor at sannsynligheten for «utslag, gitt syk» er $P(B|A) = 0{,}99$.
Ved hjelp av Bayes regel kan vi så finne sannsynligheten for at en vilkårlig person som får positivt utslag, faktisk er syk, altså «syk, gitt utslag», $ P(A|B)$:
$P(A|B) =\frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)} = {\large \frac{0,0001 \cdot 0{,}99}{0{,}010098}} \approx 0{,}0098$.
Det er om lag 0,98 % sannsynlig at en vilkårlig person som får positivt utslag, faktisk er syk.
Tallene i eksempel 3 er hentet fra oppgave 3 i artikkelen med introduksjon til sannsynlighet, der vi skulle tippe hvor sannsynlig det var at vi, med positivt utslag på en 99 % sikker test, hadde en sykdom som rammet hver ti-tusende innbygger. P(B), altså hvor ofte testen i snitt ga utslag, var imidlertid ikke oppgitt, men dette kan vi regne oss fram til. Positiv test får vi i 99 % av tilfellene for syke personer og 1 % av tilfellene for friske personer. Av 10 000 er 1 syk og 9999 friske, så vi får
$P(B) = {\large \frac{1}{10 \, 000}} \cdot 0{,}99 + {\large \frac{9999}{10 \, 000}} \cdot 0{,}01 = 0{,}010098$
At en vilkårlig person er frisk, er den komplementære hendelsen til A, altså AC, så vi ser at vi regner ut P(B) som P(A) · P(B|A) + P(AC) · P(B|AC).
Ofte vil vi måtte regne oss fram til P(B) på denne måten. En sykdomstest vil i praksis også gjerne ha forskjellig nøyaktighet for syke og friske.
Eksempel 4:
-
-
-
- 1 % av en befolkningen i et land har en sykdom.
- En test påviser sykdommen i 90 % av tilfellene hos de syke.
- 9,6 % av testene er falske positive, det vil si at de feilaktig påviser sykdommen hos friske.
-
-
Så skal vi beregne sannsynligheten for at en person som tester positivt, faktisk har sykdommen.
Kaller vi hendelsen «syk person» for A og hendelsen «positiv test» for B, har vi:
-
-
-
- P(A) = 0,01. Sannsynligheten for at en person er syk, er 0,01.
- P(AC) = 1 − 0,01 = 0,99. Sannsynligheten for at en person er frisk, er 0,99.
- P(B|A) = 0,9. Sannsynligheten for positiv test hos en syk person er 0,9.
- P(B|AC) = 0,096. Sannsynligheten for positiv test hos en frisk person er 0,096.
-
-
Og vi får P(B) = P(A) · P(B|A) + P(AC) · P(B|AC) = 0,01 · 0,9 + 0,99 · 0,096 = 0,10404.
Ved hjelp av Bayes regel kan vi så beregne sannsynligheten for at en person har sykdommen, gitt en positiv test:
$P(A | B) = \frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)} = {\large \frac{0{,}01 \cdot 0{,}9}{0{,}10404}}\approx 0{,}0865$
Sannsynligheten for sykdom, gitt positiv test, er ca. 8,65 %.
-
-
-
- Katteallergi forekommer hos 10 % av en befolkningen.
- En test påviser allergi hos 80 % av de allergiske.
- 15 % av testene er falske positive, det vil si at de feilaktig påviser allergi hos friske.
-
-
Beregn sannsynligheten for at en person som tester positivt, faktisk har allergi.
Kilder
-
- Hinna, K.R.C., Rinvold, R.A., Gustavsen, TS. (2011). QED 5-10, bind 1. Høyskoleforlaget
- Ubøe, J. (2011). Statistikk for økonomifag. Gyldendal akademisk
- Hagen, Per C. (2000). Innføring i sannsynlighetsregning og statistikk. Cappelen akademisk