En sammensetning av betingede sannsynligheter kan illustreres ved hjelp av sannsynlighetstrær. Et sannsynlighetstre vil kunne gjøre det enklere å få oversikt over de forskjellige sannsynlighetene.
I eksempel 4 i artikkelen om Bayes regel studerte vi en situasjon der:
-
- 1 % av en befolkningen i et land har en sykdom.
- En test påviser sykdommen i 90 % av tilfellene hos de syke.
- 9,6 % av testene er falske positive, det vil si at de feilaktig påviser sykdommen hos friske.
Disse opplysningene kan vi illustrere slik, i et sannsynlighetstre:
I et sannsynlighetstre illustrerer vi de forskjellige mulighetene som greiner. Punktene som greinene løper ut fra, kalles noder. I denne artikkelen nøyer vi oss med å se på trær med to greiner per node, men det er fullt mulig å ha flere.
Greinene som løper ut fra en node, skal illustrere alle valgmuligheter, derfor må summen av sannsynlighetene i disse være 1, altså 100 %. Vi kan derved enkelt regne ut hvilke verdier som skal stå ved spørsmålstegnene i treet vårt:
Lest ovenfra og nedover representerer verdiene i første sett med greiner de uavhengige sannsynlighetene for «syk», og «frisk». I andre sett med greiner representerer verdiene de betingede sannsynlighetene for «positiv test, gitt syk», «negativ test, gitt syk», «positiv test, gitt frisk» og «negativ test, gitt frisk».
Ytterpunktene i treet, det vil si nodene det ikke løper ut greiner fra, kalles løvnoder. Ved å multiplisere sannsynlighetene langs greinene som fører fram til en løvnode, kan vi finne sannsynligheten for å ende i den noden:
Den totale sannsynligheten for å få positiv test finner vi ved å summere verdiene i løvnodene som er knyttet til en gren med positiv test, altså 0,9 % + 9,504 % = 10,404 %. Tilsvarende kan vi finne den totale sannsynligheten for å få negativ test ved å summere verdiene i løvnodene som er knyttet til en gren med negativ test, altså 0,1 % + 89,496 % = 89,596 %. Dette kan vi naturligvis også beregne ut fra at summen av sannsynlighetene i løvnodene utgjør 100 %: 100 % − 10,404 % = 89,596 %.
Skal vi så beregne sannsynligheten for at en person som tester positivt, faktisk har sykdommen, kan vi gjøre det ved å dividere sannsynligheten for en positiv test der vedkommende faktisk er syk, med sannsynligheten for en positiv test totalt: 0,9 % / 10,404 % ≈ 8,65 %. Dette er det samme som vi fant i eksempel 4 på siden Bayes regel.
Kaller vi hendelsen «syk person» for A og hendelsen «positiv test» for B, og setter dette inn i sannsynlighetstreet, ser det slik ut:
I artikkelen om Bayes regel så vi at vi regner ut P(A|B) som $\frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)}$. Vi så også at vi kan regne ut P(B) som P(A) · P(B|A) + P(AC) · P(B|AC). Setter vi dette sammen, får vi
$P(A|B) = \frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(A) \cdot P(B|A) + P(A^C) \cdot P(B|A^C)}$
Så markerer vi elementene i telleren med en gul sirkel, og elementene i nevneren med grønne sirkler i sannsynlighetstreet:
Da ser vi at vi egentlig brukte Bayes regel da vi beregnet sannsynligheten for at en person som testet positivt, faktisk hadde sykdommen, basert på verdiene i sannsynlighetstreet.
Tegn et sannsynlighetstre for situasjonen i oppgave 2 i artikkelen om Bayes regel:
-
-
-
- Katteallergi forekommer hos 10 % av en befolkningen.
- En test påviser allergi hos 80 % av de allergiske.
- 15 % av testene er falske positive, det vil si at de feilaktig påviser allergi hos friske.
-
-
Skriv inn sannsynligheter i alle greinene og løvnodene, og bruk så disse til å beregne sannsynligheten for at en person som tester positivt, faktisk har allergi. Sjekk at du får det samme som i oppgave 2 i artikkelen om Bayes regel.
Kilder
-
-
- Hinna, K.R.C., Rinvold, R.A., Gustavsen, TS. (2011). QED 5-10, bind 1. Høyskoleforlaget
- Ubøe, J. (2011). Statistikk for økonomifag. Gyldendal akademisk
- Hagen, Per C. (2000). Innføring i sannsynlighetsregning og statistikk. Cappelen akademisk
-