Sannsynlighetstrær

En sammensetning av betingede sannsynligheter kan illustreres ved hjelp av sannsynlighetstrær. Et sannsynlighetstre vil kunne gjøre det enklere å få oversikt over de forskjellige sannsynlighetene.

I eksempel 4 i artikkelen om Bayes regel studerte vi en situasjon der:

    • 1 % av en befolkningen i et land har en sykdom.
    • En test påviser sykdommen i 90 % av tilfellene hos de syke.
    • 9,6 % av testene er falske positive, det vil si at de feilaktig påviser sykdommen hos friske.

Disse opplysningene kan vi illustrere slik, i et sannsynlighetstre:

Sannsynlighetstre med bare oppgitte opplysninger

I et sannsynlighetstre illustrerer vi de forskjellige mulighetene som greiner. Punktene som greinene løper ut fra, kalles noder. I denne artikkelen nøyer vi oss med å se på trær med to greiner per node, men det er fullt mulig å ha flere.

Greinene som løper ut fra en node, skal illustrere alle valgmuligheter, derfor må summen av sannsynlighetene i disse være 1, altså 100 %. Vi kan derved enkelt regne ut hvilke verdier som skal stå ved spørsmålstegnene i treet vårt:

Sannsynlighetstre inkludert beregnede grenverdier

Lest ovenfra og nedover representerer verdiene i første sett med greiner de uavhengige sannsynlighetene for «syk», og «frisk». I andre sett med greiner representerer verdiene de betingede sannsynlighetene for «positiv test, gitt syk», «negativ test, gitt syk», «positiv test, gitt frisk» og «negativ test, gitt frisk».

Ytterpunktene i treet, det vil si nodene det ikke løper ut greiner fra, kalles løvnoder. Ved å multiplisere sannsynlighetene langs greinene som fører fram til en løvnode, kan vi finne sannsynligheten for å ende i den noden:

Sannsynlighetstre inkludert verdier i løvnodene

Den totale sannsynligheten for å få positiv test finner vi ved å summere verdiene i løvnodene som er knyttet til en gren med positiv test, altså 0,9 % + 9,504 % = 10,404 %. Tilsvarende kan vi finne den totale sannsynligheten for å få negativ test ved å summere verdiene i løvnodene som er knyttet til en gren med negativ test, altså 0,1 % + 89,496 % = 89,596 %. Dette kan vi naturligvis også beregne ut fra at summen av sannsynlighetene i løvnodene utgjør 100 %: 100 % − 10,404 % = 89,596 %.

Skal vi så beregne sannsynligheten for at en person som tester positivt, faktisk har sykdommen, kan vi gjøre det ved å dividere sannsynligheten for en positiv test der vedkommende faktisk er syk, med sannsynligheten for en positiv test totalt: 0,9 % / 10,404 % ≈ 8,65 %. Dette er det samme som vi fant i eksempel 4 på siden Bayes regel.

Kaller vi hendelsen «syk person» for A og hendelsen «positiv test» for B, og setter dette inn i sannsynlighetstreet, ser det slik ut:

Sannsynlighetstre med symbolske sannsynligheter

I artikkelen om Bayes regel så vi at vi regner ut P(A|B) som $\frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)}$. Vi så også at vi kan regne ut P(B) som P(A) · P(B|A) + P(AC) · P(B|AC). Setter vi dette sammen, får vi

$P(A|B) = \frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(A) \cdot P(B|A) + P(A^C) \cdot P(B|A^C)}$

Så markerer vi elementene i telleren med en gul sirkel, og elementene i nevneren med grønne sirkler i sannsynlighetstreet:

Sannsynlighetstre med symbolske sannsynligheter og markeringer

Da ser vi at vi egentlig brukte Bayes regel da vi beregnet sannsynligheten for at en person som testet positivt, faktisk hadde sykdommen, basert på verdiene i sannsynlighetstreet.

Oppgave 1:

Tegn et sannsynlighetstre for situasjonen i oppgave 2 i artikkelen om Bayes regel:

        • Katteallergi forekommer hos 10 % av en befolkningen.
        • En test påviser allergi hos 80 % av de allergiske.
        • 15 % av testene er falske positive, det vil si at de feilaktig påviser allergi hos friske.

Skriv inn sannsynligheter i alle greinene og løvnodene, og bruk så disse til å beregne sannsynligheten for at en person som tester positivt, faktisk har allergi. Sjekk at du får det samme som i oppgave 2 i artikkelen om Bayes regel.

Se løsningsforslag

Kilder

      • Hinna, K.R.C., Rinvold, R.A., Gustavsen, TS. (2011). QED 5-10, bind 1. Høyskoleforlaget
      • Ubøe, J. (2011). Statistikk for økonomifag. Gyldendal akademisk
      • Hagen, Per C. (2000). Innføring i sannsynlighetsregning og statistikk. Cappelen akademisk