Sannsynlighetstrær

En sammensetning av betingede sannsynligheter kan illustreres ved hjelp av sannsynlighetstrær. Et sannsynlighetstre vil kunne gjøre det enklere å få oversikt over de forskjellige sannsynlighetene.

I eksempel 4 i artikkelen om Bayes regel studerte vi en situasjon der:

    • 1 % av en befolkningen i et land har en sykdom.
    • En test påviser sykdommen i 90 % av tilfellene hos de syke.
    • 9,6 % av testene er falske positive, det vil si at de feilaktig påviser sykdommen hos friske.

Disse opplysningene kan vi illustrere slik, i et sannsynlighetstre:

Sannsynlighetstre med bare oppgitte opplysninger

I et sannsynlighetstre illustrerer vi de forskjellige mulighetene som greiner. Punktene som greinene løper ut fra, kalles noder. I denne artikkelen nøyer vi oss med å se på trær med to greiner per node, men det er fullt mulig å ha flere.

Greinene som løper ut fra en node, skal illustrere alle valgmuligheter, derfor må summen av sannsynlighetene i disse være 1, altså 100 %. Vi kan derved enkelt regne ut hvilke verdier som skal stå ved spørsmålstegnene i treet vårt:

Sannsynlighetstre inkludert beregnede grenverdier

Lest ovenfra og nedover representerer verdiene i første sett med greiner de uavhengige sannsynlighetene for «syk», og «frisk». I andre sett med greiner representerer verdiene de betingede sannsynlighetene for «positiv test, gitt syk», «negativ test, gitt syk», «positiv test, gitt frisk» og «negativ test, gitt frisk».

Ytterpunktene i treet, det vil si nodene det ikke løper ut greiner fra, kalles løvnoder. Ved å multiplisere sannsynlighetene langs greinene som fører fram til en løvnode, kan vi finne sannsynligheten for å ende i den noden:

Sannsynlighetstre inkludert verdier i løvnodene

Den totale sannsynligheten for å få positiv test finner vi ved å summere verdiene i løvnodene som er knyttet til en gren med positiv test, altså 0,9 % + 9,504 % = 10,404 %. Tilsvarende kan vi finne den totale sannsynligheten for å få negativ test ved å summere verdiene i løvnodene som er knyttet til en gren med negativ test, altså 0,1 % + 89,496 % = 89,596 %. Dette kan vi naturligvis også beregne ut fra at summen av sannsynlighetene i løvnodene utgjør 100 %: 100 % − 10,404 % = 89,596 %.

Skal vi så beregne sannsynligheten for at en person som tester positivt, faktisk har sykdommen, kan vi gjøre det ved å dividere sannsynligheten for en positiv test der vedkommende faktisk er syk, med sannsynligheten for en positiv test totalt: 0,9 % / 10,404 % ≈ 8,65 %. Dette er det samme som vi fant i eksempel 4 på siden Bayes regel.

Kaller vi hendelsen «syk person» for A og hendelsen «positiv test» for B, og setter dette inn i sannsynlighetstreet, ser det slik ut:

Sannsynlighetstre med symbolske sannsynligheter

I artikkelen om Bayes regel så vi at vi regner ut P(A|B) som $\frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)}$. Vi så også at vi kan regne ut P(B) som P(A) · P(B|A) + P(AC) · P(B|AC). Setter vi dette sammen, får vi

$P(A|B) = \frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(A) \cdot P(B|A) + P(A^C) \cdot P(B|A^C)}$

Så markerer vi elementene i telleren med en gul sirkel, og elementene i nevneren med grønne sirkler i sannsynlighetstreet:

Sannsynlighetstre med symbolske sannsynligheter og markeringer

Da ser vi at vi egentlig brukte Bayes regel da vi beregnet sannsynligheten for at en person som testet positivt, faktisk hadde sykdommen, basert på verdiene i sannsynlighetstreet.

Oppgave 1:

Tegn et sannsynlighetstre for situasjonen i oppgave 2 i artikkelen om Bayes regel:

        • Katteallergi forekommer hos 10 % av en befolkningen.
        • En test påviser allergi hos 80 % av de allergiske.
        • 15 % av testene er falske positive, det vil si at de feilaktig påviser allergi hos friske.

Skriv inn sannsynligheter i alle greinene og løvnodene, og bruk så disse til å beregne sannsynligheten for at en person som tester positivt, faktisk har allergi. Sjekk at du får det samme som i oppgave 2 i artikkelen om Bayes regel.

Se løsningsforslag

Kilder

      • Hinna, K.R.C., Rinvold, R.A., Gustavsen, TS. (2011). QED 5-10, bind 1. Høyskoleforlaget
      • Ubøe, J. (2011). Statistikk for økonomifag. Gyldendal akademisk
      • Hagen, Per C. (2000). Innføring i sannsynlighetsregning og statistikk. Cappelen akademisk

Bayes regel

I artikkelen om betinget sannsynlighet så vi hvordan vi ved hjelp av regelen for betinget sannsynlighet kan finne den betingede sannsynligheten P(B|A) hvis vi kjenner P(AB) og P(A).

Hvis vi kjenner den betingede sannsynligheten P(B|A), kan vi ved hjelp av Bayes regel finne den «omvendte» betingede sannsynligheten, P(A|B):

$\fbox{Bayes regel: $P(A | B) = \frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)}$}$

Bayes regel ble formulert av presten Thomas Bayes.

Vi ser at for å bruke Bayes regel må vi i tillegg til P(B|A) kjenne P(A) og P(B), men vi trenger ikke kjenne P(AB).

Eksempel 1:

I eksempel 2 i artikkelen om betinget sannsynlighet hadde vi en situasjon der sannsynligheten for hendelse A, at en gamer spilte WoW, var 80 %, at sannsynligheten for hendelse B, at en gamer spilte CoD, var 30 %, og vi regnet ut at sannsynligheten for (B|A) var 25 %. Da kan vi ved hjelp av Bayes regel regne ut sannsynligheten for (A|B), altså at en gamer som spiler CoD, også spiller WoW:

$P(A | B) = \frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)} = {\large \frac{0{,}8 \cdot 0{,}25 }{0{,}3}}\approx 0{,}6667$. Gitt at en gamer spiller CoD, er det om lag 67 % sannsynlig at vedkommende også spiller WoW. Vi ser av Venn-diagrammet under at dette stemmer, fordi $ {\large \frac{2}{3}}$ av alle gamerne i B også ligger i A.

P(A) = 80/100, P(A|B) = 20/100

Oppgave 1:

I eksempel 1 i artikkelen om betinget sannsynlighet så vi på et spill der vi kastet to terninger og vant hvis vi fikk sum 11 eller 12. Vi da hadde følgende sannsynligheter:

Sannsynlighet for «sum 11 eller 12»: $P(B) = {\large \frac{1}{12}}$.

Sannsynlighet for «seks på første terning»: $P(A) = {\large \frac{1}{6}}$.

Sannsynlighet for å vinne, gitt at vi har fått seks på første terning: $P(B | A) = {\large \frac{1}{3}}$.

Bruk Bayes regel til å finne den «omvendte», betingede sannsynligheten, det vil si sannsynligheten for at første terning var 6 hvis vi har vunnet, altså P(A|B).

Se løsningsforslag

I eksempel 1 kunne vi klart oss uten Bayes regel fordi vi fra eksempel 2 i artikkelen om betinget sannsynlighet visste at P(AB) = 0,2, og kunne regnet ut (A|B) ved å bytte om A og B i formelen for betinget sannsynlighet:

$P(A | B) = \frac{\displaystyle P(B \cap A)}{\displaystyle P(B)} = {\large \frac{0{,}2}{0{,}3}} \approx 0{,}6667$.

Men det er ikke alltid vi kjenner P(AB), slik som i eksempel 2.

Eksempel 2:

På en smerteklinikk får 10 % av pasientene narkotiske tabletter. Generelt er 5 % av pasientene narkomane. Av de som får narkotiske tabletter, er 8 % narkomane. Så skal vi regne ut hvor sannsynlig det er at en narkoman pasient får narkotiske tabletter.

Kaller vi hendelsen at en pasient får narkotiske tabletter for A, har vi at P(A) = 0,1.

Kaller vi hendelsen at en pasient er narkoman for B, har vi at P(B) = 0,05.

Hendelsen at en pasient er narkoman, gitt at vedkommende får narkotiske tabletter, blir da B|A, og vi har at P(B|A) = 0,08.

Sannsynligheten for at en narkoman pasient får narkotiske tabletter blir da P(A|B), og Bayes regel gir oss at

$P(A | B) = \frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)} = {\large \frac{0{,}1 \cdot 0{,}08}{0{,}05}} = 0{,}16$.

Det er 16 % sannsynlig at en narkoman pasient får narkotiske tabletter.

Eksempel 3:

$ {\large \frac{1}{10 \, 000}}$ av innbyggerne i et land har en sykdom. Velger vi personer tilfeldig, og lar hendelse A være at en vilkårlig person er syk, vil vi ha $P(A) = {\large \frac{1}{10 \, 000}} = 0{,}0001$.

Det finnes en test for sykdommen, som i snitt gir utslag i 1,0098 % av tilfellene den brukes. Lar vi hendelse B være at testen gir utslag, vil vi ha $P(B) = 0{,}010098$.

Testen er 99 % sikker, det vil si at hvis en syk person testes, vil den slå ut med 99 % sikkerhet. Vi har derfor at sannsynligheten for «utslag, gitt syk» er $P(B|A) = 0{,}99$.

Ved hjelp av Bayes regel kan vi så finne sannsynligheten for at en vilkårlig person som får positivt utslag, faktisk er syk, altså «syk, gitt utslag», $ P(A|B)$:

$P(A|B) =\frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)} = {\large \frac{0,0001 \cdot 0{,}99}{0{,}010098}} \approx 0{,}0098$.

Det er om lag 0,98 % sannsynlig at en vilkårlig person som får positivt utslag, faktisk er syk.

Tallene i eksempel 3 er hentet fra oppgave 3 i artikkelen med introduksjon til sannsynlighet, der vi skulle tippe hvor sannsynlig det var at vi, med positivt utslag på en 99 % sikker test, hadde en sykdom som rammet hver ti-tusende innbygger. P(B), altså hvor ofte testen i snitt ga utslag, var imidlertid ikke oppgitt, men dette kan vi regne oss fram til. Positiv test får vi i 99 % av tilfellene for syke personer og 1 % av tilfellene for friske personer. Av 10 000 er 1 syk og 9999 friske, så vi får

$P(B) = {\large \frac{1}{10 \, 000}} \cdot 0{,}99 + {\large \frac{9999}{10 \, 000}} \cdot 0{,}01 = 0{,}010098$

At en vilkårlig person er frisk, er den komplementære hendelsen til A, altså AC, så vi ser at vi regner ut P(B) som P(A) · P(B|A) + P(AC) · P(B|AC).

Ofte vil vi måtte regne oss fram til P(B) på denne måten. En sykdomstest vil i praksis også gjerne ha forskjellig nøyaktighet for syke og friske.

Eksempel 4:

        • 1 % av en befolkningen i et land har en sykdom.
        • En test påviser sykdommen i 90 % av tilfellene hos de syke.
        • 9,6 % av testene er falske positive, det vil si at de feilaktig påviser sykdommen hos friske.

Så skal vi beregne sannsynligheten for at en person som tester positivt, faktisk har sykdommen.

Kaller vi hendelsen «syk person» for A og hendelsen «positiv test» for B, har vi:

        • P(A) = 0,01. Sannsynligheten for at en person er syk, er 0,01.
        • P(AC) = 1 − 0,01 = 0,99. Sannsynligheten for at en person er frisk, er 0,99.
        • P(B|A) = 0,9. Sannsynligheten for positiv test hos en syk person er 0,9.
        • P(B|AC) = 0,096. Sannsynligheten for positiv test hos en frisk person er 0,096.

Og vi får P(B) = P(A) · P(B|A) + P(AC) · P(B|AC) = 0,01 · 0,9 + 0,99 · 0,096 = 0,10404.

Ved hjelp av Bayes regel kan vi så beregne sannsynligheten for at en person har sykdommen, gitt en positiv test:

$P(A | B) = \frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)} = {\large \frac{0{,}01 \cdot 0{,}9}{0{,}10404}}\approx 0{,}0865$

Sannsynligheten for sykdom, gitt positiv test, er ca. 8,65 %.

Oppgave 2:

        • Katteallergi forekommer hos 10 % av en befolkningen.
        • En test påviser allergi hos 80 % av de allergiske.
        • 15 % av testene er falske positive, det vil si at de feilaktig påviser allergi hos friske.

Beregn sannsynligheten for at en person som tester positivt, faktisk har allergi.

Se løsningsforslag

Kilder

    • Hinna, K.R.C., Rinvold, R.A., Gustavsen, TS. (2011). QED 5-10, bind 1. Høyskoleforlaget
    • Ubøe, J. (2011). Statistikk for økonomifag. Gyldendal akademisk
    • Hagen, Per C. (2000). Innføring i sannsynlighetsregning og statistikk. Cappelen akademisk

Betinget sannsynlighet

Hva er betinget sannsynlighet?

I artikkelen om den generelle produktregelen så vi at vi regner ut sannsynligheten for at to avhengige hendelser begge inntreffer ved å multiplisere sannsynligheten for at den første inntreffer med sannsynligheten for at den andre inntreffer, gitt at den første har inntruffet: $P(A \cap B) = P(A) \cdot P(B)$.

Vi brukte så denne regelen til å regne ut at hvis sannsynligheten for sol en vilkårlig dag er 60 %, og sannsynligheten for sol etter en annen soldag er 80 %, er sannsynligheten for sol to etterfølgende dager 0,6 · 0,8 = 0,48.

Men så snur vi litt på problemstillingen, og sier at vi vet at sannsynligheten for sol en vilkårlig dag er 60 %, og at sannsynligheten for sol på to etterfølgende dager er 48 %. Og så skal vi regne ut sannsynligheten for at en dag får sol gitt at det var sol dagen før. Det betyr at vi må finne verdien til x i likningen 0,6 · x = 0,48. Og det gjør vi ved å dividere med 0,6 på begge sider av likhetstegnet, noe som gir x = 0,8, det vil si 80 prosent.

Vi fant altså sannsynligheten for «sol, gitt sol dagen før» ved å dividere sannsynligheten for «sol etterfølgende dager» på sannsynligheten for «sol første dag». Generaliserer vi dette, og dividerer med P(A) på begge sider av likhetstegnet i produktregelen, får vi $ \frac{\displaystyle P(A \cap B)}{\displaystyle P(A)} = P(B|A)$. Bytter vi så om høyre og venstre side, får vi regelen for betinget sannsynlighet:

$\fbox{Betinget sannsynlighet: $P(B|A) = \frac{\displaystyle P(A \cap B)}{\displaystyle P(A)}$}$

Denne regelen sier at sannsynligheten for at B inntreffer, gitt at A har inntruffet, er lik sannsynligheten for at A og B begge inntreffer dividert med sannsynligheten for at A inntreffer.

I eksempel 1 under illustrerer vi denne regelen med terningkast.

Eksempel 1:

I et spill kaster vi to terninger og vinner hvis summen av øyne er elleve eller tolv. Kaller vi dette hendelse B, kan vi illustrere situasjonen med dette Venn-diagrammet:

Venn diagram som illustrerer terningkombinasjoner som gir sum 11 eller 12

Venn-diagrammet inneholder alle de 36 mulige kombinasjonene av øyne på terningene, med delmengden B, de kombinasjonene som gir sum elleve eller tolv, innringet. Vi ser at B inneholder 3 kombinasjoner, så «gunstige på mulige» gir $P(B) = {\large \frac{3}{36}} = {\large \frac{1}{12}}$. Sannsynligheten for å vinne er $ {\large \frac{1}{12}}$.

Men så tenker vi oss at vi kaster den første terningen, får seks, og skal finne sannsynligheten er for å vinne når vi kaster den andre terningen.

Kaller vi hendelsen «seks på første terning» for A, kan vi illustrere situasjonen med dette Venn-diagrammet:

Venn diagram som illustrerer terningkombinasjoner som gir sum 11 eller 12, gitt at en hendelse har inntruffet

Vi ser at $P(A \cap B) = {\large \frac{2}{36}} = {\large \frac{1}{18}}$ fordi 2 av 36 kombinasjoner ligger både i A og B. Vi vet også at $P(A) = {\large \frac{1}{6}}$ fordi sannsynligheten for å få seks på en terning er ${\large \frac{1}{6}}$. Sannsynligheten for å vinne når første terning var seks, kan vi uttrykke som P(B|A), det vil si sannsynligheten for hendelse B, «sum elleve eller tolv», gitt hendelse A, «seks på første terning».

Regelen for betinget sannsynlighet gir at $P(B|A) = \frac{\displaystyle P(A \cap B)}{\displaystyle P(A)} = {\Large\frac{\frac{1}{18}}{\frac{1}{6}}} = {\large \frac{6}{18}} = {\large \frac{1}{3}}$. Sannsynligheten for å vinne når første terning var seks, er $ {\large \frac{1}{3}}$.

Dette gir mening hvis vi ser på Venn-diagrammet, for av de totalt 6 mulighetene for øyne på andre terning ligger 2 av disse i A, og sannsynligheten for at vi får en av disse når vi kaster andre terning, er, ifølge «gunstige på mulige», ${\large \frac{2}{6}} = {\large \frac{1}{3}}$.

Illustrasjon av betinget sannsynlighet

I eksempel 2 under illustrerer vi hvordan P(B|A) endrer seg når P(AB) endrer seg og når P(A) endrer seg.

Eksempel 2:

Blant 100 gamere som ble intervjuet, spilte 80 «World of Witchcraft» (WoW), 30 spilte «Claw of Duty» (CoD), og 20 spilte begge disse. Lar vi hendelse A være at noen spiller WoW, og hendelse B at noen spiller CoD, kan vi illustrere dette med Venn-diagrammet under, der hver gamer er representert med en blå prikk.

P(A) = 80/100, P(A|B) = 20/100

Vi antar at disse dataene er representative for gamere, og skal anslå hvor sannsynlig det er at en vilkårlig gamer spiller CoD, gitt at vedkommende spiller WoW.

Vi har P(A) = 0,8 fordi 80 av 100 spiller WoW, og vi har P(AB) = 0,2 fordi 20 av 100 spiller både WoW og CoD. Regelen for betinget sannsynlighet gir da:

$P(B|A) = \frac{\displaystyle P(A \cap B)}{\displaystyle P(A)} = {\large \frac{0{,}2}{0{,}8}} = 0{,}25$. Gitt at en gamer spiller WoW, er det 25 % sannsynlig at vedkommende også spiller CoD. Vi ser av Venn-diagrammet at dette er fornuftig, for av alle gamerne i A ligger $ {\large \frac{1}{4}}$ også i B.

Så skal vi se hvordan denne sannsynligheten endrer seg hvis 80 av 100 spiller WoW som før, men bare 10 av disse også spiller CoD. Denne situasjonen kan vi illustrere med dette Venn-diagrammet:

P(A) = 80/100, P(A|B) = 10/100

Sannsynligheten for at en vilkårlig gamer spiller både WoW og CoD blir nå:

$P(B|A) = \frac{\displaystyle P(A \cap B)}{\displaystyle P(A)} = {\large \frac{0{,}1}{0{,}8}} = 0{,}125$. Sannsynligheten er halvert fordi bare $ {\large \frac{1}{8}}$ av alle gamerne i A også ligger i B.

Går vi tilbake til at 20 gamere spiller både WoW og CoD, men sier at bare 40 av 100 spiller WoW, får vi dette Venn-diagrammet:

P(A) = 40/100, P(A|B) = 20/100

Sannsynligheten for at en vilkårlig gamer spiller både WoW og CoD blir nå:

$P(B|A) = \frac{\displaystyle P(A \cap B)}{\displaystyle P(A)} = {\large \frac{0{,}2}{0{,}4}} = 0{,}5$. Sannsynligheten er doblet fordi hele $ {\large \frac{1}{2}}$ av alle gamerne i A også ligger i B.

Vi legger merke til at

        • Sannsynligheten for B|A øker når sannsynligheten for AB øker.
        • Sannsynligheten for B|A øker når sannsynligheten for A avtar. Vi kan tenke på sannsynligheten for A som et mål på hvor «eksklusiv» hendelsen A er. Jo mer A ekskluderer utfall som ikke ligger i AB, jo mer sannsynlig blir B|A.
        • Vi trenger ikke kjenne sannsynligheten for B for å beregne sannsynligheten for B|A.

Oppgave 1:

I et spill der du kaster to terninger, vinner du hvis du får sum 4 eller mindre.

  1. Hva er sannsynligheten for å vinne?
     
  2. Hva er sannsynligheten for å vinne hvis du har kastet den ene terningen og fått 2?

Se løsningsforslag

Oppgave 2:

På et gatekjøkken kjøper 40 % av kundene pølse, og 15 % kjøper pølse og chips. Bruk regelen om betinget sannsynlighet til å beregne sannsynligheten for at en vilkårlig kunde som kjøper pølse, også kjøper chips.

Se løsningsforslag

Betinget sannsynlighet og mengder

Vi kan også bruke kardinalitet i mengder til å komme fram til regelen for betinget sannsynlighet.

I artikkelen om mengder bruker vi bokstaven n for å angi en mengdes kardinalitet, altså antall elementer i en mengde. For eksempel betyr n(A) = 6 at mengden A inneholder 6 elementer, slik som i eksempel 1.

Tenker vi «gunstige på mulige», kan vi uttrykke P(B|A) som antall elementer som ligger i både A og B, dividert på antall elementer i A totalt. Altså $P(B|A) = \frac{\displaystyle n(A \cap B)}{\displaystyle n(A)}$.

Gjør vi så et lite mattetriks, og utvider brøken med $\frac{\displaystyle 1}{\displaystyle n(U)}$, der n(U) er antall elementer i mengden som består av hele utfallsrommet, får vi:

$P(B|A) = \frac{\displaystyle n(A \cap B)}{\displaystyle n(A)} \cdot \frac{\frac{\displaystyle 1}{\displaystyle n(U)}}{\frac{\displaystyle 1}{\displaystyle n(U)}} = \frac{\frac{\displaystyle n(A \cap B)}{\displaystyle n(U)}}{\frac{\displaystyle n(A)}{\displaystyle n(U)}}$

Det som står i telleren i hovedbrøken, er antall elementer i AB dividert på antall elementer totalt. Noe som ikke er annet enn «gunstige på mulige» for hendelsen AB , altså P(AB). Tilsvarende er det som står i nevneren P(A). Trekker vi det hele sammen, får vi regelen for betinget sannsynlighet: $P(B|A) = \frac{\displaystyle P(A \cap B)}{\displaystyle P(A)}$.

SkjermfilmSe filmen «Betinget sannsynlighet»

Uavhengighet kan også angis ved hjelp av betinget sannsynlighet:

$\fbox{$B$ er uavhengig av $A$ hvis $P(B|A) = P(B)$}$

Hendelsen B er uavhengig av hendelsen A hvis sannsynligheten for B ikke påvirkes av om A har inntruffet eller ikke.

Kilder

    • Hinna, K.R.C., Rinvold, R.A., Gustavsen, TS. (2011). QED 5-10, bind 1. Høyskoleforlaget
    • Ubøe, J. (2011). Statistikk for økonomifag. Gyldendal akademisk
    • Hagen, Per C. (2000). Innføring i sannsynlighetsregning og statistikk. Cappelen akademisk

Den generelle produktregelen

Uavhengige og avhengige hendelser

Vi vet at det i en by er 60 % sannsynlig at det blir sol en vilkårlig dag i juli. 

Så skal vi regne ut sannsynligheten for at det blir sol i byen både 15. juli neste år og 15. juli året etter det igjen.

Det er ingen grunn til å tro at det skal være noen avhengighet mellom to dager så langt fra hverandre, så vi kan bruke produktregelen for uavhengige hendelser:

$\fbox{Produktregelen for uavhengige hendelser: $P(A \cap B) = P(A) \cdot P(B)$}$

Sannsynligheten for at det blir sol i byen begge de to dagene er altså 0,6 · 0,6 = 0,36, det vil si 36 %.

Men så sier vi videre at vi vet at det i den samme byen er 80 % sannsynlig at det etter en dag med sol kommer en ny dag med sol. Og så skal vi regne ut sannsynligheten for at det blir sol både 15. og 16. juli neste år.

Disse hendelsene er ikke uavhengige, vi vet at sannsynligheten for sol en vilkårlig dag generelt er 60 %, men 80 % hvis det var sol dagen før. Vi kan derfor ikke bruke produktregelen for uavhengige hendelser. I stedet bruker vi den generelle produktregelen, som tar høyde for at hendelser kan være avhengige av hverandre:

$\fbox{Den generelle produktregelen: $P(A \cap B) = P(A) \cdot P(B|A)$}$

B|A leses «B, gitt A», og P(B|A) er sannsynligheten for at hendelse B inntreffer, gitt at hendelse A har inntruffet. Lar vi hendelse A bety «sol 15. juli» og hendelse B bety «sol 16. juli», vet vi at P(A) er 60 % og P(B|A) er 80 %.

Sannsynligheten for at det blir sol både 15. og 16. juli neste år, blir altså, ifølge den generelle produktregelen, 0,6 · 0,8 = 0,48, det vil si 48 %.

Den generelle produktregelen sier at sannsynligheten for at hendelse A og B begge inntreffer er lik sannsynligheten for A multiplisert med sannsynligheten for B, gitt at A har inntruffet.

Dersom hendelsene A og B faktisk er uavhengige, er P(B|A) = P(B), og den generelle produktregelen blir lik produktregelen for uavhengige hendelser.

Oppgave 1:

En eksamen består av en teoretisk og en praktisk prøve. I snitt klarer 70 % den teoretiske prøven, og 80 % av de som klarer den teoretiske prøven, klarer den praktiske prøven. Beregn sannsynligheten for å klare både den teoretiske og den praktiske prøven.

Se løsningsforslag

Så et eksempel der vi ser på bruk av produktregelen når vi trekker kuler fra ei eske, med og uten tilbakelegging:

Eksempel 1:

Ei eske inneholder 10 kuler, hvorav 6 er hvite og 4 svarte, og vi skal finne sannsynligheten for å først få ei hvit kule, deretter ei svart, når vi trekker ei kule, legger tilbake, og så trekker en gang til.

Vi kaller sannsynligheten for å trekke ei hvit kule for P(H), og sannsynligheten for å trekke ei svart for P(S).

Siden 6 av totalt 10 kuler er hvite, alle med lik sannsynlighet for å bli trukket, får vi
$P(H) = {\large \frac{6}{10}} = {\large\frac{3}{5}}$.

Tilsvarende for svart:
$P(S) = {\large \frac{4}{10}} = {\large\frac{2}{5}}$.

Disse hendelsene er uavhengige, så vi bruker produktregelen for uavhengige hendelser for å finne sannsynligheten for å først trekke hvit, så svart:
$P(H \cap S) = P(H) \cdot P(S) = {\large\frac{3}{5}} \cdot {\large\frac{2}{5}} = {\large\frac{6}{25}} = 24 \%$.

Men så lar vi være å legge den første kula tilbake, og spør hva sannsynligheten da er for å først få ei hvit kule, deretter ei svart. Nå er de to trekningene ikke lenger uavhengige, for sannsynligheten for å få ei svart kule i andre trekning avhenger av hva vi fikk i første trekning. Har vi fått hvit kule i første trekning, er det fremdeles 4 svarte tilbake, men nå er det bare 9 å velge blant, så vi får
$P(S|H) = {\large \frac{4}{9}}$.

Så bruker vi den generelle produktregelen for å finne sannsynligheten for å først trekke hvit, så svart:
$P(H \cap S) = P(H) \cdot P(S|H) = {\large\frac{3}{5}} \cdot {\large\frac{4}{9}} = {\large\frac{4}{15}} \approx 27 \%$.

Varianten uten tilbakelegging er naturlig nok litt mer sannsynlig enn varianten med tilbakelegging fordi det i andre trekning da er en større andel svarte kuler.

Vil vi beregne sannsynligheten for det motsatte, først svart kule, så hvit uten tilbakelegging, får vi
$P(S) = {\large \frac{4}{10}} = {\large\frac{2}{5}}$
$P(H|S) = {\large \frac{6}{9}}$
$P(S \cap H) = P(S) \cdot P(H|S) = {\large\frac{2}{5}} \cdot {\large\frac{6}{9}} = {\large\frac{4}{15}}$.

Sannsynligheten er altså den samme, uavhengig av hvilken rekkefølge vi trekker kulene i. Det er logisk, for i produktregelen P(AB) = P(A) · P(B|A) kan vi jo fritt velge om A skal representere «hvit» og B «svart», eller omvendt.

Til sammen gir disse to tilfellene sannsynligheten for å få ei svart og ei hvit kule når vi trekker to ganger uten tilbakelegging, ${\large\frac{4}{15}} + {\large\frac{4}{15}} = {\large\frac{8}{15}}$.

Oppgave 2:

Vi har 7 kuler av ulik farge i en pose, deriblant 1 rød, og skal beregne sannsynligheten for å få den røde hvis vi trekker 3 kuler.

Vi kan tenke oss at vi stikker hånda i posen og trekker opp 3 kuler samtidig. Hver kule har en sannsynlighet på ${\large \frac{1}{7}}$ for å være rød, så totalt er det en sannsynlighet på ${\large \frac{3}{7}} \approx 43 \, \%$ for at vi har fått den røde.

Men vi kan også tenke oss at vi trekker ei kule av gangen, og resonnerer slik: Ved første trekning er 1 av 7 kuler røde, så sannsynligheten for å få den røde er da ${\large \frac{1}{7}}$. Hvis vi ikke får den røde kula i første trekning, er 1 av 6 gjenværende kuler røde, så sannsynligheten for å få den røde i andre trekning er ${\large \frac{1}{6}}$. Hvis vi fremdeles ikke har fått den røde kula, er 1 av 5 gjenværende røde kuler røde så sannsynligheten for å få den røde i tredje trekning er ${\large \frac{1}{5}}$.

Vi kan bare få den røde kula i én av trekningene, så disse utfallene kan ikke inntreffe samtidig. Vi kan derfor beregne den totale sannsynligheten ved å bruke addisjonsregelen for disjunkte utfall.

Og den totale sannsynligheten blir ${\large \frac{1}{7}} + {\large \frac{1}{6}} + {\large \frac{1}{5}} = {\large \frac{107}{210}} \approx 51 \, \%$.

Vi får altså forskjellig svar avhengig av hvordan vi betrakter situasjonen. Kan dette være riktig? Hvis ikke, hva er problemet, og hvordan er korrekt utregning?

​Se løsningsforslag

Oppgave 3:

I oppgave 2 hadde vi 7 kuler av ulik farge i en pose, deriblant 1 rød, og beregnet sannsynligheten for å trekke den røde hvis vi trakk 3 kuler.

Beregn nå denne sannsynligheten ved hjelp av teknikken for trekning fra blandede mengder, slik det er beskrevet i artikkelen om kombinatorikk.

​Se løsningsforslag

Test for uavhengighet

Produktregelen for uavhengige hendelser sier altså at hvis to hendelser er uavhengige, er sannsynligheten for at begge skal inntreffe, lik sannsynligheten for den ene hendelsen multiplisert med sannsynligheten for den andre, $P(A \cap B) = P(A) \cdot P(B)$

Denne regelen kan vi snu på, og si at to hendelser er uavhengige hvis sannsynligheten for at begge skal inntreffe, er lik sannsynligheten for den ene hendelsen multiplisert med sannsynligheten for den andre.

Eksempel 2:

Vi trekker et kort tilfeldig fra en full kortstokk. Vi lar hendelse A være at vi får ess, hendelse B at vi får spar. Så skal vi avgjøre om disse hendelsene er uavhengige.

Av 52 kort er 13 spar, 4 er ess, og 1 er både spar og ess, så «gunstige på mulige» gir

$P(A) = {\large \frac{13}{52}} = {\large \frac{1}{4}}$

$P(B) = {\large \frac{4}{52}} = {\large \frac{1}{13}}$

$P(A \cap B) = {\large \frac{1}{52}}$.

Siden $P(A) \cdot P(B) = {\large \frac{1}{4}} \cdot {\large \frac{1}{13}} = {\large \frac{1}{52}} = P(A \cap B)$, er hendelsene uavhengige.

At to hendelser er uavhengige, må ikke forveksles med at de er disjunkte. At to hendelser, A og B, er disjunkte, betyr at de ikke kan inntreffe samtidig, det vil si at P(AB) = 0.

Kilder

    • Hinna, K.R.C., Rinvold, R.A., Gustavsen, TS. (2011). QED 5-10, bind 1. Høyskoleforlaget
    • Ubøe, J. (2011). Statistikk for økonomifag. Gyldendal akademisk
    • Hagen, Per C. (2000). Innføring i sannsynlighetsregning og statistikk. Cappelen akademisk