Betinget sannsynlighet

Vi har sett at når vi kaster en terning to ganger, er sannsynligheten for å få 6 begge gangene lik produktet av sannsynlighetene for å få 6 i et enkelt kast: ${\large \frac{1}{6}} \cdot {\large \frac{1}{6}} = {\large \frac{1}{36}}$. Så hvis vi før vi begynner å kaste spør: “Hva er sannsynligheten for at vi kaster 6 to ganger på rad?”, er svaret ${\large \frac{1}{36}}$. Men hvis vi allerede har kastet én gang og fått 6, kreves det jo bare ett kast til med 6. Så svaret på spørsmålet “Hva er sannsynligheten for at vi kaster 6 to ganger på rad når vi allerede har fått 6 i første kast” er ${\large \frac{1}{6}}$. Vi sier at sannsynligheten for å få 6 i to etterfølgende kast, gitt at vi har fått 6 i første kast, er en sjettedel.

I en hendelse som er satt sammen av hendelser i flere etterfølgende forsøk, endrer sannsynlighetene seg etter hvert som vi gjennomfører forsøkene. Vi snakker om betinget sannsynlighet, sannsynligheten for at noe skal skje, gitt at noe allerede har skjedd.

Vi ser på et litt mer komplisert eksempel:

Eksempel 1:

I et spill kaster vi to terninger og vinner hvis summen er 11 eller 12. Hva er sannsynligheten for å vinne?

Vi kaller hendelsen “11 eller 12” for B. Figuren under viser et Venn-diagram med forsøkets utfallsrom. Det inneholder alle de 36 mulige kombinasjonene av øyne på terningene, med delmengden B innringet.

Venn diagram som illustrerer terningkombinasjoner som gir sum 11 eller 12

Vi ser at B inneholder 3 enkeltutfall, så “gunstige på mulige” gir $P(B) = {\large \frac{3}{36}} = {\large \frac{1}{12}}$.

Men la oss så si at vi kaster den første terningen, får 6, og spør oss hva sannsynligheten nå er for å vinne. Dette tilfellet er illustrert i Venn-diagrammet under, der A representerer hendelsen “seks på første terning”:

Venn diagram som illustrerer terningkombinasjoner som gir sum 11 eller 12, gitt at en hendelse har inntruffet

Utfallene i A er de variantene vi kan få når vi kaster neste terning. Av totalt 6 ligger 2 også i B, så de gir “sum 11 eller 12” og gevinst. Gunstige på mulige gir at sannsynligheten for å vinne nå er ${\large \frac{2}{6}} = {\large \frac{1}{3}}$.

I eksempel 1 fant vi ut at sannsynligheten for å vinne i et spill, P(B), gitt at hendelsen “seks på første terning”, A, hadde inntruffet, var ${\large \frac{1}{3}}$. Vi skriver dette som $P(B | A) = {\large \frac{1}{3}}$. B | A betyr altså “B, gitt A“.

I artikkelen om begreper i sannsynlighet brukte vi bokstaven n for å angi antall elementer i en mengde, det vi kalte mengdens kardinalitet. I eksempel 1 har vi at n(A) = 6, n(B) = 3 og n(AB) = 2. Kaller vi hele utfallsrommet for U, har vi n(U) = 36.

P(B | A) fant vi ved å bruke “gunstige på mulige”, det vil si å ta antall elementer som er felles for A og B og dividere på antall elementer i A. Vi har altså at

$P(B | A) = \frac{\displaystyle n(A \cap B)}{\displaystyle n(A)}$.

Gjør vi et lite mattetriks og utvider brøken med $\frac{\displaystyle 1}{\displaystyle n(U)}$, der n(U) altså er antall elementer i mengden totalt, får vi:

$P(B | A) = \frac{\displaystyle n(A \cap B)}{\displaystyle n(A)} \cdot \frac{\frac{\displaystyle 1}{\displaystyle n(U)}}{\frac{\displaystyle 1}{\displaystyle n(U)}} = \frac{\frac{\displaystyle n(A \cap B)}{\displaystyle n(U)}}{\frac{\displaystyle n(A)}{\displaystyle n(U)}}$.

Det som står i telleren i hovedbrøken er altså antall elementer i AB dividert på antall elementer totalt. Og det er jo ikke annet enn “gunstige på mulige” for hendelsen AB , altså P(AB). Tilsvarende er det som står i nevneren P(A). Trekker vi det hele sammen, får vi setningen for betinget sannsynlighet:

$\fbox{Betinget sannsynlighet: $P(B | A) = \frac{\displaystyle P(A \cap B)}{\displaystyle P(A)}$}$

Sannsynligheten for hendelse B gitt at hendelse A har inntruffet, er lik sannsynligheten for at både A og B inntreffer dividert med sannsynligheten for A.

I eksempel 1 får vi ved “gunstige på mulige” at $P(A \cap B) = {\large \frac{2}{36}} = {\large \frac{1}{18}}$ og $P(A) = {\large \frac{6}{36}} = {\large \frac{1}{6}}$.

$P(B | A) = \frac{{\LARGE \frac{1}{18}}}{{\LARGE \frac{1}{6}}} = {\large \frac{1}{3}}$, som stemmer med det vi fant i eksempel 1.

Eksempel 2:

La oss si at det er 65 % sannsynlighet for at nyfødte i et land lever til de fyller 70 år, og 30 % sannsynlighet for at de lever til de fyller 80 år. Så vil vi finne sannsynligheten for at en person i landet som nettopp har fylt 70 år, vil leve til å fylle 80 år.

Her skal vi finne en betinget sannsynlighet, nemlig sannsynligheten for at en person vil fylle 80, gitt fylte 70.

Vi kaller sannsynligheten for å fylle 70 for A, og sannsynligheten for å fylle 80 for B. Det er oppgitt at P(A) = 0,65. Hva er så P(AB), sannsynligheten for å fylle både 70 og 80? Jo, den er jo den samme som for å fylle 80, for en kan ikke bli 80 uten å først ha blitt 70. De som fyller 70 er en delmengde av de som fyller 80. Så P(AB) = 0,30.

Formelen for betinget sannsynlighet gir nå at $P(B | A) = {\large \frac{P(A \cap B)}{P(A)}} = {\large \frac{0,30}{0{,}65}} \approx 0{,}462$.

Sannsynligheten for å fylle 80 ved fylte 70 er ca. 46 %. Det er rimelig at sannsynligheten for å fylle 80 er større for en 70-åring enn for en nyfødt, fordi det er 35 % sannsynlighet for at en nyfødt vil dø før fylte 70, en sannsynlighet som er 0 for en 70-åring.

Oppgave 1:

I et spill der du kaster to terninger vinner du hvis du får sum 4 eller mindre.

  1. Hva er sannsynligheten for å vinne?
     
  2. Hva er sannsynligheten for å vinne hvis du har kastet den ene terningen og fått 2?

Se løsningsforslag
 

SkjermfilmSe filmen “Betinget sannsynlighet”
 

Test for uavhengighet

Hvis vi kjenner sannsynligheten for en hendelse A, sannsynligheten for en hendelse B, og sannsynligheten for begge hendelsene, AB, kan vi avgjøre om A og B er uavhengige hendelser ved å bruke følgende test:

$\fbox{$A$ og $B$ er uavhengige hvis $P(A \cap B) = P(A) \cdot P(B)$}$

Dette kjenner vi igjen som produktsetningen for uavhengige hendelser, som sier at sannsynligheten for at to hendelser begge inntreffer er lik produktet av enkeltsannsynlighetene, forutsatt at hendelsene er uavhengige.

Eksempel 3:

Vi trekker et kort tilfeldig fra en full kortstokk. Vi lar hendelse A være at vi får ess, hendelse B at vi får spar. Er disse hendelsene uavhengige?

Av 52 kort er 4 ess, 13 er spar, og 1 er både spar og ess, så vi får

$P(A) = {\large \frac{4}{52}} = {\large \frac{1}{13}}$

$P(B) = {\large \frac{13}{52}} = {\large \frac{1}{4}}$

$P(A \cap B) = {\large \frac{1}{52}}$.

Siden $P(A) \cdot P(B) = {\large \frac{1}{13}} \cdot {\large \frac{1}{4}} = {\large \frac{1}{52}} = P(A \cap B)$, er hendelsene uavhengige.

At to hendelser er uavhengige må ikke forveksles med at de er disjunkte. At to hendelser, A og B, er disjunkte, betyr at de ikke kan inntreffe samtidig, det vil si at P(AB) = 0.

Uavhengighet kan også angis ved hjelp av betinget sannsynlighet:

$\fbox{$B$ er uavhengig av $A$ hvis $P(B | A) = P(B)$}$

B er uavhengig av A hvis sannsynligheten for B ikke påvirkes av om A har inntruffet eller ikke.

Den generelle produktsetningen

Ved hjelp av betinget sannsynlighet kan vi formulere en generell variant av produktsetningen, der det ikke er noe krav om at hendelsene som inngår er uavhengige:

$\fbox{Produktsetningen: $P(A \cap B) = P(A) \cdot P(B | A)$}$

Sannsynligheten for at både hendelse A og B inntreffer er lik sannsynligheten for A multiplisert med sannsynligheten for B, gitt at A har inntruffet.

Dersom hendelse A og B faktisk er uavhengige, er P(B | A) = P(B), og den generelle produktsetningen blir lik produktsetningen for uavhengige hendelser.

Eksempel 4:

Ei eske inneholder 10 kuler, hvorav 6 er hvite og 4 svarte, og vi skal finne sannsynligheten for å først få ei hvit kule, deretter ei svart, når vi trekker ei kule, legger tilbake, og så trekker en gang til.

Vi kaller sannsynligheten for å trekke ei hvit kule for P(H), og sannsynligheten for å trekke ei svart for P(S).

Siden 6 av totalt 10 kuler er hvite, alle med lik sannsynlighet for å bli trukket, får vi
$P(H) = {\large \frac{6}{10}} = {\large\frac{3}{5}}$.

Tilsvarende for svart:
$P(S) = {\large \frac{4}{10}} = {\large\frac{2}{5}}$.

Disse hendelsene er uavhengige, så vi bruker produktsetningen for uavhengige hendelser for å finne den totale sannsynligheten:
$P(H \cap S) = P(H) \cdot P(S) = {\large\frac{3}{5}} \cdot {\large\frac{2}{5}} = {\large\frac{6}{25}} = 24 \%$.

Men så lar vi være å legge den første kula tilbake, og spør hva sannsynligheten da er for å først få ei hvit kule, deretter ei svart. Nå er de to trekningene ikke lenger uavhengige, for sannsynligheten for å få ei svart kule i andre trekning avhenger av hva vi fikk i første trekning. Har vi fått hvit kule i første trekning, er det 4 av 9 svarte kuler tilbake og vi får
$P(S | H) = {\large \frac{4}{9}}$.

Vi bruker den generelle produktsetningen for å finne den totale sannsynligheten:
$P(H \cap S) = P(H) \cdot P(S | H) = {\large\frac{3}{5}} \cdot {\large\frac{4}{9}} = {\large\frac{4}{15}} \approx 27 \%$.

Varianten uten tilbakelegging er naturlig nok litt mer sannsynlig enn varianten med tilbakelegging fordi det i andre trekning da er en større andel svarte kuler.

Vil vi beregne sannsynligheten for det motsatte, først svart kule, så hvit uten tilbakelegging, får vi
$P(S) = {\large \frac{4}{10}} = {\large\frac{2}{5}}$
$P(H | S) = {\large \frac{6}{9}}$
$P(S \cap H) = P(S) \cdot P(H | S) = {\large\frac{2}{5}} \cdot {\large\frac{6}{9}} = {\large\frac{4}{15}}$.

Sannsynligheten er altså den samme, uavhengig av hvilken rekkefølge vi trekker kulene i. Det er logisk, for i produktsetningen P(AB) = P(A) · P(B | A) kan vi jo fritt velge om A skal representere “hvit” og B “svart”, eller omvendt.

Til sammen gir disse to tilfellene sannsynligheten for å få ei svart og ei hvit kule når vi trekker to ganger, ${\large\frac{4}{15}} + {\large\frac{4}{15}} = {\large\frac{8}{15}}$.

Som vi så da vi studerte trekning fra blandede mengder i artikkelen om kombinatorikk, kan vi også regne dette ut som antall mulige kombinasjoner med 1 hvit multiplisert med antall mulige kombinasjoner med 1 svart dividert med antall mulige kombinasjoner totalt:
${\Large \frac{\binom{6}{1} \cdot  \binom{4}{1}}{ \binom{10}{2}}} = {\large \frac{24}{45}} = {\large \frac{8}{15}}$.

Oppgave 2:

Vi har 7 kuler av ulik farge i en pose, deriblant 1 rød, og skal beregne sannsynligheten for å trekke den røde hvis vi trekker 3 kuler.

Vi kan tenke oss at vi stikker hånda i posen og trekker opp 3 kuler. Hver kule har en sannsynlighet på ${\large \frac{1}{7}}$ for å være rød, så totalt er det en sannsynlighet på ${\large \frac{3}{7}}$ for at vi har trukket den røde.

Men vi kan også tenke oss at vi trekker ei og ei kule, og resonnerer slik: Ved første trekning er 1 av 7 kuler røde, så sannsynligheten for å trekke den røde er da ${\large \frac{1}{7}}$. Ved neste trekning er 1 av 6 røde kuler røde, så sannsynligheten for å trekke den røde da er ${\large \frac{1}{6}}$. Og i tredje trekning er 1 av 5 kuler røde, så sannsynligheten for å trekke den røde da er ${\large \frac{1}{5}}$. Og den totale sannsynligheten blir ${\large \frac{1}{7}} + {\large \frac{1}{6}} + {\large \frac{1}{5}}$.

Vi får altså forskjellig svar avhengig av hvordan vi betrakter situasjonen. Kan dette være riktig? Hvis ikke, hva er problemet, og hvordan er korrekt utregning?

​Se løsningsforslag

Oppgave 3:

I oppgave 2 hadde vi 7 kuler av ulik farge i en pose, deriblant 1 rød, og beregnet sannsynligheten for å trekke den røde hvis vi trakk 3 kuler.

Beregn nå denne sannsynligheten ved hjelp av teknikken for trekning fra blandede mengder, slik det er beskrevet i artikkelen om kombinatorikk.

​Se løsningsforslag

Bayes setning

Vi har sett hvordan vi ved hjelp av setningen for betinget sannsynlighet kan finne P(BA) hvis vi kjenner P(A ∩ B) og P(A).

Bayes setning lar oss finne den “omvendte” betingede sannsynligheten, P(A | B):

$\fbox{Bayes setning: $P(A | B) = P(B | A) \cdot \frac{\displaystyle P(A)}{\displaystyle P(B)}$}$

Bayes setning ble formulert av presten Thomas Bayes.

Eksempel 5:

I artikkelen om introduksjon til sannsynlighet spurte vi hva sannsynligheten for at du faktisk er syk er hvis du tester positivt på en test som er 99 % sikker, og hver ti-tusende person er smittet. Dette kan vi nå regne ut ved hjelp av betinget sannsynlighet og Bayes setning.

Vi kaller begivenheten “syk” for S. Vi har $P(S) = {\large \frac{1}{10 \, 000}} = 0{,}0001$ fordi hver ti-tusende person er syk.

Vi kaller begivenheten “positiv test” for T. For å finne P(T), må vi regne litt. Positiv test får vi i 99 % av tilfellene for syke personer og 1 % av tilfellene for friske personer. Av 10 000 er 1 syk og 9999 friske, så vi får

$P(T) = {\large \frac{0{,}99 \cdot 1+ 0{,}01 \cdot 9999}{10 \, 000}} = 0{,}010098$.

Vi kjenner også P(T | S) = 0,99 fordi testen slår ut med 99 % sikkerhet hvis du er syk.

Da får vi sannsynligheten for at du er syk, gitt at testen er positiv, fra Bayes setning:

$P(S | T) = P(T | S) \cdot {\large \frac{P(S)}{P(T)}} = 0{,}99 \cdot {\large \frac{0,0001}{0{,}010098}} \approx 0{,}0098$.

Det er ca. 1 % sjanse for at du faktisk er syk.

Oppgave 4:

I eksempel 1 så vi på et spill der vi vant hvis vi fikk sum 11 eller 12. Vi da hadde følgende sannsynligheter:

Sannsynlighet for “sum 11 eller 12”: $P(B) = {\large \frac{1}{12}}$.

Sannsynlighet for “seks på første terning”: $P(A) = {\large \frac{1}{6}}$.

Sannsynlighet for å vinne, gitt at vi har fått seks på første terning: $P(B | A) = {\large \frac{1}{3}}$.

Bruk Bayes setning til å finne den “omvendte”, betingede sannsynligheten, det vil si sannsynligheten for at første terning var 6 hvis vi har vunnet, P(A | B).

​Se løsningsforslag
 

SkjermfilmSe filmen “Bayes setning”
 

Sannsynlighetstrær

En komplisert sammensetning av betingede sannsynligheter kan gjøres mer oversiktlig ved hjelp av sannsynlighetstrær. Vi illustrerer med et eksempel, hentet fra Ubøe: statistikk for økonomifag.

Eksempel 6:

En bedrift har to hovedmaskiner, maskin 1 og maskin 2. 60 % av varene blir behandlet på maskin 1, mens resten blir behandlet på maskin 2. Av varene som blir behandlet på maskin 1, blir i neste trinn 75 % sluttbehandlet på maskin 3, og resten på maskin 4. Av varene som blir behandlet på maskin 2, blir i neste trinn 50 % sluttbehandlet på maskin 5, og resten på maskin 6. Alle varer som behandles på maskin 3, er feilfrie. Av varene som behandles på maskin 4, er 40 % feilfrie. Av varene som behandles på maskin 5, er 60 % feilfrie, mens kun 10 % av varene som behandles på maskin 6, er feilfrie.

Denne kompliserte beskrivelsen blir mye klarere hvis vi illustrerer den med et sannsynlighetstre.

Sannsynlighetstre med relative verdier

Her ser vi for eksempel at i første trinn blir 60 % av produksjonen behandlet på maskin 1, som beskrevet. Og når resten blir behandlet på maskin 2, må dette utgjøre 40 %.

Eksempel 6:

Sannsynlighetstreet i eksempel 6 inneholder relative verdier. For eksempel ser vi at maskin 3 gir 100 % varer uten feil og 0 % med feil, og at maskin 4 gir 40 % varer uten feil og 60 % med feil. Men det er vanskelig å danne seg et bilde av helheten, for eksempel å finne ut hvor mange varer totalt som har feil.

Vi regner derfor om til absolutte verdier ved å multiplisere verdiene langs grenene i treet. Når for eksempel 60 % av totalproduksjonen foregår på maskin 1, og 25 % av det som kommer ut av maskin 1 går videre til maskin 4, utgjør dette 0,6 ·0,25 = 0,15, altså 15 % av totalproduksjonen. Følger vi tråden videre gjennom maskin 4, ser vi at 0,15 · 0,6 = 0,09, altså 9 % av totalproduksjonen kommer ut av maskin 4 med feil.
Med alt regnet om til absolutte sannsynligheter blir sannsynlighetstreet som vist under:

Sannsynlighetstre med absolutte verdier

Eksempel 8:

Med utgangspunkt i sannsynlighetstreet i eksempel 7, skal vi finne ut hvor stor prosent av feilene som skjer på maskin 1.

Vi finner total feilprosent ved å summere prosentene med feil i slutten av produksjonskjeden. (Ytterst i sannsynlighetstreet). Vi får 0 % + 9 % + 8 % + 18 % = 35 % feil. Ut av dette kommer 0 % + 9 % = 9 % via maskin 1. Så feil fra maskin 1 utgjør ${\large \frac{9}{35}} \approx 0{,}26$. Omlag 26 % av alle feil kommer fra maskin 1.

Eksempel 9:

Med utgangspunkt i sannsynlighetstreet i eksempel 7, skal vi beregne sannsynligheten for at produksjonen fra maskin 1 og 3 er feilfri.

Totalt kommer 45 % + 0 % fra disse maskinene, og totalt er 45 % feilfrie. “Gunstige på mulige” gir at $P(\text{OK | maskin 1 og 3}) = {\large \frac{0{,}45}{0{,}45}} = 1$, altså er 100 % feilfrie.

Oppgave 5:

Beregn, med utgangspunkt i sannsynlighetstreet i eksempel 7, hvor stor sannsynligheten er for at en vare kommer fra maskin 1 og 3 hvis den er feilfri.

​Se løsningsforslag

Oppgave 6:

Fra Ubøe: statistikk for økonomifag:

En megler selger andeler i 3 forskjellige fond: A, B og C. 30 % av kundenes penger blir investert i A, 60 % i B og 10 % i C. De forskjellige fondene sprer investeringene på aksjemarkedene i USA, Europa og Japan, med andeler som vist i tabellen under:

Fond USA Europa Japan
A 50 % 30 % 20 %
B 20 % 70 % 10 %
C 30 % 50 % 20 %
      1. Tegn et sannsynlighetstre som beskriver situasjonen. Skriv inn relative sannsynligheter (de som er oppgitt i oppgaven) langs grenene i treet, og beregn de absolutte sannsynlighetene ytterst.
      2. Hvor stor andel av midlene i fond A og fond B er investert i USA?
      3. Hvor stor del av investeringene i USA er kommet gjennom fond A?

​Se løsningsforslag

Kilder:

  • Hinna, K.R.C., Rinvold, R.A., Gustavsen, TS. (2011). QED 5-10, bind 1. Høyskoleforlaget
  • Ubøe, J. (2011). Statistikk for økonomifag. Gyldendal akademisk
  • Hagen, Per C. (2000). Innføring i sannsynlighetsregning og statistikk. Cappelen akademisk