Regneark

Tabellen under gir en oversikt over alle regneark (Excel) det refereres til på nettstedet.

Artikkel Beskrivelse Regneark
Pytagoreiske tripler Genererer pytagoreiske tripler basert på formlene $x = 2st$, $y = s^2 – t^2$ og $z = s^2 + t^2$. pytagoreiske_tripler
Begreper i sannsynlighet Simulerer 1000 kast med to terninger og teller opp hvor mange ganger de forskjellige summene forekommer sum_to_terninger
Misforståelser i sannsynlighet Simulerer 20 bilsifre og 30 fødselsdager, og markerer like verdier med en X. flere_like
Gir brukeren mulighet til å eksperimentere med parametere i paradokset med de falske positive falske_positive
Kombinatorikk Eksempler på bruk av kombinatorikk-funksjonene fakultet, permuter og kombinasjon. kombinatorikk
Lar brukeren oppgi antall gutter og jenter i en klasse og i et utvalg, og beregner hvor mange kombinasjoner det finnes. utvalg_av_elever
Introduksjon til statistikk Viser hvordan vi kan bruke diagrammer til å gi galt inntrykk ved å "jukse" med aksene. aksejuks
Måltall i statistikk Viser et par stolpediagrammer. stolpediagrammer
Demonstrerer bruk av funksjoner for å beregne gjennomsnitt, median, typetall, standardavvik, variasjonsbredde, persentiler, kvartiler og kvartilbredde. maaltall
Diskrete sannsynlighetsfordelinger Viser bruk av funksjonen for å beregne binomiske sannsynligheter. binom_fordeling
Viser bruk av funksjonen for å beregne hypergeometriske sannsynligheter. hypergeom_fordeling
Viser bruk av funksjonen for å beregne poissonsannsynligheter. poissonfordeling
Normalfordelingen Beregner sannsynligheter i en normalfordeling med en gitt forventning og et gitt standardavvik normalfordeling
Estimering Beregner konfidensintervaller for et gitt gjennomsnitt, et gitt standardavvik og en gitt populasjonsstørrelse basert på en normalfordeling. konfidens_normal
Beregner konfidensintervaller for et gitt gjennomsnitt, et gitt standardavvik og en gitt populasjonsstørrelse basert på en t-fordeling. konfidens_t
Sammenlikne datasett Beregner kovarians og korrelasjonskoeffisient samvariasjon
Viser eksempler på bruk av funksjonen t.test t_test

 

Løsningsforslag, sannsynlighet

Introduksjon til sannsynlighet

Oppgave 1:

En kollega vil vedde på at det blant de første 20 bilene som passerer er minst to som har samme to sluttsifre i registreringsnummeret. Bør du vedde imot?

Nei, du vil sannsynligvis tape. Det er om lag 87 % sannsynlighet for at minst to av 20 vilkårlige registreringsnumre slutter på samme to sifre.

Tenk deg at en vegg er delt i 100 like store ruter, at du skal kaste en ball tjue ganger mot veggen i blinde, og at det er helt tilfeldig hvor du treffer. Sannsynligheten for ikke å treffe samme rute to eller flere ganger er da den samme som for at ingen av 20 biler har samme sluttsifre.

De første kastene går nok greit. Men når du kommer til kast 16, er det 15 ruter du ikke må treffe. Så er det 16, neste gang 17, så 18, og til slutt 19. Selv om det i hvert kast er mest sannsynlig å treffe en ny rute, er det ikke så sannsynlig at du klarer det i kast etter kast etter kast.

Tilbake til oppgaven

Oppgave 2:

I Monty Halls gameshow vinner du en bil hvis du velger den riktige av tre dører. Når du har valgt dør, åpner Monty en av de to andre, der det ikke er noe bak. Du vet nå at bilen enten er bak den ene døren du har valgt, eller bak den tredje, som ennå er lukket. Er det noen vits i å bytte dør, sannsynlighetene er vel 50-50?

Ja, du bør bytte! Sjansene er ikke 50-50, men ca. 33-66. Ved å bytte dobler du vinnersannsynlighetene.

Idet du velger, er det en tredels sannsynlighet for at bilen er bak døra du har valgt, og to tredels sannsynlighet for at den er bak en av de to andre. Når Monty åpner en dør uten noe bak, betyr det at det er to tredels sannsynlighet for at bilen er bak den lukkede døra du ikke har valgt.

Vanskelig å forstå? La oss gjøre problemstillingen mer ekstrem, av og til kan det å gjøre noe veldig stort eller veldig lite gjøre ting mer intuitive.

Tenk deg at det er 1000 dører med en bil bak en av dem. Du velger 1, så åpner Monty 998 der det ikke er noe. Vil du fremdeles ikke bytte til den ene døra som er igjen? Selvfølgelig vil du det. Ved å bytte øker du vinnersannsynlighetene fra 0,1 % til 99,9 %.

Tilbake til oppgaven

Oppgave 3:

Du tester positivt på en dødelig sykdom som har rammet hver titusende innbygger. Testen er 99 % sikker, så du regner med at du sannsynligvis stryker med hvis du ikke betaler en formue for behandling. Men hvor sannsynlig er det at du faktisk er syk?

Det er om lag 1 % sannsynlighet for at du faktisk er syk. Hvis du trodde at sannsynligheten for at du var syk var kjempestor, lot du deg lure av paradokset med de falske positive.

At testen er 99 % sikker betyr at den i 1 % av tilfellene ikke klarer å påvise at en syk person faktisk er syk, men også at den i 1 % av tilfellene påviser sykdom hos en person som faktisk er frisk. Og siden det finnes så mange flere friske enn syke, er det flest friske som blir feildiagnostisert.

La oss si at vi tester 1 000 000 personer. Siden hver titusende i gjennomsnitt er syk, kan vi blant disse forvente å finne 100 syke og 999 900 friske. Av de syke vil i snitt 99 %, altså 99 teste positivt. Av de friske vil i snitt 1 %, altså 9999 teste positivt. Totalt er det altså 9999 + 99 = 10 098 positive tester. Av disse er ${\large \frac{99}{10 \, 098}} \approx 0{,}0098$, altså ca. 1 %, fra personer som faktisk er syke.

Tilbake til oppgaven

Begreper i sannsynlighet

Oppgave 1:

Vi skal bestemme hva som er utfallsrommet, og hvilke enkeltutfall vi kan få når vi kaster tre mynter og teller opp antall kron.

Vi kan få ingen, én, to eller tre kron, så utfallsrommet er {0, 1, 2, 3}.

Kaller vi kron for K og mynt for M, blir enkeltutfallene
{M-M-M, M-M-K, M-K-M, M-K-K, K-M-M, K-M-K, K-K-M, K-K-K}.

Det er altså 8 mulige enkeltutfall. Det gir mening, for det finnes 2 muligheter for hver av 3 mynter, altså 23 = 8 kombinasjonsmuligheter.

Tilbake til oppgaven

Oppgave 2:

På et terningkast skal vi beregne sannsynligheten for å få

    1. 5 eller 6
      Dette er to av i alt seks like sannsynlige muligheter som ikke kan inntreffe samtidig, så sannsynligheten blir $P(\{5, 6\}) = {\large \frac{2}{6}} = {\large \frac{1}{3}}$.
       
    2. Ikke 5 eller 6
      Dette tilsvarer å få 1, 2, 3 eller 4. Samme argument som i punkt 1 gir at sannsynligheten blir $P(\{1, 2, 3, 4\}) = {\large \frac{4}{6}} = {\large \frac{2}{3}}$.
      Vi kan imidlertid også benytte oss av at summen av sannsynlighetene skal bli 1, slik at sannsynligheten for ikke å 5 eller 6 er $1 − P(\{5, 6\}) = 1 − {\large \frac{1}{3}} = {\large \frac{2}{3}}$.

Tilbake til oppgaven

Oppgave 3:

Vi skal beregne sannsynlighetene for å få henholdsvis 0, 1, 2 og 3 kron ved kast med 3 mynter.

Vi har i alt 8 enkeltutfall:
{M-M-M, M-M-K, M-K-M, M-K-K, K-M-M-, K-M-K, K-K-M, K-K-K}.

Vi ser at 1 av disse gir null kron, 3 gir én kron, 3 gir to kron, og 1 gir tre kron. Så sannsynlighetene blir

$P(0) = P(3) = {\large \frac{1}{8}}$.

$P(1) = P(2) = {\large \frac{3}{8}}$.

Vi ser at vi har en symmetrisk fordeling sentrert rundt én og to kron.

Tilbake til oppgaven

Oppgave 4:

    1. Vi skal beregne sannsynligheten for at en familie med to barn har ett barn av hvert kjønn, når vi antar at gutt og jente er like sannsynlig.
      Vi har fire, like sannsynlige enkeltutfall som ikke kan inntreffe samtidig: {G-G, G-J, J-G, J-J}.
      To av disse gir ett av hvert kjønn, så ut fra «gunstige på mulige» får vi at
      $P(\text{«ett av hvert»}) = {\large \frac{2}{4}} = {\large \frac{1}{2}}$.
       
    2. Vi skal svare på hvorfor mange svarer feil på spørsmålet over, og hva de svarer.
      Mange tenker på dette som en uniform modell, der kombinasjonene «to gutter», «ett av hvert» og «to jenter» er like sannsynlig, og tror derfor at det er en tredjedels sannsynlighet for ett av hvert kjønn. Men modellen er ikke uniform, de forskjellige mulighetene har ulik sannsynlighet.

Tilbake til oppgaven

Mengder

Oppgave 1:

Med utgangspunkt i mengdene A = {a, b, c, d, e}, K = {b, c, d} og V = {a, i} skal vi beregne mengder ut fra unioner og snitt. Vi skal også angi mengdens kardinalitet, noe som vil si antall elementer i mengdene.

    1. A ∪ V
      Dette er mengden av elementer som finnes i A eller V eller begge:
      A ∪ V = {a, b, c, d, e, i}.
      n(A ∪ V) = 6.
       
    2. AK
      Dette er mengden av elementer som finnes i A eller K eller begge:
      A ∪ K = {a, b, c, d, e}.
      n(A ∪ K) = 5.
       
    3. K ∪ V
      Dette er mengden av elementer som finnes i K eller V eller begge:
      K ∪ V = {a, b, c, d, i}.
      n(K ∪ V) = 5.
       
    4. A ∩ V 
      Dette er mengden av elementer som finnes i både A og VA ∩ V = {a}.
      n(A ∩ V) = 1.
       
    5. A ∩ K
      Dette er mengden av elementer som finnes i både A og K:
      A ∩ K= {b, c, d}.
      n(A ∩ K) = 3.
       
    6. KV
      Dette er mengden av elementer som finnes i både K og V:
      K ∩ = ∅
      n(K ∩ V) = 0.
      K og V har ingen felles elementer, de er disjunkte.

​Tilbake til oppgaven

Addisjonsregelen

Oppgave 1:

Basert på at sannsynlighetene for å få henholdsvis 0, 1, 2 og 3 kron ved kast med 3 mynter er henholdsvis ${\large \frac{1}{8}}$, ${\large \frac{3}{8}}$, ${\large \frac{3}{8}}$ og ${\large \frac{1}{8}}$ skal vi beregne sannsynligheten for «minst én kron, altså P(X ≥ 1), der X er antall kron.

Dette er disjunkte utfall, vi må få enten 0, 1, 2 og 3 kron, vi kan ikke få for eksempel 1 og 2 kron samtidig, så vi kan bruke addisjonsregelen for disjunkte utfall:

$P(X \ge 1) = P(1) + P(2) + P(3) = {\large \frac{3}{8}} + {\large \frac{3}{8}} + {\large \frac{1}{8}} = {\large \frac{7}{8}}$.

Tilbake til oppgaven

Oppgave 2:

I spillet vist under kan vi spille på «tall», «farge», «både tall og farge» og «enten tall eller farge».

En forenklet rulett

Vi skal så finne vinnersannsynlighetene i hvert av tilfellene.

Det er 12 mulige ruter, så ved å telle antall gunstige og bruke «gunstige på mulige» får vi:

Riktig tall. Det er 3 ruter for hvert tall, så vi får $P(T) = {\large \frac{3}{12}} = {\large \frac{1}{4}}$.

Riktig farge: Det er 4 ruter for hver farge, så vi får $P(F) = {\large \frac{4}{12}} = {\large \frac{1}{3}}$.

Både riktig tall og riktig farge: Det er 1 rute for hver kombinasjon av tall og farge, så vi får $P(T \cap F) = {\large \frac{1}{12}}$.

Når det gjelder «Enten riktig tall eller riktig farge», er dette sammensatt av to ikke-disjunkte utfall, så vi må bruke den generelle addisjonsregelen:

$P(T \cup F) = P(T) + P(F) − P(T \cap F) = {\large \frac{1}{4}} + {\large \frac{1}{3}} − {\large \frac{1}{12}} = {\large \frac{1}{2}}$.

Tilbake til oppgaven

Komplementregelen

Oppgave 1:

Vi skal finne sannsynligheten for «minst én kron» ved kast med 3 mynter ved å bruke komplementregelen og at sannsynligheten for «ingen kron» er ${\large \frac{1}{8}}$.

Hendelsen «minst én kron», P(X ≥ 1), og hendelsen «ingen kron», P(0) er komplementære. Vi får derfor at $P(X \ge 1) = 1 − {\large \frac{1}{8}} = {\large \frac{7}{8}}$, som var det samme vi fikk i oppgave 1 i artikkelen om addisjonsregelen.

Tilbake til oppgaven

Produktregelen

Oppgave 1:

Vi skal finne sannsynligheten for å tippe riktig vinner i alle 5 løp i V5, når det er henholdsvis 12, 10, 14, 9 og 12 hester med i de enkelte løpene og vi velger hester tilfeldig.

I hvert løp har hver hest samme sannsynlighet for å bli valgt, så vi kan bruke «gunstige på mulige» for å finne sannsynligheten for å velge vinnerhesten.

NB! Vi sier ikke at alle hestene har like stor sannsynlighet for å vinne sitt løp, denne sannsynligheten er ukjent, og spiller ingen rolle. En bestemt hest kan gjerne være garantert å vinne, sannsynligheten vi er ute etter er sannsynligheten for at vi velger akkurat denne hesten når vi plukker tilfeldig. En annen sak er imidlertid at det ikke er noen god taktikk å plukke tilfeldig, nettopp fordi noen hester har større vinnersannsynlighet enn andre.

«Gunstige på mulige» gir for de enkelte løpene sannsynligheter på henholdsvis

${\large \frac{1}{12}}$, ${\large \frac{1}{10}}$, ${\large \frac{1}{14}}$, ${\large \frac{1}{9}}$ og ${\large \frac{1}{12}}$.

Den totale sannsynligheten finner vi ved å multiplisere hver av disse sannsynlighetene, i henhold til produktregelen for uavhengige hendelser. Vi får

${\large \frac{1}{12}} \cdot {\large \frac{1}{10}} \cdot {\large \frac{1}{14}} \cdot {\large \frac{1}{9}} \cdot {\large \frac{1}{12}} = {\large \frac{1}{181 \, 440}}\approx 5{,}5 \cdot 10^{−6}$. Om lag 0,00055 %.

Vinnersannsynligheten er altså ikke særlig stor når vi bare velger hester tilfeldig.

Tilbake til oppgaven

Kombinere regler

Oppgave 1:

Vi har at sannsynligheten for at en tegnestift havner med spissen opp er $P(O) = {\large \frac{2}{3}}$, kaster tre tegnestifter, og skal finne sannsynlighetene de fire hendelsene under, samt forklare hvorfor summen av sannsynlighetene blir 1.

  1. Alle havner med spissen opp.
    De tre tegnestiftene er uavhengige av hverandre, derfor kan vi finne sannsynligheten for at alle har spissen opp ved å bruke produktregelen og multiplisere enkeltsannsynlighetene.
    $P(\text{alle opp}) = {\large \frac{2}{3}} \cdot {\large \frac{2}{3}} \cdot {\large \frac{2}{3}} = {\large \frac{8}{27}} \approx 0{,}2963$.
     
  2. Alle havner med spissen ned.
    Vi har at sannsynligheten for spissen opp er $P(O) = {\large \frac{2}{3}}$. Da må sannsynligheten for spissen ned ifølge komplementregelen være $P(N) = 1 − {\large \frac{2}{3}} = {\large \frac{1}{3}}$.
    Produktregelen gir
    $P(\text{alle ned}) = {\large \frac{1}{3}} \cdot {\large \frac{1}{3}} \cdot {\large \frac{1}{3}} = {\large \frac{1}{27}} \approx 0{,}0370$.
     
  3. To havner med spissen opp og en med spissen ned.
    Nå blir det litt mer komplisert, for her finnes tre varianter, O-O-N, O-N-O og N-O-O. Sannsynligheten for O-O-N blir ifølge produktregelen
    $P(\text{O-O-N}) = {\large \frac{2}{3}} \cdot {\large \frac{2}{3}} \cdot {\large \frac{1}{3}} = {\large \frac{4}{27}} \approx 0{,}1481$.
    For de andre to resultatene bytter vi jo bare om på faktorene, så sannsynligheten for hvert av disse blir naturligvis også ${\large \frac{4}{27}}$.
    Siden disse tre ikke kan inntreffe samtidig, kan vi bruke addisjonsregelen for disjunkte utfall:
    $P(\text{2 opp, 1 ned}) = {\large \frac{4}{27}} + {\large \frac{4}{27}} + {\large \frac{4}{27}} = {\large \frac{12}{27}} \approx 0{,}4444$.
     
  4. To havner med spissen ned og en med spissen opp.
    Samme logikk som i forrige punkt. Det finnes tre varianter, N-N-O, N-O-N og O-N-N.
    $P(\text{N-N-O}) = {\large \frac{1}{3}} \cdot {\large \frac{1}{3}} \cdot {\large \frac{2}{3}} = {\large \frac{2}{27}} \approx 0{,}0741$.
    Og
    $P(\text{2 ned, 1 opp}) = {\large \frac{2}{27}} + {\large \frac{2}{27}} + {\large \frac{2}{27}} = {\large \frac{6}{27}} \approx 0{,}2222$.

Summen av sannsynlighetene blir ${\large \frac{8}{27}} + {\large \frac{1}{27}} + {\large \frac{12}{27}} + {\large \frac{6}{27}} = {\large \frac{27}{27}}= 1$.

Grunnen til at summen blir 1, er at de fire hendelsene dekker alle måter tre tegnestifter kan bli liggende på, og den totale sannsynligheten i et stokastisk forsøk er alltid 1.

Det kan se ut som det å beregne slike sannsynligheter blir svært arbeidskrevende hvis vi har mange objekter, for eksempel 100 tegnestifter. Men heldigvis finnes det metoder som ikke krever at vi finner enkeltsannsynligheter slik som her. I forsøk basert på to mulige enkeltutfall, slik som her med spissen opp eller spissen ned, kan vi for eksempel modellere hendelsen ut fra en binomisk sannsynlighetsfordeling, noe som er beskrevet i artikkelen om diskrete sannsynlighetsfordelinger.

Tilbake til oppgaven

Oppgave_2:

Vi skal beregne sannsynligheten for å få minst én sekser i et kast med fem terninger.

Dette er en veldig sammensatt hendelse, så vi tar utgangspunkt i den komplementære hendelsen, det vil si å få ingen seksere. Sannsynligheten for å ikke få sekser på en terning er ${\large \frac{5}{6}}$, og produktregelen for uavhengige hendelser gir at sannsynligheten for «ingen sekser» med fem terninger er $\Big({\large \frac{5}{6}}\Big)^5 = {\large \frac{3125}{7776}}$.

Komplementregelen gir så at sannsynligheten for «minst én sekser» blir
$1 − {\large \frac{3125}{7776}} = {\large \frac{7776 − 3125}{7776}} = {\large \frac{4651}{7776}} \approx 0{,}5981$

Tilbake til oppgaven

Oppgave 3:

Vi skal beregne sannsynligheten for å få minst én kron i et kast med fem mynter.

Vi tar utgangspunkt i den komplementære hendelsen, å ikke få kron. Sannsynligheten for å ikke få kron på en mynt er ${\large \frac{1}{2}}$, og produktregelen for uavhengige hendelser gir at sannsynligheten for «ingen kron» med fem mynter er $\Big({\large \frac{1}{2}}\Big)^5 = {\large \frac{1}{32}}$.

Komplementregelen gir så at sannsynligheten for «minst én kron» blir
$1 − {\large \frac{1}{32}} = {\large \frac{32 − 1}{32}} = {\large \frac{31}{32}} \approx 0{,}9688$

Tilbake til oppgaven

Oppgave 4:

Vi skal finne sannsynligheten for at det i en klasse med 30 elever finnes noen som har samme fødselsdag.

«Magefølelsen» sier kanskje at sannsynligheten ikke er særlig stor, for det finnes jo 365 mulige fødselsdager, der vi bare velger 30 av disse.

For å beregne den nøyaktige sannsynligheten ser vi på den komplementære hendelsen, at ingen av elevene har samme fødselsdag. Det kan vi tenke på som hendelsen at en elev har unik fødselsdag gjentatt tretti ganger. Elevene er tilfeldig sammensatt, så det er ingen avhengighet mellom dem, for eksempel at noen er tvillinger. Vi kan derfor bruke produktregelen til å regne ut sannsynligheten.

For første elev finnes det 365 av 365 unike dager, for andre elev finnes det 364 av 365, deretter 363 av 365, og så videre. For hver ny elev blir én av de unike fødselsdagene brukt opp. Vi får derfor følgende sannsynlighet:

${\large \frac{365}{365}} \cdot {\large \frac{364}{365}} \cdot {\large \frac{363}{365}} \cdot \, \dots \, \cdot {\large \frac{336}{365}} \approx 0,2937$. Dette er sannsynligheten for at ingen har samme fødselsdag.

Ved å bruke komplementregelen finner vi at sannsynligheten for at noen har samme fødselsdag er ca. 1 − 0,2937 = 0,7063, altså ca. 71 %.

Tilbake til oppgaven

Den generelle produktregelen

Oppgave 1:

En eksamen består av en teoretisk og en praktisk prøve. I snitt klarer 70 % den teoretiske prøven, 80 % av de som klarer den teoretiske prøven, klarer den praktiske prøven, og vi skal beregne sannsynligheten for å klare både den teoretiske og den praktiske prøven.

Kaller vi hendelsen «bestått teoretisk prøve» for A og hendelsen «bestått praktisk prøve» for B, vet vi at:

P(A) = 0,7

P(B|A) = 0,8.

Sannsynligheten for å bestå begge prøver blir da ifølge den generelle produktregelen:

P(A ∩ B) = P(A) · P(B|A) = 0,7 · 0,8 = 0,56. Sannsynligheten for å klare begge prøver er 56 %.

Tilbake til oppgaven

Oppgave 2:

Vi har 7 kuler av ulik farge i en pose, deriblant 1 rød, og skal beregne sannsynligheten for å få den røde hvis vi trekker 3 kuler.

Vi modellerer dette først som at vi stikker hånda i posen, trekker opp 3 kuler, og får en sannsynlighet på ${\large \frac{3}{7}}$, ca. 43 %. Det er riktig. Her bruker vi gunstige på mulige, og får en sannsynlighet på ${\large \frac{n}{7}}$ for å få den røde når vi trekker n kuler. Trekker vi alle 7 kulene, blir sannsynligheten for å få den røde ${\large \frac{7}{7}} = 1$.

Men så modellerer vi det som at vi trekker ei og ei kule, og resonnerer slik: Ved første trekning er 1 av 7 kuler røde, så sannsynligheten for å få den røde er ${\large \frac{1}{7}}$. Hvis vi ikke får den røde kula i første trekning, er 1 av 6 gjenværende kuler røde, så sannsynligheten for å få den røde i andre trekning er ${\large \frac{1}{6}}$. Hvis vi fremdeles ikke har fått den røde kula, er 1 av 5 gjenværende kuler røde så sannsynligheten for å få den røde i tredje trekning er ${\large \frac{1}{5}}$. Summen av disse sannsynlighetene blir ca. 51 %, altså høyere enn det vi fikk med den første utregningsmetoden.

Denne utregningsmetoden er feil. Det blir tydelig hvis vi utvider til å trekke 7 ganger, da får vi en sannsynlighet på ${\large \frac{1}{7}} + {\large \frac{1}{6}} + {\large \frac{1}{5}} + {\large \frac{1}{4}} + {\large \frac{1}{3}} + {\large \frac{1}{2}} + {\large \frac{1}{1}} \approx 2{,}59$.

Problemet er at trekningene ikke er uavhengige. Sannsynligheten for å få den røde kula i andre trekning er ${\large \frac{1}{6}}$, betinget at vi ikke har fått den i første, og sannsynligheten for å få den røde i tredje trekning er ${\large \frac{1}{5}}$, betinget at vi ikke har fått den i første eller andre.

Sannsynligheten for å ikke få den røde kula i første trekning er ${\large \frac{6}{7}}$ , det kan vi lett regne ut ved å bruke «gunstige på mulige» eller komplementregelen. Sannsynligheten for å få den i andre, betinget at vi ikke fikk den i første, er ${\large \frac{1}{6}}$. Og sannsynligheten for å få den røde kula i andre trekning blir ${\large\frac{6}{7}} \cdot {\large\frac{1}{6}} = {\large\frac{1}{7}}$.

Kaller vi hendelsen «ikke rød kule i første trekning» for A, og hendelsen «rød kule i andre trekning» for B, ser vi at vi egentlig har brukt den generelle produktregelen her:

$P(A \cap B) = P(A) \cdot P(B | A) = {\large\frac{6}{7}} \cdot {\large\frac{1}{6}} = {\large\frac{1}{7}}$

Når vi trekker tredje gang, er sannsynligheten for at kula er rød ${\large \frac{1}{5}}$, betinget at vi ikke fikk den røde kula i noen av de to forrige trekningene, med en sannsynlighet på ${\large \frac{5}{7}}$. Så den generelle produktregelen gir en sannsynlighet på ${\large\frac{5}{7}} \cdot {\large\frac{1}{5}} = {\large\frac{1}{7}}$.

Vi ser at sannsynligheten for å trekke den røde kula er ${\large \frac{1}{7}}$ i hver av de tre trekningene, og den totale sannsynligheten blir ${\large \frac{3}{7}}$, som er det samme vi fikk da vi tenkte oss at vi trakk de 3 kulene samtidig.

Denne utregningsmetoden kan vi utvide til 7 trekninger, og vi vil få at sannsynligheten for å få den røde er ${\large \frac{1}{7}}$ i hver av trekningene.

Det er viktig å være oppmerksom på at sannsynligheten på ${\large \frac{3}{7}}$ gjelder situasjonen der vi før vi begynner å trekke spør hva sannsynligheten for å få den røde kula er når vi trekker tre ganger. Hvis vi trekker ei og ei kule og etter hver trekning spør hva sannsynligheten for å få den røde kula i neste trekning er, har vi en helt annen situasjon. Det er tre atskilte forsøk, og de tre sannsynlighetene på henholdsvis ${\large \frac{1}{7}}$, ${\large \frac{1}{6}}$ og ${\large \frac{1}{5}}$ kan ikke settes sammen.

Tilbake til oppgaven

Oppgave 3:

Vi skal beregne sannsynligheten i oppgave 2 ved hjelp av teknikken for trekning fra blandede mengder.

Det gunstige utfallet består av 1 rød og 2 ikke-røde kuler. 1 rød kule blant 1 kan kombineres på ${\large \binom{1}{1}} = 1$ måter, og 2 ikke-røde blant 6 kan kombineres på ${\large \binom{6}{2}} = 15$ måter. Totalt finnes det ${\large \binom{7}{3}} = 35$ måter å kombinere 3 av 7 kuler på. Så «gunstige på mulige» gir at sannsynligheten for å få den røde kula er ${\large \frac{1 \cdot 15}{35}} = {\large \frac{3}{7}}$, som er det samme vi fikk i oppgave 2.

Tilbake til oppgaven

Betinget sannsynlighet

Oppgave 1:

Vi spiller et spill der vi kaster to terninger, vinner hvis vi får sum 4 eller mindre, og skal beregne:

    1. Hva sannsynligheten er for å vinne.
      Ved kast med to terninger er det totalt 36 enkeltutfall. 6 av disse gir sum 4 eller mindre, nemlig 1-1, 1-2, 1-3, 3-1, 2-1 og 2-2. «Gunstige på mulige» gir at sannsynligheten for å vinne er ${\large \frac{6}{36}} = {\large \frac{1}{6}}$. Kaller vi dette for hendelse B, har vi altså at $P(B) = {\large \frac{1}{6}}$.
       
    2. Hva sannsynligheten er for å vinne hvis vi har kastet første terning og fått 2.
      Vi kaller dette for hendelse A. Sannsynligheten for å få 2 på en terning er en sjettedel, så $P(A) = {\large \frac{1}{6}}$.
      De mulige utfallene med 2 på første terning er 2-1, 2-2, 2-3, 2-4, 2-5 og 2-6. To av disse er felles med B. Siden dette er 2 av i alt 36 mulige utfall, blir $P(A \cap B) = {\large \frac{2}{36}} = {\large \frac{1}{18}}$.
      Og formelen for betinget sannsynlighet gir $P(B|A) = {\large \frac{P(A \cap B)}{P(A)}} = {\LARGE \frac{\frac{1}{18}}{\frac{1}{6}}} = {\large \frac{1}{3}}$.

Tilbake til oppgaven

Oppgave 2:

På et gatekjøkken kjøper 40 % av kundene pølse, 15 % kjøper pølse og chips, og vi skal beregne sannsynligheten for at en vilkårlig kunde som kjøper pølse, også kjøper chips.

Kaller vi hendelsen «kjøpe pølse» for A og hendelsen «kjøpe chips» for B, vet vi at:

P(A) = 0,4

P(A ∩ B) = 0,15

Sannsynligheten for at en vilkårlig kunde som kjøper pølse, også kjøper chips, blir da 

$P(B | A) = \frac{\displaystyle P(A \cap B)}{\displaystyle P(A)} = {\large \frac{0{,}15}{0{,}4}} = 0{,}375$. Altså 37,5 %.

Tilbake til oppgaven

Bayes regel

Oppgave 1:

I et spill der vi vinner hvis vi får sum 11 eller 12 ved et kast med to terninger har vi følgende sannsynligheter:
Sannsynlighet for «sum 11 eller 12»: $P(B) = {\large \frac{1}{12}}$.
Sannsynlighet for «seks på første terning»: $P(A) = {\large \frac{1}{6}}$.
Sannsynlighet for å vinne, gitt at vi har fått seks på første terning»: $P(B|A) = {\large \frac{1}{3}}$.

Så skal bruke Bayes regel til å finne sannsynligheten for at første terning var 6 hvis vi har vunnet, P(A | B). Vi får:

$P(A|B) = P(B|A) \cdot {\large \frac{P(A)}{P(B)}} = {\large \frac{1}{3}} \cdot \frac{{\LARGE \frac{1}{6}}}{{\LARGE \frac{1}{12}}} = {\large \frac{2}{3}}$.

Ser vi på et Venn-diagram som viser situasjonen, skjønner vi at dette er riktig:

Venn diagram som illustrerer terningkombinasjoner som gir sum 11 eller 12, gitt at en hendelse har inntruffet

Av totalt 3 utfall som gir «sum 11 eller 12», har 2 seks på første terning, så «gunstige på mulige» gir at sannsynligheten er to tredeler.

Tilbake til oppgaven

Oppgave 2:

Vi har fått vite at

    • Katteallergi forekommer hos 10 % av en befolkningen.
    • En test påviser allergi hos 80 % av de allergiske.
    • 15 % av testene er falske positive, det vil si at de feilaktig påviser allergi hos friske.

Så skal vi beregne sannsynligheten for at en person som tester positivt, faktisk har allergi.

Kaller vi hendelsen «allergi» for A og hendelsen «positiv test» for B, har vi:

    • P(A) = 0,1. Sannsynligheten for at en person har allergi, er 0,1.
    • P(AC) = 1 − 0,1 = 0,9. Sannsynligheten for at en person er frisk, er 0,9.
    • P(B|A) = 0,8. Sannsynligheten for positiv test hos en allergisk person er 0,8.
    • P(B|AC) = 0,15. Sannsynligheten for positiv test hos en frisk person er 0,15.

Og vi får P(B) = P(A) · P(B|A) + P(AC) · P(B|AC) = 0,1 · 0,8 + 0,9 · 0,15 = 0,215.

Ved hjelp av Bayes regel kan vi så beregne sannsynligheten for at en person er allergisk, gitt en positiv test:

$P(A | B) = \frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)} = {\large \frac{0{,}1 \cdot 0{,}8}{0{,}215}}\approx 0{,}3721$

Sannsynligheten for allergi, gitt positiv test, er ca. 37,21 %.

Tilbake til oppgaven

Sannsynlighetstrær

Oppgave 1:

Vi skal tegne et sannsynlighetstre for situasjonen i oppgave 2 i artikkelen om Bayes regel:

    • Katteallergi forekommer hos 10 % av en befolkningen.
    • En test påviser allergi hos 80 % av de allergiske.
    • 15 % av testene er falske positive, det vil si at de feilaktig påviser allergi hos friske.

Vi skal skrive inn sannsynligheter i alle greinene og løvnodene, og bruke disse til å beregne sannsynligheten for at en person som tester positivt, faktisk har allergi.

Sannsynlighetstreet kan se slik ut:

sannsynlighetstre med grein- og nodesannsynligheter

For å beregne sannsynligheten for at en person som tester positivt, faktisk har allergi, dividerer vi sannsynligheten for en positiv test der vedkommende faktisk har allergi, med sannsynligheten for en positiv test totalt: 8 % / (8 % + 13,5 %) ≈ 37,21 %. Som er det samme som i oppgave 2 i artikkelen om Bayes regel.

Tilbake til oppgaven

Skjermfilmer, sannsynlighet

Tabellen under gir en oversikt over alle skjermfilmer det refereres til på nettstedet, under temaet «Sannsynlighet».

Artikkel Beskrivelse Skjermfilm
Introduksjon til sannsynlighet Introduksjon til sannsynlighet med tre klassiske problemstillinger. Introduksjon til sannsynlighet
Begreper i sannsynlighet Om begrepene utfall, utfallsrom, hendelse, komplementhendelse og uniform sannsynlighetsmodell. Begreper i sannsynlighet
Vi lærer å bruke prinsippet «gunstige på mulige» til å beregne sannsynligheter, og ser på empirisk sannsynlighet. Enkel sannsynlighet
Kombinere utfall Om mengder, delmengder, hvordan vi kombinerer mengder, og illustrerer mengder med Venn-diagrammer. Vi lærer hva snitt, union og kardinalitet betyr. Mengder
Vi lærer addisjonsregelen for disjunkte hendelser og den generelle addisjonsregelen. Addisjonsprinsippet
Sammensatte hendelser Vi lærer produktregelen for uavhengige hendelser, og ser hvordan den sammen med komplementprinsippet kan forenkle utregninger ved å erstatte addisjonsregelen . Produktprinsippet
Betinget sannsynlighet Om å beregne sannsynlighet for betingede hendelser. Betinget sannsynlighet
Vi blir kjent med Bayes setning. Bayes setning
Misforståelser i sannsynlighet En gjennomgang av vanlige misforståelser i sannsynlighet Misforståelser i sannsynlighet
Kombinatorikk En introduksjon til kombinatorikk, der vi presenterer noen enkle problemer som kan løses med kombinatorikk. Introduksjon til kombinatorikk
Vi undersøker hvor mange måter vi kan organisere elementer på. Permutasjoner
Om å beregne hvor mange delmengder en kan lage av en mengde. Delmengder
Om å beregne antqall kombinasjonsmuligheter når vi velger fra blandede mengder. Blandede mengder

Kombinatorikk i spill

I artikkelen om kombinatorikk lærte vi systematiske metoder for å beregne kombinasjonsmuligheter. Her skal vi bruke disse metodene, og litt til, for å beregne kombinasjonsmuligheter og sannsynligheter i noen spill og konkurranser.

Pokerhender

Pokerhånd med tress i damer

Det finnes forskjellige typer poker, her ser vi på varianten five-card draw, der en spiller får utdelt en hånd på 5 kort. Det vil si 5 kort trukket tilfeldig fra en stokk på 52 kort.

En pokerhånd kan vi betrakte som et uordnet utvalg uten tilbakelegging. Uordnet fordi det ikke spiller noen rolle hvilken rekkefølge kortene blir delt ut i, vi sorterer dem etterpå. Uten tilbakelegging fordi samme kort ikke kan deles ut mer enn én gang.

Kombinasjonene som gir en bestemt pokerhånd, er i noen tilfeller relativt enkle å finne, for eksempel royal straight flush, fordi denne hånden består av de fem høyeste kortene i samme farge. Det eneste som kan variere er fargen, så det finnes derfor bare 4 slike hender.

I andre pokerhender kan antall kombinasjoner være mer komplisert å beregne, for eksempel at det finnes 54 912 muligheter for tress. Noe som kompliserer i dette tilfellet, er at vi ikke bare kan se på hvilke muligheter vi har for tre like kort, men også må stille krav til de to andre kortene, slik at vi ikke får en hånd med fire like eller hus i stedet.

For å beregne sannsynligheter i poker dividerer vi antall mulige kombinasjoner i en bestemt type hånd på antall mulige kombinasjoner i en pokerhånd totalt.

Som vi regnet ut i eksempel 9 i artikkelen om kombinatorikk, finner vi antall mulige kombinasjoner i en pokerhånd ved å beregne antall uordnede utvalg med 5 av 52 kort:

${\large \binom{52}{5}} = {\large \frac{52!}{5!(52 – 5)!}} = 2 \, 598\, 960$

Sannsynligheten for å få utdelt royal straight flush, for eksempel, blir da:

${\large \frac{4}{2 \, 598 \, 960}} \approx 1{,}539 \cdot 10^{-6}$, altså om lag 0,000154 %.

Antall kombinasjoner i andre pokerhender kan være mer kompliserte å finne.

En oversikt over antall kortkombinasjoner og sannsynligheter finnes på Wikipedia: pokersannsynlighet. Ta det som en utfordring å finne ut hvordan de er beregnet.

Tress

Her er en utregning for tress:

En kortstokk har 13 valører og 4 farger. Skal vi få tress, må vi ha 3 kort med samme valør, og det finnes altså 13 muligheter for dette. Vi kan få 3 toere, 3 treere, 3 firere, og så videre. Vi har altså ${\large \binom{13}{1}} = 13$ muligheter for valør. Det finnes også forskjellige muligheter for kombinasjon av farger. Vi kan kombinere spar/hjerter/ruter, spar/kløver/ruter, og så videre. Totalt ${\large \binom{4}{3}} = 4$ kombinasjonsmuligheter.

Det betyr at det finnes ${\large \binom{13}{1}} \cdot {\large \binom{4}{3}} = 13 \cdot 4 = 52$ kombinasjonsmuligheter for 3 kort med samme valør.

Siden en pokerhånd består av 5 kort, inneholder den 2 kort i tillegg til de 3 med samme valør. Disse 2 kan trekkes blant 49 gjenværende kort, noe som gir ${\large \binom{49}{2}} = 1176$ kombinasjonsmuligheter for de siste 2 kortene.

Men vi kan ikke tillate alle disse kombinasjonene. For hvis ett av kortene har samme valør som de tre like, har vi en pokerhånd med fire like, ikke tress. Det er imidlertid bare 1 av de 49 kortene som kan gi dette resultatet, vi kan fritt velge blant de 48 andre, noe som gir ${\large \binom{48}{2}} = 1128$ kombinasjonsmuligheter for de siste 2 kortene.

Vi kan heller ikke tillate at de 2 gjenværende kortene deler valør, for da har vi tre like pluss et par, noe som er hus i poker, og ikke tress. Så disse kombinasjonene må trekkes fra. For å regne ut hvor mange kombinasjoner det er, bruker vi samme prinsipp som vi innledningsvis brukte for å finne antall mulige kombinasjoner av 3 like kort. Men vi må huske at det nå bare er 12 tilgjengelige valører, så vi får ${\large \binom{12}{1}} = 12$ muligheter for valg av valør. Og vi får ${\large \binom{4}{2}} = 6$ kombinasjonsmuligheter for farger. Totalt 12 · 6 = 72 kombinasjoner som gir par. Vi sitter altså igjen med 1128 − 72 = 1056 lovlige kombinasjonsmuligheter for de siste 2 kortene.

Da gjenstår det bare å multiplisere antall kombinasjonsmuligheter for tre like kort med kombinasjonsmulighetene for de to siste kortene: 52 · 1056 = 54 912. Det finnes 54 912 forskjellige pokerhender med tress.

Sannsynligheten for å få utdelt tress er da

${\large \frac{54 \, 912}{2 \, 598 \, 960}} \approx 2{,}113 \cdot 10^{-2}$, , altså om lag 2,113 %.

Når det gjelder kombinasjonsmuligheter for de siste 2 kortene, kan vi alternativt tenke slik: Vi kaller kortene A og B og trekker kort A først. Vi har da 49 kort å velge blant, hvorav 1 er «ulovlig», med samme valør som de 3 like. Altså 49 − 1 = 48 lovlige valg for A.
For B er det så 48 kort å velge blant, hvorav 1 er «ulovlig», med samme valør som de 3 like, og 3 er «ulovlige» med samme valør som A. Altså 48 − 1 − 3 = 44 lovlige valg for B.
Siden det ikke spiller noen rolle hvilket kort som er A og hvilket som er B, må vi dividere på antall måter å sortere A og B på, nemlig 2!. Og det totale antallet tillatte kombinasjoner blir ${\large \frac{48 \cdot 44}{2!}} = 1056$, som er det samme som vi fant tidligere.

Som et tredje alternativ for de 2 siste kortene kan vi tenke oss at vi for disse velger 2 ulike valører blant de 12 tilgjengelige, noe som gir ${\large \binom{12}{2}} = 66$ kombinasjonsmuligheter. Hvert av kortene kan velges fritt blant 4 farger, noe som totalt gir ${\large \binom{4}{1}} \cdot {\large \binom{4}{1}} = 16$ kombinasjonsmuligheter. Totalt gir det ${\large \binom{12}{2}} \cdot {\large \binom{4}{1}^2} = 66 \cdot 16 = 1056$ kombinasjonsmuligheter, som før.

Slår vi dette uttrykket sammen med uttrykket for antall kombinasjoner av 3 like kort, får vi et samlet uttrykk for antall mulige pokerhender med tress:
${\large \binom{13}{1}} \cdot {\large \binom{4}{3}} \cdot {\large \binom{12}{2}} \cdot {\large \binom{4}{1}^2} = 54 \,912$.

Lottorekker

Eksempler på lottotall med tilleggstall

Ei vinnerrekke i Lotto består av 7 tall mellom 1 og 34 trukket tilfeldig. Ei Lotto-rekke kan vi betrakte som et uordnet utvalg uten tilbakelegging. Uordnet fordi det ikke spiller noen rolle hvilken rekkefølge tallene blir trukket i, vi sorterer dem etterpå. Uten tilbakelegging fordi samme tall ikke kan trekkes mer enn én gang.

Vi spiller Lotto ved å sette opp 7 tall, som så blir sammenliknet med vinnerrekka. Det utbetales premie for 7, 6, 5 og 4 rette, samt for 6 rette + 1 tilleggstall, der tilleggstallet trekkes tilfeldig blant tallene som er tilbake når selve Lotto-rekka er trukket.

For å beregne vinnersannsynligheter i Lotto dividerer vi antall mulige vinnerrekker med antall mulige lottorekker totalt. Som vi beregnet i eksempel 14 i artikkelen om kombinatorikk, er antall rekker totalt ${\large \frac{34!}{7!(34 – 7)!}} = 5 \, 379 \, 616$

Vi skal nå se på noen kombinasjonsmuligheter og sannsynligheter.

7 rette

Det finnes bare ei enkelt rekke med 7 rette, så sannsynligheten for å få dette er ${\large \frac{1}{5 \, 379 \, 616}} \approx 1{,}8589 \cdot 10^{-7}$.

Det er om lag 0,00001859 % sannsynlig å få 7 rette.

6 rette + tilleggstall

6 rette + 1 tilleggstall kan vi få ved å erstatte hvilket som helst av tallene i vinnerrekka med tilleggstallet, altså totalt 7 kombinasjonsmuligheter. Så sannsynligheten for dette blir ${\large \frac{7}{5 \, 379 \, 616}} \approx 1{,}3012 \cdot 10^{-6}$.

Det er om lag 0,00013012 % sannsynlig å få 6 rette + tilleggstall.

6 rette

Når 7 lottotall er trukket, gjenstår det 27 tall, og vi kan få 6 rette ved å erstatte hvilket som helst av tallene i vinnerrekka med et hvilket som helst av disse, altså 7 · 27 = 189 kombinasjonsmuligheter. Imidlertid vil 7 av disse inneholde tilleggstallet og gi gevinsten «6 + tilleggstall», så vi trekker dem fra, og står igjen med 182 kombinasjonsmuligheter. Sannsynligheten for dette blir ${\large \frac{182}{5 \, 379 \, 616}} \approx 3{,}3831 \cdot 10^{-5}$.

Det er om lag 0,0033831 % sannsynlig å få 6 rette.

5 rette

5 rette kan vi få ved å erstatte hvilken som helst av kombinasjon av 2 av de 7 tallene i vinnerrekka med en hvilken som helst kombinasjon av 2 av de 27 tallene som ikke er i vinnerrekka. Antall kombinasjonsmuligheter blir derfor ${\large \binom{7}{2}} \cdot {\large \binom{27}{2}} = 21 \cdot 351 = 7371$. Sannsynligheten for dette blir ${\large \frac{7371}{5 \, 379 \, 616}} \approx 1{,}3702 \cdot 10^{-3}$.

Det er om lag 0,13702 % sannsynlig å få 5 rette.

4 rette

Samme argument som for 5 rette gir at antall kombinasjonsmuligheter blir ${\large \binom{7}{3}} \cdot {\large \binom{27}{3}} = 35 \cdot 2925 = 102 \, 375$. Sannsynligheten for dette blir ${\large \frac{102 \, 375}{5 \, 379 \, 616}} \approx 1{,}9030 \cdot 10^{-2}$.

Det er om lag 1,903 % sannsynlig å få 4 rette.

0 rette

0 rette kan vi få ved en hvilken som helst kombinasjon av de 27 tallene som ikke er i vinnerrekka, så antall kombinasjonsmuligheter blir ${\large \binom{27}{7}} = 888 \, 030$. Sannsynligheten for dette blir ${\large \frac{888 \, 030}{5 \, 379 \, 616}} \approx 1{,}651 \cdot 10^{-1}$.

Det er om lag 16,507 % sannsynlig å få 0 rette på ei Lotto-rekke.

Sannsynligheten i lottorekker diskuteres også i lys av hypergeometriske fordelinger i eksempel 7 i artikkelen om diskrete sannsynlighetsfordelinger.

Fischer-sjakk

I vanlig sjakk stiller spillerne opp de såkalte offiserene i rekkefølgen tårn, springer (hest), løper, dronning, konge, løper, springer, tårn:

Startoppstilling for offiserene i sjakk

Gjennom århundrer har imidlertid de første fasene i sjakkpartier blitt grundig analysert, og det er utviklet mye kunnskap om hvilke trekk som er bra og hvilke som er mindre bra. En sjakkspiller med god kunnskap om slik åpningsteori vil ha en klar fordel mot en spiller med mindre kunnskap.

Slik er det imidlertid ikke i Fischer-sjakk, oppfunnet av stormester Bobby Fischer, der offiserene stilles opp i tilfeldig rekkefølge.

Fischer-sjakk kalles også 960-sjakk fordi det finnes 960 forskjellige måter å stille offiserene opp på. Nå skal vi se hvordan vi kommer fram til dette tallet.

Tenker vi oss offiserene nummerert fra 1 til 8, vil det finnes 8! = 40 320 måter å organisere dem på. Men siden det ikke vil ha noen betydning om de to løperne bytter plass, eller om de to springerne bytter plass, blir det bare fjerdeparten så mange unike oppstillingsmuligheter, altså 10 080.

Det finnes imidlertid to spesialkrav til oppstillingen. Løperne må stå på forskjellig farge, som i vanlig sjakk, altså en løper på svart og en løper på hvitt felt. Dessuten må kongen stå mellom tårnene, slik at det er mulig å utføre rokade til begge sider, som i vanlig sjakk.

Utfordringen ved å innarbeide disse spesialkravene i beregningene ligger i å finne rett måte å angripe problemet på. Starter vi med et tårn, for eksempel, blir det hele komplisert fordi mulige plasseringer av kongen vil avhenge av hvor vi har plassert tårnet, og mulige plasseringer av det andre tårnet vil avhenge av hvor vi har plassert kongen.

I stedet starter vi med å plassere løperne. Første løper kan plasseres på ett av 8 felt, deretter kan andre løper plasseres på ett av de 4 feltene av motsatt farge, totalt 8 · 4 = 32 muligheter. Men siden det ikke vil ha noen betydning om løperne bytter plass, blir det bare halvparten så mange unike oppstillingsmuligheter, altså 16.

Når løperne er på plass, finnes det 6 · 5 = 30 muligheter for springerne, men, som for løperne, spiller det ingen rolle om de bytter plass, så det blir 15 unike oppstillingsmuligheter.

Så finnes det 4 muligheter for å plassere dronningen, deretter gjenstår det bare 3 ledige felt. Siden kongen skal stå mellom tårnene, kan de disse 3 brikkene da bare plasseres på 1 måte.

Totalt blir det altså 16 · 15 · 4 · 1 = 960 unike oppstillingsmuligheter.

Rett person i rett hus

Fem pepperkakehus

I TV-serien Hvem bor her er poenget å avgjøre hvem av 5 personer som bor i hvilket av 5 hus. Konseptet går egentlig ut på å knytte personlighetstyper til interiør, men la oss si at vi bare gjetter tilfeldig. Hva er da sannsynligheten for å plassere henholdsvis 0, 1, 2, 3, 4 og 5 personer i rett hus?

Totalt kan 5 personer plasseres i husene på 5! = 120 forskjellige måter.

For å beregne hvor mange av disse plasseringene som er uten noen person i rett hus, trenger vi et begrep som heter subfakultet (min oversettelse av subfactorial). Subfakultetet til n angir antall mulige permutasjoner av n elementer der ingen av elementene er på sin opprinnelige plass.

Subfakultetet til n skrives som !n, vi setter altså et utropstegnet foran tallet vi vil beregne subfakultetet til, ikke bak, som ved vanlig fakultet.

Det finnes flere måter å beregne !n på. For eksempel ved hjelp av rekka 

$!n = n! {\displaystyle \sum_{m=0}^n} {\large \frac{(-1)^m}{m!}}$, der n ≥ 0.

som gir

$!0 = 0! \cdot {\large \frac{(-1)^0}{0!}} = 1 \cdot \frac{1}{1} = 1$
Det samme som 0!

$!1 = 1! \cdot \Big({\large \frac{(-1)^0}{0!} + \frac{(-1)^1}{1!}} \Big)= 1 \cdot \big( 1 -1 \big) = 0$
Det er lett å skjønne at dette må være riktig, siden det for 1 enkelt verdi ikke finnes alternative plasser.

$!2 = 2! \cdot \Big({\large \frac{(-1)^0}{0!}} + {\large \frac{(-1)^1}{1!}} + {\large \frac{(-1)^2}{2!}} \Big)= 2 \cdot \big( 1 – 1 + {\large \frac{1}{2}} \big) = 1$
Det er også lett å skjønne at dette må være riktig, for 2 verdier kan bare bytte plass med hverandre.

Videre får vi !3 = 2, !4 = 9, !5 = 44.

Det finnes altså !5 = 44 måter å plassere 5 personer i 5 hus på uten at noen er på rett plass.

Vil vi ha nøyaktig 1 person i rett hus, finnes det 5 muligheter for dette, og de resterende 4 kan da plasseres i feil hus på !4 = 9 måter. Totalt 5 · 9 = 45 kombinasjonsmuligheter.

Generelt vil n av 5 på rett plass kunne kombineres på ${\large \binom{5}{n}}$ måter, og de resterende på !(5-n) måter.

For n = 0 … 5 får vi

n ${\large \binom{5}{n}}$ !(5-n) Kombinasjoner
0 1 44 1 · 44 = 44
1 5 9 5 · 9 = 45
2 10 2 10 · 2 = 20
3 10 1 10 · 1 = 10
4 5 0 5 · 0 = 0
5 1 1 1 · 1 = 1

For å finne de tilhørende sannsynlighetene hvis vi gjetter tilfeldig, dividerer vi antall kombinasjoner med 120, som er antall kombinasjoner totalt:

  • Ingen i rett hus: ca. 36,67 % sannsynlighet.
  • 1 i rett hus: 37,5 % sannsynlighet.
  • 2 i rett hus: ca. 16,67 % sannsynlighet.
  • 3 i rett hus: ca. 8,33 % sannsynlighet.
  • 4 i rett hus: 0 % sannsynlighet.
  • Alle i rett hus: ca. 0,83 % sannsynlighet.

Kilder

Misforståelser i sannsynlighet

Som vi nevnte i artikkelen om introduksjon til sannsynlighet, er magefølelsen ofte ikke å stole på når det gjelder sannsynlighet. I denne artikkelen skal vi se på noen mulige misoppfatninger.

Størrelse på sannsynligheter

I oppgave 1 i artikkelen om introduksjon til sannsynlighet så vi at sannsynligheten for at minst to av 20 vilkårlige biler har samme to sluttsifre i registreringsnummeret er om lag 87 %. Det er altså betydelig større sannsynlighet for like sifre enn for ikke like sifre. En typisk magefølelse vil basere seg på at 20 av 100 mulige sifre gir en sannsynlighet på $\large \frac{20}{100}$, altså 20 %.

Men vi regner altså ikke dette ut på denne måten. Som vi viste i artikkelen om sammensatte hendelser,  ser vi på komplementhendelsen, som består i at ingen av bilene har to like sluttsifre. Da må sifrene til første bil ikke gjentas blant de 19 neste, sifrene til andre bil ikke gjentas blant de 18 neste, og så videre. Vi føler intuitivt at sannsynligheten for at dette skjer ikke er særlig stor, og den blir${\large \frac{100}{100}} \cdot {\large \frac{99}{100}} \cdot {\large \frac{98}{100}} \cdot \, \dots \, \cdot {\large \frac{81}{100}} \approx 0{,}1304$, ca. 13 %. Og sannsynligheten for det motsatte, altså minst to biler med samme to sluttsifre blir om lag 100 % – 13 % = 87 %.

I en tilsvarende situasjon spør vi hvor sannsynlig det er at minst to elever i en klasse på 30 har samme fødselsdag. Magefølelsen sier kanskje at denne sannsynligheten ikke er særlig stor, fordi 30 av 365 mulige datoer bør gi en sannsynlighet på ${\large \frac{30}{365}} \approx 0{,}0822$, altså om lag 8 %. Men argumentet for sannsynligheten til komplementhendelsen er den samme som for bilsifrene. Første elevs fødselsdag må ikke gjentas blant 29 andre. Andre elevs fødselsdag må ikke gjentas blant 28 andre, og så videre. Som vi så i oppgave 2 i artikkelen om sammensatte hendelser, var sannsynligheten for dette om lag 28 %, og sannsynligheten for at minst to elever har samme fødselsdag derved om lag 100 % – 28 % = 72 %.

Regnearket under inneholder en simulering av 20 bilsifre og 30 fødselsdager, der verdiene trekkes tilfeldig ved hjelp av funksjonen tilfeldigmellom. Like verdier markeres med en X. Trykk F9 for å generere nye verdier.

RegnearkÅpne regneark med simulering av bilsifre og fødselsdager

 
I oppgave 2 i artikkelen om introduksjon til sannsynlighet så vi på det såkalte Monty Hall-problemet, oppkalt etter TV-verten Monty Hall. I Monty Halls TV-show, Let′s make a deal, skal en deltaker velge én av tre dører. Bak en av dørene er en bil, bak de to andre dørene er det ikke noe av verdi. Deltakeren velger en dør. Monty, som vet hvor bilen er, åpner så en av dørene uten noe bak, og deltakeren får muligheten til å bytte dør. Feilen mange gjør er å tro at det ikke er noen vits i å bytte dør, fordi sannsynligheten uansett er en tredel. Men faktum er at å bytte dør dobler vinnersjansene.

Når deltakeren har pekt ut en dør, er sannsynligheten for at bilen befinner seg bak den døren en tredel, og sannsynligheten for at den befinner seg bak en av de to andre dørene er to tredeler. De to tredelene fordeler seg med en tredel på hver dør. Men idet Monty åpner en dør, faller sannsynligheten for at bilen er bak denne døren til 0. Sannsynligheten på to tredeler forskyves da over på den siste døren, og deltakeren dobler vinnersjansene ved å bytte. Dette er illustrert under, der deltakeren velger dør nummer 3, og Monty åpner dør nummer 2.

Illustrasjon av Monty Hall-problemet før Monty åpner en dør

Deltakeren velger dør nummer 3

Illustrasjon av Monty Hall-problemet etter at Monty har åpnet en dør

Monty åpner dør nummer 2

 

I en vitenskapelig studie av Granberg & Brown valgte bare 12 % av forsøkspersonene å bytte dør. I en undersøkelse gjort på Discovery-programmet Mythbusters valgte ingen å bytte. De begrunnet med magefølelse, og at de likte å stå på sine valg.

Monty Hall-problemet er for øvrig et eksempel på problemer der løsningen blir enklere å forstå hvis en gjør noe veldig stort eller veldig lite. La oss overdrive og si at det er 1000 dører i stedet for 3. Deltakeren velger 1 dør og Monty åpner 998 andre han vet det ikke er noe bak. Prinsippet er ikke endret, men nå er det blitt mye tydeligere at deltakeren øker sjansene ved å bytte dør.

I oppgave 3 i artikkelen om introduksjon til sannsynlighet så vi på paradokset med de falske positive. Når en får positivt utslag på en sykdomstest som er 99 % sikker, er det fort å tro at det er 99 % sannsynlighet for at en er syk. Men 99 % sikker betyr ikke bare at testen i ett tilfelle blant 100 syke ikke klarer å påvise sykdommen, men også at den feilaktig påviser sykdom i ett tilfelle blant 100 friske. Hvis sykdommen er sjelden, finnes det mange flere friske en syke, derfor er det flest friske som blir feildiagnostisert.
(I dette eksemplet var det samme feilprosent for friske og syke, i praksis vil en medisinsk test gjerne ha forskjellige feilprosenter for de to tilfellene.)

RegnearkÅpne et regneark der du kan eksperimentere med parametere blant de falske positive
 

Uavhengige og avhengige hendelser

Erfaringsmessig vet mange at sannsynligheten for å få kron ti ganger på rad når vi kaster en mynt, er liten. Hvis vi har fått kron ni ganger på rad, og så spør hva sannsynligheten er for å få en kron til, vil noen derfor påstå at den er svært liten. Men dette er selvsagt en feilslutning. De enkelte kastene er uavhengige av hverandre, og sannsynligheten for å få kron er en halv i hvert enkelt kast, uavhengig av hvor mange kron vi har fått tidligere. Den lave sannsynligheten for ti kron på rad ligger i at vi i utgangspunktet har et krav om at vi må oppnå noe med sannsynlighet en halv ti ganger etter hverandre.

Lottotall er et annet eksempel på feilvurdering av avhengighet. Hvilke lottotall som blir trukket i en spilleomgang er helt uavhengig av hvilke som ble trukket i spilleomgangen før. Like fullt hadde avisa VG en periode en oversikt over lottotallenes «formkurver», det vil si en tabell over hvor ofte tallene hadde forekommet i de siste trekningene.

Ganske morsomt / tragisk at Norsk Tipping selv har en artikkel om at noen tall i spillet Extra trekkes oftere enn andre, selv om alle tallene naturligvis har like stor sannsynlighet for å bli trukket ut. Dette påpeker de også til slutt i artikkelen, og poengterer derved at deres egen artikkel er meningsløs.

Tre vanlige feilslutninger er

  • En hendelse står for tur. Hvis for eksempel tallet 3 ikke har vært med i lottorekkene på ti uker, er det stor sannsynlighet for at det blir trukket ut neste gang.
     
  • Sannsynligheten for en hendelse er brukt opp. Hvis for eksempel tallet 3 har vært med i de siste fem lottorekkene, er det liten sannsynlighet for at det blir trukket ut neste gang.
     
  • En hendelse er «i form». Hvis for eksempel tallet 3 har vært med i de siste fem lottorekkene, er det «i form» og har økt sannsynlighet for å bli trukket ut neste gang. Dette argumentet kan det imidlertid være et visst hold i. Hvis en hendelse opptrer hyppigere enn den beregnede sannsynligheten skulle tilsi, kan det tyde på at sannsynligheten faktisk er høyere enn beregnet, noe vi skal se nærmere på i artikkelen om hypotesetesting. Ei lottokule som dukker opp for ofte, kan ha økt sannsynlighet for å bli trukket ut fordi vekta avviker fra normalen. I praksis skjer imidlertid ikke dette, lottokulenes vekt og form kontrolleres jevnlig av Justervesenet.

I eksemplene over er det feilaktig gjort antakelser om avhengighet mellom uavhengige hendelser. Men det motsatte er også mulig, å anta uavhengighet mellom avhengige hendelser. Og avhengigheter er ikke alltid like lette å oppdage, så her er det fort å gå fem på.

Som eksempel kan vi ta kortspillet Krig.

En kortstokk deles på midten, og to personer får hver sin halvpart med billedsiden ned. Så snur de om kort etter kort på likt, og høyeste kort vinner. Hvis de får kort med lik valør, er det «Krig». Hva er da sannsynligheten for at det blir «krig» på første kort? Det er fort å anta at sannsynligheten er en trettendedel, om lag 7,7 %, fordi kortstokken har tretten valører. Og slik ville det vært hvis spillerne hadde hver sin komplette kortstokk. Men siden de deler en stokk, vil det, når den ene spilleren får opp en valør, bare være tre kort med samme valør igjen til den andre. Hvis for eksempel den ene spilleren får opp ruter konge, vil det kunne bli «krig» bare på spar, kløver eller hjerter konge. Det er altså tre gunstige blant i alt femtien gjenværende kort. Sannsynligheten blir derfor tre femtien-deler, om lag 5,9 %.

Andre eksempler på avhengige hendelse er været på etterfølgende dager og pokerhender. Sannsynligheten for hva de andre har varierer med hva en har selv.

Mønstre og regelmessighet

I TV-programmet Siffer ba programleder Jo Røislien to mennesker plassere en del gjenstander tilfeldig utover en stor flate. De sørget da omhyggelig for at ingen mønstre oppstod. Mens da han selv bare slengte gjenstandene tilfeldig utover, lot det til å oppstå mønstre. Det er altså en tendens til å tro at mønstre ikke kan oppstå ved tilfeldigheter, noe som er feil.

I Lotto er alle tallkombinasjonene like sannsynlige. Men siden det finnes en misoppfatning om at mønstre ikke oppstår ved tilfeldigheter, tror noen likevel at ei Lotto-rekke med et tydelig mønster som 1-2-3-4-5-6-7 er mindre sannsynlig enn ei rekke uten mønster, som 3-11-7-22-33-2-8. Blant de følgende tre seriene med myntkast vil nummer 1 gjerne bli rangert som mest sannsynlig, deretter nummer 2, og så nummer 3, på grunn av den økende graden av system.

  1. kron-mynt-mynt-kron-mynt-kron
     
  2. kron-kron-kron-mynt-mynt-mynt
     
  3. kron-kron-kron-kron-kron-kron

Men med en rettferdig mynt har alle seriene samme sannsynlighet, ${({\large \frac{1}{2}})}^6 = {\large \frac{1}{64}}$, om lag 1,6 %. Det betyr imidlertid ikke at det er like sannsynlig å få seks kron som å få tre mynt og tre kron. Sannsynligheten for tre mynt og tre kron er ${\large \frac{20}{64}}$, altså 20 ganger høyere enn sannsynligheten for seks kron. Dette skyldes at det finnes tjue forskjellige serier med tre mynt og tre kron, mens det bare finnes én enkelt serie med seks kron.

Sjeldne hendelser

Det er en misoppfatning at en hendelse med svært liten sannsynlighet aldri vil inntreffe. Men slik er det ikke. Sannsynligheten for å vinne hovedgevinsten i Lotto er for eksempel mindre enn sannsynligheten for å slippe en ball fra et vindu på toget mellom Oslo og Trondheim og treffe ei bøtte som står et vilkårlig sted langs sporet. Likevel er det som regel én eller flere vinnere hver uke.

Tallrekka under viser 102 simulerte terningkast:

2, 6, 2, 3, 5, 3, 3, 4, 6, 3, 3, 6, 1, 4, 1, 5, 6, 1, 3, 4, 2, 5, 4, 2, 2, 3, 3, 5, 4, 5, 4, 5, 1, 4, 5, 4, 4, 6, 5, 3, 2, 4, 3, 4, 1, 6, 6, 3, 2, 3, 4, 1, 3, 5, 6, 6, 6, 5, 2, 2, 6, 3, 2, 1, 5, 2, 3, 5, 2, 1, 6, 6, 4, 3, 3, 1, 3, 3, 6, 3, 4, 3, 5, 6, 5, 4, 3, 3, 4, 2, 1, 5, 6, 1, 3, 2, 3, 1, 2, 2, 3, 5.

Sannsynligheten for at akkurat denne rekka skulle dukke opp er ${({\large \frac{1}{6}})}^{102} \approx 4,252 \cdot 10^{-80}$. Hvis alle atomene i det synlige universet hadde et nummer, og to personer valgte hvert sitt atom vilkårlig, ville dette tallet være noe rundt sannsynligheten for at begge valgte samme atom. Så lite sannsynlig er det å få akkurat denne rekka, allikevel dukket den opp. Vi kan selvsagt fortsette å fylle på med terningkast, og etter hvert som lengden øker nærmer sannsynligheten for akkurat den rekka seg null. Likevel er den der. I artikkelen om normalfordelingen skal vi se at hendelser kan inntreffe selv om de har sannsynlighet 0.

Utvalgsstørrelse

En feil noen gjør er å trekke konklusjoner basert på for små utvalg. Ved et stort antall terningkast med en rettferdig terning forventer vi å få i gjennomsnitt 3,5. For eksempel er gjennomsnittet av kastene i forrige avsnitt om lag 3,55. Avvik fra gjennomsnittet kan tyde på at terningen ikke er rettferdig. Dersom en terning for eksempel er manipulert til å gi ekstra mange seksere, vil vi kunne forvente at gjennomsnittet ligger høyere enn 3,5. Men kaster vi en terning fem ganger og får et gjennomsnitt som er alt for høyt, kan vi allikevel ikke trekke noen konklusjon. Utvalget på fem kast er altfor lite.

Mer presist sagt er det veldig stor usikkerhet knyttet til små utvalg, men denne usikkerheten avtar når utvalgets størrelse øker. Det finnes ikke noen magisk grense der en går fra veldig usikker til veldig sikker, men i mange sammenhenger regnes utvalg på mindre enn 30 som små.

Generelt sier store talls lov at jo flere forsøk vi gjør, jo nærmere vil vi i gjennomsnitt komme det forventede resultatet. Det er altså ikke slik noen tror at det er like sannsynlig å få 550 kron eller mer ved 1000 kast med en rettferdig mynt, som det er å få 55 kron eller mer ved 100 kast. Selv om forholdstallet er det samme, ${\large \frac{550}{1000}} = {\large \frac{55}{100}}$, er 550 et mye mindre sannsynlig avvik fra gjennomsnittet på 500 enn 55 er fra gjennomsnittet på 50. Sannsynlighetene er henholdsvis om lag 0,07 % og 13,6 %. Gjør vi mange forsøk med 1000 myntkast, vil antall kron i så mye som 99,84 % av tilfellene ligge mellom 450 og 550, men gjør vi mange forsøk med 100 myntkast, vil antall kron i bare om lag 68 % av tilfellene ligge mellom 45 og 55.
 

SkjermfilmSe filmen «Misforståelser i sannsynlighet»
 

Kilder

  • Røislien J., Nome M. (2011). Siffer. Versal forlag

Sannsynlighetstrær

En sammensetning av betingede sannsynligheter kan illustreres ved hjelp av sannsynlighetstrær. Et sannsynlighetstre vil kunne gjøre det enklere å få oversikt over de forskjellige sannsynlighetene.

I eksempel 4 i artikkelen om Bayes regel studerte vi en situasjon der:

    • 1 % av en befolkningen i et land har en sykdom.
    • En test påviser sykdommen i 90 % av tilfellene hos de syke.
    • 9,6 % av testene er falske positive, det vil si at de feilaktig påviser sykdommen hos friske.

Disse opplysningene kan vi illustrere slik, i et sannsynlighetstre:

Sannsynlighetstre med bare oppgitte opplysninger

I et sannsynlighetstre illustrerer vi de forskjellige mulighetene som greiner. Punktene som greinene løper ut fra, kalles noder. I denne artikkelen nøyer vi oss med å se på trær med to greiner per node, men det er fullt mulig å ha flere.

Greinene som løper ut fra en node, skal illustrere alle valgmuligheter, derfor må summen av sannsynlighetene i disse være 1, altså 100 %. Vi kan derved enkelt regne ut hvilke verdier som skal stå ved spørsmålstegnene i treet vårt:

Sannsynlighetstre inkludert beregnede grenverdier

Lest ovenfra og nedover representerer verdiene i første sett med greiner de uavhengige sannsynlighetene for «syk», og «frisk». I andre sett med greiner representerer verdiene de betingede sannsynlighetene for «positiv test, gitt syk», «negativ test, gitt syk», «positiv test, gitt frisk» og «negativ test, gitt frisk».

Ytterpunktene i treet, det vil si nodene det ikke løper ut greiner fra, kalles løvnoder. Ved å multiplisere sannsynlighetene langs greinene som fører fram til en løvnode, kan vi finne sannsynligheten for å ende i den noden:

Sannsynlighetstre inkludert verdier i løvnodene

Den totale sannsynligheten for å få positiv test finner vi ved å summere verdiene i løvnodene som er knyttet til en gren med positiv test, altså 0,9 % + 9,504 % = 10,404 %. Tilsvarende kan vi finne den totale sannsynligheten for å få negativ test ved å summere verdiene i løvnodene som er knyttet til en gren med negativ test, altså 0,1 % + 89,496 % = 89,596 %. Dette kan vi naturligvis også beregne ut fra at summen av sannsynlighetene i løvnodene utgjør 100 %: 100 % − 10,404 % = 89,596 %.

Skal vi så beregne sannsynligheten for at en person som tester positivt, faktisk har sykdommen, kan vi gjøre det ved å dividere sannsynligheten for en positiv test der vedkommende faktisk er syk, med sannsynligheten for en positiv test totalt: 0,9 % / 10,404 % ≈ 8,65 %. Dette er det samme som vi fant i eksempel 4 på siden Bayes regel.

Kaller vi hendelsen «syk person» for A og hendelsen «positiv test» for B, og setter dette inn i sannsynlighetstreet, ser det slik ut:

Sannsynlighetstre med symbolske sannsynligheter

I artikkelen om Bayes regel så vi at vi regner ut P(A|B) som $\frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)}$. Vi så også at vi kan regne ut P(B) som P(A) · P(B|A) + P(AC) · P(B|AC). Setter vi dette sammen, får vi

$P(A|B) = \frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(A) \cdot P(B|A) + P(A^C) \cdot P(B|A^C)}$

Så markerer vi elementene i telleren med en gul sirkel, og elementene i nevneren med grønne sirkler i sannsynlighetstreet:

Sannsynlighetstre med symbolske sannsynligheter og markeringer

Da ser vi at vi egentlig brukte Bayes regel da vi beregnet sannsynligheten for at en person som testet positivt, faktisk hadde sykdommen, basert på verdiene i sannsynlighetstreet.

Oppgave 1:

Tegn et sannsynlighetstre for situasjonen i oppgave 2 i artikkelen om Bayes regel:

        • Katteallergi forekommer hos 10 % av en befolkningen.
        • En test påviser allergi hos 80 % av de allergiske.
        • 15 % av testene er falske positive, det vil si at de feilaktig påviser allergi hos friske.

Skriv inn sannsynligheter i alle greinene og løvnodene, og bruk så disse til å beregne sannsynligheten for at en person som tester positivt, faktisk har allergi. Sjekk at du får det samme som i oppgave 2 i artikkelen om Bayes regel.

Se løsningsforslag

Kilder

      • Hinna, K.R.C., Rinvold, R.A., Gustavsen, TS. (2011). QED 5-10, bind 1. Høyskoleforlaget
      • Ubøe, J. (2011). Statistikk for økonomifag. Gyldendal akademisk
      • Hagen, Per C. (2000). Innføring i sannsynlighetsregning og statistikk. Cappelen akademisk

Bayes regel

I artikkelen om betinget sannsynlighet så vi hvordan vi ved hjelp av regelen for betinget sannsynlighet kan finne den betingede sannsynligheten P(B|A) hvis vi kjenner P(AB) og P(A).

Hvis vi kjenner den betingede sannsynligheten P(B|A), kan vi ved hjelp av Bayes regel finne den «omvendte» betingede sannsynligheten, P(A|B):

$\fbox{Bayes regel: $P(A | B) = \frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)}$}$

Bayes regel ble formulert av presten Thomas Bayes.

Vi ser at for å bruke Bayes regel må vi i tillegg til P(B|A) kjenne P(A) og P(B), men vi trenger ikke kjenne P(AB).

Eksempel 1:

I eksempel 2 i artikkelen om betinget sannsynlighet hadde vi en situasjon der sannsynligheten for hendelse A, at en gamer spilte WoW, var 80 %, at sannsynligheten for hendelse B, at en gamer spilte CoD, var 30 %, og vi regnet ut at sannsynligheten for (B|A) var 25 %. Da kan vi ved hjelp av Bayes regel regne ut sannsynligheten for (A|B), altså at en gamer som spiler CoD, også spiller WoW:

$P(A | B) = \frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)} = {\large \frac{0{,}8 \cdot 0{,}25 }{0{,}3}}\approx 0{,}6667$. Gitt at en gamer spiller CoD, er det om lag 67 % sannsynlig at vedkommende også spiller WoW. Vi ser av Venn-diagrammet under at dette stemmer, fordi $ {\large \frac{2}{3}}$ av alle gamerne i B også ligger i A.

P(A) = 80/100, P(A|B) = 20/100

Oppgave 1:

I eksempel 1 i artikkelen om betinget sannsynlighet så vi på et spill der vi kastet to terninger og vant hvis vi fikk sum 11 eller 12. Vi da hadde følgende sannsynligheter:

Sannsynlighet for «sum 11 eller 12»: $P(B) = {\large \frac{1}{12}}$.

Sannsynlighet for «seks på første terning»: $P(A) = {\large \frac{1}{6}}$.

Sannsynlighet for å vinne, gitt at vi har fått seks på første terning: $P(B | A) = {\large \frac{1}{3}}$.

Bruk Bayes regel til å finne den «omvendte», betingede sannsynligheten, det vil si sannsynligheten for at første terning var 6 hvis vi har vunnet, altså P(A|B).

Se løsningsforslag

I eksempel 1 kunne vi klart oss uten Bayes regel fordi vi fra eksempel 2 i artikkelen om betinget sannsynlighet visste at P(AB) = 0,2, og kunne regnet ut (A|B) ved å bytte om A og B i formelen for betinget sannsynlighet:

$P(A | B) = \frac{\displaystyle P(B \cap A)}{\displaystyle P(B)} = {\large \frac{0{,}2}{0{,}3}} \approx 0{,}6667$.

Men det er ikke alltid vi kjenner P(AB), slik som i eksempel 2.

Eksempel 2:

På en smerteklinikk får 10 % av pasientene narkotiske tabletter. Generelt er 5 % av pasientene narkomane. Av de som får narkotiske tabletter, er 8 % narkomane. Så skal vi regne ut hvor sannsynlig det er at en narkoman pasient får narkotiske tabletter.

Kaller vi hendelsen at en pasient får narkotiske tabletter for A, har vi at P(A) = 0,1.

Kaller vi hendelsen at en pasient er narkoman for B, har vi at P(B) = 0,05.

Hendelsen at en pasient er narkoman, gitt at vedkommende får narkotiske tabletter, blir da B|A, og vi har at P(B|A) = 0,08.

Sannsynligheten for at en narkoman pasient får narkotiske tabletter blir da P(A|B), og Bayes regel gir oss at

$P(A | B) = \frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)} = {\large \frac{0{,}1 \cdot 0{,}08}{0{,}05}} = 0{,}16$.

Det er 16 % sannsynlig at en narkoman pasient får narkotiske tabletter.

Eksempel 3:

$ {\large \frac{1}{10 \, 000}}$ av innbyggerne i et land har en sykdom. Velger vi personer tilfeldig, og lar hendelse A være at en vilkårlig person er syk, vil vi ha $P(A) = {\large \frac{1}{10 \, 000}} = 0{,}0001$.

Det finnes en test for sykdommen, som i snitt gir utslag i 1,0098 % av tilfellene den brukes. Lar vi hendelse B være at testen gir utslag, vil vi ha $P(B) = 0{,}010098$.

Testen er 99 % sikker, det vil si at hvis en syk person testes, vil den slå ut med 99 % sikkerhet. Vi har derfor at sannsynligheten for «utslag, gitt syk» er $P(B|A) = 0{,}99$.

Ved hjelp av Bayes regel kan vi så finne sannsynligheten for at en vilkårlig person som får positivt utslag, faktisk er syk, altså «syk, gitt utslag», $ P(A|B)$:

$P(A|B) =\frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)} = {\large \frac{0,0001 \cdot 0{,}99}{0{,}010098}} \approx 0{,}0098$.

Det er om lag 0,98 % sannsynlig at en vilkårlig person som får positivt utslag, faktisk er syk.

Tallene i eksempel 3 er hentet fra oppgave 3 i artikkelen med introduksjon til sannsynlighet, der vi skulle tippe hvor sannsynlig det var at vi, med positivt utslag på en 99 % sikker test, hadde en sykdom som rammet hver ti-tusende innbygger. P(B), altså hvor ofte testen i snitt ga utslag, var imidlertid ikke oppgitt, men dette kan vi regne oss fram til. Positiv test får vi i 99 % av tilfellene for syke personer og 1 % av tilfellene for friske personer. Av 10 000 er 1 syk og 9999 friske, så vi får

$P(B) = {\large \frac{1}{10 \, 000}} \cdot 0{,}99 + {\large \frac{9999}{10 \, 000}} \cdot 0{,}01 = 0{,}010098$

At en vilkårlig person er frisk, er den komplementære hendelsen til A, altså AC, så vi ser at vi regner ut P(B) som P(A) · P(B|A) + P(AC) · P(B|AC).

Ofte vil vi måtte regne oss fram til P(B) på denne måten. En sykdomstest vil i praksis også gjerne ha forskjellig nøyaktighet for syke og friske.

Eksempel 4:

        • 1 % av en befolkningen i et land har en sykdom.
        • En test påviser sykdommen i 90 % av tilfellene hos de syke.
        • 9,6 % av testene er falske positive, det vil si at de feilaktig påviser sykdommen hos friske.

Så skal vi beregne sannsynligheten for at en person som tester positivt, faktisk har sykdommen.

Kaller vi hendelsen «syk person» for A og hendelsen «positiv test» for B, har vi:

        • P(A) = 0,01. Sannsynligheten for at en person er syk, er 0,01.
        • P(AC) = 1 − 0,01 = 0,99. Sannsynligheten for at en person er frisk, er 0,99.
        • P(B|A) = 0,9. Sannsynligheten for positiv test hos en syk person er 0,9.
        • P(B|AC) = 0,096. Sannsynligheten for positiv test hos en frisk person er 0,096.

Og vi får P(B) = P(A) · P(B|A) + P(AC) · P(B|AC) = 0,01 · 0,9 + 0,99 · 0,096 = 0,10404.

Ved hjelp av Bayes regel kan vi så beregne sannsynligheten for at en person har sykdommen, gitt en positiv test:

$P(A | B) = \frac{\displaystyle P(A) \cdot P(B | A)}{\displaystyle P(B)} = {\large \frac{0{,}01 \cdot 0{,}9}{0{,}10404}}\approx 0{,}0865$

Sannsynligheten for sykdom, gitt positiv test, er ca. 8,65 %.

Oppgave 2:

        • Katteallergi forekommer hos 10 % av en befolkningen.
        • En test påviser allergi hos 80 % av de allergiske.
        • 15 % av testene er falske positive, det vil si at de feilaktig påviser allergi hos friske.

Beregn sannsynligheten for at en person som tester positivt, faktisk har allergi.

Se løsningsforslag

Kilder

    • Hinna, K.R.C., Rinvold, R.A., Gustavsen, TS. (2011). QED 5-10, bind 1. Høyskoleforlaget
    • Ubøe, J. (2011). Statistikk for økonomifag. Gyldendal akademisk
    • Hagen, Per C. (2000). Innføring i sannsynlighetsregning og statistikk. Cappelen akademisk

Betinget sannsynlighet

Hva er betinget sannsynlighet?

I artikkelen om den generelle produktregelen så vi at vi regner ut sannsynligheten for at to avhengige hendelser begge inntreffer ved å multiplisere sannsynligheten for at den første inntreffer med sannsynligheten for at den andre inntreffer, gitt at den første har inntruffet: $P(A \cap B) = P(A) \cdot P(B)$.

Vi brukte så denne regelen til å regne ut at hvis sannsynligheten for sol en vilkårlig dag er 60 %, og sannsynligheten for sol etter en annen soldag er 80 %, er sannsynligheten for sol to etterfølgende dager 0,6 · 0,8 = 0,48.

Men så snur vi litt på problemstillingen, og sier at vi vet at sannsynligheten for sol en vilkårlig dag er 60 %, og at sannsynligheten for sol på to etterfølgende dager er 48 %. Og så skal vi regne ut sannsynligheten for at en dag får sol gitt at det var sol dagen før. Det betyr at vi må finne verdien til x i likningen 0,6 · x = 0,48. Og det gjør vi ved å dividere med 0,6 på begge sider av likhetstegnet, noe som gir x = 0,8, det vil si 80 prosent.

Vi fant altså sannsynligheten for «sol, gitt sol dagen før» ved å dividere sannsynligheten for «sol etterfølgende dager» på sannsynligheten for «sol første dag». Generaliserer vi dette, og dividerer med P(A) på begge sider av likhetstegnet i produktregelen, får vi $ \frac{\displaystyle P(A \cap B)}{\displaystyle P(A)} = P(B|A)$. Bytter vi så om høyre og venstre side, får vi regelen for betinget sannsynlighet:

$\fbox{Betinget sannsynlighet: $P(B|A) = \frac{\displaystyle P(A \cap B)}{\displaystyle P(A)}$}$

Denne regelen sier at sannsynligheten for at B inntreffer, gitt at A har inntruffet, er lik sannsynligheten for at A og B begge inntreffer dividert med sannsynligheten for at A inntreffer.

I eksempel 1 under illustrerer vi denne regelen med terningkast.

Eksempel 1:

I et spill kaster vi to terninger og vinner hvis summen av øyne er elleve eller tolv. Kaller vi dette hendelse B, kan vi illustrere situasjonen med dette Venn-diagrammet:

Venn diagram som illustrerer terningkombinasjoner som gir sum 11 eller 12

Venn-diagrammet inneholder alle de 36 mulige kombinasjonene av øyne på terningene, med delmengden B, de kombinasjonene som gir sum elleve eller tolv, innringet. Vi ser at B inneholder 3 kombinasjoner, så «gunstige på mulige» gir $P(B) = {\large \frac{3}{36}} = {\large \frac{1}{12}}$. Sannsynligheten for å vinne er $ {\large \frac{1}{12}}$.

Men så tenker vi oss at vi kaster den første terningen, får seks, og skal finne sannsynligheten er for å vinne når vi kaster den andre terningen.

Kaller vi hendelsen «seks på første terning» for A, kan vi illustrere situasjonen med dette Venn-diagrammet:

Venn diagram som illustrerer terningkombinasjoner som gir sum 11 eller 12, gitt at en hendelse har inntruffet

Vi ser at $P(A \cap B) = {\large \frac{2}{36}} = {\large \frac{1}{18}}$ fordi 2 av 36 kombinasjoner ligger både i A og B. Vi vet også at $P(A) = {\large \frac{1}{6}}$ fordi sannsynligheten for å få seks på en terning er ${\large \frac{1}{6}}$. Sannsynligheten for å vinne når første terning var seks, kan vi uttrykke som P(B|A), det vil si sannsynligheten for hendelse B, «sum elleve eller tolv», gitt hendelse A, «seks på første terning».

Regelen for betinget sannsynlighet gir at $P(B|A) = \frac{\displaystyle P(A \cap B)}{\displaystyle P(A)} = {\Large\frac{\frac{1}{18}}{\frac{1}{6}}} = {\large \frac{6}{18}} = {\large \frac{1}{3}}$. Sannsynligheten for å vinne når første terning var seks, er $ {\large \frac{1}{3}}$.

Dette gir mening hvis vi ser på Venn-diagrammet, for av de totalt 6 mulighetene for øyne på andre terning ligger 2 av disse i A, og sannsynligheten for at vi får en av disse når vi kaster andre terning, er, ifølge «gunstige på mulige», ${\large \frac{2}{6}} = {\large \frac{1}{3}}$.

Illustrasjon av betinget sannsynlighet

I eksempel 2 under illustrerer vi hvordan P(B|A) endrer seg når P(AB) endrer seg og når P(A) endrer seg.

Eksempel 2:

Blant 100 gamere som ble intervjuet, spilte 80 «World of Witchcraft» (WoW), 30 spilte «Claw of Duty» (CoD), og 20 spilte begge disse. Lar vi hendelse A være at noen spiller WoW, og hendelse B at noen spiller CoD, kan vi illustrere dette med Venn-diagrammet under, der hver gamer er representert med en blå prikk.

P(A) = 80/100, P(A|B) = 20/100

Vi antar at disse dataene er representative for gamere, og skal anslå hvor sannsynlig det er at en vilkårlig gamer spiller CoD, gitt at vedkommende spiller WoW.

Vi har P(A) = 0,8 fordi 80 av 100 spiller WoW, og vi har P(AB) = 0,2 fordi 20 av 100 spiller både WoW og CoD. Regelen for betinget sannsynlighet gir da:

$P(B|A) = \frac{\displaystyle P(A \cap B)}{\displaystyle P(A)} = {\large \frac{0{,}2}{0{,}8}} = 0{,}25$. Gitt at en gamer spiller WoW, er det 25 % sannsynlig at vedkommende også spiller CoD. Vi ser av Venn-diagrammet at dette er fornuftig, for av alle gamerne i A ligger $ {\large \frac{1}{4}}$ også i B.

Så skal vi se hvordan denne sannsynligheten endrer seg hvis 80 av 100 spiller WoW som før, men bare 10 av disse også spiller CoD. Denne situasjonen kan vi illustrere med dette Venn-diagrammet:

P(A) = 80/100, P(A|B) = 10/100

Sannsynligheten for at en vilkårlig gamer spiller både WoW og CoD blir nå:

$P(B|A) = \frac{\displaystyle P(A \cap B)}{\displaystyle P(A)} = {\large \frac{0{,}1}{0{,}8}} = 0{,}125$. Sannsynligheten er halvert fordi bare $ {\large \frac{1}{8}}$ av alle gamerne i A også ligger i B.

Går vi tilbake til at 20 gamere spiller både WoW og CoD, men sier at bare 40 av 100 spiller WoW, får vi dette Venn-diagrammet:

P(A) = 40/100, P(A|B) = 20/100

Sannsynligheten for at en vilkårlig gamer spiller både WoW og CoD blir nå:

$P(B|A) = \frac{\displaystyle P(A \cap B)}{\displaystyle P(A)} = {\large \frac{0{,}2}{0{,}4}} = 0{,}5$. Sannsynligheten er doblet fordi hele $ {\large \frac{1}{2}}$ av alle gamerne i A også ligger i B.

Vi legger merke til at

        • Sannsynligheten for B|A øker når sannsynligheten for AB øker.
        • Sannsynligheten for B|A øker når sannsynligheten for A avtar. Vi kan tenke på sannsynligheten for A som et mål på hvor «eksklusiv» hendelsen A er. Jo mer A ekskluderer utfall som ikke ligger i AB, jo mer sannsynlig blir B|A.
        • Vi trenger ikke kjenne sannsynligheten for B for å beregne sannsynligheten for B|A.

Oppgave 1:

I et spill der du kaster to terninger, vinner du hvis du får sum 4 eller mindre.

  1. Hva er sannsynligheten for å vinne?
     
  2. Hva er sannsynligheten for å vinne hvis du har kastet den ene terningen og fått 2?

Se løsningsforslag

Oppgave 2:

På et gatekjøkken kjøper 40 % av kundene pølse, og 15 % kjøper pølse og chips. Bruk regelen om betinget sannsynlighet til å beregne sannsynligheten for at en vilkårlig kunde som kjøper pølse, også kjøper chips.

Se løsningsforslag

Betinget sannsynlighet og mengder

Vi kan også bruke kardinalitet i mengder til å komme fram til regelen for betinget sannsynlighet.

I artikkelen om mengder bruker vi bokstaven n for å angi en mengdes kardinalitet, altså antall elementer i en mengde. For eksempel betyr n(A) = 6 at mengden A inneholder 6 elementer, slik som i eksempel 1.

Tenker vi «gunstige på mulige», kan vi uttrykke P(B|A) som antall elementer som ligger i både A og B, dividert på antall elementer i A totalt. Altså $P(B|A) = \frac{\displaystyle n(A \cap B)}{\displaystyle n(A)}$.

Gjør vi så et lite mattetriks, og utvider brøken med $\frac{\displaystyle 1}{\displaystyle n(U)}$, der n(U) er antall elementer i mengden som består av hele utfallsrommet, får vi:

$P(B|A) = \frac{\displaystyle n(A \cap B)}{\displaystyle n(A)} \cdot \frac{\frac{\displaystyle 1}{\displaystyle n(U)}}{\frac{\displaystyle 1}{\displaystyle n(U)}} = \frac{\frac{\displaystyle n(A \cap B)}{\displaystyle n(U)}}{\frac{\displaystyle n(A)}{\displaystyle n(U)}}$

Det som står i telleren i hovedbrøken, er antall elementer i AB dividert på antall elementer totalt. Noe som ikke er annet enn «gunstige på mulige» for hendelsen AB , altså P(AB). Tilsvarende er det som står i nevneren P(A). Trekker vi det hele sammen, får vi regelen for betinget sannsynlighet: $P(B|A) = \frac{\displaystyle P(A \cap B)}{\displaystyle P(A)}$.

SkjermfilmSe filmen «Betinget sannsynlighet»

Uavhengighet kan også angis ved hjelp av betinget sannsynlighet:

$\fbox{$B$ er uavhengig av $A$ hvis $P(B|A) = P(B)$}$

Hendelsen B er uavhengig av hendelsen A hvis sannsynligheten for B ikke påvirkes av om A har inntruffet eller ikke.

Kilder

    • Hinna, K.R.C., Rinvold, R.A., Gustavsen, TS. (2011). QED 5-10, bind 1. Høyskoleforlaget
    • Ubøe, J. (2011). Statistikk for økonomifag. Gyldendal akademisk
    • Hagen, Per C. (2000). Innføring i sannsynlighetsregning og statistikk. Cappelen akademisk

Den generelle produktregelen

Uavhengige og avhengige hendelser

Vi vet at det i en by er 60 % sannsynlig at det blir sol en vilkårlig dag i juli. 

Så skal vi regne ut sannsynligheten for at det blir sol i byen både 15. juli neste år og 15. juli året etter det igjen.

Det er ingen grunn til å tro at det skal være noen avhengighet mellom to dager så langt fra hverandre, så vi kan bruke produktregelen for uavhengige hendelser:

$\fbox{Produktregelen for uavhengige hendelser: $P(A \cap B) = P(A) \cdot P(B)$}$

Sannsynligheten for at det blir sol i byen begge de to dagene er altså 0,6 · 0,6 = 0,36, det vil si 36 %.

Men så sier vi videre at vi vet at det i den samme byen er 80 % sannsynlig at det etter en dag med sol kommer en ny dag med sol. Og så skal vi regne ut sannsynligheten for at det blir sol både 15. og 16. juli neste år.

Disse hendelsene er ikke uavhengige, vi vet at sannsynligheten for sol en vilkårlig dag generelt er 60 %, men 80 % hvis det var sol dagen før. Vi kan derfor ikke bruke produktregelen for uavhengige hendelser. I stedet bruker vi den generelle produktregelen, som tar høyde for at hendelser kan være avhengige av hverandre:

$\fbox{Den generelle produktregelen: $P(A \cap B) = P(A) \cdot P(B|A)$}$

B|A leses «B, gitt A», og P(B|A) er sannsynligheten for at hendelse B inntreffer, gitt at hendelse A har inntruffet. Lar vi hendelse A bety «sol 15. juli» og hendelse B bety «sol 16. juli», vet vi at P(A) er 60 % og P(B|A) er 80 %.

Sannsynligheten for at det blir sol både 15. og 16. juli neste år, blir altså, ifølge den generelle produktregelen, 0,6 · 0,8 = 0,48, det vil si 48 %.

Den generelle produktregelen sier at sannsynligheten for at hendelse A og B begge inntreffer er lik sannsynligheten for A multiplisert med sannsynligheten for B, gitt at A har inntruffet.

Dersom hendelsene A og B faktisk er uavhengige, er P(B|A) = P(B), og den generelle produktregelen blir lik produktregelen for uavhengige hendelser.

Oppgave 1:

En eksamen består av en teoretisk og en praktisk prøve. I snitt klarer 70 % den teoretiske prøven, og 80 % av de som klarer den teoretiske prøven, klarer den praktiske prøven. Beregn sannsynligheten for å klare både den teoretiske og den praktiske prøven.

Se løsningsforslag

Så et eksempel der vi ser på bruk av produktregelen når vi trekker kuler fra ei eske, med og uten tilbakelegging:

Eksempel 1:

Ei eske inneholder 10 kuler, hvorav 6 er hvite og 4 svarte, og vi skal finne sannsynligheten for å først få ei hvit kule, deretter ei svart, når vi trekker ei kule, legger tilbake, og så trekker en gang til.

Vi kaller sannsynligheten for å trekke ei hvit kule for P(H), og sannsynligheten for å trekke ei svart for P(S).

Siden 6 av totalt 10 kuler er hvite, alle med lik sannsynlighet for å bli trukket, får vi
$P(H) = {\large \frac{6}{10}} = {\large\frac{3}{5}}$.

Tilsvarende for svart:
$P(S) = {\large \frac{4}{10}} = {\large\frac{2}{5}}$.

Disse hendelsene er uavhengige, så vi bruker produktregelen for uavhengige hendelser for å finne sannsynligheten for å først trekke hvit, så svart:
$P(H \cap S) = P(H) \cdot P(S) = {\large\frac{3}{5}} \cdot {\large\frac{2}{5}} = {\large\frac{6}{25}} = 24 \%$.

Men så lar vi være å legge den første kula tilbake, og spør hva sannsynligheten da er for å først få ei hvit kule, deretter ei svart. Nå er de to trekningene ikke lenger uavhengige, for sannsynligheten for å få ei svart kule i andre trekning avhenger av hva vi fikk i første trekning. Har vi fått hvit kule i første trekning, er det fremdeles 4 svarte tilbake, men nå er det bare 9 å velge blant, så vi får
$P(S|H) = {\large \frac{4}{9}}$.

Så bruker vi den generelle produktregelen for å finne sannsynligheten for å først trekke hvit, så svart:
$P(H \cap S) = P(H) \cdot P(S|H) = {\large\frac{3}{5}} \cdot {\large\frac{4}{9}} = {\large\frac{4}{15}} \approx 27 \%$.

Varianten uten tilbakelegging er naturlig nok litt mer sannsynlig enn varianten med tilbakelegging fordi det i andre trekning da er en større andel svarte kuler.

Vil vi beregne sannsynligheten for det motsatte, først svart kule, så hvit uten tilbakelegging, får vi
$P(S) = {\large \frac{4}{10}} = {\large\frac{2}{5}}$
$P(H|S) = {\large \frac{6}{9}}$
$P(S \cap H) = P(S) \cdot P(H|S) = {\large\frac{2}{5}} \cdot {\large\frac{6}{9}} = {\large\frac{4}{15}}$.

Sannsynligheten er altså den samme, uavhengig av hvilken rekkefølge vi trekker kulene i. Det er logisk, for i produktregelen P(AB) = P(A) · P(B|A) kan vi jo fritt velge om A skal representere «hvit» og B «svart», eller omvendt.

Til sammen gir disse to tilfellene sannsynligheten for å få ei svart og ei hvit kule når vi trekker to ganger uten tilbakelegging, ${\large\frac{4}{15}} + {\large\frac{4}{15}} = {\large\frac{8}{15}}$.

Oppgave 2:

Vi har 7 kuler av ulik farge i en pose, deriblant 1 rød, og skal beregne sannsynligheten for å få den røde hvis vi trekker 3 kuler.

Vi kan tenke oss at vi stikker hånda i posen og trekker opp 3 kuler samtidig. Hver kule har en sannsynlighet på ${\large \frac{1}{7}}$ for å være rød, så totalt er det en sannsynlighet på ${\large \frac{3}{7}} \approx 43 \, \%$ for at vi har fått den røde.

Men vi kan også tenke oss at vi trekker ei kule av gangen, og resonnerer slik: Ved første trekning er 1 av 7 kuler røde, så sannsynligheten for å få den røde er da ${\large \frac{1}{7}}$. Hvis vi ikke får den røde kula i første trekning, er 1 av 6 gjenværende kuler røde, så sannsynligheten for å få den røde i andre trekning er ${\large \frac{1}{6}}$. Hvis vi fremdeles ikke har fått den røde kula, er 1 av 5 gjenværende røde kuler røde så sannsynligheten for å få den røde i tredje trekning er ${\large \frac{1}{5}}$.

Vi kan bare få den røde kula i én av trekningene, så disse utfallene kan ikke inntreffe samtidig. Vi kan derfor beregne den totale sannsynligheten ved å bruke addisjonsregelen for disjunkte utfall.

Og den totale sannsynligheten blir ${\large \frac{1}{7}} + {\large \frac{1}{6}} + {\large \frac{1}{5}} = {\large \frac{107}{210}} \approx 51 \, \%$.

Vi får altså forskjellig svar avhengig av hvordan vi betrakter situasjonen. Kan dette være riktig? Hvis ikke, hva er problemet, og hvordan er korrekt utregning?

​Se løsningsforslag

Oppgave 3:

I oppgave 2 hadde vi 7 kuler av ulik farge i en pose, deriblant 1 rød, og beregnet sannsynligheten for å trekke den røde hvis vi trakk 3 kuler.

Beregn nå denne sannsynligheten ved hjelp av teknikken for trekning fra blandede mengder, slik det er beskrevet i artikkelen om kombinatorikk.

​Se løsningsforslag

Test for uavhengighet

Produktregelen for uavhengige hendelser sier altså at hvis to hendelser er uavhengige, er sannsynligheten for at begge skal inntreffe, lik sannsynligheten for den ene hendelsen multiplisert med sannsynligheten for den andre, $P(A \cap B) = P(A) \cdot P(B)$

Denne regelen kan vi snu på, og si at to hendelser er uavhengige hvis sannsynligheten for at begge skal inntreffe, er lik sannsynligheten for den ene hendelsen multiplisert med sannsynligheten for den andre.

Eksempel 2:

Vi trekker et kort tilfeldig fra en full kortstokk. Vi lar hendelse A være at vi får ess, hendelse B at vi får spar. Så skal vi avgjøre om disse hendelsene er uavhengige.

Av 52 kort er 13 spar, 4 er ess, og 1 er både spar og ess, så «gunstige på mulige» gir

$P(A) = {\large \frac{13}{52}} = {\large \frac{1}{4}}$

$P(B) = {\large \frac{4}{52}} = {\large \frac{1}{13}}$

$P(A \cap B) = {\large \frac{1}{52}}$.

Siden $P(A) \cdot P(B) = {\large \frac{1}{4}} \cdot {\large \frac{1}{13}} = {\large \frac{1}{52}} = P(A \cap B)$, er hendelsene uavhengige.

At to hendelser er uavhengige, må ikke forveksles med at de er disjunkte. At to hendelser, A og B, er disjunkte, betyr at de ikke kan inntreffe samtidig, det vil si at P(AB) = 0.

Kilder

    • Hinna, K.R.C., Rinvold, R.A., Gustavsen, TS. (2011). QED 5-10, bind 1. Høyskoleforlaget
    • Ubøe, J. (2011). Statistikk for økonomifag. Gyldendal akademisk
    • Hagen, Per C. (2000). Innføring i sannsynlighetsregning og statistikk. Cappelen akademisk

Kombinere regler

Oppsummering av regler

I artikkelen om addisjonsregelen diskuterer vi addisjonsregelen for disjunkte hendelser, som sier at når to hendelser ikke begge kan inntreffe, er sannsynligheten for at minst én av hendelsene inntreffer, lik summen av sannsynlighetene for hver av de to hendelsene:

$\fbox{Addisjonsregelen for disjunkte hendelser: $P(A \cup B) = P(A) + P(B)$}$

Videre ser vi på den generelle addisjonsregelen, som også er gyldig i det tilfellet at to hendelser begge kan inntreffe, og sier at sannsynligheten for at minst én av hendelsene inntreffer er lik summen av sannsynlighetene for hver av de to hendelsene minus sannsynligheten for begge:

$\fbox{Den generelle addisjonsregelen: $P(A \cup B) = P(A) + P(B) – P(A \cap B)$}$

I artikkelen om komplementregelen blir vi kjent med komplementregelen, som sier at sannsynligheten for at en hendelse ikke inntreffer, er lik 1 minus sannsynligheten for at den inntreffer:

$\fbox{Komplementregelen: $P(A^C) = 1 – P(A)$}$

I artikkelen om produktregelen presenterer vi produktregelen for uavhengige hendelser, som sier at sannsynligheten for at to uavhengige hendelser begge inntreffer, er lik produktet av sannsynlighetene for hver av de to hendelsene:

$\fbox{Produktregelen for uavhengige hendelser: $P(A \cap B) = P(A) \cdot P(B)$}$

Minst én sekser

Nå skal vi se hvordan vi kan bruke disse reglene til å, på tre forskjellige måter, regne ut sannsynligheten for å få minst én sekser ved et kast med to terninger.

Kaller vi «seks på første terning» for hendelse A, og «seks på andre terning» for hendelse B, kan vi illustrere et kast med to terninger slik:

Illustrasjon av kast med 2 terninger

I det oransje området ligger de 25 utfallene uten seks på noen av terningene, for eksempel 5-3 og 2-4, men vi har ikke skrevet dem inn, for oversiktens skyld.

Vi vet at sannsynligheten for å få seks på en terning er ${\large \frac{1}{6}}$, så $P(A) = {\large \frac{1}{6}}$, noe som utgjør de gule og grønne områdene i figuren, og $P(B)={\large \frac{1}{6}}$, noe som utgjør de blå og grønne områdene i figuren. Det grønne området inngår i både A og B, så disse hendelsene er ikke disjunkte.

Sannsynligheten for å få seks på begge terningene kan vi beregne ved hjelp av produktregelen:
$P(A \cap B) = P(A) \cdot P(B) = {\large \frac{1}{6}} \cdot {\large \frac{1}{6}} = {\large \frac{1}{36}}$, noe som utgjør det grønne området i figuren. 

Sannsynligheten for å ikke få seks på en terning kan vi beregne ved hjelp av komplementregelen:
$P(A^C) = 1 – {\large \frac{1}{6}} = {\large \frac{5}{6}}$, det utgjør alt utenom de gule og grønne områdene i figuren, og $P(B^C) = 1 – {\large \frac{1}{6}} = {\large \frac{5}{6}}$, det utgjør alt utenom de blå og grønne områdene i figuren.

I de følgende eksemplene skal vi så beregne sannsynligheten for å få minst én sekser ved et kast med to terninger, altså $P(A \cup B)$, noe som utgjør de gule, blå og grønne områdene i figuren.

Eksempel 1:

Vi skal beregne $P(A \cup B)$ ved hjelp av addisjonsregelen.

Siden A og B ikke er disjunkte, må vi bruke den generelle addisjonsregelen:

$P(A \cup B) = P(A) + P(B) – P(A \cap B) = {\large \frac{1}{6}} + {\large \frac{1}{6}} – {\large \frac{1}{36}} = {\large \frac{6}{36}} + {\large \frac{6}{36}} – {\large \frac{1}{6}} = {\large \frac{11}{36}} \approx 0{,}3056$

Eksempel 2:

Vi skal beregne $P(A \cup B)$ ved å bryte hendelsen ned i tre disjunkte hendelser:

      1. Seks på første terning, men ikke andre, det vil si det gule området i figuren.
      2. Seks på andre terning, men ikke første, det vil si det blå området i figuren.
      3. Seks på begge terninger, det vil si det grønne området i figuren.

Sannsynligheten for hendelse 1 finner vi ved å bruke produktregelen på sannsynlighetene for de to hendelsene, som altså er $P(A) = {\large \frac{1}{6}}$ og $P(B^C) = {\large \frac{5}{6}}$:
$P(A \cap B^C) = {\large \frac{1}{6}} \cdot {\large \frac{5}{6}}= {\large \frac{5}{36}}$

Sannsynligheten for hendelse 2 blir tilsvarende:
$P(A^C \cap B) = {\large \frac{5}{6}} \cdot {\large \frac{1}{6}}= {\large \frac{5}{36}}$

Sannsynligheten for hendelse 3 har vi beregnet tidligere:
$P(A \cap B) = P(A) \cdot P(B) = {\large \frac{1}{6}} \cdot {\large \frac{1}{6}} = {\large \frac{1}{36}}$

I modul 1 så vi at addisjonsregelen for disjunkte hendelser kan utvides til et vilkårlig antall hendelser, og er lik summen av sannsynlighetene for hver av hendelsene som inngår, noe som gir
${\large \frac{5}{36}} + {\large \frac{5}{36}} + {\large \frac{1}{36}} = {\large \frac{11}{36}}$

Eksempel 3:

Vi skal beregne $P(A \cup B)$ ved å bruke komplementregelen.

Den komplementære hendelsen til «minst én sekser» er «ingen sekser». Det kan vi bare få hvis vi verken får seks på første eller andre terning. Sannsynligheten for å ikke få seks på en terning har vi tidligere beregnet til $ {\large \frac{5}{6}}$, så produktregelen gir $P(A^C \cap B^C) = {\large \frac{5}{6}} \cdot {\large \frac{5}{6}}= {\large \frac{25}{36}}$. Dette utgjør det oransje området i figuren. Siden området inni sirklene utgjør $P(A \cup B)$, skjønner vi at det oransje området utgjør $P \big((A \cup B)^C \big)$. Komplementregelen gir da:
$P(A \cup B) = 1 – P \big((A \cup B)^C \big) = 1 – {\large \frac{25}{36}} = {\large \frac{36 – 25}{36}} = {\large \frac{11}{36}}$

Vi kommer også fram til ${\large \frac{11}{36}}$ hvis vi dividerer antall utfall som inneholder en sekser, det vil si 11, med antall utfall totalt, noe som er 36.

Oppgave 1:

Vi har funnet ut at når vi kaster en bestemt type tegnestift, er sannsynligheten for at den havner med spissen opp lik $P(O) = {\large \frac{2}{3}}$.

Vi kaster tre tegnestifter av denne typen. Beregn sannsynlighetene for de fire hendelsene under, og forklar hvorfor summen av de fire sannsynlighetene blir 1.

      1. Alle havner med spissen opp.
         
      2. Alle havner med spissen ned.
         
      3. To havner med spissen opp og én med spissen ned.
         
      4. To havner med spissen ned og én med spissen opp.

Se løsningsforslag

Kombinere produkt- og komplementregelen

Av de tre måtene vi brukte for å regne ut sannsynligheten for å få minst én sekser ved et kast med to terninger på, har bruk av komplementregelen en klar fordel i at den er enkel å skalere.

La os si at vi skal beregne sannsynligheten for å få minst én sekser ved et kast med tre terninger. Kaller vi «seks på første terning» for hendelse A, «seks på andre terning» for hendelse B, og «seks på tredje terning» for hendelse C, kan vi illustrere dette slik, med et Venn-diagram:

Venn-diagram med tre overlappende mengder

Sannsynligheten vi er ute etter å finne, er P(A ∪ B ∪ C), det grønne området i figuren. Dette omfatter utfallene «seks på bare første terning», «seks på bare andre terning», «seks på bare tredje terning», «seks på første og andre terning», «seks på første og tredje terning», «seks på andre og tredje terning» og «seks på alle terningene».

Skal vi regne dette ut ved hjelp av den generelle addisjonsregelen, må vi utvide denne til å omfatte tre hendelser, slik vi så i modul 1, og vi får:
P(A ∪ B ∪ C) = P(A) + P(B) + P(C) − P(A ∩ B) − P(A ∩ C) − P(B ∩ C) + P(A ∩ B ∩ C)

Skal vi dele opp i disjunkte hendelser, får vi totalt sju stykker.

Skal vi telle gunstige utfall, har vi totalt 216 mulige utfall å undersøke.

Mye enklere er det da å se på den komplementære hendelsen, som er «ingen sekser», en hendelse som bare inntreffer hvis vi ikke får seks på noen av terningene. Siden sannsynligheten for å ikke får seks på en terning er ${\large \frac{5}{6}}$, gir produktregelen at sannsynligheten for «ingen sekser» med tre terninger er ${\large \frac{5}{6}} \cdot {\large \frac{5}{6}} \cdot {\large \frac{5}{6}} = {\large \frac{125}{216}}$.

Og komplementregelen gir at sannsynligheten for «minst én sekser» blir
$1 – {\large \frac{125}{216}} = {\large \frac{216 – 125}{216}} = {\large \frac{91}{216}} \approx 0{,}4213$

Oppgave 2:

Beregn sannsynligheten for å få minst én sekser i et kast med fem terninger.

Se løsningsforslag

Oppgave 3:

Beregn sannsynligheten for å få minst én kron i et kast med fem mynter.

Se løsningsforslag

Biler med like sluttsifre

Nå vil det ikke være så altfor komplisert å bruke den generelle addisjonsregelen til å regne ut sannsynligheten for å få minst én sekser ved et kast med tre terninger, for
$P(A) = P(B) = P(C) = {\large \frac{1}{6}}$
$P(A \cap B) = P(A \cap C) = P(B \cap C) = {\large \frac{1}{6}} \cdot {\large \frac{1}{6}} = {\large \frac{1}{36}}$
$P(A \cap B \cap C) = {\large \frac{1}{6}} \cdot {\large \frac{1}{6}} \cdot {\large \frac{1}{6}} = {\large \frac{125}{216}}$
Så vi får
$P(A \cup B \cup C) = 3 \cdot {\large \frac{1}{6}} – 3 \cdot {\large \frac{1}{36}} + {\large \frac{125}{136}} = {\large \frac{108 – 18 + 1}{216}} = {\large \frac{91}{216}} $

Men noen situasjoner vil være helt uoverkommelige å håndtere med denne metoden. I oppgave 1 i artikkelen om introduksjon til sannsynlighet fikk vi vite at sannsynligheten for at minst to av tjue vilkårlige biler har samme to sluttsifre i registreringsnummeret er ca. 87 %. Denne hendelsen er svært sammensatt. Det kan være at bil 1 og 5 har samme, det kan være at bil 3, 6 og 11 har samme, det kan være at 3 og 13 har samme og at samtidig 9 og 17 har samme, og så videre. Å modellere dette med den generelle addisjonsregelen, ved å dele opp i disjunkte utfall, eller ved å dividere gunstige på mulige orker vi ikke tenke på å prøve en gang.

Heldigvis er sannsynligheten for den komplementære hendelsen ganske lett å beregne. Den komplementære hendelsen til «minst to med like sluttsifre» er «alle med unike sluttsifre».

Det finnes totalt 100 mulige varianter av to sluttsifre, alt fra 00 til 99.

For første bil er alle 100 variantene unike, for andre bil er 99 unike, for tredje bil er 98 unike, og så videre. Sannsynligheten for at første bil har unike sifre blir følgelig ${\large \frac{100}{100}}$, sannsynligheten for at andre bil har unike sifre blir ${\large \frac{99}{100}}$, sannsynligheten for at tredje bil har unike sifre blir ${\large \frac{98}{100}}$, og så videre ned til tjuende bil, der sannsynligheten for unike sifre blir ${\large \frac{81}{100}}$.

Siden dette er uavhengige hendelser, sier produktregelen at sannsynligheten for at alle hendelsene inntreffer, er lik produktet av enkeltsannsynlighetene, og vi får

$P(\text{Unike sifre}) = {\large \frac{100}{100}} \cdot {\large \frac{99}{100}} \cdot {\large \frac{98}{100}} \cdot \; \dots \; \cdot {\large \frac{81}{100}} \approx 0{,}1304$

Ved å bruke komplementregelen får vi at

$P(\text{Minst to med like sifre}) = 1 – P(\text{Unike sifre}) \approx 1 – 0{,}1304 = 0{,}8696$

Det er altså ca. 87 % sannsynlighet for at minst to av tjue biler har samme to sluttsifre.

Vi kan regne ut ${\large \frac{100}{100}} \cdot {\large \frac{99}{100}} \cdot {\large \frac{98}{100}} \cdot \; \dots \; \cdot {\large \frac{81}{100}}$ som ${\large \frac{100!}{80! \, \cdot \, 100^{\Large 20}}}$. Kalkulatorer klarer ofte ikke å beregne høyere fakulteter enn 69!, men vi kan gjøre beregningen i Excel ved å skrive =fakultet(100)/(fakultet(80) * 100^20), eller i GeoGebra ved å skrive 100!/(80! * 100^20) i inntastingsfeltet.

Et alternativ der vi unngår høye tall i mellomregningene, kan være å sette opp utregningene i et regneark som vist under. Der inneholder kolonne A tallene fra 100 ned til 81, kolonne B inneholder tallene i kolonne A dividert på 100, og i celle C1 beregner vi produktet av tallene i kolonne B ved hjelp av formelen =produkt(B1:B20).

Beregning av sannsynlighet for like sluttsifre

Fødselsdagsproblemet

Oppgave 4:

Hva er sannsynligheten for at det i en klasse med 30 elever finnes noen som har samme fødselsdag? Gi et anslag ved hjelp av «magefølelsen» først, og beregn så den nøyaktige sannsynligheten ved hjelp av samme metode som i eksemplet med sluttsifre over. For enkelhets skyld ser vi bort fra skuddår, og regner med at alle er født i et år med 365 dager. Vi antar også at fødselsdagene er tilfeldig fordelt på årets dager.

NB! Verken Excel eller GeoGebra beregner høyere fakulteter enn 170!, så det kan være lurt å bruke teknikken med regneark som er vist over.

Se løsningsforslag

 

SkjermfilmSe filmen «Produktprinsippet»

 

Kilder

    • Hinna, K.R.C., Rinvold, R.A., Gustavsen, TS. (2011). QED 5-10, bind 1. Høyskoleforlaget
    • Ubøe, J. (2011). Statistikk for økonomifag. Gyldendal akademisk
    • Hagen, Per C. (2000). Innføring i sannsynlighetsregning og statistikk. Cappelen akademisk