Binomisk fordeling

Hva er binomisk fordeling?

Myntkast er et eksempel på en diskret sannsynlighetsfordeling som kalles binomisk fordeling. Et forsøk der utfallene følger en binomisk fordeling, har følgende tre karakteristikker:

  1. Forsøket har to mulige enkeltutfall. Det er vanlig å kalle disse for suksess eller fiasko. I et myntkast kan vi for eksempel la kron representerer suksess og mynt fiasko.
     
  2. Sannsynligheten for suksess, p, skal være den samme fra forsøk til forsøk. Det betyr imidlertid ikke at vi alltid må ha p = 0,5, p kan ha alle mulige verdier mellom 0 og 1. I kast med en rettferdig mynt er imidlertid p = 0,5.
     
  3. Forsøkene skal være uavhengige. Dette er tilfellet ved myntkast, én mynt påvirker ikke en annen.

Andre eksempler på binomiske forsøk kan være om en vare er defekt eller i orden, eller om deltakerne i en spørreundersøkelse har svart «ja» eller «nei» på et spørsmål.

Ved kast med en rettferdig mynt er altså sannsynligheten for suksess p = 0,5, noe som resulterer i en symmetrisk sannsynlighetsfordeling, slik som vist under.

Stolpediagram som viser punktsannsynligheten for antall kron i et myntkast med 5 mynter

Men bruker vi en juksemynt som 3 av 4 ganger gir kron, vil vi fremdeles ha et binomisk forsøk, men nå med p = 0,75 og en punktsannsynlighet som vist under. Vi ser at fordelingen er skjev, med tyngdepunkt til høyre. Naturligvis er det mer sannsynlig å få mange kron enn å få mange mynt når sannsynligheten for kron er 0,75 og sannsynligheten for mynt følgelig er 0,25.

Stolpediagram som viser punktsannsynligheten for antall kron i et myntkast med 5 mynter, med en juksemynt med p = 0,75

Sannsynligheter i binomisk fordeling

Hvis x er antall suksesser i et binomisk forsøk, p sannsynligheten for suksess, og n antall forsøk, er P(X) gitt ved

$\fbox{Binomisk fordeling: $P(X = x) = {\large \binom{n}{x}} p^x (1 – p)^{(n – x)}$}$

Eksempel 1:

Vi skal bruke formelen for binomisk fordeling til å beregne tre sannsynligheter ved kast med 5 rettferdige mynter. Her har vi at n = 5 og p = 0,5.

  1. Sannsynligheten for 3 kron.
     
    Vi får
     $P(X = 3) = {\large \binom{5}{3}} (0{,}5)^3 (1 – 0,5)^{(5 – 3)} = 0{,}3125$.
     
  2. Sannsynligheten for 1 kron eller mindre.
     
    Vi må addere sannsynlighetene for å få 0 eller 1 kron, og får
    $P(X \le 1) = P(X = 1) + P(X = 0) =$
    ${\large \binom{5}{1}} (0,5)^1 (1 – 0{,}5)^{(5 – 1)} + {\large \binom{5}{0}} (0{,}5)^0 (1 – 0{,}5)^{(5 – 0)} \approx 0{,}0313 + 0{,}1563 = 0{,}1875$.
     
  3. Sannsynligheten for 4 kron eller mindre.
     
    Vi kan addere sannsynlighetene for 4, 3, 2, 1 og 0 kron, men det er enklere å basere seg på sannsynligheten for den komplementære hendelsen, 5 kron. Vi får
    $P(X \le 4) = 1 – P(X = 5) =$
    $1 – {\large \binom{5}{5}} (0,5)^5 (1 – 0,5)^{(5 – 5)} \approx 1 – 0{,}0313 = 0{,}9687$.

SkjermfilmSe filmen «Binomisk fordeling»
 

For å angi at en tilfeldig variabel, X, er binomisk fordelt i n forsøk med suksess-sannsynlighet p, skriver vi

$\fbox{$X \sim Bin(n, p)$}$

Binomisk fordeling i Excel og GeoGebra

I Excel beregner vi binomiske sannsynligheter med funksjonen binom.fordeling.n. Vi må da oppgi antall suksesser, antall forsøk, forsøkenes sannsynlighet, og om vi skal beregne kumulativ sannsynlighet eller punktsannsynlighet. sann betyr kumulativ sannsynlighet, usann betyr ikke-kumulativ, altså punktsannsynlighet.

RegnearkÅpne et regneark med beregningene fra eksempel 1

Tilsvarende funksjon i GeoGebra heter fordelingbinomial. Her er rekkefølgen på parameterne annerledes, vi angir antall forsøk, forsøkenes sannsynlighet, antall suksesser, true for kumulativ sannsynlighet og false for punktsannsynlighet.

For eksempel skriver vi =binom.fordeling.n(3; 5; 0,5; usann) i Excel og fordelingbinomial(5, 0.5, 3, false) i GeoGebra for å beregne sannsynligheten i eksempel 1.1 og =binom.fordeling.n(1; 5; 0,5; sann) i Excel og fordelingbinomial(5, 0.5, 1, true) i GeoGebra for å beregne sannsynligheten i eksempel 1.2.

I GeoGebra er det imidlertid mer praktisk å bruke sannsynlighetskalkulatoren som beskrives i artikkelen om statistikk i GeoGebra.

Oppgave 1:

La X betegne antall kron i 8 kast med en juksemynt der sannsynligheten for kron er 0,6. Beregn ved hjelp av formelen for binomisk fordeling:

  1. P(X = 4)
     
  2. P(X ≤ 2)
     
  3. P(X ≤ 6)

Kontroller svarene i Excel eller GeoGebra.

Uten å regne ut, anslå om P(X = 7) er større, lik, eller lavere enn P(X = 1).

Se løsningsforslag

Eksempel 2:

I oppgave 1 i artikkelen om å kombinere regler bruker vi produkt-, komplement- og addisjonsregler for å beregne sannsynlighetene for hvordan tre tegnestifter vi kaster, blir liggende, når sannsynligheten for å havne med spissen opp er ${\large \frac{2}{3}}$. Vi kan gjøre de samme beregningene ved å betrakte tegnestiftkast som en binomisk situasjon. Kaller vi «spissen opp» for suksess, får vi følgende sannsynligheter:

      1. Alle havner med spissen opp. Det betyr 3 suksesser, og vi får
        $P(X = 3) = {\large \binom{3}{3}} (\frac{2}{3})^3 (1 – \frac{2}{3})^{(3 – 3)} \approx 0{,}2963$
         
      2. Alle havner med spissen ned. Det betyr 0 suksesser, og vi får
        $P(X = 0) = {\large \binom{3}{0}} (\frac{2}{3})^0 (1 – \frac{2}{3})^{(3 – 0)} \approx 0{,}0370$
         
      3. 2 havner med spissen opp og 1 med spissen ned. Det betyr 2 suksesser, og vi får
        $P(X = 2) = {\large \binom{3}{2}} (\frac{2}{3})^2 (1 – \frac{2}{3})^{(3 – 2)} \approx 0{,}4444$
         
      4. 1 havner med spissen opp og 2 med spissen ned. Det betyr 1 suksess, og vi får
        $P(X = 1) = {\large \binom{3}{1}} (\frac{2}{3})^1 (1 – \frac{2}{3})^{(3 – 1)} \approx 0{,}2222$

Dette er de samme tallene vi fant med produkt-, komplement- og addisjonsreglene. Metoden med binomisk sannsynlighet er imidlertid mye lettere å utvide hvis kaster flere tegnestifter.

Eksempel 3:

Norsk Tipping har en artikkel om at noen tall i spillet Extra trekkes oftere enn andre. De mest ekstreme tilfellene er et tall som er trukket så lite som 26 ganger, og et tall som er trukket så mye som 43 ganger i løpet av et år. Her skal vi regne ut hvor sannsynlige disse hendelsene er.

I Extra trekkes 47 av 75 mulige tall, noe som gir en sannsynlighet på om lag 0,63 for at et gitt tall skal bli trukket. Siden Extra trekkes ukentlig, kan vi regne med at det er 52 trekninger i et år.

I en gitt trekning har et tall to muligheter, det blir enten trukket, eller det blir ikke trukket. Sannsynligheten for å bli trukket er den samme i alle trekninger, og trekningene er uavhengige. Så antall ganger et tall blir trukket i løpet av et år, oppfyller kravene til en binomisk fordeling.

Regner vi hendelsen å bli trukket som suksess, har vi altså p ≈ 0,63. Og siden vi har 52 trekninger i et år, har vi n = 52.

Sannsynligheten for å bli trukket 26 ganger blir

$P(X = 26) \approx {\large \binom{52}{26}} 0{,}63^{26} (1 – 0{,}63)^{(52 – 26)} \approx 0,0178$. Ca. 1,78 %.

Sannsynligheten for å bli trukket 43 ganger blir

$P(X = 43) \approx {\large \binom{52}{43}} 0{,}63^{43} (1 – 0{,}63)^{(52 – 43)} \approx 0,0011$. Ca. 0,11 %.

Men mer interessant enn å spørre om sannsynligheten for å bli trukket akkurat 26 ganger og akkurat 43 ganger, er det å spørre om sannsynligheten for å bli trukket 26 ganger eller sjeldnere, og 43 ganger eller mer, altså P(X ≤ 26) og P(X ≥ 43).

I Excel og GeoGebra beregner vi P(X ≤ 26) ved å skrive henholdsvis
= binom.fordeling.n(26; 52; 0,63; sann) og fordelingbinomial(52, 0.63, 26, true)
og får om lag 0,0377, ca. 3,77 %.

For å beregne P(X ≥ 43), beregner vi 1 – P(X ≤ 42), og skriver henholdsvis
= 1 – binom.fordeling.n(42; 52; 0,63; sann) og 1 – fordelingbinomial(52, 0.63, 42, true)
og får om lag 0,0017, ca. 0,17 %.

Binomisk fordelingstabell

I tidligere tider var tabeller et viktig hjelpemiddel til å finne binomiske sannsynligheter, men i datamaskinenes tidsalder har de mindre nytte. Et utdrag av en kumulativ, binomisk tabell er vist under. Her er p sannsynligheten for suksess, n antall forsøk, og x antall suksesser.

Kumulativ tabell over binomisk fordeling

Vil vi for eksempel finne sannsynligheten for å få «2 eller færre kron» i et kast med 3 mynter, velger vi p = 0,5, n = 3, x = 2, og leser av 0,8750. Vil vi finne sannsynligheten for «nøyaktig 2 kron», må vi ta sannsynligheten for «2 eller færre kron» og trekke fra sannsynligheten for 1 eller færre kron, 0,8750 – 0,5000 = 0,3750.

Dette nettstedet har også en komplett, binomisk fordelingtabell.

Forventning og varians i binomisk fordeling

I artikkelen om forventning og varians lærer vi at forventningen til et stokastisk forsøk angir forventet middelverdi for utfallene, mens variansen angir forventet spredning av utfallene. Hvis X ~ Bin(n, p), har vi at

$\fbox{$\begin{align} E(X) &= np \\
Var(X) &= np(1 – p) \end{align}$}$

At forventningen øker proporsjonalt med antall forsøk er intuitivt rimelig. Jo flere forsøk vi gjør, jo flere suksesser kan vi forvente til sammen. At forventningen øker proporsjonalt med sannsynligheten for suksess er også rimelig. Jo større sannsynlighet for suksess, jo flere suksesser kan vi forvente.

Når det gjelder variansen, er det også intuitivt rimelig at den øker med antall forsøk. Jo flere forsøk, jo flere resultater spredt utover. Når det gjelder sannsynligheten, vil p(1 – p) ha sin høyeste verdi når p = 0,5. Vi får altså størst varians når sannsynligheten for suksess og fiasko er den samme. Dette er også intuitivt rimelig, for jo større sannsynligheten for suksess eller fiasko er, jo mer vil resultatene klumpe seg rundt dette resultatet. Drar vi det helt ut i det ekstreme og setter p = 1 eller p = 0, vil vi bare få suksesser eller bare fiaskoer, og variansen blir 0.

Eksempel 4:

Figuren under viser tre binomiske fordelinger med 100 forsøk og sannsynligheter på henholdsvis 0,1, 0,5 og 0,9.

Kurver som vise binomialfordelinger med 100 forsøk og sannsynligheter på 0,1, 0,5 og 0,9

For den blå fordelingen, som viser X ~ Bin(100, 0,1), får vi E(X) = 100 · 0,1 = 10 og Var(X) = 100 · 0,1 · (1 – 0,1) = 9.

For den røde fordelingen, som viser X ~ Bin(100, 0,5), får vi E(X) = 100 · 0,5 = 50 og Var(X) = 100 · 0,5 · (1 – 0,5) = 25.

For den grønne fordelingen, som viser X ~ Bin(100, 0,9), får vi E(X) = 100 · 0,9 = 90 og Var(X) = 100 · 0,9 · (1 – 0,9) = 9.

Vi ser at forventningen i alle tre tilfeller havner der fordelingene har toppen. Og vi ser at variansen er større når sannsynligheten er 0,5 enn når den er 0,1 og 0,9. Dette stemmer med figuren, for vi ser at den røde fordelingen er bredere enn de to andre.

Oppgave 2:

Finn E(X) og Var(X) når

  1. X er antall kron i 10 kast med en rettferdig mynt.
     
  2. X er antall seksere i 5 kast med en rettferdig terning.

Se løsningsforslag

Kilder

    • Ubøe, J. (2011). Statistikk for økonomifag. Gyldendal akademisk
    • Hagen, Per C. (2000). Innføring i sannsynlighetsregning og statistikk. Cappelen akademisk
    • Bhattacharyya, G, Johnson, R.A. (1977) Statistical concepts and methods. John Wiley & Sons