I artikkelen om begreper i sannsynlighet ser vi at når vi kaster en rettferdig terning, er det like stor sannsynlighet for å få 1, 2, 3, 4, 5 og 6. Vi har en uniform sannsynlighetsfordeling. I temaet om kombinatorikk lærer vi strukturerte metoder for å beregne antall utfall i uniforme modeller, noe som er nyttig å kunne når det er så mange utfall at vi ikke klarer å telle dem opp. For eksempel å beregne antall mulige bridgehender.
I artikkelen om begreper i sannsynlighet ser vi også på kast med tre mynter, og teller opp kombinasjonene som gir henholdsvis 0, 1, 2 og 3 kron. Det er bare åtte mulige utfall, så det er rimelig enkelt. Øker vi antall mynter, vil vi imidlertid også her se at det fort blir uoverkommelig komplisert å gjøre beregninger ved å telle enkeltutfall. Antall kron i et myntkast er imidlertid ikke uniformt fordelt, så vi kan ikke bruke noen av kombinatorikk-metodene vi har lært. Imidlertid følger sannsynligheten for X kron et mønster som muliggjør beregning av kombinasjonsmuligheter.
Slike mønstre kaller vi sannsynlighetsfordelinger. Dersom utfallene har atskilte verdier, for eksempel tallene 1, 2, 3, 4, eller kron og mynt, har vi en diskret sannsynlighetsfordeling.
Søylediagrammet under viser sannsynlighetene for 0, 1, 2, 3, 4 og 5 kron i et kast med 5 mynter.
Vi ser at det er mest sannsynlig å få 2 og 3 kron, og minst sannsynlig å få 0 og 5 kron. Dette skyldes at det er mange flere enkeltutfall som kan kombineres til 2 og 3 enn til 0 og 5. Summen av høydene på søylene er 1, fordi de til sammen dekker utfallsrommet i et stokastisk forsøk, der total sannsynlighet alltid er 1.
Vi kan si at diagrammet viser P(X = x) der X representerer hendelsen «Antall kron i et kast med 5 mynter», og x betegner 0, 1, 2, 3, 4 eller 5. For eksempel betyr P(X = 3) = 0,3125 at sannsynligheten for 3 kron er 0,3125.
Diagrammet viser punktfordelingen for X, det vi si at høyden på hver søyle viser sannsynligheten for akkurat den verdien den står over. Ofte er vi imidlertid interessert i den kumulative fordelingen, der vi i stedet for P(X = x) ser på P(X ≤ x), det vil si sannsynligheten for at X er mindre eller lik enn en gitt verdi.
Den kumulative sannsynlighetsfordelingen for «Antall kron i et kast med 5 mynter» er vist under.
«Kumulativ» betyr at noe hoper seg opp, sannsynlighetene hoper seg opp mot høyre. I søylen over X = 2, for eksempel, inngår P(X = 0), P(X = 1) og P(X = 2). Vi ser at det er riktig hvis vi sammenlikner de to diagrammene. I det øverste diagrammet ser vi at P(X = 0) ≈ 0,03, P(X = 1) ≈ 0,16 og P(X = 2) ≈ 0,31, til sammen om lag 0,5, som er høyden på søylen over 2 i det nederste diagrammet.
Den totale søylehøyden i et kumulativt diagram er ikke 1, i stedet er søylen lengst til høyre 1, fordi den inkluderer hele utfallsrommet.
Siden summen av alle sannsynlighetene i utfallsrommet bestandig er 1, vil det følgende vil alltid gjelde:
$\fbox{$P(X > x) = 1 – P(X \le x)$}$
Derfor kan vi i en kumulativ sannsynlighetsfordeling også lett finne sannsynligheter for verdier høyere enn en gitt verdi.
Eksempel 1:
Tabellen under viser verdier for P(X = x) og P(X ≤ x), der X er «Antall kron i et kast med 5 mynter».
x | 0 | 1 | 2 | 3 | 4 | 5 |
P(X = x) | 0,03125 | 0,15625 | 0,31250 | 0,31250 | 0,15625 | 0,03125 |
P(X ≤ x) | 0,03125 | 0,18750 | 0,50000 | 0,81250 | 0,96875 | 1,00000 |
Så skal vi bruke tabellen til å finne P(X = 3), P(X ≤ 3) og P(X > 3).
Av tabellen ser vi at
P(X = 3) = 0,31250.
P(X ≤ 3) = 0,81250.
P(X > 3) = 1 – P(X ≤ 3) = 1- 0,81250 = 0,18750.
Vi kunne også enkelt ha funnet P(X > 3) som P(X = 4) + P(X = 5) = 0,15625 + 0,03125 = 0,18750.
Dette nettstedet har egne artikler om de diskrete sannsynlighetsfordelingene binomisk fordeling, hypergeometrisk fordeling og poissonfordeling.
Kilder
-
- Ubøe, J. (2011). Statistikk for økonomifag. Gyldendal akademisk
- Hagen, Per C. (2000). Innføring i sannsynlighetsregning og statistikk. Cappelen akademisk
- Bhattacharyya, G, Johnson, R.A. (1977) Statistical concepts and methods. John Wiley & Sons