Begreper i sannsynlighet

Mengder

For å kunne diskutere sannsynlighet på en strukturert måte, er vi avhengige av å kjenne til noen grunnbegreper. Vi starter med å se litt på mengder, som brukes i mange sammenhenger. En mengde er en samling elementer som deler én eller flere egenskaper. Disse egenskapene må være veldefinert, slik at vi helt sikkert kan si om et element er medlem av mengden eller ikke.

Eksempel 1:

«Alle norske biler med registreringsnummer som begynner på PP» er en mengde. «Alle elever på Gufsemo skole» er en mengde. Men «Alle skitne biler» kan vanskelig sies å være en mengde fordi det ikke finnes noen klar definisjon av hva som menes med skitten.

Vi kan angi hva en mengde inneholder ved å liste opp elementene mellom klammeparenteser.

Eksempel 2:

Mengden T som består av alle positive, ensifrede heltall, kan vi angi slik: T = {1, 2, 3, 4, 5, 6, 7, 8, 9}, eventuelt som T = {1, 2, 3, … , 9}.

Mengder illustrerer vi gjerne med Venn-diagrammer. Vi representerer da mengden med en kurve rundt elementene, ofte en sirkel.

Eksempel 3:

Mengden T med tall fra eksempel 2, kan vi illustrere slik:

Venn-diagram med en enkelt mengde

En mengde kan være en delmengde av en annen mengde. I et Venn-diagram kan vi illustrere dette med en sirkel som ligger inni en annen sirkel.

Eksempel 4:

Mengden av positive, ensifrede partall, E = {2, 4, 6, 8} og mengden av positive, ensifrede oddetall, E = {1, 3, 5, 7, 9}, er delmengder av mengden T fra eksempel 2. I et Venn-diagram kan dette illustreres slik:

Venn-diagram med to delmengder

Mengder kan være delmengder av flere mengder samtidig. I et Venn-diagram illustrerer vi dette med overlappende sirkler.

Eksempel 5:

Mengden ensifrede primtall, P = {2, 3, 5, 7} , består av elementer fra både mengden med partall, E, og mengden med oddetall, O, fra eksempel 4. I et Venn-diagram kan dette illustreres slik:

Venn-diagram med overlappende mengder

Fra Venn-diagrammet i eksempel 5 ser vi at mengden av elementer som både er i P og O, består av {3, 5, 7}, og at mengden av elementer som både er i P og E, består av {2}. Men mengden av elementer som både er i E og O inneholder ikke noe fordi sirklene ikke overlapper. Vi sier at mengden er tom. En tom mengde angir vi med klammer uten noe mellom, {}, eller med symbolet ∅.

Antall elementer i en mengde kaller vi mengdens kardinalitet. Kardinalitet kan angis på forskjellige måter, her vil vi bruke bokstaven n. n(A) betyr altså mengden av elementer i A. I eksempel 5 har vi at n(O) = 5, n(E) = 4 og n(P) = 4. Kardinaliteten til en tom mengde er null, n(∅) = 0. 

Utfall og hendelser

I artikkelen introduksjon til sannsynlighet sa vi at resultatet av et terningkast var et stokastisk, altså tilfeldig, fenomen. Å kaste terninger kaller vi derfor gjerne et stokastisk forsøk. Vi kan ikke på forhånd forutse resultatet av enkeltkast, men kaster vi mange ganger, vil vi se mønstre i resultatene.

Når vi kaster en terning, kan resultatet bli 1, 2, 3, 4, 5 eller 6. Disse tallene er de mulige utfallene av det stokastiske forsøket. Vi vet ikke på forhånd hvilket av tallene vi vil få, men vet at det må bli ett av dem. Vi kan ikke få 0 eller 7, og terningen kan ikke bli stående og balansere på en kant. Tallene 1 – 6 utgjør mengden av mulige utfall av forsøket, noe vi kaller forsøkets utfallsrom.

Eksempel 6:

Når vi kaster en mynt, kan den enten lande på mynt eller kron. Utfallsrommet til et myntkast er derved {mynt, kron}.

En kombinasjon av ett eller flere utfall vil vi kalle en hendelse, for eksempel «partall» ved kast med en terning, noe som består av utfallene 2, 4 og 6, eller «sum 11 eller mer» ved kast med to terninger, noe som består av utfallene 11 og 12. Et annet ord for hendelse er begivenhet.

Det er ikke noe skarpt skille mellom utfall og hendelse, av og til kan vi betrakte et utfall i et stokastisk forsøk som en hendelse satt sammen av flere enkeltutfall. Det finnes heller ingen entydig definisjon, begrepene brukes på litt forskjellig måte i forskjellige bøker. På dette nettstedet vil vi imidlertid bruke begrepene utfall og hendelse slik de er definert over.

Eksempel 7:

Vi kaster to terninger og summerer antall øyne. Forsøkets mulige utfall er da de elleve verdiene {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}.

Men vi kan gjerne se på disse utfallene som hendelser satt sammen av resultatet på første og andre terning. For summen 2 finnes bare muligheten 1-1, mens summen 7 kan være satt sammen av 1-6, 2-5, 3-4, 4-3, 5-2 og 6-1.

Oppgave 1:

Vi kaster tre mynter og noterer hvor mange kron vi får. Hva er dette forsøkets utfallsrom? Hvordan kan utfallene brytes ned i enkeltutfall?

Se løsningsforslag

Sannsynligheter

Så er vi klare til å beregne sannsynligheter. En sannsynlighet er et mål på hvor stor sjanse det er for at en bestemt hendelse i et stokastisk forsøk vil inntreffe. For eksempel er sannsynligheten for å få 3 i et kast med en vanlig terning en sjettedel.

Sannsynligheten er et tall mellom 0 og 1, eller sagt på en annen måte, mellom 0 % og 100 %. En hendelse som ikke kan inntreffe har sannsynlighet 0, en hendelse som helt sikkert inntreffer har sannsynlighet 1. I et kast med en vanlig terning er for eksempel sannsynligheten for å få 7 lik 0, mens sannsynligheten for å få ett av tallene 1 – 6 er lik 1.

Det er vanlig å betegne sannsynlighet med bokstaven P, for probability. Vi kan tenke på P som en funksjon der vi putter inn en hendelse, og får ut sannsynligheten for hendelsen. At sannsynligheten for å få 7 i et terningkast er 0, skriver vi som $P(7) = 0$, at sannsynligheten for å få 3 er en sjettedel, skriver vi som $P(3) = {\large \frac{1}{6}}$, og at sannsynligheten for å få ett av tallene 1 – 6 er lik 1, skriver vi som $P(\{1, 2, 3, 4, 5, 6 \}) = 1$.

Uniform sannsynlighetsmodell

Et terningkast er et eksempel på en uniform sannsynlighetsmodell, der er alle utfallene er like sannsynlige. Sannsynligheten for å få 1, 2, 3, 4, 5 eller 6 er nemlig den samme, en sjettedel. Vi skriver $P(1) = P(2) = P(3) = P(4) = P(5) = P(6) = {\large \frac{1}{6}}$.

Grunnen til at sannsynligheten for hvert av utfallene ved et terningkast er en sjettedel, er at det finnes totalt seks utfall som er like sannsynlige og ikke kan inntreffe samtidig. Siden den totale sannsynligheten er 1, blir det en sjettedel på hver.

Generelt, der vi har en uniform sannsynlighetsmodell med n mulige utfall som ikke kan inntreffe samtidig, blir sannsynligheten for hvert utfall $\frac{\displaystyle 1}{\displaystyle n}$.

For å finne sannsynligheten for en hendelse som er satt sammen av flere utfall i en slik modell, kan vi bruke prinsippet «gunstige på mulige». Vi dividerer da antall gunstige utfall, altså de som gir hendelsen vi ønsker, med antall utfall totalt.

Hvis A er hendelsen vi skal beregne sannsynligheten for, g er antall utfall som resulterer i A (gunstige), m er antall utfall totalt (mulige), og vi har en modell der alle utfallene har like stor sannsynlighet og ikke kan inntreffe samtidig, har vi:

$\fbox {Gunstige på mulige: $P(A) = \frac{\displaystyle g}{\displaystyle m}$}$

Eksempel 8:

I et kast med en mynt gir «gunstige på mulige» at $P(\text{mynt}) = P(\text{kron})= {\large \frac{1}{2}}$.

Eksempel 9:

Hvis vi vil beregne sannsynligheten for å få et partall når vi kaster en terning, ser vi at dette skjer når vi får 2, 4 eller 6. Antall gunstige utfall er altså 3 av totalt 6 mulige. Så vi får $P(\{2, 4, 6 \}) = {\large \frac{3}{6}}= {\large \frac{1}{2}}$.

Oppgave 2:

Vi kaster en terning. Bruk prinsippet med gunstige på mulige til å beregne sannsynligheten for å få

  1. 5 eller 6.
     
  2. Ikke 5 eller 6.

Se løsningsforslag

Ikke-uniform sannsynlighetsmodell

Hvis vi mange ganger gjentar et forsøk med å kaste to terninger og summere antall øyne, vil vi oppdage at forskjellige summer ikke opptrer like ofte. Det er fordi vi ikke har er en uniform modell, så de forskjellige utfallene er ikke like sannsynlige. Sum 7 er for eksempel mer sannsynlig enn sum 2. I en ikke-uniform modell kan det allikevel være at vi kan beregne sannsynlighetene ved å betrakte utfallene som hendelser satt sammen av utfall som er uniformt fordelt.

Eksempel 10:

Vi skal beregne sannsynlighetene for de forskjellige summene vi kan få når vi kaster to terninger. Vi vet at for hver av terningene er hvert av de seks utfallene like sannsynlig. Det betyr at alle kombinasjoner av øyne er like sannsynlige, for eksempel 1-3, 4-4 og 6-2. Grupperer vi disse ut fra summen, får vi

Kast Sum
1-1 2
1-2, 2-1 3
1-3, 2-2, 3-1 4
1-4, 2-3, 3-2, 4-1 5
1-5, 2-4, 3-3, 4-2, 5-1 6
1-6, 2-5, 3-4, 4-3, 5-2, 6-1 7
2-6, 3-5, 4-4, 5-3, 6-2 8
3-6, 4-5, 5-4, 6-3 9
4-6, 5-5, 6-4 10
5-6, 6-5 11
6-6 12

Det er totalt 36 like sannsynlige kombinasjoner som ikke kan inntreffe samtidig. Vi teller opp forekomster i hver gruppe, bruker «gunstige på mulige», og får:

$P(2) = P(12) = {\large \frac{1}{36}}$

$P(3) = P(11) = {\large \frac{2}{36}} = {\large \frac{1}{18}}$

$P(4) = P(10) = {\large \frac{3}{36}} = {\large \frac{1}{12}}$

$P(5) = P(9) = {\large \frac{4}{36}} = {\large \frac{1}{9}}$

$P(6) = P(8) = {\large \frac{5}{36}}$

$P(7) = {\large \frac{6}{36}} = {\large \frac{1}{6}}$

Vi ser at vi har en fordeling som er symmetrisk rundt 7, der 7 er mest sannsynlig, og sannsynligheten synker jo lenger bort fra 7 vi kommer.

Regnearket under bruker funksjonen tilfeldigmellom til å simulere 1000 kast med to terninger, og teller opp hvor mange ganger de forskjellige summene forekommer. Trykk F9 for å generere nye verdier.

RegnearkÅpne et regneark der du kan simulere 1000 kast med to terninger.


Oppgave 3:

Sannsynlighetsmodellen i forsøket i oppgave 1, der vi kastet tre mynter og noterte hvor mange kron vi fikk, er ikke uniform. Men sannsynligheten for kron og mynt på hver enkelt mynt er den samme, nemlig en halv, disse utfallene følger en uniform modell. Benytt dette til å beregne sannsynligheten for å få henholdsvis null, én, to og tre kron ved å bruke «gunstige på mulige».

Se løsningsforslag

Oppgave 4:

Det fødes i gjennomsnitt litt flere gutter enn jenter. I denne oppgaven forenkler vi imidlertid sannsynlighetsmodellen litt, og antar at vi har en uniform fordeling med like stor sjanse for gutte- som for jentefødsel: $P(G) = P(J) = {\large \frac{1}{2}}$.

    1. En familie med to barn kan ha to jenter, to gutter, eller ett barn av hvert kjønn. Hva er sannsynligheten for å ha ett barn av hvert kjønn?
    2. Mange svarer feil på spørsmålet over. Hva tror du de svarer, og hvorfor?

Se løsningsforslag

Empirisk sannsynlighet

Basert på formen på en vanlig terning kan vi regne ut at vi har seks, like sannsynlige utfall ved et terningkast. I rollespillet Dungeons & Dragons brukes imidlertid terninger med andre antall sider, blant annet en med 20 sider. Men så lenge terningen er symmetrisk, med jevn vektfordeling, er det rimelig å anta at vi har like mange, like sannsynlige utfall som terningen har sider, når vi kaster den.

Når vi kaster en tegnestift, vil den enten lande med spissen ned eller spissen opp. Vi har altså to mulige utfall. Men det er ingen grunn til å tro at begge utfallene er like sannsynlige, og antakelig vil sannsynlighetene variere med typen tegnestift. Det vil også være svært vanskelig å regne seg fram til sannsynlighetene ut fra formen på tegnestiften. I stedet bruker vi en eksperimentell metode, der vi kaster en tegnestift et antall ganger, og teller hvor mange ganger den lander med spissen opp eller ned. Lander den n av t ganger med spissen opp, vil det være rimelig å anta at sannsynligheten for å få spissen opp er ${\large \frac{n}{t}}$, for eksempel gir 674 av 1000 ganger 0,674, eller 67,4 % sjanse for spissen opp. Vi vil aldri få et helt nøyaktig tall, men jo flere ganger vi kaster, jo sikrere blir resultatet. Ved hjelp av statistisk analyse vil vi kunne slå fast nøyaktig hvor sikkert anslaget vårt er. For eksempel at det er 95 % sikkert at sannsynligheten ligger mellom 0,65 og 0,70 når vi får spiss opp 674 av 1000 ganger. Sannsynligheter bestemt ut fra slike forsøk kalles empirisk (erfaringsbasert) sannsynlighet.

SkjermfilmSe filmen «Begreper i sannsynlighet»
 

SkjermfilmSe filmen «Enkel sannsynlighet»
 

Kilder

  • Hinna, K.R.C., Rinvold, R.A., Gustavsen, TS. (2011). QED 5-10, bind 1. Høyskoleforlaget
  • Ubøe, J. (2011). Statistikk for økonomifag. Gyldendal akademisk
  • Hagen, Per C. (2000). Innføring i sannsynlighetsregning og statistikk. Cappelen akademisk