Forventning og varians

Forventning

I artikkelen om måltall i statistikk lærte vi å beregne gjennomsnitt og standardavvik for et datasett.

Eksempelet under simulerer terningkast med Excel og beregner gjennomsnittet av antall øyne på en terning.

Eksempel 1:

Vi simulerer 10 kast tre ganger, og får gjennomsnitt på henholdsvis 3,40, 4,00 og 4,40. Gjennomsnittet av disse tre verdiene er omlag 3,93 og standardavviket omlag 0,41.

Vi simulerer 100 kast tre ganger, og får gjennomsnitt på henholdsvis 3,59, 3,36 og 3,59. Gjennomsnittet av disse tre verdiene er omlag 3,51 og standardavviket omlag 0,11.

Vi simulerer 10 000 kast tre ganger, og får gjennomsnitt på henholdsvis 3,53, 3,54 og 3,50. Gjennomsnittet av disse tre verdiene er omlag 3,52 og standardavviket omlag 0,02.

I eksempel 1 ser vi at standardavviket blir mindre når vi gjør mange forsøk, de tre gjennomsnittene klumper seg tettere sammen rundt noe i nærheten av 3,5. Dette er intuitivt rimelig, for gjennomsnittet av antall øyne på en terning er ${\large \frac{1 + 2 + 3 + 4 + 5 + 6}{6}} = 3{,}5$, og er terningen rettferdig, vil vi forvente at vi, når vi gjør mange nok kast, havner veldig nærme dette gjennomsnittet.

Vi sier at forventningen til dette forsøket er 3,5, noe vi skriver som E(X) = 3,5, der X er en tilfeldig variabel. En tilfeldig (stokastisk) variabel representerer utfallet av en tilfeldig hendelse, der et gitt sett verdier opptrer med gitte sannsynligheter.

Når vi skriver E(X) = 3,5, betyr det at hvis vi genererer X mange ganger, forventer vi at verdiene vil være sentrert rundt 3,5.

Vi beregner forventningen til en tilfeldig variabel ved å multiplisere hver mulig verdi av variabelen med sannsynligheten for at denne verdien opptrer. Hvis $X$ er en tilfeldig variabel med mulige verdier $x_1, x_2, \dots, x_n$ og tilhørende sannsynligheter $p_1, p_2, \dots, p_n$, er forventningen, $E(X)$, gitt ved

$\fbox{Forventning: $E(X) = x_1 \cdot p_1 + x_2 \cdot p_2 + \dots + x_n \cdot p_n$}$

Eksempel 2:

Vi skal finne forventningen til antall øyne i et terningkast. Vi kaller "antall øyne" for X, og vet at mulige verdier for X da er 1, 2, 3, 4, 5 og 6. Sannsynligheten for hver av disse verdiene er ${\large \frac{1}{6}}$. Så forventningen blir:

$E(X) = 1 \cdot {\large \frac{1}{6}} + 2 \cdot {\large \frac{1}{6}} + 3 \cdot {\large \frac{1}{6}} + 4 \cdot {\large \frac{1}{6}} + 5 \cdot {\large \frac{1}{6}} + 6 \cdot {\large \frac{1}{6}} = {\large \frac{21}{6}} = 3{,}5$.

Eksempel 3:

Ved et kast med to terninger kan summen av antall øyne variere fra 2 til 12. Kaller vi summen av antall øyne $X$, har vi altså følgende mulige verdier for $X$: $x_1 = 2, x_2 = 3, \dots, x_{11} = 12$.

I artikkelen om begreper i sannsynlighet fant vi sannsynlighetene for disse verdiene:

$P(X = 2) = P(X = 12) = {\large \frac{1}{36}}$

$P(X = 3) = P(X = 11) = {\large \frac{2}{36}}$

$P(X = 4) = P(X = 10) = {\large \frac{3}{36}}$

$P(X = 5) = P(X = 9) = {\large \frac{4}{36}}$

$P(X = 6) = P(X = 8) = {\large \frac{5}{36}}$

$P(X = 7) = {\large \frac{6}{36}}$

Forventningen blir da:

$E(X) = 2 \cdot {\large \frac{1}{36}} + 3 \cdot {\large \frac{1}{18}} + 4 \cdot {\large \frac{1}{12}} + 5 \cdot {\large \frac{1}{9}} + 6 \cdot {\large \frac{5}{36}} + 7 \cdot {\large \frac{1}{6}} + 8 \cdot {\large \frac{5}{36}} + 9 \cdot {\large \frac{1}{9}} + 10 \cdot {\large \frac{1}{12}} + 11 \cdot {\large \frac{1}{18}} + 12 \cdot {\large \frac{1}{36}} = \\
 \, \\
\frac{\displaystyle 2 \cdot 1 + 3 \cdot 2 + 4 \cdot 3 + 5 \cdot 4 + 6 \cdot 5 + 7 \cdot 6 + 8 \cdot 5 + 9 \cdot 4 + 10 \cdot 3 + 11 \cdot 2 + 12 \cdot 1}{\displaystyle36} = \frac{\displaystyle 252}{\displaystyle 36} = 7$

Ved kast med to terninger er forventningen til summen 7.

Oppgave 1:

Blant kundene som kommer inn i en klesbutikk kjøper gjennomsnittlig 30 % ingen ting, 20 % ett plagg, 40 % to plagg og 10 % 3 plagg. Finn forventningen til hvor mye en vilkårlig kunde kjøper.

Se løsningsforslag

Hvis $X$ og $Y$ er to tilfeldige variabler, og $k$ en konstant, gjelder følgende:

$\fbox{$E(X + Y) = E(X) + E(Y) \\
E(k) = k \\
E(k + X) = k + E(X) \\
E(k \cdot X) = k \cdot E(X)$ }$

Forventningen til en sum av to variabler er altså lik summen av forventningene, forventningen til en konstant er lik konstanten selv, og forventningen til en konstant addert til, eller multiplisert med, en variabel er lik konstanten addert til, eller multiplisert med, forventningen til variabelen.

Eksempel 4:

I eksempel 3 fant vi at E(X) = 7 når X er summen av antall øyne i et kast med to terninger. Men utregningen var omstendelig og forutsatte at vi kjente sannsynlighetene for alle 11 mulige verdier av X.

Siden vi vet at E(Y) = 3,5 når Y er antall øyne i kast med én terning, kan vi ved hjelp av regelen for forventningen til en sum av to variabler i stedet regne det ut som E(X) = E(Y + Y) = E(Y) + E(Y) = 3,5 + 3,5 = 7.

Hvis vi skal beregne forventningen til en funksjon av en tilfeldig variabel, har vi at

$\fbox{$E(f(X)) = f(x_1) \cdot p_1 + f(x_2) \cdot p_2 + \dots + f(x_n) \cdot p_n$}$

Vi beregner altså forventningen til en funksjon av $X$ ved å sette de mulige verdiene til $X$ inn i funksjonsuttrykket og multiplisere med de tilhørende sannsynlighetene.

Varians

I artikkelen om måltall i statistikk lærte vi å beregne standardavviket til et datasett, noe som var et mål på spredningen fra gjennomsnittet. Vi beregnet da først datasettets varians, og tok så kvadratrota av variansen. Standardavviket betegnet vi med $\sigma$.

Nå skal vi se at vi også kan beregne varians og standardavvik til en tilfeldig variabel, X. På samme måte som variansen til et datasett uttrykker graden av spredning i dataene, er variansen til en tilfeldig variabel et mål på hvor langt fra forventningsverdien de enkelte verdiene kan ventes å komme.

Variansen er definert som

$\fbox{Varians: $Var(X) = E\big( \, {(X – E(X))}^2 \, \big)$}$

Variansen er altså forventningen til kvadratet av avstanden mellom en verdi, X, og forventningsverdien, E(X).

Kvadreringen gjør at vi bare får positive verdier, så variansen er et tall som er større eller lik 0. Hvis variansen er 0, forventes alle verdiene å havne nøyaktig på forventningsverdien.

Standardavviket er kvadratrota av variansen, og betegnes med $\sigma$:

$\fbox{Standardavvik: $\sigma(X) = \sqrt{Var(X)}$}$

Vi kan altså beregne $\sigma$ ikke bare for et gitt sett med data, men også for en teoretisk sannsynlighetsfordeling, slik som summen av antall øyne på to terninger. $\sigma$ kalles derfor ofte også for det teoretiske standardavviket. 

Regnereglene blir imidlertid litt klumpete hvis vi bruker standardavvik, så i det følgende holder vi oss til varians.

Eksempel 5:

På en mynt skriver vi "1" på den ene siden og "6" på den andre, og lar X representerer tallet vi får når vi kaster.

Sannsynligheten for å få henholdsvis 1 og 6 er $p(1) = p(6) = 0{,}5$.

$E(X) = 1 \cdot 0{,}5 + 6 \cdot 0{,}5 = 3{,}5$.

$Var(X) = E\big( \, (X – E(X))^2 \, \big) = (1 – 3{,}5)^2 \cdot 0{,}5 + (6 – 3{,}5)^2 \cdot 0{,}5 = 6{,}25$.

Skriver vi i stedet "3" og "4", blir $E(X)$ den samme,

$E(X) = 3 \cdot 0{,}5 + 4 \cdot 0{,}5 = 3{,}5$.

Men variansen blir mye mindre:

$Var(X) = (3 – 3{,}5)^2 \cdot 0{,}5 + (4 – 3{,}5)^2 \cdot 0{,}5 = 0{,}25$.

Det er fordi forventningen til avviket fra 3,5 er mye mindre for 3 og 4 enn 1 og 6.

Uttrykket for $Var(X)$ vi har gitt over kan være litt tungvint å bruke i praksis. Ved hjelp av litt algebra og regnereglene for forventning kan det omformes til:

$\fbox{Varians: $Var(X) = E(X^2) – (E(X))^2 $}$

Vi kan altså finne variansen ved å ta forventningen til kvadratet av variabelen og trekke fra kvadratet av forventningen. På denne formen er det vanskelig å se hva variansen egentlig representerer, men formen er mer praktisk i bruk.

Eksempel 6:

I eksempel 5 fant vi at når X representerte utfallet av et kast med en mynt med "1" på den ene siden og "6" på den andre, var E(X) = 3,5 og Var(X) = 6,25.

Med den nye måten å beregne Var(X) på får vi

$E(X^2) = 1^2 \cdot 0{,}5 + 6^2 \cdot 0{,}5 = 18{,}5$

$Var(X) = E(X^2) – (E(X))^2 = 18{,}5 – (3{,}5)^2 = 6{,}25$, som er det samme som før.

Med en mynt med "3" på den ene siden og "4" på den andre var E(X) = 3,5 og Var(X) = 0,25.

Med den nye måten å beregne Var(X) på får vi

$E(X^2) = 3^2 \cdot 0{,}5 + 4^2 \cdot 0{,}5 = 12{,}5$

$Var(X) = E(X^2) – (E(X))^2 = 12{,}5 – (3{,}5)^2 = 0{,}25$, som er det samme som før.

Eksempel 7:

I eksempel 2 fant vi at forventningen til antall øyne i et terningkast var E(X) = 3,5. Nå skal vi finne variansen.

Vi får

$E(X^2) = 1 \cdot {\large \frac{1}{6}} + 2^2 \cdot {\large \frac{1}{6}} + 3^2 \cdot {\large \frac{1}{6}} + 4^2 \cdot {\large \frac{1}{6}} + 5^2 \cdot {\large \frac{1}{6}} + 6^2 \cdot {\large \frac{1}{6}} = {\large \frac{91}{6}} \approx 15{,}17$.

$Var(X) = E(X^2) – (E(X))^2 \approx 15{,}17 – (3{,}5)^2 = 2{,}92$.

Oppgave 2:

Kundene som kommer inn i en butikk kjøper X enheter av en vare. 20 % av kundene kjøper ingen ting, 20 % av kundene kjøper én vare, og 60 % av kundene kjøper to varer. Finn forventning, varians og standardavvik til X.

Se løsningsforslag

Hvis $X$ er en tilfeldig variabel, og $k$ en konstant, gjelder følgende:

$\fbox{$ Var(k) = k \\
Var(k + X) = Var(X) \\
Var(k \cdot X) = k^2 \cdot Var(X)$ }$

Variansen til en konstant er altså lik konstanten selv, variansen til en konstant addert til en variabel er lik variansen til variabelen, og variansen til en konstant multiplisert med en variabel er lik kvadratet av konstanten multiplisert med variansen til variabelen.

Eksempel 8:

Vi så i eksempel 5 og 6 at hvis X representerte utfallet av et kast med en mynt med "1" på den ene siden og "6" på den andre, var E(X) = 3,5 og Var(X) = 6,25. Skriver vi i stedet "11" og "16", får vi

$E(X) = 11 \cdot 0{,}5 + 16 \cdot 0{,}5 = 13{,}5$

$E(X^2) = (11)^2 \cdot 0{,}5 + (16)^2 \cdot 0{,}5 = 188{,}5$

$Var(X) = E(X^2) – (E(X))^2 = 188{,}5 – (13{,}5)^2 = 6{,}25$

Da vi byttet ut "1" med "11" og "6" med "16" adderte vi egentlig en konstant, k = 10, til verdiene. Og vi ser at den nye forventningen og variansen er i tråd med reglene for å addere en konstant:

$E(k + X) = k + E(X)$, fordi $E(10 + X) = 13{,}5 = 10 + 3{,}5$

$Var(k + X) = Var(X)$, fordi $Var(10 + X) = Var(X) = 6{,}25$

Det er intuitivt riktig at å addere en konstant ikke endrer variansen, for spredningen endres jo ikke, verdiene forskyves bare.

Oppgave 3:

Vi så i eksempel 5 og 6 at hvis X representerte utfallet av et kast med en mynt med "1" på den ene siden og "6" på den andre, var E(X) = 3,5 og Var(X) = 6,25. Skriver vi i stedet "2" og "12", har vi multiplisert verdiene med en konstant, k = 2.

Bruk samme metode som i eksempel 8 til å beregne hva E(X) og Var(X) blir nå. Avgjør om resultatet er i tråd med reglene for forventning og varians til en variabel multiplisert med en konstant.

Se løsningsforslag

De tre reglene om varians og konstanter kan sammenfattes i én regel, der $X$ er en tilfeldig variabel, og $a$ og $b$ konstanter:

$\fbox{$Var(a + b \cdot X) = b^2 \cdot Var(X)$ }$

Dersom $X$ og $Y$ er to tilfeldige variabler som er uavhengige, har vi også at

$\fbox{$Var(X + Y) = Var(X) + Var(Y)$}$

Dersom $X$ og $Y$ ikke er uavhengige, har vi at

$\fbox{$Var(X + Y) = Var(X) + Var(Y) + 2 \cdot Cov(X, Y)$}$

$Cov$ betyr kovarians, og er et uttrykk for hvor sterkt $X$ og $Y$ samvarierer. Dersom $X$ og $Y$ er uavhengige, slik at det ikke er samvariasjon, blir $Cov(X, Y) = 0$, og vi står igjen med den forenklede varianten for uavhengige variabler. Begrepet kovarians blir presentert i artikkelen om å sammenlikne datasett.

Kilder:

  • Ubøe, J. (2011). Statistikk for økonomifag. Gyldendal akademisk
  • Wikipedia