Todennäköisyys ja tilastot


Jos taulukko ei mahdu ruudulle, tartu ja rullaa sivusuunnassa.

Todennäköisyyslaskenta ja tilastotiede

Diskreetin tilastollisen jakauman tunnuksia

Jakauman muodostavat luvut x1 , x2 , … , xn.
Keskilukuja
1. Keskiarvo
    \bar{x}=\frac{\sum_{i=1}^{n}{x}_{i}}{n}=\frac{\sum x}{n}
2. Keskiarvo väliaikaisen keskiarvon \bar{x}' avulla laskettuna
  \bar{x}=\bar{x}'+\frac{\sum_{i=1}^{n}({x}_{i}-\bar{x}')}{n}=\bar{x}'+\bar{d} ({d}_{i}={x}_{i}-\bar{x}')
3. Painotettu
    keskiarvo
 \bar{x}=\frac{\sum_{i=1}^{n}({a}_{i}{x}_{i})}{\sum_{i=1}^{n}{a}_{1}}=\frac{\sum ax}{\sum a}(ai on xi :n painokerroin)
4. Tyyppiarvo eli moodi Mo on se jakauman luku (tai luvut), jolla on suurin
     frekvenssi. 
5. Mediaani Md on suuruusjärjestykseen lajitellun jakauman keskimmäinen luku.
    Jos lukuja on parillinen määrä, niin Md on kahden keskimmäisen luvun keskiarvo.
Hajontalukuja
6. Vaihteluväli  Δ on jakauman suurimman ja pienimmän luvun erotus.
7. Keskipoikkeama (M.D.)
      
8. Keskihajonta  
    
    Otos keskihajonta
      {s}_{n-1}=\sqrt{\frac{\sum_{i=1}^{n}{\left({x}_{i}-\bar{x} \right)}^{2}}{n-1}}
9. Keskiarvon keskivirhe
 {s}_{\bar{x}}=\frac{s}{\sqrt{n}}
10. Varianssi = s2

 

Jos taulukko ei mahdu ruudulle, tartu ja rullaa sivusuunnassa.

Luokitellun tilastollisen jakauman tunnuslukuja

Luokitellussa luvut on jaettu k luokkaan, joiden frekvenssit ovat ƒ1, ƒ2, … , ƒk. Frekvenssien summa on sama kuin lukujen kokonais määrä n.
Keskilukuja
1. Keskiarvo \bar{x}=\frac{\sum_{i=1}^{k}{f}_{i}{x}_{i}}{\sum_{i=1}^{k}{f}_{i}}=\frac{\sum fx}{n}
2. Moodiluokka on se luokka (tai luokat), jolla on suurin frekvenssi.
3. Mediaaniluokka on se luokka, jonka alueella summafrekvenssi saa arvon (n / 2).
Hajontalukuja
4. Keskipoikkeama (M.D.) =\frac{\sum_{i=1}^{k}{f}_{i}\left|{x}_{i}-\bar{x} \right|}{n}
5. Keskihajonta s=\sqrt{\frac{\sum_{i=1}^{k}{f}_{i}{\left({x}_{i}-\bar{x} \right)}^{2}}{n}}
    Otoskeskihajonta {s}_{n-1}=\sqrt{\frac{\sum_{i=1}^{k}{f}_{i}{\left({x}_{i}-\bar{x} \right)}^{2}}{n-1}}

Jos taulukko ei mahdu ruudulle, tartu ja rullaa sivusuunnassa.

Kahden diskreetin muuttujan tilastollinen jakauma

Jakauman muodostavat lukuparit (x1, y1), (x2, y2), … , (xn, yn).
Muuttujien x ja y kovarianssi
 
Pearsonin korrelaatiokerroin (tulomomenttikerroin)
 r=\frac{\sum_{i=1}^{n}\left({x}_{i}-\bar{x} \right)\left({y}_{i}-\bar{y} \right)}{\sqrt{\sum_{i=1}^{n}{\left({x}_{i}-\bar{x} \right)}^{2}\sum_{i=1}^{n}{\left({y}_{i}-\bar{y} \right)}^{2}}}
 =\frac{n\sum xy-\sum x\sum y}{\sqrt{\left[n\sum {x}^{2}-{\left(\sum x \right)}^{2} \right]\left[n\sum {y}^{2}-{\left(\sum y \right)}^{2} \right]}}=\frac{{s}_{xy}}{{s}_{x}{s}_{y}}sx ja sy ovat muuttujien x ja y keskihajonnat
 Spearmanin järjestyskorrelaatiokerroin
 {r}_{s}=1-\frac{6\sum_{i=1}^{n}{{d}_{i}}^{2}}{n\left({n}^{2}-1 \right)}d1=parin(xi, yi) järjestyslukujen erotus
Korrelaation tulkinta
Korrelaatiokertoimen r arvot ovat välillä -1 ≤ r ≤ 1. Jos r = \pm 1, niin x ja y riippuvat toisistaan lineaarisesti. Korrelaatiokertoimen tarkempi tulkinta riippuu havaintoparien lukumäärästä n, mutta suuntaa antavasti voidaan todeta:
 
Suoran sovitus pistejoukkoon
 Jos y riippuu tilastollisesti lineaarisesti x:stä ja on tehty esim. mittaussarja (xi, yi), on parhaiten riippuvuutta kuvaavan suoran eli regressiosuoran y = bx + a
 kulmakerroin b=\frac{n\sum {x}_{i}{y}_{i}-\left(\sum {x}_{i} \right)\left(\sum {y}_{i} \right)}{n\sum {{x}_{i}}^{2}-{\left(\sum {x}_{i} \right)}^{2}} 
 ja vakioa=\frac{\sum {y}_{i}-b\sum {x}_{i}}{n}. 

Jos taulukko ei mahdu ruudulle, tartu ja rullaa sivusuunnassa.

Kombinaatio-oppi

Jos joukossa on n alkiota, niin niistä voidaan muodostaa erilaisia
– järjestyksiä eli permutaatioita n! = n (n -1) … * 2 * 1 kpl
– k alkiota käsittäviä järjestyksiä eli variaatioita
 {\left(n \right)}_{k}=n\left(n-1 \right)...\left(n-\left(k-1 \right) \right)=\frac{n!}{\left(n-k \right)!}\: kpl(laskimissa symboli nPr)
– k alkiota käsittäviä osajoukkoja eli kombinaatioita
 \begin{pmatrix} n\\k   \end{pmatrix}=\frac{n!}{k!\left(n-k \right)!}\: kpl(laskimissa symboli nCr)

Jos taulukko ei mahdu ruudulle, tartu ja rullaa sivusuunnassa.

Diskreetti todennäköisyys jakauma

Diskreetti satunnaismuuttuja X saa erilliset arvot x1, x2, … todennäköisyyksillä
p1, p2, … joiden summa on = 1
1. Odotusarvo E(X)=\mu =\sum_{i}^{}{p}_{i}{x}_{i}
2. Keskihajonta D(X)=\sigma =\sqrt{\sum_{i}^{}{p}_{i}{\left({x}_{i}-\mu  \right)}^{2}}
3. Varianssi ={\sigma }^{2}

Jos taulukko ei mahdu ruudulle, tartu ja rullaa sivusuunnassa.

Jatkuva todennäköisyysjakauma

Jatkuvan satunnaismuuttujan X arvojoukko olkoon väli E = [a, b].
Osavälit A = [c, d] ⊂ E ovat tapahtumia.
Satunnaismuuttujan X tiheysfunktiolle ƒ pätee:
1o ∀ x ∈ E: ƒ (x) ≥ 0 
 2^{\circ} \:\int_{a}^{b}f(x)\:dx=1jos E = , niin ehto on
  
Muuttujaan liittyvä kertymäfunktio on F(x)=P(X\leq x)=\int_{a}^{x}f(t)\:dt
1. Todennäköisyys P(A)=\int_{c}^{d}f(x)\:dx=F(d)-F(c)
  
2. Odotusarvo E(X)=\mu =\int_{a}^{b}xf(x)\: dx
3. Keskihajonta 
  D(X)=\sigma =\sqrt{\int_{a}^{b}{\left(x-\mu  \right)}^{2}f(x)\: dx}=\sqrt{E({x}^{2})-{\mu }^{2}}
4. Varianssi ={\sigma }^{2}

Jos taulukko ei mahdu ruudulle, tartu ja rullaa sivusuunnassa.

Normaalijakauma

Jos jatkuva satunnaismuuttuja X noudattaa normaalijakaumaa parametrein μ ja σ, niin merkitään X ~ N (μ, σ). Jos jakauma on normitettu, niin X ~ N (1, 0).
Jos X ~ N (μ, σ), niin Z=\frac{X-\mu }{\sigma }\sim N(0,1)
Tapahtuman A todennäköisyys 
 P(A)=P(c\leq X\leq d)=P\left(\frac{c-\mu }{\sigma }\leq Z\leq \frac{d-\mu }{\sigma } \right)=\Phi \left(\frac{d-\mu }{\sigma } \right)-\Phi \left(\frac{c-\mu }{\sigma } \right)
ks. kertymäfunktion arvotaulukko (linkki)

Jos taulukko ei mahdu ruudulle, tartu ja rullaa sivusuunnassa.

Diskreettejä jakaumia

JakaumaMäärittelyjoukkoPistetoden-
näköisyys
Parametrin rajatOdotusarvoKeskihajonta
binomijakaumak = 0, 1, … , n \begin{pmatrix} n\\k   \end{pmatrix}{p}^{k}{q}^{n-k}0 < p < 1
(q = 1 – p)
np \sqrt{npq}
geometrinen jakaumak = 0, 1, 2, …qk p0 < p < 1 \frac{q}{p} \frac{\sqrt{q}}{p}
Poisson ’ in jakaumak = 0, 1, 2, … \frac{{a}^{k}}{k!}{e}^{-a}a > 0a \sqrt{a}

Jos taulukko ei mahdu ruudulle, tartu ja rullaa sivusuunnassa.

Jatkuvia jakaumia

JakaumaMäärittely-
joukko
TiheysfunktioParametrin rajatOdotus-
arvo
Keski-
hajonta
normaalijakauma {\frac{1}{\sigma \sqrt{2\pi }}}e^{-\frac{1}{2}{\left(\frac{x-\mu }{\sigma } \right)}^{2}}σ > 0μσ
normitettu normaalijakauma {\frac{1}{\sigma \sqrt{\pi }}}e^{-\frac{1}{2}{x}^{2}} 01
eksponentti-
jakauma
+ {ae}^{-ax}a > 0 \frac{1}{a} \frac{1}{a}
tasainen jakauma[a, b] \frac{1}{b-a}b > a \frac{a+b}{2} \frac{b-a}{2\sqrt{3}}

Jos taulukko ei mahdu ruudulle, tartu ja rullaa sivusuunnassa.

Luottamusvälit

1. Perusjoukon odotusarvon μ luottamusväli
    95 %:n luottamustasolla on väli \left[\bar{x}-1,96\frac{s}{\sqrt{n}};\: \bar{x}+1,96\frac{s}{\sqrt{n}} \right]
    99 %:n luottamustasolla on väli \left[\bar{x}-2,58\frac{s}{\sqrt{n}};\: \bar{x}+2,58\frac{s}{\sqrt{n}} \right]
    99,9 %:n luottamustasolla on väli \left[\bar{x}-3,29\frac{s}{\sqrt{n}};\: \bar{x}+3,29\frac{s}{\sqrt{n}} \right]
Kaavoissa s on satunnaismuuttujan keskihajonta, \bar{x} satunnaismuuttujan otoksesta laskettu otoskeskiarvo ja n otoksen koko. Kun hajonta estimoidaan otoksesta, korvataan kertoimet 1,96; 2,58 ja 3,29 t-jakauman arvoilla tp, kun p = 0,05; p = 0,01 ja p = 0,001 sekä vapausasteluku n – 1.
2. Suhteellisen osuuden p luottamusväli
    95 %:n luottamustasolla on väli \left[\hat{p}-1,96s;\: \hat{p}+1,96s \right]
    99 %:n luottamustasolla on väli \left[\hat{p}-2,58s;\: \hat{p}+2,58s \right]
    99,9 %:n luottamustasolla on väli \left[\hat{p}-3,29s;\: \hat{p}+3,29s \right]
Jos taulukko ei mahdu ruudulle, tartu ja rullaa sivusuunnassa.
Kaavoissa \hat{p} ja s ovat satunnaismuuttujan otoksesta laskettavia tunnuslukuja; \hat{p} = otoksesta laskettu suhteellinen osuus, n = otoksen koko,
 s=\sqrt{\frac{\hat{p}\left(1-\hat{p} \right)}{n}}= suhteellisen osuuden otosjakauman keskihajonta.