Statistika2012_3

Download Report

Transcript Statistika2012_3

STATISTIKA
Ing. Jan Popelka, Ph.D.
odborný asistent
Katedra informatiky a geoinformatiky
Univerzita Jana Evangelisty Purkyně v Ústí nad Labem
email: [email protected]
WWW: http://most.ujep.cz/~popelka
PRAVDĚPODOBNOST
STATISTIKA – 3.HODINA
Základní pojmy
 Základní pravidla pro počítání s pravděpodobnostmi
 Definice pravděpodobnosti
 Diskrétní náhodná veličina
 Vybraná diskrétní rozdělení
 Spojitá náhodná veličina
 Vybraná spojitá rozdělení

3
PRAVDĚPODOBNOST
PRAVDA a PODOBNOST
Pravděpodobný = podobný pravdě
= podobný skutečnosti
= do jaké míry je pravdivý
4
PRAVDĚPODOBNOST - JEVY
Hromadné náhodné jevy
(stochastické jevy)




Jsou hromadné – opakují se.
I když probíhají ve stejných podmínkách,
nemají stejný průběh.
Výsledek nemůžeme s jistotou
předpovědět, lze jen vyjmenovat množinu
očekávaných výsledků.
Lze vyčíslit pravděpodobnost, s jakou lze
očekávat výsledek z výše uvedené množiny.
Příklad: hod kostkou – jeden hod je náhodným pokusem, pokud
hod opakuji vícekrát, jde o hromadný jev. Výsledkem je počet ok
na kostce (podmínky pokusu musejí být vždy stejné = stejná
kostka).
5
PRAVDĚPODOBNOST - JEVY
Hromadné nenáhodné jevy (deterministické jevy)



Mají stejný průběh, pokud probíhají ve stejných podmínkách.
Výsledek jevu můžeme s jistotou předpovědět.
Fyzikální jevy, astronomické jevy, chemické procesy.
Příklad:
Hod kostkou – hod je deterministickým pokusem, pokud sleduji,
zda padne směrem k zemi (podmínky pokusu musejí být vždy stejné).
6
PRAVDĚPODOBNOST - JEVY
Hromadné náhodné a nenáhodné jevy
Rozvoj vědy a lidského myšlení vede k předefinování řady jevů z
kategorie náhodných do kategorie nenáhodných.
Příklad: Nemoc – dříve mohlo být infekční onemocnění bráno jako
náhoda (někdo onemocní a někdo ne), dnes umíme určit
podmínky, kdy člověk onemocní a kdy ne (vliv imunitního
systému).
Příklad: Pohyb planet – dříve byl pohyb planet po obloze
považován náhodný, již od starověkých civilizací víme, že se řídí
přesnými pravidly.
Příklad: Hod kostkou – dnes jej považujeme za ideální příklad
náhodného jevu, v budoucnu třeba bude znám přesný model, který
předpoví výsledek hodu.
7
PRAVDĚPODOBNOST - JEVY
Náhodný (stochastický) jev je výsledkem náhodného pokusu
(značí se A, B, C, … )
Hod kostkou je náhodným pokusem a počet ok na kostce je výsledek
neboli náhodný jev.

Jednoduché (elementární) jevy – jsou všechny možné výsledky,
náhodného pokusu, nelze je rozložit na jevy jednodušší.
Příklad: Na kostce padne číslo 2.

Složené jevy – lze je rozložit na jevy jednoduché.
Příklad: Na kostce padne číslo sudé. Jev lze rozložit na jednoduché
jevy - padne číslo 2, 4 nebo 6.
8
PRAVDĚPODOBNOST - JEVY
Prostor elementárních jevů (E) je množina všech výsledků
náhodného pokusu, tedy všech elementárních jevů. Prostor může
být konečný, spočetný nebo nespočetný.
Příklad: Na šestistěnné kostce jsou elementární jevy hodnoty
1,2,3,4,5,6. Prostor elementárních jevů lze zapsat
E = {(1),(2),(3),(4),(5),(6)}.
Příklad: Hod dvěma mincemi
E={(orel,orel),(panna,panna),(orel,panna), (panna,orel)}.
Příklad: Ve Sportce je 13 983 816 elementárních jevů.
Pokud vsadíme takovýto počet různých tiketů,
vyhrajeme první cenu!
 49 
 
6 
9
PRAVDĚPODOBNOST - JEVY
Jistý jev - za daných podmínek nastane vždy.
Příklad: Na šestistěnné kostce vždy padne nějaké číslo od 1 do 6.
Příklad: Na šestistěnné kostce vždy padne buď číslo sudé nebo číslo
liché.
Nemožný jev - za daných podmínek nenastane nikdy.
Příklad Na šestistěnné kostce nikdy nepadne číslo 0.
10
PRAVDĚPODOBNOST - OPERACE S JEVY
Opačný jev (Ā) – je jev, který nastane pouze tehdy, když
nenastane jev A.


sjednocení opačných jevů je jistý jev.
opačné jevy jsou jevy neslučitelné (disjunktní) - nemohou
nastat zároveň (buď nastane jeden, nebo druhý)
Příklad: Při hodu mincí nikdy nepadne panna a orel zároveň. Vždy
padne jen jedna možnost.
11
PRAVDĚPODOBNOST - OPERACE S JEVY
Opačný jev (Ā) – je jev, který nastane pouze tehdy, když nenastane
jev A.
Pravidla:
 sjednocení opačných jevů je jistý jev.
 opačné jevy jsou jevy neslučitelné (disjunktní) - nemohou
nastat zároveň (buď nastane jeden nebo druhý)
Např. Při hodu mincí nikdy nepadne panna a orel zároveň. Vždy
padne jen jedna možnost.
12
PRAVDĚPODOBNOST - DEFINICE
Klasická definice (Laplaceova)
Příklad: Jaká je pravděpodobnost hlavní výhry ve Sportce?
Ve Sportce je 13 983 816 možných případů (možných kombinací šesti čísel
ze 49 možných).
Hlavní výhra je jen jediná šestice (počet příznivých kombinací šesti čísel je
jedna jediná). Pravděpodobnost hlavní výhry je podle klasické definice
pravděpodobnosti
P(A) = příznivé / možné.
P(A) = 1/13 983 816 = 0,000 000 072 tj. 0,000 007 2 %
13
PRAVDĚPODOBNOST - DEFINICE
Klasická definice (Laplaceova)
Náhodný pokus má konečný počet n elementárních jevů, které
mohou nastat se stejnou možností (n tzv. možných případů).
Sledovaný náhodný jev A je určen jako sjednocení určitého počtu
(m) z těchto možných el. jevů, tedy jev A nastává při m případech z
n možných (m je počet tzv. příznivých případů).
Za těchto okolností pravděpodobnost jevu A je rovna:
P(A) = m/n
14
PRAVDĚPODOBNOST - DEFINICE
Matematická definice (Kolmogorovova)
Pravděpodobnost je definována jako funkce, která přiřazuje
náhodnému jevu reálné číslo, a pro toto přiřazení platí tři
axiomy:
1. Pravděpodobnost náhodného jevu A je nezáporné číslo:
P(A) ≥ 0.
2. Pravděpodobnost jistého jevu E je jedna: P(E) = 1.
3. Pravděpodobnost sjednocení dvou vzájemně neslučitelných
(disjunktivních) jevů A a B je rovna součtu jejich
pravděpodobností:
platí-li A  B  0 , pak P(A  B) = P(A) + P(B) .
15
PRAVDĚPODOBNOST - DEFINICE
Statistická definice (von Misessova)
Příklad: Jaká je pravděpodobnost narození holčičky?
Statistická definice odvozuje pravděpodobnost na základě pokusu.
Pokusem mohou být porody na území České republiky za uplynulý rok, kdy
se narodilo 61 483 chlapců a 58 359 dívek.
Pravděpodobnost narození holčičky je přibližně
58 359 /119 842 = 0,486, tedy 48,69 %.
Pro porovnání za rok 2003: 45 554/93 658 = 0,486, tedy 48,64 %.
S rostoucím počtem sledovaných náhodných pokusů se zjištěná relativní
četnost bude přibližovat odhadované pravděpodobnosti.
16
PRAVDĚPODOBNOST - DEFINICE
Statistická definice (von Misessova)
Provedli jsme n-krát náhodný pokus. V této sérii pokusů nastal
náhodný jev A m-krát.
Relativní četnost pokusu A (tj. poměr m/n) se přibližuje
(konverguje) k pravděpodobnosti tohoto jevu pro velký počet
náhodných pokusů:
P(A)  n lim 
m( A)
n
17
PRAVDĚPODOBNOST - DEFINICE
Statistická definice (von Misessova)



Pravděpodobnost jistého jevu E je jedna: P(E) = 1.
Pravděpodobnost nemožného jevu Ø je nula: P(Ø) = 0.
Pravděpodobnost libovolného náhodného jevu A je:
0 ≤ P(A) ≤ 1.
18
PRAVDĚPODOBNOST - DEFINICE
Statistická definice (von Misessova)
Pravděpodobnost úmrtí v Ústeckém kraji podle věku
(2009-2010)
Věk
0
10
20
30
40
50
60
70
80
90
100
105
Muži
0,44 %
0,03 %
0,08 %
0,09 %
0,22 %
0,63 %
1,87 %
4,24 %
9,54 %
23,71 %
53,54 %
100,00 %
Ženy
0,44 %
0,01 %
0,02 %
0,03 %
0,09 %
0,30 %
0,84 %
2,14 %
6,36 %
22,12 %
62,53 %
100,00 %
19
PRAVDĚPODOBNOST - DEFINICE
Statistická definice (von Misessova)





Pravděpodobnost smrti úrazem
Pravděpodobnost smrti sebevraždou
Pravděpodobnost smrti vraždou
4%
1,3 %
0,1 %
Pravděpodobnost smrti úrazem, sebevraždou a vraždou
(konec 18. století) 1 %, 1%, 0,1 %
Pravděpodobnost smrti úrazem, sebevraždou a vraždou
(normalizace)
5 %, 1,6%, 0,1 %
20
NÁHODNÁ VELIČINA
Náhodná veličina je kvantitativní zobrazení výsledků náhodného pokusu.
Náhodná veličina se značí X (velké X) a konkrétní hodnoty, kterých může
nabývat xi.
Diskrétní náhodná veličina nabývá
konečného nebo spočetného počtu
hodnot.
Spojitá náhodná veličina nabývá
libovolných hodnot z konečného nebo
nekonečného intervalu.
21
DISKRÉTNÍ ROZDĚLENÍ
Diskrétní náhodná veličina nabývá
konečného nebo spočetného počtu
hodnot.
22
DISKRÉTNÍ ROZDĚLENÍ
Pravděpodobnost, že náhodná veličina nabyla konkrétní hodnoty xi
zapisujeme:
P(X = xi) = P(xi) = pi
Rozdělení pravděpodobností je vztah mezi hodnotami resp. intervaly
náhodné veličiny X a jejich pravděpodobnostmi pi.
23
DISKRÉTNÍ ROZDĚLENÍ
Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet
narozených chlapců mezi třemi novorozenci. Pravděpodobnost narození
chlapce je 0,52.
Popis rozdělení prostřednictvím tabulky:
Náhodná veličina X nabývá hodnot 0,1,2,3 (kolik chlapců může být mezi
třemi novorozenci).
Počet chlapců (xi)
Pravděpodobnost P(X=xi)
Pravděpodobnost
P(X= xi)
0 (tři dívky)
= 0,48∙0,48∙0,48 =
0,11
1 (chlapec, dvě dívky)
= 0,52∙0,48∙0,48∙3 = 0,12∙3 =
0,36
2 (dva chlapci a dívka)
= 0,52∙0,52∙0,48∙3 = 0,13∙3 =
0,39
3 (tři chlapci)
= 0,52∙0,52∙0,52 =
0,14
24
Celkem
1,00
1,00
PRAVDĚPODOBNOSTNÍ FUNKCE P(x)
Pravděpodobnostní funkce pro nespojitou náhodnou veličinu udává
pravděpodobnost, že náhodná veličina X nabude hodnoty x.
P(x) = P(X = x)
Vlastnosti pravděpodobnostní funkce:
• funkce je omezená 0 ≤ P(x) ≤ 1
• pravděpodobnostní funkce diskrétní náhodné veličiny je nespojitá!
25
PRAVDĚPODOBNOSTNÍ FUNKCE P(x)
Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet
narozených chlapců mezi třemi novorozenci.
Popis rozdělení prostřednictvím grafu pravděpodobnostní fce P(x):
Pravděpodobnost p(x)
Rozdělení počtu chlapců mezi třemi novorozenci
0,45
0,4
0,35
0,3
0,25
0,2
0,15
0,1
0,05
0
0
1
2
3
Počet chlapců (náhodná veličina X)
4
26
PRAVDĚPODOBNOSTNÍ FUNKCE P(x)
Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet
narozených chlapců mezi třemi novorozenci.
Popis rozdělení funkčním zápisem pravděpodobnostní fce P(x):
Počet chlapců (x)
Pravděpodobnost P(X=x)
Funkční zápis
0 (tři dívky)
= 0,48∙0,48∙0,48 =
1∙0,520∙(1-0,52)3
1 (chlapec, dvě dívky)
= 0,52∙0,48∙0,48∙3 =
3∙0,521∙(1-0,52)2
2 (dva chlapci a dívka)
= 0,52∙0,52∙0,48∙3 =
3∙0,522∙(1-0,52)1
3 (tři chlapci)
= 0,52∙0,52∙0,52 =
1∙0,523∙(1-0,52)0
Celkem
1,00
1,00
Pravděpodobnostní funkci příkladu lze obecně zapsat:
n x
n x
P( x)     1   
 x
 n
n!
Pozn.:   
 x  x!(n  x)!
27
DISTRIBUČNÍ FUNKCE F(x)
Distribuční funkce (někdy také kumulativní distribuční funkce) pro
nespojitou náhodnou veličinu udává pravděpodobnost, že náhodná veličina
X nabude hodnoty menší, než je zvolená hodnota x, nebo stejně velké.
F(x) = P(X ≤ x)
Vlastnosti distribuční funkce:
• 0 ≤ F(x) ≤ 1 omezená funkce
• pro a < b platí F(a) ≤ F(b) neklesající funkce
• P(a < X ≤ b) = F(b) - F(a)
• distribuční funkce diskrétní náhodné veličiny je nespojitá
• F(x) = P(X ≤ x) = ΣP(x)
28
DISTRIBUČNÍ FUNKCE F(x)
Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet
narozených chlapců mezi třemi novorozenci.
Popis rozdělení prostřednictvím tabulky:
(bude doplněn sloupec distribuční funkce). Hodnoty F(x) vyjadřují
pravděpodobnost, že se narodí x nebo méně chlapců!
Počet chlapců (x)
P(x) = P(X=x)
F(x) = P(X≤x)
0 (tři dívky)
0,11
0,11
1 (chlapec, dvě dívky)
0,36
0,11+0,36 = 0,47
2 (dva chlapci a dívka)
0,39
0,11+0,36+0,39 = 0,86
3 (tři chlapci)
0,14
0,11+0,36+0,39+0,14 = 1
Celkem
1,00
-
29
DISTRIBUČNÍ FUNKCE F(x)
Příklad: Popište rozdělení pravděpodobností náhodné veličiny počet
narozených chlapců mezi třemi novorozenci.
Popis rozdělení prostřednictvím grafu distribuční funkce F(x):
Rozdělení počtu chlapců mezi třemi novorozenci
1.2
1
F(x)
0.8
0.6
0.4
0.2
0
0
1
2
Počet chlapců (náhodná veličina X)
3
4
30
BINOMICKÉ BI(n,)
Graf pravděpodobnostní funkce P(x)
Graf distribuční funkce F(x)
0,3
1
0,25
0,8
0,2
F(x)
p(x)
0,6
0,15
0,4
0,1
0,2
0,05
0
0
0
2
4
6
x
8
10
0
2
4
6
8
10
x
31
BINOMICKÉ BI(n,)
Aplikace: Náhodný výběr s vracením prvků.
Pravděpodobnost, že se v sérii n nezávislých náhodných pokusů objeví
sledovaný jev právě x krát. Např: „hod více kostkami“.
Pravděpodobnostní funkce:
n x
n x
P( x)     1   
 x
, x = 0,1,2,...,n,
, 0<π<1
Parametry:
π ... pravděpodobnost náhodného jevu
n ... počet opakování
Střední hodnota:
Rozptyl:
E ( X )  n
D( X )  n (1   )
MS Excel = BINOMDIST(počet úspěšných pokusů - x ; celkový počet
pokusů - n; pravděpodobnost úspěchu – π ;
pravděpodobnostní fce - 0 nebo distribuční funkce - 1)
32
BINOMICKÉ BI(n,)
Příklad: Jaká je pravděpodobnost, že při hodu pěti kostkami padne třikrát
číslo sudé?
Parametry:
π = 0,5 (pravděpodobnost náhodného jevu – padne sudé číslo)
n = 5 (počet opakování – počet hodů), x = 3 (úspěšné pokusy)
Výpočet:
 n x
 5 3
n x
5 3
P(3)     1       0,5 1  0,5  0,313 tj. 31,3%
 x
 3
Střední hodnota: E ( X )  n  5  0,5  2,5
Rozptyl:
D( X )  n (1   )  5  0,5(1  0,5)  1,25
MS Excel = BINOMDIST(3; 5; 0,5; 0)
33
BINOMICKÉ BI(n,)
Příklad: Konkrétní student FŽP má pravděpodobnost zaspání na výuku 0,3.
4x v týdnu je výuka od 8:00. Jaká je pravděpodobnost, že zaspí 2x v týdnu?
Parametry:
π = 0,3 (pravděpodobnost náhodného jevu = zaspí)
n = 4 (počet opakování = počet dnů), x = 2 (úspěšné pokusy = zaspání)
Výpočet:
 n x
 4 2
n x
4 2
P(2)     1       0,3 1  0,3  0, 264 tj. 26, 4%
 x
 2
Střední hodnota: E ( X )  n  4  0,3  1, 2
Rozptyl:
D( X )  n (1   )  4  0,3  (1  0,3)  0,36
MS Excel = BINOMDIST(2; 4; 0,3; 0)
34
BINOMICKÉ BI(n,)
Příklad: Konkrétní student FŽP má pravděpodobnost zaspání na výuku 0,3.
4x v týdnu je výuka od 8:00. Jaká je pravděpodobnost, že zaspí 2x v týdnu?
Graf pravděpodobnostní funkce P(x)
Binomické rozdělení Bi(4;0,3)
0.45
0.4
0.35
P(2) = 0,264
P(x)
0.3
0.25
0.2
0.15
0.1
0.05
0
0
0.5
1
1.5
2
2.5
3
Počet zaspání za týden (x)
3.5
4
4.5
35
BINOMICKÉ BI(n,)
Příklad: Konkrétní student FŽP má pravděpodobnost zaspání na výuku 0,3.
4x v týdnu je výuka od 8:00. Jaká je pravděpodobnost, že zaspí alespoň 1x?
Parametry:
π = 0,3 (pravděpodobnost náhodného jevu – zaspí)
n = 4 (počet opakování – počet dnů), alespoň 1x tzn. x ≥ 1(zaspání)
Výpočet:
P( X  1)  P(1)  P(2)  P(3)  P(4)  1  P(0) 
 1  0, 24  0,76 tj. 76 %
Střední hodnota: E ( X )  n  4  0,3  1, 2
Rozptyl:
D( X )  n (1   )  4  0,3  (1  0,3)  0,36
MS Excel = 1-BINOMDIST(0; 4; 0,3; 0)
36
POISSONOVO PO()
Graf pravděpodobnostní funkce P(x)
Graf distribuční funkce F(x)
1
0,2
λ = 10
10
0,16
0,8
λ = 44
0,6
p(x)
p(x)
0,12
0,08
0,4
0,04
0,2
0
0
λ = 10
0
5
10
15
x
20
25
30
10
λ =44
0
5
10
15
20
25
30
x
37
POISSONOVO PO()
Aplikace: Počet událostí v časové jednotce, počet částic v jednotce plochy
nebo objemu. Např: „doba obsluhy“; „chybovost výrobků“.
Pravděpodobnostní funkce:
P( x) 
x
x!
e 
, k = 0,1,2,...
Parametry:
 ... střední počet událostí v časové jednotce, jednotce plochy nebo objemu
Střední hodnota:
Rozptyl:
E (X )  
D(X )  
MS Excel = POISSON (počet událostí - k ; průměrný počet událostí - ;
pravděpodobnostní fce - 0 nebo distribuční funkce - 1)
38
POISSONOVO PO()
Za hodinu přijede k čerpací stanici 30 automobilů? Jaká je
pravděpodobnost, že za 20 minut jich přijede 15?
Parametry:
 = 10 = (30/60)·20 (počet aut za 20 minut)
Výpočet:
P(15) 
Střední hodnota:
Rozptyl:
x
x!
e 
1015 10

e  0, 035 tj. 3,5%
15!
E ( X )    10
D( X )    10
MS Excel = POISSON (15; 10; 0)
39
POISSONOVO PO()
Za hodinu přijede k čerpací stanici 30 automobilů? Jaká je
pravděpodobnost, že za 20 minut jich přijede 15?
Graf pravděpodobnostní funkce P(x)
Poissonovo rozdělení Po(10)
0.14
0.12
P(x)
0.1
0.08
0.06
P(15) = 0,035
0.04
0.02
0
0
5
10
15
20
Počet návštěvníků za 20 minut (x)
25
30
40
HYPERGEOMETRICKÉ HY(N,M,n)
Aplikace: Náhodný výběr bez vracení prvků (počet prvků výběru
se snižuje). Např: „tahání barevných kuliček“; „zjišťování vadných
výrobků při přejímce zboží“.
Pravděpodobnostní funkce:
max(0,n-N+M) ≤ x ≤ min(M, n)
 M  N  M 
 

x
n

x
,
P( x)   
N
 
n 
Parametry:
N ... počet jednotek v základním souboru
M ... počet jednotek se sledovanou vlastností
n ... počet náhodně vybraných jednotek (výběr)
41
HYPERGEOMETRICKÉ HY(N,M,n)
Aplikace: Náhodný výběr bez vracení prvků (počet prvků výběru
se snižuje). Např: „tahání barevných kuliček“; „zjišťování vadných
výrobků při přejímce zboží“.
Střední hodnota, rozptyl:
E( X )  n
M
M
, D( X )  n
N
N
 M  N n
1  
N  N 1

MS Excel = HYPGEOMDIST (počet úspěšných pokusů - k ; počet náhodně vybraných
jednotek - n; počet jednotek se sledovanou vlastností – M ; počet jednotek v souboru - N)
42
HYPERGEOMETRICKÉ HY(N,M,n)
Ze 12 studentů se průběžně připravují 4. Jaká je pravděpodobnost, že při
dotázání 2 náhodně vybraných studentů, budou oba vědět.
Parametry:
N = 12 (studentů ve třídě); M = 4 (se připravují); n = 2 (vybraní)
 M  N  M   4  12  4 
 
  

x
n

x
2
2

2
   
  0, 091 tj. 9,1 %
P(2)   
Výpočet:
N
12 
 
 
n
 
2 
M
Střední hodnota:
E( X )  n
 0, 667
N
M  M  N n
D( X )  n  1  
 0, 404
Rozptyl:
43
N
N  N 1
MS Excel =HYPGEOMDIST(2;2;4;12)
HYPERGEOMETRICKÉ HY(N,M,n)
Ze 12 studentů se průběžně připravují 4. Jaká je pravděpodobnost, že při
dotázání 2 náhodně vybraných studentů, budou oba vědět.
Graf pravděpodobnostní funkce P(x)
Hypergeometrické rozdělení Hy(12;4,2)
0.6
0.5
P(x)
0.4
0.3
0.2
P(2) = 0,091
0.1
44
0
0
0.5
1
1.5
Počet připravených studentů (x)
2
2.5
CHARAKTERISTIKY ROZDĚLENÍ
Obecný způsob výpočtu střední hodnoty diskrétní náhodné veličiny:
n
E ( X )   xi pi
i 1
Obecný způsob výpočtu rozptylu diskrétní náhodné veličiny:
n
D( X )    xi  E ( X ) pi  E ( X 2 )  E ( X ) 2
2
i 1
45
SPOJITÁ ROZDĚLENÍ
Spojitá náhodná veličina
nabývá libovolných hodnot
z konečného nebo nekonečného
intervalu.
46
47
DISTRIBUČNÍ FUNKCE F(x)
Distribuční funkce (někdy také kumulativní distribuční funkce) pro
spojitou náhodnou veličinu udává pravděpodobnost, že náhodná veličina X
nabude hodnoty menší, než je zvolená hodnota x, nebo stejně velké:
F(x) = P(X ≤ x)
Vlastnosti distribuční funkce:
• 0 ≤ F(x) ≤ 1 omezená funkce,
• pro a < b platí F(a) ≤ F(b) neklesající funkce,
• P (a < X ≤ b) = F(b) - F(a),
• distribuční funkce spojité náhodné veličiny je spojitá.
48
HUSTOTA PRAVDĚPODOBNOSTI f(x)
Pravděpodobnostní funkce pro spojitou náhodnou veličinu
neexistuje!
Pravděpodobnost, že se trefíme právě do určité hodnoty
z nekonečného počtu možných hodnot spojité veličiny, je nulová.
Paradox nulové pravděpodobnosti:
P(X = x) = 0.
49
HUSTOTA PRAVDĚPODOBNOSTI f(x)
Kvůli paradoxu nulové pravděpodobnosti je zavedena nová funkce
hustota pravděpodobnosti – f(x).
Příklady hustoty pravď.
• f(x) ≥ 0 pro všechna x
• v oblasti - ∞ a + ∞ se její hodnota
blíží nule
lim x  f ( x)  0,
0
0
lim x  f ( x )  0.
0
0
50
0
0
HUSTOTA PRAVDĚPODOBNOSTI f(x)
Hustota pravděpodobnosti – f(x).
• obsah plochy pod křivkou
hustoty pravděpodobnosti je 1:
Příklady hustoty pravď.


f ( x)dx  1

a jde o pravděpodobnost
Obsah = 1
P(  X  )  1
Obsah = 1
Obsah = 1
51
HUSTOTA PRAVDĚPODOBNOSTI f(x)
Hustota pravděpodobnosti – f(x).
• obsah plochy mezi hodnotami
a, b se vypočte pomocí určitého
integrálu:
Příklady hustoty pravď.
b
 f ( x)dx
a
a jde o pravděpodobnost
P(a  X  b).
a
b
52
a
b
HUSTOTA PRAVDĚPODOBNOSTI f(x)
Vztah mezi hustotou f(x) a distribuční funkcí F(x):
x
F ( x)  P( X  x) 
 f (t )dt,

dF ( x)
f ( x) 
 F ( x)
dx
Hustota pravděpodobnosti a distribuční funkce
Distribuční funkce
F(x) je integrálem
hustoty f(x).
Hustota f(x) je
derivací
distribuční funkce
F(x).
53
(GAUSS-LAPLACEOVO)
NORMÁLNÍ ROZDĚLENÍ
N(,2)
Graf hustoty pravděpodobnosti f(x)
Graf distribuční funkce F(x)
54
(GAUSS-LAPLACEOVO)
NORMÁLNÍ N(,2)
Aplikace: V případech, kdy na kolísání náhodné veličiny působí velký počet
nepatrných a vzájemně nezávislých jevů.
Např: „výška a váha v populaci“; „chyby měření“.
Distribuční funkce F(x):
Hustotní funkce f(x):
F ( x) 
1
 2
x
e
Střední hodnota:
E (X )  
Rozptyl:
D( X )   2
2 2
dz


1
f ( x) 
e
 2
Parametry:
μ ... střední hodnota
σ2 ... rozptyl

( z  )2
( x )2
2 2
,  x  
MS Excel = NORMDIST (hodnota sledovaného jevu – x; střední hodnota – μ;
směrodatná odchylka – σ; hustota pravď. – 0 nebo distribuční funkce – 1)
55
(GAUSS-LAPLACEOVO)
NORMÁLNÍ N(,2)
Vlastnosti normálního rozdělení
Pravidlo tří sigma:
v rozmezí  ± 1
v rozmezí  ± 2
v rozmezí  ± 3
leží 68,3% všech možných hodnot,
leží 95,5% všech možných hodnot,
leží 99,7% všech možných hodnot.
56
(GAUSS-LAPLACEOVO)
NORMÁLNÍ N(,2)
Počet bodů z testu inteligence má normální rozdělení se střední hodnotou
100 a směrodatnou odchylkou 15. Jaká je pravděpodobnost získání více jak
125 bodů?
Parametry:
μ = 100
σ2 = 152 = 225
Náhodná veličina má normální rozdělení N(100; 225).
Řešení: P(X>125) = 1- P(X≤125) = 1 – F(125)
MS Excel: = 1 - NORMDIST (125; 100; 15; 1)
Výsledek: P(X>125) = 1 – 0,952 = 0,048
Pravděpodobnost získání více než 125 bodů je 4,8 %.
Pozn. Protože P(X=125) = 0, pak P(X>125) = 1- P(X≤125) =1- P(X<125).
57
(GAUSS-LAPLACEOVO)
NORMÁLNÍ N(,2)
Počet bodů z testu inteligence má normální rozdělení se střední hodnotou
100 a směrodatnou odchylkou 15. Jaký je medián rozdělení?
Známe pravděpodobnost, ale neznáme hodnotu. Počítáme medián, tedy
50 % kvantil rozdělení.
Řešení: P(X ≤ x) = F(x) = 0,5 kolik je x?
MS Excel: = NORMINV(0,5; 100; 15)
~
Výsledek: N(100; 225)0,5 = x = 100
Polovina osob dosáhne nejvýše 100 bodů.
Pozn. Excel má vlastní funkce pro počítání kvantilů spojitých rozdělení
MS Excel
= NORMINV (kvantil – p; střední hodnota – μ; směrodatná odchylka – σ)
58
NORMOVANÉ NORMÁLNÍ U
Graf hustoty pravděpodobnosti f(x)
Graf distribuční funkce F(x)
Pozn. Normované normální rozdělení je zelené (μ = 0, σ2 = 1).
59
NORMOVANÉ NORMÁLNÍ U
Aplikace: Usnadnění výpočtů pravděpodobnosti a kvantilů normálního
rozdělení. Statistická indukce.
Libovolné normální rozdělení lze převést na normované pomocí vzorce:
Parametry:
μ=0
σ2 = 1
Střední hodnota:
Rozptyl:
U
X 

E( X )  0
D( X )  1
MS Excel = NORMSDIST (hodnota sledovaného jevu – x)
60
NORMOVANÉ NORMÁLNÍ U
Výpočet kvantilů normovaného normálního rozdělení up
u0,95 … je 95% kvantil
normovaného normálního
rozdělení.
Tedy hodnota, která je větší
nebo rovna jak 95 % hodnot
rozdělení.
u0,95 = 1,64
1,64
Aplikace: Kvantily se velmi často využívají ve statistické indukci a jsou
uvedeny ve statistických tabulkách.
MS Excel = NORMSINV (kvantil – p)
61
(PEARSONOVO)
CHÍ-KVADRÁT χ2(n)
Graf hustoty pravděpodobnosti f(x)
Pozn. V grafu je parametr n značen jako k.
Graf distribuční funkce F(x)
62
(PEARSONOVO)
CHÍ-KVADRÁT χ2(n)
Aplikace: Kvantily se velmi často využívají ve statistické indukci.
Odvozené z normovaného normálního rozdělení jako:
S = X12 + X22 + X12 + … + Xn2 , kde X1,X2 , … ,Xn ~ N(0;1)
Parametry:
n … počet stupňů volnosti
Střední hodnota:
E( X )  n
Rozptyl:
D( X )  2n
MS Excel = CHIDIST (hodnota sledovaného jevu – x, počet stupňů
volnosti – n)
63
(PEARSONOVO)
CHÍ-KVADRÁT χ2(n)
Výpočet kvantilů chí-kvadrát rozdělení χ2p (n)
χ20,90 (12) … je 90% kvantil
chí-kvadrát rozdělení.
Tedy hodnota, která je větší
nebo rovna jak 90 % hodnot
rozdělení.
18,55
χ20,90 (12) = 18,55
Aplikace: Kvantily se velmi často využívají ve statistické indukci a pro různé
stupně volnosti n jsou uvedeny ve statistických tabulkách.
MS Excel = CHIINV (upravený kvantil – 1-p, počet stupňů volnosti – n)
STUDENTOVO t(n)
Graf hustoty pravděpodobnosti f(x)
65
STUDENTOVO t(n)
Aplikace: Kvantily se velmi často využívají ve statistické indukci.
Odvozené z normovaného normálního rozdělení jako
X1
T
X2
n
, kde X1~ N(0;1) a X2 ~ χ2(n)
Parametry:
n … počet stupňů volnosti
MS Excel = TDIST (hodnota sledovaného jevu – x, počet stupňů volnosti – n)
66
STUDENTOVO t(n)
Výpočet kvantilů rozdělení t(n)
t0,99 (9) … je 99% kvantil
Studentova t rozdělení.
2,82
Tedy hodnota, která je větší
nebo rovna jak 99 % hodnot
rozdělení.
t0,99(9) = 2,82
Aplikace: Kvantily se velmi často využívají ve statistické indukci a jsou pro
různé stupně volnosti n uvedeny ve statistických tabulkách.
67
MS Excel = TINV (upravený kvantil – 2(1-p), počet stupňů volnosti – n) pokud p >0,5
= -1*TINV (upravený kvantil – 1-p, počet stupňů volnosti – n) pokud p <0,5.
FISHER-SNEDECOR
F-ROZDĚLENÍ F(m,n)
Graf hustoty pravděpodobnosti f(x)
68
FISHER-SNEDECOR
F-ROZDĚLENÍ F(m,n)
Aplikace: Kvantily se velmi často využívají ve statistické indukci.
Odvozené z chí-kvadrát rozdělení jako
X1
T
X2
n
, kde X1 ~ χ2(n) a X2 ~ χ2(m)
m
Parametry:
n … počet stupňů volnosti
m … počet stupňů volnosti
MS Excel = FDIST (hodnota sledovaného jevu – x, počet stupňů volnosti – n)
FISHER-SNEDECOR
F-ROZDĚLENÍ F(m,n)
Výpočet kvantilů rozdělení F(m,n)
F0,6 (10,12) … je 60% kvantil
F rozdělení.
1,15
Tedy hodnota, která je větší
nebo rovna jak 60 % hodnot
rozdělení.
F0,6 (10;12) = 1,15
Aplikace: Kvantily se velmi často využívají ve statistické indukci a jsou pro
různé stupně volnosti m a n uvedeny ve statistických tabulkách.
70
MS Excel = FINV (upravený kvantil – 1-p, počet stupňů volnosti – n)
BETA ROZDĚLENÍ B(α,β)
Graf hustoty pravděpodobnosti f(x)
71
SPOJITÁ ROZDĚLENÍ V MS EXCEL
Rozdělení
Distribuční funkce
Kvantil
Funkce kvantilu
Normální
N(μ;σ2)
=NORMDIST
(x;μ;σ;1) 1
1pro výpočet
hustotní funkce se
zadá parametr 0
Np(μ;σ2)
=NORMINV(p;μ;σ)
Normované
normální
N(0;1)
=NORMSDIST(x)
up
=NORMSINV(p)
Chí-kvadrát
2(v)
=CHIDIST(x;v)
p2(v)
=CHIINV(1-p;v)
Studentovo
t(v)
=TDIST(x;v)
tp(v)
=TINV(2*(1-p);v) pro p >0,5
=-1*TINV(2*p;v) pro p < 0,5
F rozdělení
F(v1; v2)
=FDIST(x;v1;v2)
Fp(v1;v2)
=FINV(1-p;v1;v2)
72
KVANTILY ROZDĚLENÍ V ONLINE
KALKULÁTORECH
Výpočty kvantilů základních i řady další rozdělení lze provádět i pomocí
online kalkulátorů. Výpočet může být i jednodušší než pomocí funkcí MS
Excel.
•
Quantile Calculator (www.solvemymath.com)
13 spojitých a 4 nespojitá rozdělení
•
SOCR Distributome (socr.ucla.edu)
přes 70 spojitých a nespojitých rozdělení s grafickým rozhraním pro
zobrazení pravděpodobnostních funkcí a hustot pravděpodobností a
výpočet kvantilů
73
PRAVDĚPODOBNOST
DŮLEŽITÉ POJMY – 3. PŘEDNÁŠKA
Náhodný jev a nenáhodný jev
 Klasická definice pravděpodobnosti
 Statistická definice pravděpodobnosti
 Diskrétní náhodná veličina
 Pravděpodobnostní funkce
 Distribuční funkce
 Spojitá náhodná veličina
 Hustota pravděpodobnosti
 Normální rozdělení
 Kvantily

74