Transcript Document

Náhodná veličina.
Nechť (, , P) je pravděpodobnostní prostor:
 je základní prostor,  je -algebra (všechny podmnožiny ),
P je pravděpodobnost. Náhodná veličina X je reálná měřitelná funkce X:   R.
Poznámka:
Měřitelná funkce: vzorem otevřeného intervalu je prvek , neboli je podmnožina .
Příklad.
Házíme kostkou.
 = {padne 1, padne 2, …, padne 6}
 jsou všechny podmnožiny 
P je pravděpodobnostní funkce definovaná na .
Definujeme náhodnou veličinu X: padne i  i.
Rozlišujeme diskrétní a spojité náhodné veličiny.
Diskrétní náhodná veličina má obor hodnot diskrétní (například konečný).
Spojitá náhodná veličina má obor hodnot interval, nebo jejich spočetné sjednocení.
Diskrétní náhodná veličina.
Ke každé hodnotě oboru hodnot definujeme pravděpodobnost, s níž hodnota nastane.
Postup je následující:
    X ( )  R
x  R  P ( x)  R
    P ( X ( )  x )  p ( x )  R
p je tak zvaná pravděpodobnostní funkce.
Jestliže obor hodnot náhodné veličiny X je {x1, x2, …, xn}, pak
p ( x i )  0 , i  1,..., n
n

p( xi )  1
i 1
Náhodná veličina X je definována současně:
• předpisem
• pravděpodobnostní funkcí
Další možnost je definovat náhodnou funkci předpisem a distribuční funkcí F takto:
F ( x )  P ( X ( )  x ) 
 P ( X ( ) 
xi  x
xi )
Příklad.
Auto musí projet 4 křižovatky řízené semafory. Na každém semaforu může být
buď zelená, nebo červená (oranžovou neuvažujeme).
Označme náhodnou veličinu X počet projetých křižovatek na zelenou do první, kam
dojede na červenou.
Napište pravděpodobnostní funkci p a distribuční funkci F.
0.5
Obor hodnot X je {0, 1, 2, 3, 4}
p(0) = 0.5
p(1) = 0.52 = 0.25
p(2) = 0.53 = 0.125
p(3) = 0.54 = 0.0625
p(4) = 0.54 = 0.0625
p(x) = 0, x > 4.
F(x) =
0
x0
0 .5
0 x 1
0 . 75
1 x  2
pro
0 . 875
2 x3
0 . 9375
3 x4
1
4 x
0.4
0.3
0.2
0.1
0
0
1
2
3
4
5
Příklad.
V osudí je 5 bílých a 7 červených míčků. Náhodná veličina X představuje počet
bílých míčků mezi pěti vybranými. Vytvořte pravděpodobnostní a distribuční funkci
této náhodné veličiny.
 5  7

  

 x  5  x 
p
(
x
)

Obor hodnot X je {0, 1, 2, 3, 4, 5}
, x = 0, 1, 2, 3, 4, 5
 12 
 
5 
F ( x )  P ( X ( )  x )   P ( X ( )  x i )
xi  x
0.5
0.4
0.3
0.2
0.1
0
0
1
2
3
4
5
Spojitá náhodná veličina.
K popisu se používá distribuční funkce F.
F (x) = P (X () < x)
Vlastnosti F(x) (společné pro spojitou i diskrétní náhodnou veličinu):
 0 ≤ F(x) ≤ 1
 P(x1 ≤ X () < x2) = F(x2) - F(x1) pro x1 < x2
 F(x) je neklesající funkce
 F(- ∞) = 0, F(∞) = 1
 F(x) je zleva spojitá v bodech x = xi, i = 1,2,..., diskrétní náhodné veličiny a
spojitá v ostatních bodech.
Místo pravděpodobnostní funkce u diskrétní náhodné veličiny definujeme
funkci hustoty f takto:
Je to reálná funkce definovaná a nezáporná na intervalu <a, b>,
f ( x )  lim
h 0
P ( x  X ( )  x  h )
h
f (x) = 0, x  <a, b>
, x, x+h <a, b>,
Vlastnosti f (x) a F (x) spojité náhodné veličiny X:
 pro x ∈ R platí: f (x) ≥ 0

 
f ( x ) dx  1
, f(x) > 0, x <a, b>


f ( x)  F ( x)
/
x

F ( x )  P ( X ( )  x ) 

f ( x ) dx

x2

P ( x 1  X ( )  x 2 )  F ( x 2 )  F ( x 1 ) 

f ( x ) dx
x1
Příklad.
Náhodná veličina X je dána distribuční funkcí F: Určete f (x), znázorněte graficky
F (x), f (x), vypočtěte P(0.4 ≤ X ( ) < 1.6).
F (x) = 0, x  0, F (x) = x 2 / 4, 0 < x  2, F (x) = 1, x > 2.
1.2
1
F
0.8
0.6
0.4
0.2
0
0
0.5
1
1.5
x
2
2.5
3
f (x) = 0, x  0, f (x) = x / 2, 0 < x  2, f (x) = 0, x > 2.
1
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
0.5
1
1.5
2
2.5
3
Definice náhodné veličiny pomocí momentů.
Obecná definice momentu mk:
x
mk 
k
i
p( xi )
pro diskrétní náhodnou veličinu
f ( x ) dx
pro spojitou náhodnou veličinu
i

x
mk 
k

Obecná náhodná veličina může mít nekonečně mnoho nenulových
momentů (k + ). To znamená, že pro její charakterizaci je nutno spočítat
nekonečně mnoho momentů.
V praxi se
 používají náhodné veličiny, které mají jen několik nenulových momentů
 počítá jen několik prvních momentů, i když se jedná o obecnou náhodnou veličinu.
(nejčastěji 2).
Obecná definice centrálního momentu nk
(m je 1. moment náhodné veličiny podle definice výše):
nk 
 (x
 m ) p( xi )
k
i
pro diskrétní náhodnou veličinu
i

nk 
 (x  m )

k
f ( x ) dx
pro spojitou náhodnou veličinu
Nejčastěji používané momenty.
1. moment m1 označuje střední hodnotu náhodné veličiny X,
m1  E ( X )  m
E(X )  m 
x
i
pro diskrétní náhodnou veličinu
p( xi )
i

E(X )  m 
 xf ( x ) dx pro spojitou náhodnou veličinu

Pro střední hodnotu platí:
1. E(c) = c , kde c je konstanta
2. E(c.X) = c.E(X)
3. E(X±Y) = E(X) ± E(Y)
4. E(X.Y) = E(X).E(Y), jsou-li X a Y nezávislé
2. Centrální moment označuje rozptyl náhodné veličiny X,
n2  2 = var X

2

 (x
 m ) p( xi )
2
i
pro diskrétní náhodnou veličinu
i


2

 (x  m )

2
f ( x ) dx
pro spojitou náhodnou veličinu
Pro rozptyl D (X)   2 platí:
1. D(c) = 0, kde c je konstanta
2. D(c.X) = c 2.D(X)
3. D(X + Y) = D(X) + D(Y), jsou-li X a Y nezávislé
4. σ se nazývá směrodatná odchylka
3. centrální moment slouží k určení asymetrie rozdělení náhodné veličiny X,
n3 se nazývá šikmost.
n3 = E[(X – EX)3] / 3
4. centrální moment n4 se nazývá špičatost
n4 = E[(X – EX)4] / 4
Kvantily.
Nechť F(x) je distribuční funkce spojité náhodné veličiny X. Pak hodnota xp, pro
kterou platí F(xp) = p, kde p∈<0,1>, se nazývá p-kvantil.
Nejužívanější kvantily:
kvartily: x0.25, x 0.50, x 0.75 - rozdělí obor možných hodnot na čtyři části se stejnou
pravděpodobností výskytu
decily: x 0.1, x 0.2, ..., x 0.9 - rozdělí obor možných hodnot na deset částí se stejnou
pravděpodobností výskytu
percentily: x 0.01, x 0.02, ..., x 0.99 - rozdělí obor možných hodnot na sto částí se
stejnou pravděpodobností výskytu
medián: x 0.5 . . . rozdělí obor možných hodnot na 2 části se stejnou
pravděpodobností výskytu.
Modus.
 u diskrétní náhodné veličiny je to hodnota, v níž pravděpodobnostní funkce p(xi)
dosahuje maxima.
 u spojité náhodné veličiny je to hodnota, v níž hustota pravděpodobnosti f (x)
nabývá lokálního maxima.
Motivace pro statistiku.
Sledujeme životnost součástky v počítači, který je v nepřetržitém provozu.
Životnost kolísá podle prostředí, v němž je počítač umístěn (prašnost, vlhkost, …)
Lze tedy na životnost pohlížet jako na náhodnou veličinu v základním prostoru
, což je spojitý časový interval (možná životnost součástky).
Takto definovaný problém však nijak nepomáhá v určení „průměrné doby života“
součástky.
Náhodná veličina „životnost součástky“ má nějakou funkci hustoty, nějakou kladnou
střední (průměrnou, očekávanou) hodnotu m, kladnou hodnotu variability  2 (rozptyl).
Má tedy nějaké rozdělení pravděpodobností, které nám však není známo.
Vybereme náhodně n počítačů a zjistíme u nich životnost součástky.
Kdybychom tento výběr prováděli m – krát (m n-tic počítačů), životnost součástky by
se patrně v každém z těchto m výběrů lišila.
Proto tuto n-tici náhodně vybraných počítačů X1, …, Xn lze pokládat za
náhodné veličiny. Předpokládáme, že
• počítače byly vybrány nezávisle na sobě
• všechny mají stejné rozdělení pravděpodobností (pocházejí z téhož prostředí).
Posloupnost nezávislých náhodných veličin X1, …, Xn, které mají stejné rozdělení
pravděpodobností, se nazývá náhodný výběr z tohoto společného rozdělení.
Význam náhodného výběru.
Pomocí n náhodně vybraných prvků jsme schopni popsat (definovat) náhodnou
veličinu X = životnost součástky počítače.
Definujeme
•
•

1
X 
n
S
2

1
n

výběrový průměr  je to náhodná veličina
Xi
i 1

n

n
(X i  X )
2
výběrový rozptyl  je to náhodná veličina
i 1
a platí

•
E X  m
•
var X  

X

2
/n
je nestranný odhad m
standard error of mean (SE)  kolísání průměrů
(s rostoucím n klesá k nule)
•
ES
2

2
S2 je nestranný odhad 2
kde X1, …, Xn je náhodný výběr z rozdělení s parametry m, 2. (EX značí střední (očekávanou = expected)
hodnotu náhodné veličiny X, var X značí rozptyl (varianci) náhodné veličiny X).
Cvičení.
Hustota pravděpodobnosti náhodné veličiny X má tvar:
f (x) = 0, x < 0; f (x) = a sin x, 0 ≤ x < p ; f (x) = 0, x  p.
Určete koeficient a, distribuční funkci F(x) a P(p/2 < X < 2p ).
Náhodná veličina X je dána tabulkou. Určete její první moment, 2. centrální moment.
x
p
1
0.3
2
0.1
3
0.4
4
???
Náhodná veličina X má hustotu pravděpodobnosti:
f (x) = x2 e-x /2, x (0, + ), f (x) = 0, jinak. Určete modus.
Náhodná veličina X má hustotu pravděpodobnosti: f (x) = 2x, x<0, 1>, f (x) = 0 jinak.
Spočtěte střední hodnotu a varianci.
Určete první decil a třetí kvartil pro náhodnou veličinu danou hustotou takto:
f (x) = 1/2, x<0, 2>, f (x) = 0 jinak.
Třikrát vystřelíme na cíl. Pravděpodobnost zásahu při každém výstřelu je p = 0.7. Určete:
a) pravděpodobnostní funkci počtu zásahů při třech nezávislých výsledcích,
b) distribuční funkci a její graf.
Náhodná veličina X je dána distribuční funkcí: F (x) = 0, x < 3, F (x) = x/3 – 1, 3 ≤ x < 6, F (x) = 1, x  6.
Určete f(x), znázorněte graficky f(x), F(x) a P(1.5 ≤ X ≤ 4).
Určete,
a) pro jaká A, B bude F (x) = A + B/(1 + x2) funkcí rozložení náhodné proměnné pro x∈(0, +∞),
b) příslušnou hustotu rozložení.
V městě byl po dobu 60 dnů evidován počet dopravních nehod v průběhu každého dne a podle počtu nehod
v jednom dni vytvořena tabulka.Pro počet nehod v jednom dni jako náhodnou proměnnou sestrojit zákon
rozložení, střední hodnotu a varianci.
počet nehod / den
počet dnů s daným počtem nehod
0
4
1
28
2
10
3
7
4
6
5
4
6
1
Výsledkem náhodného pokusu je náhodná veličina nabývající hodnot 1/ n (n je přirozené číslo) s
pravděpodobnostmi nepřímo úměrnými 3n. Určit střední hodnotu této náhodné veličiny.
Funkce f (x) = C (2x – x2) má být hustotou rozložení pravděpodobnosti pro x ∈ <0,2>. Určete
a) konstantu C,
b) funkci rozložení F(x),
c) střední hodnotu příslušné náhodné veličiny,
d) varianci a směrodatnou odchylku,
e) pravděpodobnost P(X<1).