Spojitá rozdělení I

Download Report

Transcript Spojitá rozdělení I

Rozdělení pravděpodobnosti
Statistika nuda je,
má však cenné údaje,
neklesejte na mysli,
ona nám to vyčíslí.
Rozdělení pravděpodobností
Zákon rozdělení - funkce p(x), která přiřazuje každé hodnotě
xi diskrétní náhodné veličiny X příslušnou pravděpodobnost pi
= p(xi). Přitom součet pravděpodobností musí být
pro konečný počet
hodnot xi
n
 pi  1
i 1
pro nekonečný počet
hodnot xi

p
i 1
i
1
Rozdělení lze vyjádřit
•1. Tabulkou:
xi
2
3
4
5
6
7
8
9
10 11 12
pi
1 2 3 4 5 6 5 4 3 2 1
36 36 36 36 36 36 36 36 36 36 36
•2. Graficky:
Odpovídající graf funkce p(x)
S
se skládá z izolovaných
nebo úseček - úsečkový
bodů (xi, pi)
diagram
(pravděpodobnostní
p
6/36 histogram
6/36
i
6/36
5/36
4/36
4/36
3/36
2/36
1/36
1/36
5/36
4/36
3/36
2/36
1/36
0
0
1
2
3
4
5
6
7
8
9
10 11 12 13
x
2
3
4
5
6
7
8
9
10
11
12
Frekvenční a distribuční funkce
Pro získání širší představy o charakteru diskrétní náhodné
veličiny se dále ještě užívá kumulativních pravděpodobností a z
nich odvozených distribučních funkcí. Distribuční funkce je
definována vztahem
 P( X  x )
F ( x)  P( X  x) 
i
xi  X
F(x)
1
32/36
29/36
25/36
22/36
18/36
14/36
11/36
7/36
4/36
Graf této diskrétní
distribuční funkce:
0
2
3
4
5
6
7
8
9
10
11
12
Tabelární vyjádření distribuční funkce
Tabulka pro jednotlivá xi < x:
xi
2
3
4
5
6
7
8
9
10 11 12
pi
0
1 3 6 10 15 21 26 30 33 35
36 36 36 36 36 36 36 36 36 36
Rozdělení spojitých veličin -Normální
rozdělení
Normální zákon
chyby zaujímá
ve zkušenosti lidstva postavení jednoho z nejširších zobecnění přirozené filosofie. Slouží jako řídící nástroj při výzkumech v oblasti přírodních a společenských
věd, v medicíně, zemědělství
a stavebnictví. Je nepostradatelným
nástrojem pro analýzu a interpretaci základních informací získaných při pozorování
a různých experimentech.
W.J.Youden
Rozdělení normální
Náhodná veličina x má normální
rozdělení tehdy, je-li možno náhodný
výsledek interpretovat jako součet
nekonečně mnoha malých nezávislých
vlivů.
Obecný vzorec distribuční funkce
normálního rozdělení
1
f ( x) 
e
2
1 x  2
 (  )
2
Po dosazení normované náhodné veličiny
Dostáváme
1
f ( z) 
e
2
1
 ( z )2
2
z (
x

)
V oboru geologických fenoménů má
normální rozdělení
 topografický reliéf
 pevnost pobřežních písků
 specifická hmotnost horninových
vzorků ze žulového plutonu
 hustota směstnání zrn pískovce
 porozita pískovce
 procentní obsah některých minerálů v
horninách
Lognormální rozdělení
Frekvenční funkce normálního rozdělení:
µ,σ jsou parametry
logaritmickonormálního rozdělení
Srovnání distribučních funkcí lognormálního
rozdělení pro rozné hodnoty směr. odchylky
0.1
0.09
s=0.5
0.08
s=0.75
0.07
s=1
0.06
0.05
0.04
0.03
0.02
0.01
0
0.1
1.1
2.1
3.1
4.1
5.1
Lognormální rozdělení mají např.
  zrnitost některých sedimentů
  mocnost sedimentárních hornin
  délka hlavních toků v pánvích
  propustnost sedimentárních hornin
  koncentrace stopových prvků v
horninách
  plocha říčních rýžovišťových ložisek
Jiná v geologii občas aplikovaná rozdělení
Rozdělení gamma
1.6
a = 0.5
1.4
a=1
a = 0.1
1.2
1
0.8
0.6
0.4
0.2
kde Γ() je speciální gama funkce („zobecněný faktoriál“)
2.
3
2.
1
1.
9
1.
7
1.
5
1.
1
1.
3
0.
9
0.
7
0.
5
0.
3
0
0.
1
x e
f ( x, ) 
( )
1.8
f(x)
Tuto funkci lze použít
pro zkoumání proměnných,
které mohou mít asymetrické
rozdělení. Gama rozdělení
se obvykle používá
při analýze obsahů
některých kovů v rudních
blocích. Frekvenční funkce
má tvar:
 1  x
Distribuční funkce rozdělení gamma pro
různé hodnoty parametru alfa
x
Speciální spojitá rozdělení
Rozdělení chí-kvadrát
Využívá se při testování shody empirického
rozdělení s předpokládaným teoretickým (Pearsonův
test), při testování rozptylu dvou výběrových
souborů při neznámé střední hodnotě; též pro testy
nezávislosti v kontingenčních tabulkách.
Speciální spojitá rozdělení
Studentovo rozdělení
Aritmetický průměr výběrového souboru s normálním
rozdělením se může více či méně lišit od průměru
základního souboru. Pro hodnocení odchylek x  
byla definována náhodná veličina
x
t
n 1
s
které přísluší t-rozdělení (Studentovo rozdělení). Spojitá
náhodná veličina t může nabývat hodnot od – do +.
Využívá se při testování rozdílu mezi dvěma průměry
(tzv. t-test).
Fisherovo rozdělení
F-rozdělení, Fisherovo-Snedeckorovo)
Má velké využití v celé řadě testů v regresní
analýze, při analýze rozptylu a při testu shody
rozptylů dvou výběrů z normálního rozdělení.
Centrální limitní věta
"100.000 syslů se nemůže
mýlit." (Zákon velkých
čísel)
Centrální limitní věta
Normálnímu rozdělení se za určitých podmínek blíží i
jiná rozdělení náhodných veličin. O náhodných
veličinách, jejichž limitním zákonem je normální
rozdělení, říkáme, že mají asymptoticky normální
rozdělení. Důležitou aplikací je Moivre-Laplaceova
věta o konvergenci binomického rozdělení k
normálnímu. Binomické rozdělení lze aproximovat
normálním, je-li splněna podmínka
np(1-p) > 9
CLV - 1
The central limit theorem states that given a distribution with a mean  and
variance 2, the sampling distribution of the mean approaches a normal distribution
with a mean () and a variance 2/N as N, the sample size, increases.
The amazing and counter- intuitive thing about the central limit theorem is that no
matter what the shape of the original distribution, the sampling distribution of the
mean approaches a normal distribution. Furthermore, for most distributions, a
normal distribution is approached very quickly as N increases. Keep in mind that N
is the sample size for each mean and not the number of samples. Remember in a
sampling distribution the number of samples is assumed to be infinite. The sample
size is the number of scores in each sample; it is the number of scores that goes into
the computation of each mean.
On the next page are shown the results of a simulation exercise to demonstrate the
central limit theorem. The computer sampled N scores from a uniform distribution
and computed the mean. This procedure was performed 500 times for each of the
sample sizes 1, 4, 7, and 10.
CLV - 2
On the right are shown the resulting
frequency distributions each based on 500
means. For N = 4, 4 scores were sampled
from a uniform distribution 500 times and the
mean computed each time. The same method
was followed with means of 7 scores for N =
7 and 10 scores for N = 10.
Two things should be noted about the effect
of
increasing
N:
1. The distributions becomes more and more
normal.
2. The spread of the distributions decreases.
Centrální limitní věta
Předpokládejme, že náhodné veličiny jsou nezávislé.
Definujme náhodnou veličinu jako součet
Za jistých obecných podmínek se distribuční funkce náhodné
veličiny blíží distribuční funkci normálního rozdělení
Postačující podmínky platnosti centrální limitní věty
•
xi jsou nezávislé.
• Každá veličina má konečné centrální momenty do 3. řádu
včetně.