Biostatystyka_2ZPN

Download Report

Transcript Biostatystyka_2ZPN

Biostatystyka
inż. Jacek Jamiołkowski
Wykład 4
Zmienne losowe
i ich rozkłady
Definicja zmiennej losowej
Zmienną losową nazywamy funkcję określoną na przestrzeni
zdarzeń elementarnych, przyporządkowującą każdemu
zdarzeniu elementarnemu liczbę rzeczywistą z określonym
prawdopodobieństwem. Wartości jej nie możemy więc z góry
przewidzieć, bowiem zależy ona od przyczyn losowych.
Przykładowo, jeśli zmienną losową X zdefiniujemy sobie jako
„sumę oczek dwoma kostkami”, to jasne jest, że wartości
funkcji nie można z góry przewidzieć. Wartościami funkcji mogą
być liczby rzeczywiste (2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12), z
określonymi prawdopodobieństwami (najmniejsze jest
prawdopodobieństwo wyrzucenia sumy oczek 2 i 12, a
największe 7, ze względu na liczbę sprzyjających zdarzeń
elementarnych).
Rodzaje zmiennych losowych
Jeżeli zbiór wartości zmiennej losowej jest zbiorem
przeliczalnym lub skończonym, wówczas zmienną losową
nazywamy dyskretną. Jeśli natomiast zmienna losowa
przyjmuje dowolne wartości z pewnego przedziału liczbowego,
to nazywamy ją zmienną losową ciągłą.
Definicja dystrybuanty
Niezależnie od typu, każdą zmienną losową X można
jednoznacznie określić za pomocą teoretycznej dystrybuanty.
Dodatkowo, oprócz dystrybuanty zmienna losowa dyskretna
charakteryzowana jest za pomocą funkcji
prawdopodobieństwa, a zmienna losowa ciągła za pomocą
funkcji gęstości rozkładu.
Dystrybuantą zmiennej losowej X nazywamy funkcję F(x),
określonej na całym zbiorze liczb rzeczywistych (xR),
zdefiniowanej następująco:
F(x) = P(X < x)
Czyli innymi słowy wartość dystrybuanty zmiennej losowej X w
punkcie x, jest prawdopodobieństwem, że zmienna losowa X
przyjmie wartość mniejszą niż x.
Własności dystrybuanty
Dystrybuanta: F(x) = P(X < x)
0 ≤ F(x) ≤ 1
F(x) jest funkcją niemalejącą
F(x) jest funkcją przynajmniej lewostronnie ciągłą
lim F( x )  0
x  
lim F( x )  1
x  
Parametry rozkładów zmiennych losowych
Z rozkładem każdej zmiennej losowej związane są pewne
charakteryzujące go wielkości liczbowe. Charakterystyki te
nazywa się parametrami rozkładu zmiennej losowej. Do
najważniejszych parametrów zmiennych losowych należą
wartość oczekiwana i wariancja zmiennej losowej.
Wartość oczekiwana E(x) = m jest wartością, wokół której
skupiają się wartości zmiennej losowej przy wielokrotnym
powtarzaniu eksperymentu.
Wariancja V(x) = σ2 zmiennej losowej to miara rozproszenia
wartości zmiennej wokół wartości oczekiwanej, którą oblicza się
ze wzoru:
V(x) = E(X – E(X))2
Zmienne losowe i ich rozkłady
Rozkład zmiennej losowej dyskretnej
Zmienna losowa dyskretna
Zmienna losowa X jest typu dyskretnego, jeżeli istnieje
skończony, albo przeliczalny zbiór jej wartości x1, x2, …, xn, …
przyjmowanych przez zmienną z prawdopodobieństwami
odpowiednio p1, p2, …, pn, …
Funkcja prawdopodobieństwa zmiennej losowej X jest
wówczas określona następująco:
P(X  x i )  p i
przy czym:
n

pi
jeśli zbiór wartości zmiennej losowej jest skończony

pi
jeśli zbiór wartości zmiennej losowej jest przeliczalny
i 1

i 1
Funkcja prawdopodobieństwa
Funkcję prawdopodobieństwa zmiennej losowej dyskretnej X
można przedstawiać w postaci tabeli par (xi, pi) – jeśli jest to
zbiór skończony:
Wartości zmiennej
dyskretnej (xi)
x1
x2
…
xn
Prawdopodobieństwa
poszczególnych wartości (pi)
p1
p2
…
pn
Funkcja prawdopodobieństwa
Przykład:
Określ funkcję prawdopodobieństwa zmiennej losowej X,
zdefiniowanej jako liczbę reszek, wyrzuconych podczas rzutu 3
monetami.
Funkcja prawdopodobieństwa
Przestrzeń zdarzeń elementarnych doświadczenia losowego jest
następująca:
Ω = {(O, O, O), (O, O, R), (O, R, O), (O, R, R),
(R, O, O), (R, O, R), (R, R, O), (R, R, R)}
W doświadczeniu można wyrzucić 0, 1, 2 lub 3 reszki, zatem:
x1 = 0,
x2 = 1,
x3 = 2,
x4 = 3, a
p1 = 1/8,
p2 = 3/8,
p3 = 3/8,
p4 = 1/8
Funkcja prawdopodobieństwa zmiennej losowej będącej liczbą
reszek wyrzuconych w wyniku rzutu 3 monetami jest
następująca:
xi
0
1
2
3
pi
0,125
0,375
0,375
0,125
Funkcja prawdopodobieństwa
Funkcję prawdopodobieństwa zmiennej losowej dyskretnej
można przedstawić również w postaci wykresu:
0,4
0,35
0,3
p
0,25
0,2
0,15
0,1
0,05
0
0
1
2
x
3
4
Dystrybuanta zmiennej losowej dyskretnej
Dystrybuanta zmiennej losowej dyskretnej spełnia ogólną
definicję:
F(x) = P(X < x)
i przyjmuje postać:
F( x ) 
Np.
F(x1)
F(x2)
F(x3)
F(x4)
…
F(xn)
 pi
dla x  (-  ;  )
x i x
=
=
=
=
0
p1
p1 + p 2
p1 + p 2 + p3
= p1 + p 2 + p3 + … + p n = 1
Dystrybuanta zmiennej losowej dyskretnej
Przykład:
Określić dystrybuantę zmiennej losowej X zdefiniowanej jako
liczba reszek wyrzuconych za pomocą 3 monet.
Dystrybuanta zmiennej losowej dyskretnej
Funkcja prawdopodobieństwa dla tej zmiennej losowej została
już określona:
xi
0
1
2
3
pi
0,125
0,375
0,375
0,125
Należy pamiętać, że dystrybuanta przyjmuje wartości dla każdej
liczby rzeczywistej, a nie tylko dla wartości przyjmowanych
przez zmienną losową, dlatego w przypadku dyskretnej
zmiennej losowej wartości dystrybuanty najwygodniej określić
za pomocą przedziałów:
F( x ) 
 pi
x i x
x
F(x)
(-∞; 0
0
(0; 1
p1 =
0,125
(1; 2
(2; 3
(3; +∞
p1 + p2 = p1 + p2 + p3 = p1 + p2 + p3 + p4 =
0,5
0,875
1
Dystrybuanta zmiennej losowej dyskretnej
Dystrybuantę zmiennej losowej dyskretnej można przedstawić
również w postaci wykresu:
1
0,8
F(x)
0,6
0,4
0,2
0
-2
-1
0
1
2
x
3
4
5
Wartość oczekiwana i wariancja
Wartość oczekiwana dyskretnej zmiennej losowej określona jest
wzorem:
n
E(X) 
 x i pi
i 1
Wariancję dyskretnej zmiennej losowej wyraża wzór:
n
V(X) 

i 1
( x i  E(X))
2
pi
Wartość oczekiwana i wariancja
Przykład:
Wyznacz wartość oczekiwaną i wariancję zmiennej losowej X
określonej jako liczbę wyrzuconych reszek w rzucie 3 monetami.
Wartość oczekiwana i wariancja
Funkcja prawdopodobieństwa dla tej zmiennej losowej została
już określona:
xi
0
1
2
3
pi
0,125
0,375
0,375
0,125
E(X) = x1 · p1 + x2 · p2 + x3 · p3 + x4 · p4 =
= 0 · 0,125 + 1 · 0,375 + 2 · 0,375 + 3 · 0,125 =
= 0,375 + 0,75 + 0,375 = 1,5
V(X) = (x1 – E(X))2 · p1 + (x2 – E(X))2 · p2 + (x3 – E(X))2 · p3 +
+ (x4 – E(X))2 · p4 =
= (0 – 1,5)2 · 0,125 + (1 – 1,5)2 · 0,375 + (2 – 1,5)2 · 0,375 +
+ (3 – 1,5)2 · 0,125 =
= 2,25 · 0,125 + 0,5 · 0,375 + 0,5 · 0,375 + 2,25 · 0,125 =
= 0,28124 + 0,09375 + 0,09375 + 0,28124 = 0,75
Zmienne losowe i ich rozkłady
Wybrane rozkłady dyskretne
Rozkład równomierny
Z rozkładem równomiernym (inaczej zwany jednostajnym),
mamy do czynienia gdy zmienna losowa może przyjmować
wszystkie wartości z jednakowym prawdopodobieństwem:
xi
x1
x2
…
xn
pi
1/n
1/n
…
1/n
Przykładem zmiennej losowej o równomiernym rozkładzie jest
zmienna X zdefiniowana jako „liczba oczek uzyskana w wyniku
rzutu jedną kostką”.
Rozkład zero-jedynkowy
Rozkład zero-jedynkowy występuje w sytuacji, gdy rezultatem
doświadczenia losowego są dwa wykluczające się zdarzenia.
Zmienna losowa X ma rozkład zero-jedynkowy, jeśli przyjmuje
wartość 1 z prawdopodobieństwem p, a wartość 0 z
prawdopodobieństwem q = 1 – p.
Funkcja prawdopodobieństwa ma postać:
xi
0
1
pi
q
p
Przykładem zmiennej losowej o rozkładzie zero-jedynkowym
jest zmienna zdefiniowana następująco „wynikowi rzutu monetą
przypisujemy 1 w przypadku wyrzucenia orła, a 0 w przypadku
reszki”.
Rozkład dwumianowy (Bernoulliego)
Jeśli mamy do czynienia z doświadczeniem Bernoulliego, tzn.
gdy wielokrotnie (n ≥ 2) powtarzane jest doświadczenie losowe,
którego wynikiem może być jeden z dwóch stanów: „sukces” z
prawdopodobieństwem p lub „porażka” z prawdopodobieństwm
q = 1 – p, to zmienna losowa określona jako „liczba sukcesów
w n próbach” ma rozkład dwumianowy z parametrami n i p,
przy czym zmienna losowa może przyjąć wartości k = 0, 1, 2,
…, n. Prawdopodobieństwo wystąpienia tych wartości określa
wzór:
n
P(X  k )  
k

k
  p  q

n k
,
gdzie q  1  p
Przykładem zmiennej losowej o rozkładzie dwumianowym jest
zmienna określona jako „liczba orłów wyrzuconych w 100
rzutach monetą”. Zmienna ma rozkład dwumianowy o
parametrach n = 100 i p = 0,5.
Rozkład dwumianowy (Bernoulliego)
Wartość oczekiwana i wariancja zmiennej losowej o takim
rozkładzie zależy od parametrów rozkładu i dana jest wzorami:
E(X) = n · p
V(X) = n · p · q
Np. dla przytoczonego przykładu:
E(X) = 100 · 0,5 = 50
V(X) = 100 · 0,5 · 0,5 = 25
czyli najbardziej prawdopodobne jest, że w 100 rzutach monetą
wypadnie 50 razy orzeł.
Rozkład Poissona
Zmienna losowa X, przyjmująca wartości k = 0, 1, 2, … z
prawdopodobieństwami określonymi wzorem:
P(X  k ) 
λ
k
k!
e
λ
,
gdzie k  0 , 1, 2, 3, ...
ma rozkład Poissona o parametrze λ. Przedstawia on liczbę
wystąpień jakiegoś zjawiska w określonej liczbie prób, jeśli te
zdarzenia są niezależne od siebie. Rozkład Poissona jest
używany do obliczenia przybliżonych wartości
prawdopodobieństwa rozkładzie dwumianowego w przypadku
dużej liczby prób (n ≥ 50) i niskim prawdopodobieństwie
sukcesu (p ≤ 0,1), przy czym parametr rozkładu Poissona jest
wyrażony zależnością: λ = n · p. Można to w skrócie zapisać:
n
P(X  k )  
k

k
  p  q

n k

(n  p )
k!
k
e
 ( n p )
Rozkład Poissona
Dystrybuanta zmiennej losowej X o rozkładzie Poissona dana
jest wzorem:
F( x ) 
e
k x
λ

λ
k
k!
Wartość oczekiwana i wariancja zmiennej losowej o rozkładzie
Poissona równe są parametrowi λ tego rozkładu, tzn.:
E(X) = λ
V(X) = λ
Przykładem zmiennej losowej o rozkładzie zbliżonym do
rozkładu Poissona jest zmienna „liczba wypadków w ciągu roku,
przy prawdopodobieństwie dziennym wynoszącym 0,001”
Rozkład geometryczny
Rozkład geometryczny opisuje prawdopodobieństwo zdarzenia,
że pierwszy „sukces” w doświadczeniu Bernoulliego wystąpi
dokładnie w k-tej próbie.
Zmienna losowa X ma rozkład geometrycznym jeśli przyjmuje
wartości k = 1, 2, 3, …, a jej funkcja prawdopodobieństwa dana
jest wzorem:
P(X = k) = p · qk – 1, gdzie q = 1 – p
Przykładem zmiennej losowej o rozkładzie geometrycznym jest
zmienna „w którym rzucie monetą wypadnie pierwszy orzeł”.
Dystrybuantę rozkładu geometrycznego opisuje wzór:
F( x ) 

k x
p q
k 1
Rozkład geometryczny
Wartość oczekiwana i wariancja rozkładu geometrycznego
wyrażone są wzorami:
E(X) 
V(X) 
1
p
q
p
2
Np. W którym rzucie kostką można oczekiwać, że wypadnie
czwórka?
p = 1/6  E(X) = 6
Rozkład hipergeometryczny
Rozkład hipergeometryczny jest związany z tzw. schematem
urnowym. Jest to doświadczenie polegające na losowaniu bez
zwracania n elementów spośród populacji zawierającej M
elementów typu pierwszego i N elementów typu drugiego.
Rozkład hipergeometryczny określa liczbę wylosowanych w
takim doświadczeniu elementów typu pierwszego. Należy
zwrócić uwagę, że prawdopodobieństwo sukcesu zmienia się po
każdym wylosowanym elemencie, ponieważ losowanie
przebiega bez zwracania (odmiennie niż w rozkładzie
dwumianowym).
Rozkład hipergeometryczny
Funkcja prawdopodobieństwa rozkładu hipergeometrycznego
opisana jest wzorem:
P(X  k ) 
M

k
  N
  
 n  k
M  N 


 n




gdzie M jest liczbą interesujących nas elementów, N liczbą
pozostałych elementów, n liczbą losowanych elementów, a k
liczbą wylosowanych interesujących nas elementów.
Wartość oczekiwana i wariancja wyrażone są wzorami:
E(X) 
n M
V(X)  n  p  q 
M N
gdzie: p

M
M N
q 
M N n
M  N 1
N
M N
Zmienne losowe i ich rozkłady
Rozkład zmiennej losowej ciągłej
Zmienna losowa ciągła
Zmienną losową ciągłą nazywamy taką funkcję X, która
przyjmuje dowolne wartości z pewnego przedziału liczbowego
(lub przedziałów).
Z powyższej definicji wynika, że liczba wszystkich możliwych i
wzajemnie się wykluczających zdarzeń elementarnych jest
nieskończona i dlatego prawdopodobieństwo w punkcie
odpowiadającym xi równa się zero. Innymi słowy zdarzenie, że
wzrost losowo wybranej osoby wynosi dokładnie 175,0000000…
(nieskończenie wiele 0 po przecinku) jest niemożliwe.
Z tego względu opis rozkładu zmiennej losowej ciągłej musi być
inny niż dla zmiennej losowej dyskretnej. Do opisania rozkładu
zmiennej losowej ciągłej służy funkcja gęstości
prawdopodobieństwa.
Funkcja gęstości prawdopodobieństwa
Funkcja gęstości prawdopodobieństwa ciągłej zmiennej
losowej X to dowolna funkcja nieujemna f (x) ≥ 0 określona na
zbiorze liczb rzeczywistych o własności:
b
 f ( x )dx
 P( a  X  b )
a
To znaczy pole pod krzywą funkcji gęstości
prawdopodobieństwa w przedziale (a, b) jest równe
prawdopodobieństwu, że zmienna X przyjmie wartość z tego
przedziału.
Z powyższego wynika, że funkcja gęstości prawdopodobieństwa
musi spełniać warunek:

 f ( x )dx  1

(prawdopodobieństwo zdarzenia pewnego
jest równe 1)
Funkcja gęstości prawdopodobieństwa
b
 f ( x )dx
 P( a  X  b )
a
0,45
0,4
0,35
f (x)
0,3
P
0,25
0,2
P(a<X<b)
0,15
0,1
0,05
0
a
b
Dystrybuanta zmiennej losowej ciągłej
Dystrybuanta zmiennej losowej ciągłej musi spełniać ogólną
definicję:
F(x) = P(X < x)
i przyjmuje postać:
x
F( x ) 
 f ( x )d x

dla x  (-  ;  )
Dystrybuanta zmiennej losowej ciągłej
Dystrybuanta zmiennej losowej ciągłej posiada następujące
własności:
b
P( a  X  b )  P( a  X  b ) 
 f ( x )dx
 F ( b )  F (a )
a

P(X  a ) 
 f ( x )dx
a
przy czym a < b
 1  F (a )
Dystrybuanta zmiennej losowej ciągłej
Dystrybuantę zmiennej losowej ciągłej można przedstawić w
postaci wykresu:
1
0,9
P(X<3)=0,5
0,8
0,7
F(x)
0,6
0,5
0,4
0,3
0,2
0,1
0
0
1
2
3
4
5
6
Charakterystyki liczbowe zmiennej losowej
Wartość oczekiwana ciągłej zmiennej losowej określona jest
wzorem:

E(X) 
x
 f ( x )dx

Wariancję ciągłej zmiennej losowej wyraża wzór:

V(X) 
x
2
 f ( x )dx - [E(X)]
2

Medianą ciągłej zmiennej losowej jest taka wartość x, dla której
spełniona jest równość:
F(x ) 
1
2
Zmienne losowe i ich rozkłady
Wybrane rozkłady ciągłe
Rozkład jednostajny
Zmienna losowa X ma rozkład jednostajny w przedziale
(a, b), jeśli jej funkcja gęstości i dystrybuanta określone są
wzorami:
0
1
a
dla
x a
0,5
0,4
dla
a  x b
P



f (x )  
b


0,6
0,3
0,2
0
dla
x b
0,1
0
a
b
a
b
1
0
a
a
dla
x a
0,9
0,8
0,7
dla
a  x b
0,6
F(x)


x
F(x )  
b


0,5
0,4
0,3
1
dla
x b
0,2
0,1
0
Rozkład jednostajny
Jeśli zmienna losowa ma rozkład jednostajny, to wystąpienie
dowolnej wartości z określonego przedziału jest jednakowo
prawdopodobne, a wartości spoza tego przedziału nie
występują wcale.
Parametry rozkładu jednostajnego – wartość oczekiwaną,
wariancję i medianę opisują wzory:
E(X) 
V(X) 
Me 
a b
2
(b  a )
12
a b
2
2
Rozkład jednostajny
Przykład:
Autobusy komunikacji miejskiej przyjeżdżają na przystanek
dokładnie co 10 minut. Pasażer przychodzi na przystanek w
przypadkowym momencie czasu. Zmienna X oznacza czas
oczekiwania na przyjazd autobusu. Określić rozkład zmiennej
losowej X, jej gęstość, dystrybuantę oraz obliczyć
prawdopodobieństwo, że pasażer będzie oczekiwał na autobus
krócej niż 8 minut. Jaka będzie wartość oczekiwana, wariancja,
odchylenie standardowe i mediana zmiennej losowej X?
Rozkład jednostajny
Z warunków zadania wynika, że najkrótszy czas oczekiwania
wynosić może 0 minut, a najdłuższy 10 minut. Wszystkie
wartości pośrednie są jednakowo prawdopodobne, zatem mamy
do czynienia z rozkładem jednostajnym.
Wartość funkcji gęstości prawdopodobieństwa zmiennej X,
zgodnie ze wzorem ma postać:
0


1
 1
f (x )  

10
 10  0

0

dla
x 0
dla
0  x  10
dla
x  10
Rozkład jednostajny
Dystrybuanta zmiennej X na podstawie przedstawionego wzoru
to:
0


x
x 0
F(x )  

10
 10  0

1

dla
x 0
dla
0  x  10
dla
x  10
Prawdopodobieństwo, że pasażer będzie oczekiwał na autobus
krócej niż 8 minut, czyli P(X<8) można obliczyć korzystając z
wyznaczonej dystrybuanty rozkładu:
P(X  8)  F ( 8 ) 
8
10
Rozkład jednostajny
Parametry rozkładu zmiennej X, zgodnie z przedstawionymi
wzorami wynoszą:
E(X) 
V(X) 
σ 
Me 
0  10
2
5
(10  0 )
2
12
V(X) 
0  10
2
 8 ,33
8 ,33  2 ,89
 5
Rozkład wykładniczy
Zmienna losowa X ma rozkład wykładniczy z parametrem λ
(gdzie λ > 1), jeżeli funkcja gęstości i dystrybuanta określone
są wzorami:
0,8
0,7
dla
x 0
0,6
0,5

x
λ
P
0


f (x )   1
 e
λ
dla
x 0
0,4
0,3
0,2
0,1
0
1
0,9
dla
x  0
0,7
0,6

x
λ
F(x)
0


F(x )  
1  e
0,8
dla
x  0
0,5
0,4
0,3
0,2
0,1
0
1
λ
Rozkład wykładniczy
Jeśli zmienna losowa ma rozkład wykładniczy, to nie może
przyjąć wartości ujemnej, a prawdopodobieństwo wartości
dodatniej zmniejsza się wykładniczo ze wzrostem jej wartości.
Rozkład taki opisuje często czas trwania różnych zdarzeń, np.
czas bezawaryjnej pracy jakiegoś urządzenia, czas
wykonywania jakiejś czynności, itp.
Parametry rozkładu wykładniczego – wartość oczekiwaną,
wariancję i medianę opisują wzory:
E(X)  λ
V(X)  λ
2
Me  λ  ln 2
Rozkład wykładniczy
Przykład:
Zaobserwowano, że czas rozmowy w pewnym automacie
telefonicznym można opisać rozkładem wykładniczym, przy
czym średni czas trwania rozmowy wynosi 50 sekund. Jaka jest
funkcja gęstości i dystrybuanta tego rozkładu? Jakie jest
prawdopodobieństwo, że losowo wybrana osoba będzie
rozmawiać krócej niż pół minuty? A jakie, że rozmowa potrwa
dłużej niż 2 minuty?
Rozkład wykładniczy
Wiadomo, że zmienna losowa X, wyrażająca czas rozmowy
losowo wybranej osoby ma rozkład wykładniczy, oraz że
E(X)=50. Aby wyznaczyć funkcję gęstości zmiennej X, należy
znaleźć parametr λ rozkładu:
E(X) = λ

λ = 50
Zatem funkcja gęstości prawdopodobieństwa zdefiniowana jest
następująco:
0


f (x )   1
e

 50

dla
x  0
dla
x  0
x
50
Rozkład wykładniczy
Dystrybuanta zmiennej losowej X:
0


F(x )  
1  e

dla
x  0
dla
x  0
x
50
P(X < 30) = F(30) = 1 – e-30/50 = 1 – e-0,6 = 1 – 0,549 = 0,451
P(X > 120) = 1 – P(X < 120) = 1 – F(120) = 1 – 1 + e-120/50 =
= e-2,4 = 0,091
Rozkład normalny
Rozkład normalny, nazywany także rozkładem Gaussa
spełnia bardzo ważną rolę, zarówno w statystyce
matematycznej jak i naukach przyrodniczych. Bardzo wiele
metod statystycznych opiera się na zastosowaniu tego rozkładu.
Obserwacja wielu zjawisk przyrodniczych pozwoliła stwierdzić,
że odbywają się one zgodnie z rozkładem normalnym, lub
bardzo zbliżonym do niego. Wynika to z centralnego
twierdzenia granicznego, zgodnie z którym suma dużej
liczby zmiennych losowych o dowolnym, takim samym
rozkładzie zbliża się do rozkładu normalnego. Np. strumień
światła, składa się z fotonów, których emitowana energia
odpowiada rozkładowi Poissona, jednak obserwowany strumień
w skali makro, złożony z ogromnej liczby pojedynczych fotonów
ma rozkład normalny.
Rozkład normalny
Zmienna losowa X ma rozkład normalny z parametrami μ i σ,
jeżeli funkcja gęstości i dystrybuanta określone są wzorami:
0,45
0,4
dla
σ
2π
e

2σ
2
0,35
2
0,3
0,25
P
f (x ) 
1
(x μ )
0,2
   x  
0,15
0,1
0,05
0
1
0,9
dla
σ
2π
(x μ )
e

   x  
2σ
2
2
0,8
0,7
dx
0,6
F(x)
F(x ) 
1

0,5
0,4
0,3
0,2
0,1
0
Rozkład normalny
F(x ) 
1
σ
2π

e
(x μ )
2σ
2
2
dx

Niemożliwe jest przedstawienie dystrybuanty rozkładu
normalnego w prostszej postaci, ponieważ nie da się wyrazić
całki zawarta we wzorze w postaci funkcji elementarnych.
Z tego względu obliczenie wartości dystrybuanty rozkładu
normalnego w punkcie x jest bardzo złożone. W sytuacji, gdy
konieczna jest znajomość wartości dystrybuanty, można
skorzystać z tablic matematycznych. Można także obliczyć
wartość dystrybuanty korzystając z komputera. Np. w arkuszu
kalkulacyjnym Microsoft Excel można to zrobić za pomocą
funkcji:
=ROZKŁAD.NORMALNY(x;μ;σ;1)
Rozkład normalny
W tablicach matematycznych, podane są wartości dystrybuanty
dla różnych wartości x dla rozkładu standaryzowanego. Rozkład
standaryzowany, to rozkład normalny o parametrach:
μ = 0 i σ = 1, co zapisuje się: N(0, 1). Aby odczytać z tablicy
wartość dystrybuanty dla zmiennej losowej X o rozkładzie
normalnym z innymi parametrami μ i σ, należy dokonać jej
standaryzacji, to znaczy należy zdefiniować pomocniczą
zmienną losową Z, poprzez przekształcenie zmiennej X, która
będzie miała rozkład N(0, 1):
X ~ N( μ , σ )  Z 
X  μ
σ
~ N ( 0 ,1 )
A zatem:
F X ( x )  FZ (
x μ
σ
), gdzie Z ~ N(0,1)
Rozkład normalny
Na przykład wartość dystrybuanty rozkładu normalnego o
parametrach N(5,2) w punkcie 7, odpowiada wartości
dystrybuanty rozkładu standaryzowanego N(0,1) w punkcie:
(7 – 5) / 2 = 1
Rozkład normalny
Charakterystyki liczbowe rozkładu wykładniczego – wartość
oczekiwaną, wariancję, medianę i wartość modalną opisują
wzory:
E(X)  μ
V(X)  σ
2
Me  μ
Mo  μ
Jak łatwo zauważyć, wartość oczekiwana, mediana i wartość
modalna dla rozkładu normalnego o parametrach μ i σ znajdują
się w tym samym punkcie μ, co wynika z symetrii rozkładu.
Rozkład normalny
Przykład:
Wydajność produkcyjna pewnego zakładu jest zmienną losową
o rozkładzie normalnym, z wartością oczekiwaną 12 ton/h i
odchyleniem standardowym 2 tony/h. Jakie jest
prawdopodobieństwo, że wydajność będzie:
- mniejsza niż 15 ton/h,
- mniejsza niż 7 ton/h,
- większa niż 14 ton/h,
- mieści się w przedziale od 8 do 12 ton/h?
Rozkład normalny
Zmienna losowa ma rozkład X ~ N(12,2), zatem:
P(X < 15) = F(15) = FN(0,1)((15 – 12) / 2) = FN(0,1)(1,5) = 0,933
P(X < 7) = F(7) = FN(0,1)((7 – 12) / 2) = FN(0,1)(-2,5) = 0,006
P(X > 14) = 1 – F(14) = 1 – FN(0,1)((14 – 12) / 2) =
= 1 – FN(0,1)(1) = 1 – 0,841 = 0,159
P(8 < X < 12) = F(12) – F(8) =
= FN(0,1)((12 – 12) / 2) – FN(0,1)((8 – 12) / 2) =
= FN(0,1)(0) – FN(0,1)(-2) = 0,500 – 0,023 = 0,477
Inne rozkłady ciągłe
Istnieje wiele innych ważnych rozkładów ciągłych, których
wartości można odnaleźć w tablicach:
1. Rozkład t-Studenta z jednym parametrem ν nazywanym
liczbą stopni swobody.
2. Rozkład χ-kwadrat (chi-kwadrat) również z jednym
parametrem n lub df nazywanym liczbą stopni swobody.
3. Rozkład Fishera- Snedecora.
4. Rozkład Gamma
i wiele innych.