Wnioskowanie statystyczne

Download Report

Transcript Wnioskowanie statystyczne

Wnioskowanie statystyczne

dr Ewa Putek-Szeląg

Katedra Ekonometrii i Statystyki e-mail: [email protected]

Tel. (91) 444 19 63 Konsultacje: czwartek godz. 10

00

–12

00

, pok. 212

Wnioskowanie statystyczne

Literatura:

1.

2.

3.

4.

5.

Hozer J., Kolanko E., Korol M., Lasota B., Witek M.,

Statystyka. Część II. Wnioskowanie statystyczne

, Wydawnictwo Naukowe Uniwersytetu Szczecińskiego, Szczecin 1994.

Jóźwiak J., Podgórski J.,

Statystyka od podstaw

, PWE, Warszawa 2006, Aczel A. D.,

Statystyka w zarządzaniu

, PWN, Warszawa 2000 .

Greń J.,

Statystyka matematyczna, modele i zadania

, PWN, Warszawa 1987 Balicki A., Makać W.,

Metody wnioskowania statystycznego,

Wydawnictwo Uniwersytetu Gdańskiego, Gdańsk 2007. 6.

7.

8.

9.

Luszniewicz A.,

Statystyka nie jest trudna. Metody wnioskowania statystycznego

, PWE, Warszawa 1999.

Domański C.,

Testy statystyczne

, PWE, Warszawa 1990.

Fisz M.,

Rachunek prawdopodobieństwa i statystyka matematyczna

, PWN, Warszawa 1976.

Domański C., Pruska K.,

Nieklasyczne metody statystyczne

, PWE, Warszawa 2000. 10. Bąk I., Markowicz I., Mojsiewicz M., Wawrzyniak K.,

Statystyka w zadaniach. Cz. II,

Wydawnictwo Naukowo-Techniczne, Warszawa 2001.

11. Krysicki W., Bartos J., Dyczka W., Królikowska K., Wasilewski M.,

Rachunek prawdopodobieństwa i statystyka matematyczna w zadaniach. Część 2. Statystyka matematyczna,

Wydawnictwo Naukowe PWN, Warszawa 2002.

12. Bąk I., Markowicz I., Mojsiewicz M., Wawrzyniak K.,

Wzory i tablice statystyczne

, Katedra Ekonometrii i Statystyki US, Stowarzyszenie Pomoc i Rozwój, Szczecin 1997.

Właściwości prawdopodobieństwa

:

(a) A A A i B A*B B (b) ~ A A+( ~ A)= W A lub B (A+B) (d) (e) A B W Zdarzenia rozłączne A, B Zdarzenie pewne W (suma wszystkich zdarzeń możliwych) Jeśli A, B, .. są zdarzeniami rozłącznymi (wykluczają się wzajemnie) to P(A  B  …) = P(A) + P(B) + ...

Jeśli W jest zdarzeniem pewnym to P( W ) = 1 (patrz rysunek d) (patrz rysunek e) Stąd wynika, że dla dowolnego zdarzenia A 0  P(A)  1 P(A’) = 1 - P(A) Dla dowolnych zdarzeń A i B (patrz rysunek a) P(A  B) = P(A) + P(B)

P(A  B) (patrz rysunki b, c) (c)

Wnioskowanie statystyczne

Wnioskowanie statystyczne Przykład

1. W sklepie znajdują się magnetowidy trzech firm: I, II, III: 3 razy tyle magnetowidów firmy I co magnetowidów firmy II, a 5 razy tyle magnetowidów firmy I co magnetowidów firmy III. Jakie jest prawdopodobieństwo, że wybierając losowo magnetowid, trafimy na magnetowid firmy II?

Niech A oznacza zdarzenie polegające na tym, że trafimy na magnetowid firmy II. Oznaczmy ilość magnetowidów firmy II przez x. Wtedy magnetowidów firmy I będzie 3x, a firmy III będzie 3/5x magnetowidów. Stąd szukane prawdopodobieństwo jest równe: P ( A )

m

n x x

3 x

3 5 x

x 23 x 5

5 23 2. Rzucamy kostką do gry. Jakie jest prawdopodobieństwo, że wypadnie parzysta liczba oczek?

W – {1, 2, 3, 4, 5, 6} A

{2, 4, 6} P ( A )

m n

3 6

1 2

Wnioskowanie statystyczne Przykład

Żarówki są produkowane w 3 fabrykach. Z fabryki pierwszej pochodzi 25% produkcji, z fabryki drugiej 35% produkcji a z trzeciej 40%.

Produkcja wadliwa wynosi odpowiednio: dla fabryki I – 5%, dla fabryki II – 4%, dla fabryki III – 2%.

Wybrana żarówka okazała się wadliwa – jakie jest prawdopodobieństwo, ze pochodzi ona z fabryki pierwszej?

Zakładamy: B 1

wybrana żarówka pochodzi z fabryki I, B 2

wybrana żarówka pochodzi z fabryki II, B 3

wybrana żarówka pochodzi z fabryki III, A

wybrana żarówka jest wadliwa.

Szukamy P(B 1  A).

Mamy: P(B 1 ) = 0,25; P(B 2 ) = 0,35; P(B 3 ) = 0,40; P(A  B 1 ) = 0,05; P(A  B 2 ) = 0:04; P(A  B 3 ) = 0:02

P

B

1

A

 

( 0 , 25

0 , 05 ) 0 , 25

0 , 05

( 0 , 35

0 , 04 )

( 0 , 4

0 , 02 )

0 , 3623

Wnioskowanie statystyczne Przykład

W pudełku jest 10 losów ponumerowanych od 1 do 10. Na los z numerem 1 pada główna wygrana 10 zł, na losy z numerami 2 i 3 wygrana pocieszenia w wysokości 1 zł, a za wyciągnięcie pozostałych płacimy 2 zł. Załóżmy, że wyciągnięcie każdego z losów jest jednakowo prawdopodobne. Doświadczenie polega na wyciągnięciu jednego losu. Przestrzeń zdarzeń elementarnych W = {1, 2, ..., 10} i jest skończona. Określmy funkcję X będzie zmienną losową skokową oznaczającą wygraną, gdzie A = {-2, 1, 10}. Zauważmy, że X(1) = 10, X(2) = X(3) = 1, X(4) = X(5) = ... = X(10) = -2.

Rozkład prawdopodobieństwa zmiennej losowej X

wartość zmiennej losowej prawdopodobieństwo -2 0,7

Dystrybuanta zmiennej losowej X

x   2  2  x  1 1  x  10 x  10  F ( x )  P ( X  x )     F ( x ) F ( x ) F ( x )    x

 x x i

 x x i i

 x p p p i i i x i

 x p i  p 1  0 , 7  p 1  p 2  p 1  p 2  0  0 , 9  p 3  1 1 0,2 10 0,1 F ( x )

    

0 0 0 , , 7 1 9 dla dla dla dla x

2

 

2

x

1 1

x x

 

10 10

Wnioskowanie statystyczne Przykład

Dana jest dystrybuanta zmiennej losowej X x F(x) (– ∞, 0] 0 (0, 1] 1/3 (1, 3] 1/2 Znaleźć rozkład prawdopodobieństwa zmiennej losowej X.

p 1  P

X  0

 x lim  0  F

   

 1 3  0  1 3 p 2  P

X  1

 x lim  1  F

   

 1 2  1 3  1 6 p 3  P

X  3

 lim x  3  F

   

 5 6  1 2  1 3 p 4  P

X  6

 x lim  6  F

   

 1  5 6  1 6 x i p i 0 1/3 1 1/6 3 1/3 6 1/6 (3, 6] 5/6 (6, +∞) 1

Wnioskowanie statystyczne Przykład

W loterii wypuszczono 500 losów, w tym jeden los z wygraną 1000 zł, pięć losów z wygraną po 200 zł i dwadzieścia losów – po 50 zł. Określić rozkład zmiennej losowej X, będącej wielkością możliwej wygranej osoby, która kupiła jeden los. Obliczyć wartość oczekiwaną i odchylenie standardowe tak określonej zmiennej losowej. Jeżeli zmienna losowa X jest wielkością wygranej właściciela jednego losu to przyjmie wartości 0, 50, 200 lub 1000. Prawdopodobieństwo przyjęcia przez X wartości 1000 jest równe 1/500, wartości 200 wynosi 5/500, wartości 50 jest równe 20/500 a wartości 0, czyli bez wygranej 474/500. Rozkład zmiennej losowej można przedstawić w tabeli: x i p i 0 0,948 50 0,040 200 0,010 1000 0,002 E ( X )  0  0 , 948  50  0 , 040  200  0 , 010  1000  0 , 002  0  2  2  2  6 D 2 ( X )  0 2  0 , 948  50 2  0 , 040  200 2  0 , 010  1000 2  0 , 002  36  100  400  2000  36  2464 Wartość oczekiwana oznacza, że średnia wygrana właściciela jednego losu wynosi 6 zł. Odchylenie standardowe równe około 49,6 zł oznacza, że wygrana właściciela jednego losu przeciętnie odchyla się od średniej o prawie 50 zł.

Wnioskowanie statystyczne

Typ rozkładu

zero – jedynkowy dwumianowy Poissona hipergeo metryczny

Wybrane rozkłady zmiennej losowej skokowej Funkcja rozkładu

(

 i

)

  1 0 ) )  p q 1 p  k ) 

 k

)

  k )   k N   k  M  N n

Dystrybuanta

(

)

) 

k r    0 1 n  r

 k ) )  

k r    1 0 r k 

 0 1

r

e

 

r !

   

Parametry E(X), D(X)

p p ( 1  p )

np npq

 

np np N N   n 1

Wnioskowanie statystyczne

Prawdopodobieństwa odpowiadające poszczególnym wartościom (realizacjom zmiennej losowej X) są następujące: P ( X  0 )  ( 5 0 )( 0 , 1 ) 0 ( 0 , 9 ) 5  5 !

0 !

( 5  0 )!

 1  0 , 59  1  1  0 , 59  0 , 59 P ( X  1 )  ( 1 5 )( 0 , 1 ) 1 ( 0 , 9 ) 4  1 !

( 5 5 !

 1 )!

 0 , 1  0 , 66  5  0 , 1  0 , 66  0 , 33 P ( X  2 )  ( 5 2 )( 0 , 1 ) 2 ( 0 , 9 ) 3  5 !

2 !

( 5  2 )!

 0 , 01  0 , 73  10  0 , 01  0 , 73  0 , 073 P ( X  3 )  ( 5 3 )( 0 , 1 ) 3 ( 0 , 9 ) 2  3 !

( 5 5 !

 3 )!

 0 , 001  0 , 81  10  0 , 001  0 , 81  0 , 0081 P ( X  4 )  ( 5 4 )( 0 , 1 ) 4 ( 0 , 9 ) 1  5 !

4 !

( 5  4 )!

 0 , 0001  0 , 9  5  0 , 0001  0 , 9  0 , 00045 P ( X  5 )  ( 5 5 )( 0 , 1 ) 5 ( 0 , 9 ) 0  5 !

( 5 5 !

 5 )!

 0 , 00001  1  1  0 , 00001  1  0 , 00001

P(X > 2) = P(X = 3) + P(X = 4) + P(X = 5) = 0,0081 + 0,00045 + 0,00001 = 0,00856

Możliwe jest również wyznaczenie prawdopodobieństwa w oparciu o dystrybuantę P(X > 2) = 1 – P(X  2) = 1 – F(2)

Wnioskowanie statystyczne Przykład

Obliczyć prawdopodobieństwo wylosowania co najwyżej trzech osób leworęcznych w 200 losowaniach, jeśli wiadomo, że prawdopodobieństwo spotkania osoby leworęcznej w pewnej populacji ludzi wynosi 0,05. Ponieważ spełnione są warunki: p = 0,05 < 0,1 oraz N = 200 > 50, zatem mamy do czynienia z rozkładem Poissona. Wówczas   0 , 05  200  10 P

0  k  3

 

k  0

 

k  1

 

k  2

 

k  3

P  0  k  3   e  10 10 0 0 !

 e  10 10 1 1 !

 e  10 10 2 2 !

 e  10 10 3 3 !

  e  10  10 e  10  100 2 e  10  1000 6 e  10  e  10  10 e  10  50 e  10  500 e  10 3   683 e  10 3  683 3  e 10  683 3  20589  683 61767  0 , 011 Prawdopodobieństwo wylosowania co najwyżej trzech osób leworęcznych wynosi 0,011.

Wnioskowanie statystyczne

Wybrane rozkłady zmiennej losowej ciągłej Typ rozkładu

równomierny wykładniczy normalny

Funkcja gęstości f(x)

    0 , 1 ,    1   0 , e  x  , x  0

(  ) 2  1 2 

e

2  2

    

Dystrybuanta F(x)

     0 , x a b a 1 , , a    1  0  ,  x e  , x  poza tym 0   1 2  x    e (  ) 2 2  2 dx

Parametry E(X), D(X)

2 ( b a ) 2 12 , 

Wnioskowanie statystyczne

Rozkład równomierny

(prostokątny, jednostajny) jest najprostszym rozkładem zmiennej losowej typu ciągłego. Rozkład ten bywa czasem stosowany w sytuacji, gdy można przypuszczać, że każda wartość zmiennej w pewnym przedziale liczbowym jest jednakowo możliwa.

Rozkład wykładniczy

jest jedynym rozkładem ciągłym, który ma własność zwaną brakiem pamięci. Własność tę można interpretować następująco: jeżeli zmienna losowa X jest czasem bezawaryjnej pracy pewnego elementu o rozkładzie wykładniczym, to niezależnie od dotychczasowego czasu pracy elementu, dalszy czas pracy nie zależy od „przeszłości” i ma taki sam rozkład, co całkowity czas pracy elementu.

Wnioskowanie statystyczne

Zmienna losowa

X

ma

rozkład normalny

o parametrach X: N(  ,  ), jeżeli jej funkcja gęstości wyraża się wzorem:  oraz  , co w skrócie zapisuje się jako

funkcja gęstości

0,4

f ( x )

 

1 2

e

 ( x   ) 2 2  2

, gdzie

  

x

 

i

 

0

0,3 0,2 0,1 -1 0 0 -4 -3 -2 1 2 3 Dystrybuantą zmiennej losowej X mającej rozkład normalny jest funkcją F(x) określona na zbiorze liczb rzeczywistych o postaci: F ( x )   1 2  x    e  ( t   ) 2 2  2 dt -4 -3

dystrybuanta rozkładu normalnego

1 0,8 -2 0,6 0,4 0,2 -1 0 0 1 2 3 4 4

Wnioskowanie statystyczne

Funkcja gęstości w rozkładzie normalnym: – jest symetryczna względem prostej

x

=  (osią symetrii jest prosta pionowa przechodząca przez punkt x = μ), jest rosnąca dla x < μ, a malejąca dla x > μ – w punkcie

x =

 osiąga wartość maksymalną – ramiona funkcji mają punkty przegięcia dla x = 

- σ

oraz

x =

 – kształt funkcji gęstości zależy od wartości parametrów: 

+ σ

i

σ

. Parametr  decyduje o przesunięciu krzywej, natomiast parametr

σ

decyduje o „smukłości” krzywej (im mniejsza jest wariancja/odchylenie standardowe, tym wykres gęstości prawdopodobieństwa jest bardziej wysmukły) 0,5 N(0,1) N(3,1) N(0,2) N(3,2) -4 -3 -2 -1 0 0 1 2 3 4

Wnioskowanie statystyczne

Wartość oczekiwana i wariancja

dla rozkładu normalnego wyrażane są następującymi wzorami:

E ( X )

    

x

1 2

e

 ( x   ) 2 2  2

dx

 

D

2

( X )

    

( x

 

)

2 

1 2

e

 ( x   ) 2 2  2

dx

  2 Wartość  jest to taka wartość zmiennej losowej X, wokół której skupiają się wyniki wielokrotnych realizacji tej zmiennej. Innymi słowy, oczekuje się (ma się nadzieję), że wielokrotne realizacje zmiennej losowej X będą skupiały się wokół liczby  .

Wnioskowanie statystyczne

Reguła trzech sigm

Funkcja gęstości rozkładu normalnego ma zastosowanie do reguły „trzech sigma”, którą następnie rozwinięto na regułę „sześć sigma” – stosowaną w kontroli jakości, przede wszystkim w USA (np. General Electric, General Motors Company) Reguła trzech sigma – jeżeli zmienna losowa ma rozkład normalny to: – 68,3 % populacji mieści się w przedziale ( 

- σ;

+ σ)

– 95,5 % populacji mieści się w przedziale ( 

- 2σ;

+ 2σ)

– 99,7 % populacji mieści się w przedziale ( 

- 3σ;

+ 3σ)

Reguła ta ma duże znaczenie w teorii błędów obserwacji, bowiem błędy przypadkowe pomiarów tej samej wielkości fizycznej zwykle tak się rozkładają, że wyniki tych pomiarów mają rozkład normalny. Rozkład ten nie wystąpi, gdy popełniony zostanie tendencyjny błąd systematyczny.

Wnioskowanie statystyczne

Tablica dystrybuanty rozkładu normalnego N(0, 1)

→ dla u =1,64  F u = 1,64) = F u = 1,64 = 0,949497

u 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3 0

0,500000 0,539828 0,579260 0,617911 0,655422 0,691462 0,725747 0,758036 0,788145 0,815940 0,841345 0,864334 0,884930 0,903199 0,919243 0,933193 0,945201 0,955435 0,964070 0,971284 0,977250 0,982136 0,986097 0,989276 0,991802 0,993790 0,995339 0,996533 0,997445 0,998134 0,998650

0,01

0,503989 0,543795 0,583166 0,621719 0,659097 0,694974 0,729069 0,761148 0,791030 0,818589 0,843752 0,866500 0,886860 0,904902 0,920730 0,934478 0,946301 0,956367 0,964852 0,971933 0,977784 0,982571 0,986447 0,989556 0,992024 0,993963 0,995473 0,996636 0,997523 0,998193 0,998694

0,02

0,507978 0,547758 0,587064 0,625516 0,662757 0,698468 0,732371 0,764238 0,793892 0,821214 0,846136 0,868643 0,888767 0,906582 0,922196 0,935744 0,947384 0,957284 0,965621 0,972571 0,978308 0,982997 0,986791 0,989830 0,992240 0,994132 0,995603 0,996736 0,997599 0,998250 0,998736

0,03

0,511967 0,551717 0,590954 0,629300 0,666402 0,701944 0,735653 0,767305 0,796731 0,823814 0,848495 0,870762 0,890651 0,908241 0,923641 0,936992 0,948449 0,958185 0,966375 0,973197 0,978822 0,983414 0,987126 0,990097 0,992451 0,994297 0,995731 0,996833 0,997673 0,998305 0,998777

0,04

0,515953 0,555670 0,594835 0,633072 0,670031 0,705402 0,738914 0,770350 0,799546 0,826391 0,850830 0,872857 0,892512 0,909877 0,925066 0,938220 0,949497 0,959071 0,967116 0,973810 0,979325 0,983823 0,987455 0,990358 0,992656 0,994457 0,995855 0,996928 0,997744 0,998359 0,998817

0,05

0,519939 0,559618 0,598706 0,636831 0,673645 0,708840 0,742154 0,773373 0,802338 0,828944 0,853141 0,874928 0,894350 0,911492 0,926471 0,939429 0,950529 0,959941 0,967843 0,974412 0,979818 0,984222 0,987776 0,990613 0,992857 0,994614 0,995975 0,997020 0,997814 0,998411 0,998856

0,06

0,523922 0,563559 0,602568 0,640576 0,677242 0,712260 0,745373 0,776373 0,805106 0,831472 0,855428 0,876976 0,896165 0,913085 0,927855 0,940620 0,951543 0,960796 0,968557 0,975002 0,980301 0,984614 0,988089 0,990863 0,993053 0,994766 0,996093 0,997110 0,997882 0,998462 0,998893

0,07

0,527903 0,567495 0,606420 0,644309 0,680822 0,715661 0,748571 0,779350 0,807850 0,833977 0,857690 0,878999 0,897958 0,914656 0,929219 0,941792 0,952540 0,961636 0,969258 0,975581 0,980774 0,984997 0,988396 0,991106 0,993244 0,994915 0,996207 0,997197 0,997948 0,998511 0,998930

0,08

0,531881 0,571424 0,610261 0,648027 0,684386 0,719043 0,751748 0,782305 0,810570 0,836457 0,859929 0,881000 0,899727 0,916207 0,930563 0,942947 0,953521 0,962462 0,969946 0,976148 0,981237 0,985371 0,988696 0,991344 0,993431 0,995060 0,996319 0,997282 0,998012 0,998559 0,998965

0,09

0,535856 0,575345 0,614092 0,651732 0,687933 0,722405 0,754903 0,785236 0,813267 0,838913 0,862143 0,882977 0,901475 0,917736 0,931888 0,944083 0,954486 0,963273 0,970621 0,976705 0,981691 0,985738 0,988989 0,991576 0,993613 0,995201 0,996427 0,997365 0,998074 0,998605 0,998999

Wnioskowanie statystyczne

W celu obliczenia prawdopodobieństwa P(a < X  losowa X ma rozkład N( ,  b) należy skorzystać ze standaryzacji. Jeśli zmienna to zmienna standaryzowana u ma rozkład N(0,1), czyli:   )  P   a     X     b       F   b       F   a      .

Wartości F   b      oraz rozkładu normalnego.

F   a      należy odczytać w tablicach dystrybuanty standaryzowanego

Przykład

Dany jest rozkład zmiennej losowej X o parametrach N(15; 5). Obliczyć: a) P(X<12) b) P(X>14) c) P{12 < X < 14} a) P{X < 12} = F u   c) P{12 < X < 14} = 12 15 5    F u F u b) P{X > 14} = 1 – P{X < 14}= 1 –   14 15 5        F u F u     14 15 5  12 15 5    F u 1   F u

  

F u    

Wnioskowanie statystyczne Przykład

Wzrost kobiet w pewnej populacji ma rozkład normalny N(165,15). Oznacza to, iż zmienna losowa jaką jest wzrost kobiet ma rozkład normalny ze średnią równą 165 cm i odchyleniem standardowym równym 15 cm. Jaki jest udział w populacji kobiet o wzroście: a) do 160 cm, b) c) w przedziale 165-170 cm, powyżej 175 cm.

a ) P ( X  160 )  F u 160  165 15  F u (  0 , 33 )  1  F u ( 0 , 33 )  1  0 , 6293  0 , 3707 b ) P ( 165  X  170 )  F u 170  165 15  F u 165  165 15  F u ( 0 , 33 )  F u ( 0 )  0 , 6293  0 , 5  0 , 1293 c ) P ( X  175 )  1  P ( U  175 )  1  F u 175  165 15  1  F u  0 , 67   1  0 , 748571  0 , 251429

Wnioskowanie statystyczne Przykład

Zmienna losowa X ma rozkład N(20; 5). Obliczyć k i , wiedząc, że a ) P { X  k 1 }  0 , 8849 b ) c ) P { X P { X  k 2   }   k 4 0 , 6554 }  0 , 0 , 00511 a ) P { X  k 1 }  0 , 8849 F u   k 1  5 20     k 1  20 5   k 1  26 b ) c ) P { X  k 2 }  0 , 6554  1  P { X  k 2 }  0 , 6554  P { X  k 2 }  0 , 3446 F u   k 2  5 20     k 2  20 5   ,  k 2  18 P { X    k 4 }  1  P { X    k 4 }  0 , 0 , 00511  P {  k 4  X    k 4 }  0 , 99489 F u F u k 4 k 5 3  20  5 20  F u  k 4  20  20 5   0 , 99744  k 3 5  2 , 8  k 3  14 0 , 99489  2  F u k 3 5  1  0 , 99489 

Wnioskowanie statystyczne

poziom istotności l.ss

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 0,99

0,000 0,020 0,115 0,297 0,554

0,975

0,001 0,051 0,216 0,484 0,831

0,95

0,004 0,103 0,352 0,711 1,145

0,9

0,016 0,211 0,584 1,064 1,610

0,8

0,064 0,446 1,005 1,649 2,343

0,7

0,148 0,713 1,424 2,195 3,000

0,6

0,275 1,022 1,869 2,753 3,656

0,5

0,455 1,386 2,366 3,357 4,351

0,4

0,708 1,833 2,946 4,045 5,132

0,3

1,074 2,408 3,665 4,878 6,064

0,2

1,642 3,219 4,642 5,989 7,289

0,1 0,05 0,025 0,01 0,005

2,706 4,605 6,251 7,779 9,236 3,841 5,991 7,815 9,488 11,070 5,024 7,378 9,348 11,143 12,832 6,635 9,210 11,345 13,277 15,086 5,024 7,378 9,348 11,143 12,832 0,872 1,239 1,647 2,088 2,558 3,053 3,571 4,107 4,660 5,229 5,812 6,408 7,015 7,633 8,260 1,237 1,690 2,180 2,700 3,247 3,816 4,404 5,009 5,629 6,262 6,908 7,564 8,231 8,907 9,591 1,635 2,167 2,733 3,325 3,940 4,575 5,226 5,892 6,571 7,261 7,962 8,672 9,390 10,117 10,851 2,204 2,833 3,490 4,168 4,865 9,312 10,085 10,865 11,651 12,443 3,070 3,822 4,594 5,380 6,179 5,578 6,304 7,041 7,790 8,547 6,989 7,807 8,634 9,467 10,307 11,152 12,002 12,857 13,716 14,578 3,828 4,671 5,527 6,393 7,267 12,624 13,531 14,440 15,352 16,266 4,570 5,493 6,423 7,357 8,295 8,148 9,034 9,926 10,821 11,721 9,237 10,182 11,129 12,078 13,030 13,983 14,937 15,893 16,850 17,809 5,348 6,346 7,344 8,343 9,342 6,211 7,283 8,351 9,414 10,473 10,341 11,340 12,340 13,339 14,339 15,338 16,338 17,338 18,338 19,337 11,530 12,584 13,636 14,685 15,733 16,780 17,824 18,868 19,910 20,951 7,231 8,383 9,524 10,656 11,781 8,558 9,803 11,030 12,242 13,442 12,899 14,011 15,119 16,222 17,322 18,418 19,511 20,601 21,689 22,775 14,631 15,812 16,985 18,151 19,311 20,465 21,615 22,760 23,900 25,038 10,645 12,017 13,362 14,684 15,987 17,275 18,549 19,812 21,064 22,307 23,542 24,769 25,989 27,204 28,412 12,592 14,067 15,507 16,919 18,307 19,675 21,026 22,362 23,685 24,996 26,296 27,587 28,869 30,144 31,410 14,449 16,013 17,535 19,023 20,483 21,920 23,337 24,736 26,119 27,488 28,845 30,191 31,526 32,852 34,170 16,812 18,475 20,090 21,666 23,209 24,725 26,217 27,688 29,141 30,578 32,000 33,409 34,805 36,191 37,566 14,449 16,013 17,535 19,023 20,483 21,920 23,337 24,736 26,119 27,488 28,845 30,191 31,526 32,852 34,170

Wnioskowanie statystyczne

1 1 1 2 1 3 1 4 1 5 1 6 1 7 1 8 1 9 2 0 6 7 8 9 1 0 4 5 1 2 3 k

α 0,9

0 , 1 5 8 0 , 1 4 2 0 , 1 3 7 0 , 1 3 4 0 , 1 3 2 0 , 1 3 1 0 , 1 3 0 0 , 1 3 0 0 , 1 2 9 0 , 1 2 9

0,8

0 , 3 2 5 0 , 2 8 9 0 , 2 7 7 0 , 2 7 1 0 , 2 6 7 0 , 2 6 5 0 , 2 6 3 0 , 2 6 2 0 , 2 6 1 0 , 2 6 0

0,7

0 , 5 1 0 0 , 4 4 5 0 , 4 2 4 0 , 4 1 4 0 , 4 0 8 0 , 4 0 4 0 , 4 0 2 0 , 3 9 9 0 , 3 9 8 0 , 3 9 7

0,6

0 , 7 2 7 0 , 6 1 7 0 , 5 8 4 0 , 5 6 9 0 , 5 5 9 0 , 5 5 3 0 , 5 4 9 0 , 5 4 6 0 , 5 4 3 0 , 5 4 2

0,5

1 , 0 0 0 0 , 8 1 6 0 , 7 6 5 0 , 7 4 1 0 , 7 2 7 0 , 7 1 8 0 , 7 1 1 0 , 7 0 6 0 , 7 0 3 0 , 7 0 0 0 , 1 2 9 0 , 1 2 8 0 , 1 2 8 0 , 1 2 8 0 , 1 2 8 0 , 1 2 8 0 , 1 2 8 0 , 1 2 7 0 , 1 2 7 0 , 1 2 7 0 , 2 6 0 0 , 2 5 9 0 , 2 5 9 0 , 2 5 8 0 , 2 5 8 0 , 2 5 8 0 , 2 5 7 0 , 2 5 7 0 , 2 5 7 0 , 2 5 7 0 , 3 9 6 0 , 3 9 5 0 , 3 9 4 0 , 3 9 3 0 , 3 9 3 0 , 3 9 2 0 , 3 9 2 0 , 3 9 2 0 , 3 9 1 0 , 3 9 1 0 , 5 4 0 0 , 5 3 9 0 , 5 3 8 0 , 5 3 7 0 , 5 3 6 0 , 5 3 5 0 , 5 3 4 0 , 5 3 4 0 , 5 3 3 0 , 5 3 3 0 , 6 9 7 0 , 6 9 5 0 , 6 9 4 0 , 6 9 2 0 , 6 9 1 0 , 6 9 0 0 , 6 8 9 0 , 6 8 8 0 , 6 8 8 0 , 6 8 7 0 , 8 7 6 0 , 8 7 3 0 , 8 7 0 0 , 8 6 8 0 , 8 6 6 0 , 8 6 5 0 , 8 6 3 0 , 8 6 2 0 , 8 6 1 0 , 8 6 0

0,4

1 , 3 7 6 1 , 0 6 1 0 , 9 7 8 0 , 9 4 1 0 , 9 2 0 0 , 9 0 6 0 , 8 9 6 0 , 8 8 9 0 , 8 8 3 0 , 8 7 9 1 , 0 8 8 1 , 0 8 3 1 , 0 7 9 1 , 0 7 6 1 , 0 7 4 1 , 0 7 1 1 , 0 6 9 1 , 0 6 7 1 , 0 6 6 1 , 0 6 4

0,3

1 , 9 6 3 1 , 3 8 6 1 , 2 5 0 1 , 1 9 0 1 , 1 5 6 1 , 1 3 4 1 , 1 1 9 1 , 1 0 8 1 , 1 0 0 1 , 0 9 3 1 , 3 6 3 1 , 3 5 6 1 , 3 5 0 1 , 3 4 5 1 , 3 4 1 1 , 3 3 7 1 , 3 3 3 1 , 3 3 0 1 , 3 2 8 1 , 3 2 5

0,2

3 , 0 7 8 1 , 8 8 6 1 , 6 3 8 1 , 5 3 3 1 , 4 7 6 1 , 4 4 0 1 , 4 1 5 1 , 3 9 7 1 , 3 8 3 1 , 3 7 2 1 , 7 9 6 1 , 7 8 2 1 , 7 7 1 1 , 7 6 1 1 , 7 5 3 1 , 7 4 6 1 , 7 4 0 1 , 7 3 4 1 , 7 2 9 1 , 7 2 5

0,1

6 , 3 1 4 2 , 9 2 0 2 , 3 5 3 2 , 1 3 2 2 , 0 1 5 1 , 9 4 3 1 , 8 9 5 1 , 8 6 0 1 , 8 3 3 1 , 8 1 2 1 , 8 5 9 1 , 8 4 4 1 , 8 3 2 1 , 8 2 1 1 , 8 1 2 1 , 8 0 5 1 , 7 9 8 1 , 7 9 2 1 , 7 8 6 1 , 7 8 2

0,09

7 , 0 2 6 3 , 1 0 4 2 , 4 7 1 2 , 2 2 6 2 , 0 9 8 2 , 0 1 9 1 , 9 6 6 1 , 9 2 8 1 , 8 9 9 1 , 8 7 7

0,08

7 , 9 1 6 3 , 3 2 0 2 , 6 0 5 2 , 3 3 3 2 , 1 9 1 2 , 1 0 4 2 , 0 4 6 2 , 0 0 4 1 , 9 7 3 1 , 9 4 8

0,07

9 , 0 5 8 3 , 5 7 8 2 , 7 6 3 2 , 4 5 6 2 , 2 9 7

0,06

1 0 , 5 7 9 3 , 8 9 6 2 , 9 5 1 2 , 6 0 1 2 , 4 2 2

0,05

1 2 , 7 0 6 4 , 3 0 3 3 , 1 8 2 2 , 7 7 6 2 , 5 7 1

0,04

1 5 , 8 9 4 4 , 8 4 9 3 , 4 8 2 2 , 9 9 9 2 , 7 5 7

0,03

2 1 , 2 0 5 5 , 6 4 3 3 , 8 9 6 3 , 2 9 8 3 , 0 0 3

0,02

3 1 , 8 2 1 6 , 9 6 5 4 , 5 4 1 3 , 7 4 7 3 , 3 6 5

0,01

6 3 , 6 5 6 9 , 9 2 5 5 , 8 4 1 4 , 6 0 4 4 , 0 3 2

0,001

6 3 6 , 5 7 8 3 1 , 6 0 0 1 2 , 9 2 4 8 , 6 1 0 6 , 8 6 9 2 , 2 0 1 2 , 1 3 6 2 , 0 9 0 2 , 0 5 5 2 , 0 2 8 2 , 3 1 3 2 , 2 4 1 2 , 1 8 9 2 , 1 5 0 2 , 1 2 0 2 , 4 4 7 2 , 3 6 5 2 , 3 0 6 2 , 2 6 2 2 , 2 2 8 2 , 6 1 2 2 , 5 1 7 2 , 4 4 9 2 , 3 9 8 2 , 3 5 9 2 , 8 2 9 2 , 7 1 5 2 , 6 3 4 2 , 5 7 4 2 , 5 2 7 3 , 1 4 3 2 , 9 9 8 2 , 8 9 6 2 , 8 2 1 2 , 7 6 4 3 , 7 0 7 3 , 4 9 9 3 , 3 5 5 3 , 2 5 0 3 , 1 6 9 5 , 9 5 9 5 , 4 0 8 5 , 0 4 1 4 , 7 8 1 4 , 5 8 7 1 , 9 2 8 1 , 9 1 2 1 , 8 9 9 1 , 8 8 7 1 , 8 7 8 1 , 8 6 9 1 , 8 6 2 1 , 8 5 5 1 , 8 5 0 1 , 8 4 4 2 , 0 0 7 1 , 9 8 9 1 , 9 7 4 1 , 9 6 2 1 , 9 5 1 1 , 9 4 2 1 , 9 3 4 1 , 9 2 6 1 , 9 2 0 1 , 9 1 4 2 , 0 9 6 2 , 0 7 6 2 , 0 6 0 2 , 0 4 6 2 , 0 3 4 2 , 0 2 4 2 , 0 1 5 2 , 0 0 7 2 , 0 0 0 1 , 9 9 4 2 , 2 0 1 2 , 1 7 9 2 , 1 6 0 2 , 1 4 5 2 , 1 3 1 2 , 1 2 0 2 , 1 1 0 2 , 1 0 1 2 , 0 9 3 2 , 0 8 6 2 , 3 2 8 2 , 3 0 3 2 , 2 8 2 2 , 2 6 4 2 , 2 4 9 2 , 2 3 5 2 , 2 2 4 2 , 2 1 4 2 , 2 0 5 2 , 1 9 7 2 , 4 9 1 2 , 4 6 1 2 , 4 3 6 2 , 4 1 5 2 , 3 9 7 2 , 3 8 2 2 , 3 6 8 2 , 3 5 6 2 , 3 4 6 2 , 3 3 6 2 , 7 1 8 2 , 6 8 1 2 , 6 5 0 2 , 6 2 4 2 , 6 0 2 2 , 5 8 3 2 , 5 6 7 2 , 5 5 2 2 , 5 3 9 2 , 5 2 8 3 , 1 0 6 3 , 0 5 5 3 , 0 1 2 2 , 9 7 7 2 , 9 4 7 2 , 9 2 1 2 , 8 9 8 2 , 8 7 8 2 , 8 6 1 2 , 8 4 5 4 , 4 3 7 4 , 3 1 8 4 , 2 2 1 4 , 1 4 0 4 , 0 7 3 4 , 0 1 5 3 , 9 6 5 3 , 9 2 2 3 , 8 8 3 3 , 8 5 0

Wnioskowanie statystyczne Przykłady

1. W grupie studentów przeprowadzono test ze statystyki , gdzie zmienna losowa X k oznaczała liczbę zdobytych punktów (od 0 do 100, gdzie k – jest liczbą studentów). Rozkład zmiennej X k jest identyczny dla wszystkich studentów – E(X k ) = 70; D(X k ) = 20. Obliczyć prawdopodobieństwo tego, że: a) suma punktów uzyskanych przez 100 studentów będzie wyższa od 7500 punktów, b) przeciętna liczba zdobytych punktów w 100–osobowej grupie studentów będzie w przedziale 65–70 pkt.

Korzystamy z twierdzenia

Lindeberga–Levy’ego

a) Niech zmienna Z będzie sumą zmiennych X 1 , X 2 , …, X 100 → Z 100 = X 1 + X 2 +…+ X 100 , wówczas ma ona rozkład zbliżony do normalnego o parametrach P ( Z 100  7500 )  1  P ( Z 100  7500 )  1  F u N  ( n  E 7500 ( X ),  D ( X ) 7000 200   1 n )   F u N ( 100  70 ,  1  0 20  , 100 ) 99379   0 , N ( 7000 , 00621 Prawdopodobieństwo tego, że suma punktów uzyskanych przez 100–osobową grupę studentów 200 ) będzie wyższa od 7500 p. wynosi 0,621 %.

b) Niech zmienna V będzie średnią ze zmiennych X 1 , X 2 , …, X 100 , wówczas ma ona rozkład zbliżony do normalnego o parametrach N   E ( X ), D ( X ) n    N   70 , 20 100    N ( 70 , 2 ) P ( 65  V 100  70 )  F u 70  70 2  F u 65  70 2  F u  F u

 2 , 5

 0 , 5  0 , 00621  0 , 49379 Prawdopodobieństwo tego, że średnia liczba punktów uzyskanych przez 100–osobową grupę studentów będzie w przedziale 65–70 p. wynosi 49,379 %.

Wnioskowanie statystyczne

2. Pewien towar produkowany jest w 2 gatunkach. 40 % produkcji stanowi gatunek 1, natomiast 60 % – drugi. Jakie jest prawdopodobieństwo, że w niezależnie pobranej partii towaru liczącej 50 sztuk, liczba sztuk 1–go gatunku będzie większa od 24.

Jeżeli Y n jest liczbą sukcesów (mamy do czynienia z rozkładem dwumianowym), to jej rozkład dąży do rozkładu normalnego o parametrach N  np , npq .

 p  0 , 4 ; q  0 , 6 ; Y n  N  np , npq   50  0 , 4 ; 50  0 , 4  0 , 6   N ( 20 ; 3 , 464 ).

P ( Y 50  24 )  1  P ( Y 50  24 )  1  F u   24 3 ,  20 464    1  F u  1  0 , 8749  0 , 1251 3. Prawdopodobieństwo wylosowania wyrobu 1–go gatunku wynosi 0,25. Obliczyć prawdopodobieństwo tego, że częstość wystąpienia sztuk I gatunku wśród 400 wylosowanych wyrobów wyniesie nie więcej niż 30 %. Przy dużej liczbie obserwacji częstość wystąpienia sukcesu w rozkładzie dwumianowym Y n rozkład normalny o parametrach  N  p , pq n  p  0 , 25  Y n  N  p , pq n  400   N  0 , 25 ; 0 , 02165  na P ( Y 400  0 , 3 )  F u   0 0 , , 3  0 , 25 02165    F u

2 , 31

 0 , 98956