Teoria estymacji.

Download Report

Transcript Teoria estymacji.

Teoria estymacji
dr hab. Dariusz Piwczyński
2015-10-30
1
Estymacja

to postępowanie statystyczne zmierzające
do oszacowania parametrów populacji
generalnej (, ) na podstawie statystyk
(estymatorów) uzyskanych z populacji
próbnej.
2015-10-30
2
Estymatory a Parametry
POPULACJA GENERALNA
x Sx • POPULACJA
PRÓBNA
Parametry ():
 – przeciętna
w populacji
 – odchylenie
standardowe w populacji
x Sx
x
3
2015-10-30
Sx
• POPULACJA
PRÓBNA
• POPULACJA
PRÓBNA
Estymatory:
x
, Sx,
Cechy dobrego estymatora to



Nieobciążoność. Estymator nazywamy
nieobciążonym, gdy jego wartość oczekiwana
jest równa parametrowi populacji generalnej,
czyli E(Tn)= .
Efektywność. Estymator efektywny, to taki,
którego wariancja jest najmniejsza.
Zgodność. Estymator nazywamy zgodnym,
jeżeli wraz ze wzrostem liczebności próby jego
wartość zbliża się do szacowanego parametru.
2015-10-30
4
Rodzaje estymacji
punktowa
 przedziałowa

2015-10-30
5
Estymacja punktowa
polega na uznaniu estymatora z próby
losowej, jako wartości parametru.
Powyższemu stwierdzeniu towarzyszy
dodatkowo podanie błędu oszacowania.
 Średni błąd średniej arytmetycznej:

Sx
Sx 
n
2015-10-30
6
Błąd średniej

Jeżeli względny błąd estymatora nie
przekracza 7,5%, to można uznać, iż
wynik estymacji jest wysoce precyzyjny.
Jeśli przyjmuje wartości z przedziału
7,5%-15%, to dopuszczalny, a powyżej
– nie jest do przyjęcia.
2015-10-30
7
Estymacja przedziałowa

polega na wyznaczeniu przedziału
liczbowego, który z określonym
prawdopodobieństwem zawiera
szacowany parametr. Końce przedziału
zależą od wartości estymatora.
2015-10-30
8
Przedział ufności


to losowy przedział, który z określonym
prawdopodobieństwem określa wartość
parametru. To inaczej przedział liczbowy,
w którym znajduje się prawdziwa, lecz nieznana
wartość parametru .
Przedział (g1,g2) jest przedziałem ufności
parametru , określonym na poziomie ufności 1, jeżeli prawdopodobieństwo, że  leży w tym
przedziale jest równe 1-.
2015-10-30
9
Poziom ufności


1 –  jest prawdopodobieństwem, że  leży w
przedziale (g1,g2).
Jeżeli  = 0,05, to 1-  =0,95 oznacza to, że
średnio na każde 100 przedziałów ustalonych na
100 prób losowych, w 95 przypadkach
prawdziwa wartość parametru  znajduje się
wewnątrz przedziału, natomiast w 5
przypadkach znajduje się poza przedziałem.
2015-10-30
10
Przedział ufności dla średniej

 

P x  (u 
)    x  (u 
)  1
n
n 


Stosowany wtedy, gdy mamy do czynienia z
rozkładem normalnym (N(, )),  jest znane.

u - wartość zmiennej standaryzowanej U (U=(X-)/) o normalnym
rozkładzie
2015-10-30
11
Wartości krytyczne

Wartości krytyczne są
to takie wartości danej
statystyki u, że
prawdopodobieństwo,
iż zmienna losowa
przyjmie wartość
większą od u lub
mniejszą od u wynosi
.
2015-10-30
12
Wartości krytyczne rozkładu
normalnego

0,1
0,05
0,02
0,01
u
1,645
1,960
2,326
2,576
2015-10-30
0,001
3,291
13
Przedział ufności dla średniej
Sx
Sx 

P x  (u 
)    x  (u 
)  1
n
n 


Stosowany wtedy, gdy mamy do czynienia z
rozkładem normalnym lub innym,  jest
nieznane, próba duża > 30.

u - wartość zmiennej standaryzowanej U (U=(X-)/) o normalnym
rozkładzie
2015-10-30
14
Przykład
Kontrolowano masę ciała 115 ślimaków
winniczków. Średnia masa wyniosła 16,165 g,
zaś odchylenie standardowe 6,103 g. Oszacuj
95% przedział ufności dla tej cechy. Nie znamy
, nie znamy rozkładui, próba jest duża.
Sx
Sx 

P x  (u 
)    x  (u 
)  1
n
n 

2015-10-30
15
Rozwiązanie
Sx
6,103
x  (u 
)  16,165 (1,96
)  15,0498
n
115
Sx
6,103
x  (u 
)  16,165 (1,96
)  17,2806
n
115
Oszacowany przedział ufności to: (15,05; 17,28).
2015-10-30
16
Przedział ufności dla średniej 1
Sx
Sx 

P x  (t 
)    x  (t 
)  1
n 1
n 1 




Stosowany wtedy, gdy mamy do czynienia z
rozkładem normalnym, ale nie znamy  i próbie
małej, tj. poniżej 30 elementów.
(w mianowniku wzoru na odchylenie standardowe
znajduje się „/n”).
t - odczytujemy z tabeli testu t-Studenta dla liczby stopni swobody równej n-1
i odpowiedniego poziomu ufności.
2015-10-30
17
Rozkład t-Studenta

Załóżmy, że jeżeli z populacji o jakimkolwiek
rozkładzie ze średnią  i odchyleniem
standardowym  pobieramy próby o dużej
liczebności N, to rozkład średnich z tych prób
będzie rozkładem normalnym o średniej 

i odchyleniu N
2015-10-30
18
Rozkład t-Studenta

Jeżeli z populacji o rozkładzie normalnym
pobieramy próby N - elementowe, to dla każdej
próby możemy obliczyć statystykę t.
x   (x  )  n
t

Sx
Sx
2015-10-30
19
Rozkład t-Studenta

Wartości krytyczne są
to takie wartości danej
statystyki t, że
prawdopodobieństwo,
iż zmienna losowa
przyjmie wartość
większą od t lub
mniejszą od t wynosi
.
2015-10-30
20
Wartości krytyczne t
Rozkład dwuśladowy
st.swob.
2015-10-30
0.5
=ROZKŁAD.T.ODW(, st.swobody)
0.1
0.05
0.02
0.01
0.001
1
1.000
6.314
12.706
31.821
63.657
636.619
2
0.816
2.920
4.303
6.965
9.925
31.599
3
0.765
2.353
3.182
4.541
5.841
12.924
4
0.741
2.132
2.776
3.747
4.604
8.610
5
0.727
2.015
2.571
3.365
4.032
6.869
6
0.718
1.943
2.447
3.143
3.707
5.959
7
0.711
1.895
2.365
2.998
3.499
5.408
8
0.706
1.860
2.306
2.896
3.355
5.041
9
0.703
1.833
2.262
2.821
3.250
4.781
10
0.700
1.812
2.228
2.764
3.169
4.587
11
0.697
1.796
2.201
2.718
3.106
4.437
12
0.695
1.782
2.179
2.681
3.055
4.318
13
0.694
1.771
2.160
2.650
3.012
4.221
14
0.692
1.761
2.145
2.624
2.977
4.140
15
0.691
1.753
2.131
2.602
2.947
4.073
21
Przedział ufności dla średniej
Sx
Sx 

P x  (t 
)    x  (t 
)  1
n
n 


Stosowany wtedy, gdy mamy do czynienia z
rozkładem normalnym, ale nie znamy  i próbie tj.
poniżej 30 elementów. (w mianowniku wzoru na
odchylenie standardowe znajduje się „/n-1”).

t - odczytujemy z tabeli testu t-Studenta dla liczby stopni swobody równej n-1
i odpowiedniego poziomu ufności.
2015-10-30
22