Transcript Hipotezy statystyczne
30.04.2020
Hipotezy statystyczne
dr hab. Dariusz Piwczyński
1
Po co hipotezy? do...
badania założeń dotyczących średniego poziomu cechy w populacji generalnej: wydajność mleka dla określonej rasy bydła wynosi 6700 kg oceny różnicy między dwiema grupami: czy istnieje różnica między dwiema grupami zwierząt żywionych paszami o różnym składzie pod względem przyrostów dobowych?
badania zależności między cechami: czy istnieje zależność pomiędzy ilością wypalanych papierosów a zachorowalnością na nowotwór płuc?
porównania rozkładów zmiennych: badamy czy zmienna przyrosty dobowe posiada rozkład zgodny z normalnym.
30.04.2020
2
Weryfikacja hipotez statystycznych
polega na doborze określonego schematu postępowania zwanego
testem statystycznym
, który rozstrzyga, przy jakich wynikach z próby sprawdzoną hipotezę należy odrzucić, a przy jakich nie ma podstaw do jej odrzucenia.
3
30.04.2020
Hipotezy możemy podzielić na
:
parametryczne
, tj. takie, które dotyczą wartości parametrów statystycznych populacji, np. średniej arytmetycznej czy odchylenia standardowego
nieparametryczne
– dotyczą postaci rozkładu zmiennej lub losowości próby.
30.04.2020
4
Rodzaje hipotez
Hipoteza, która podlega sprawdzeniu zwana jest
hipotezą zerową (H 0
) Konkurencyjną dla niej hipotezą jest
hipoteza alternatywna (H 1 )
. 30.04.2020
5
Hipotezy jednostronne i dwustronne Na podstawie pewnych przesłanek zakładamy, że masa ciała samic gatunku kret wynosi 92 g. H 0 : µ = 92 g Alternatywna hipoteza: H 1 : µ < 92 g (hipoteza jednostronna) H 1 : µ > 92 g (hipoteza jednostronna) H 1 : µ ≠ 92 g (hipoteza dwustronna)
6
30.04.2020
Hipoteza zerowa
Hipotezę zerową
, dotyczącą wartości oczekiwanych można zapisać następująco:
H 0 : E(X 1 ) = E(X 2 ),
np. zakładamy, że średnia masa ciała samic i samców gatunku kret (w populacji generalnej) jest taka sama.
H 0 : E(X 1 ) = E(X 2 ) ~ H 0 : μ 1 = μ 2
30.04.2020
7
Założenie!
Przystępując do weryfikacji hipotezy zerowej, zakładamy iż jest ona prawdziwa.
8
30.04.2020
Błąd pierwszego rodzaju (α)
Polega na odrzuceniu hipotezy zerowej, mimo że jest ona prawdziwa. Błąd ten zwany jest poziomem istotności. Najczęściej przyjmuje wartości 0,05; 0,01 czy 0,001. Poziom istotności wskazuje, na jak mały błąd „zgadzamy się” przy weryfikacji hipotezy zerowej.
Poziom istotności
charakteru próby.
określa dopuszczalną częstość wystąpienia wyników niezgodnych z przyjętymi założeniami na skutek losowego
9
30.04.2020
Błąd drugiego rodzaju (β)
Polega na przyjęciu hipotezy zerowej, gdy jest ona w rzeczywistości fałszywa.
10
30.04.2020
Błędy towarzyszące testowaniu hipotez Hipoteza zerowa Decyzja Przyjąć H 0 Odrzucić H 0 prawdziwa fałszywa decyzja prawidłowa błąd II rodzaju błąd I rodzaju decyzja prawidłowa
Moc testu
1
, jest to prawdopodobieństwo odrzucenia hipotezy zerowej, gdy jest ona fałszywa, a hipoteza alternatywna jest prawdziwa. Testem najmocniejszym jest ten, którego, przy ustalonym poziome istotności α
,
wartość jest najmniejsza.
12
30.04.2020
Formułowanie i weryfikowanie hipotez statystycznych:
Sformułowanie hipotezy zerowej i alternatywnej.
Wybór testu lub testów określających reguły postępowania przy weryfikacji hipotezy zerowej. Określenie poziomu istotności, a tym samym wyznaczenie obszaru krytycznego hipotezy.
Formułowanie – na podstawie wyników z próby, testu i przyjętych założeń - wniosku końcowego.
13
30.04.2020
Obszar krytyczny
Zbiór wszystkich wartości danej statystyki, dla których hipoteza zerowa jest odrzucana.
14
30.04.2020
Pojedyncza próba, znane σ
u
x
0
n
Obliczone u porównujemy z wartością tablicową u α.
Jeżeli |u| ≥ u α to mamy podstawę do odrzucenia hipotezy zerowej.
30.04.2020
15
Pojedyncza próba, nie jest znane σ
t
x
0
S x S x
S x n S x
– średni błąd średniej arytmetycznej
30.04.2020
16
Czy mamy podstawę do odrzucenia H 0 = 92 g?
H
1
: µ ≠ 92 g H
1
: µ < 92 g
18
30.04.2020
Wartości krytyczne
Wartości krytyczne rozkładu t-Studenta można otrzymać w wyniku zastosowania funkcji: =rozkład.t.odw(α; ν)
Wartości krytyczne, P(|t|
t
,
) =
Podjęcie decyzji
Ponieważ obliczona wartość statystyki t jest większa niż wartość krytyczna, odrzucamy hipotezę. Nie mamy podstaw do stwierdzenia, że przeciętna masa samic w populacji generalnej to 92 g.
Enterprise guide
EG, typ test t Jednopróbkowy
EG, Wskazujemy zmienną do analizy
EG, definiujemy H
0
= 92 g
Eg, wyniki
„Pr” – prawdopodobieństwo (p-value) zerową – – błąd z jakim należy się liczyć odrzucając hipotezę prawdopodobieństwo otrzymania wyniku.
Porównujemy 2 grupy, Układ doświadczenia Niezależny a wiązany!
Doświadczenie dwugrupowe
Formułujemy hipotezę zerową i alternatywną
H 0 : E(X 1 ) = E(X 2 ) H 1 : E(X 1 )
E(X 2 )
Porównujemy 2 grupy – kryteria doboru testu Rozkład normalny?
TAK
Czy znane wariancje (pop. generalnej?
NIE
Czy równe wariancje?
NIE
Test Cochrana Coxa
TAK
Test U
TAK
Test Z n 1
NIE
Duże próby?
i n 2 >30 (50)?
NIE
Testy nieparametryczne
TAK
Test t
29
30.04.2020
Istota porównań – najmniejsza istotna różnica (NIR, LSD)
wks
S D
Jest to wartość różnicy między średnimi, która może być jeszcze uznana za wartość losową.
x 1
Jeśli różnica między średnimi jest większa niż NIR to znaczy, że są efektem czynnika kontrolowanego w doświadczeniu.
x 2 wks S D x 1 S D x 2 wks
wks – wartość krytyczna danej statystyki, np. t-Studenta, u
30.04.2020
30
1. Dwie próby, nierówne wariancje
Test Cochrana-Coxa Statystyka testująca t
t x 1 x 2 S D S D S 1 2 n 1 S 2 2 n 2
S D – średni błąd różnicy średnich Rozkład statystyki testującej: t-Studenta
30.04.2020
31
Ustalenie liczby stopni swobody
ν n 1 1 1 S S 1 2 n 1 2 1 n 1 S 2 2 n 2 2 n 2 1 1 2 S 2 2 n 2 2
2. Dwie próby, równe wariancje,
Test t
Statystyka testująca t
t x 1 x 2 S D S D (n 1 1) S 2 1 (n 1 n 2 (n 2 2) 1) S 2 2
Rozkład statystyki testującej: t-Studenta o
= n 1 + n 2 – 2
30.04.2020
n n 1 1 n 2 n 2
33
3.Rozkład normalny, znane wariancje odnoszące się do populacji generalnej (test U)
Statystyka testująca:
U x 1 x 2 σ 1 2 σ 2 2 n 1 n 2
Rozkład statystyki testującej: N(0; 1)
4. Rozkład dowolny, duże próby, nie jest znana wariancja
Statystyka testująca:
Z
S
1 2 n x
x
1
x
x 1 S 2 2 2 n 2
Rozkład statystyki testującej: N(0; 1)
Przykład
Naszym zamiarem jest porównanie samic i samców gatunku kret w zakresie masy ciała.
Próby są małe (n < 30), zakładamy że cecha posiada rozkład zgodny z normalnym. Nie znamy wariancji w populacji generalnej. Z kolei wariancje populacji próbnych są różne.
H 0 : E(X ♂ ) = E(X ♀ ) H 1 : E(X ♂ )
E(X ♀ )
Przykład cd.,
Test Cochrana-Coxa
Z jakich wzorów korzystamy?
S D S 1 2 n 1 S 2 2 n 2 258 , 82 17 74 , 21 17 4 , 426 t x 1 x 2 S D 87 , 68 73 , 76 4 , 426 3 , 145 ν 1 7 1 1 258,82 17 258,82 17 2 74,21 17 2 17 1 1 74,21 17 2 24 , 478
Wartości krytyczne,
= 0,05
ν 1 7 1 1 258,82 17 258,82 17 2 74,21 17 2 17 1 1 74,21 17 2 24 , 478
0,05 0,01 0,001 t 2.064
2.797
3.745
-2,064 2,064
Obliczona wartość statystyki t to 3,145
=ROZKŁAD.T.ODW(0.05;24)
Decyzja
Ze względu na fakt, iż obliczona wartość statystyki |t| jest większa niż wartość krytyczna przy p = 0,01 odrzucamy hipotezę zerową. Stwierdzamy tym samym, że grupy różnią się między sobą wysoko istotnie.
Test dla dwóch wariancji
Zanim przystąpimy do zbadania hipotezy zerowej dotyczącej wartości przeciętnych, musimy zweryfikować hipotezę dotyczącą podobieństwa wariancji!
Jednym z kryteriów uwzględnianych w trakcie doboru właściwego testu do porównania dwóch wartości oczekiwanych jest ustalenia czy wariancje odnoszące się do tychże porównywanych populacji są jednakowe.
Podobieństwo zmienności
Hipoteza zerowa o równości wariancji w porównywanych populacjach posiada następującą postać:
H 0 : D 2 (X 1 ) = D 2 (X 2 )
zaś alternatywna zakładająca różnice w zakresie zmienności:
H 1 : D 2 (X 1 )
D 2 (X 2 )
Statystyka F
Wykorzystywana jest do weryfikacji hipotezy o równości dwóch wariancji F S 2 1 S 2 2 Jeżeli wariancje porównywanych grup nie są sobie równe, to w powyższym wzorze, w liczniku umieszczamy wariancję o wyższej wartości!!!
Obliczoną wartość statystyki porównujemy z wartością tablicową ustaloną dla określonego poziomu istotności i liczby stopni swobody.
Rozkład F
Test FISHERA
Mamy podstawę do odrzucenia H samic i samców! W praktyce oznacza, że zmienność masy ciała samic i samców w populacji generalnej jest różna.
0 zakładającej podobieństwo wariancji w grupie
zatem test Cochrana-Coxa
Decyzja
Obliczone prawdopodobieństwo jest mniejsze niż 0,01 (oczywiście mniejsze niż 0,05) zatem mamy podstawę do odrzucenia H 0 i przyjęcia H 1 . Co to oznacza? Możemy uznać, że przeciętna masa ciała samic i samców w populacji generalnej jest różna!
Jaka różnica?
Stwierdzamy, że różnica między płciami w zakresie masy ciała jest wysoko istotna.
Test t w SAS, wybór typu tesu
EG, ustalamy zmienne
Wykres
EG, wyniki
3. odczytujemy zatem wyniki dotyczące testu t dla wariancji
Nierównych 1. Rozstrzygamy czy wariancje są równe?
2. Nie są!
Wykres pudełkowy
Wykres pudełkowy
wartości cechy, które oddalone od krawędzi skrzynki więcej niż wynosi półtora odstępu międzykwartylowego (1,5 x IQR)
Doświadczenie wiązane, przykład Wymiary grubości rogówki (mierzonej w jej centrum, μm) oka ludzkiego przed założeniem szkieł kontaktowych (GL0) i po 2 tygodniach od ich noszenia (GL2)
Hipotezy
Hipotezę zerowa – zakładamy, że grubość rogówki oka ludzkiego przed założeniem i po dwóch tygodniach noszenia szkieł kontaktowych jest taka sama.
H 0 : E(X 1 ) = E(X 2 )
Hipoteza alternatywna – zakładamy, że grubość rogówki oka ludzkiego przed założeniem i po dwóch tygodniach noszenia szkieł kontaktowych jest różna.
H 1 : E(X 1 )
E(X 2 )
Doświadczenie wiązane, obliczamy wartość statystyki t t x S d d x d – średnia z indywidualnych różnic między wymiarami grubości rogówki w 2 terminach kontroli S d S 2 d n – błąd standardowy różnicy S d 2 – wariancja zmiennej d i
56
30.04.2020
Doświadczenie wiązane, MS Excel nasze dane
Doświadczenie wiązane, MS Excel Tworzymy zmienną d i d i = GL0 – GL2
Doświadczenie wiązane, MS Excel Obliczamy średnią kolumny d i
x d
107 , 86 22 4 , 9029 S 2 d Obliczamy wariancję kolumny d i x 2 d n 1 n x d 2 S d Obliczamy błąd standardowy różnicy S 2 d n 216,19 22 3,13 Obliczamy statystykę t t x S d d 4,9029 1,56 3,13
Decyzja
Obliczona wartość statystyki t: |t| = 1,56 Wartość krytyczna t (0,05; 21) = 2,080 Nie mamy podstaw do odrzucenia hipotezy zerowej, ponieważ obliczona przez nas wartość statystyki t jest mniejsza niż wartość krytyczna odczytana przy poziomie istotności 0,05 i liczbie stopni swobody 21. Można zatem stwierdzić, że noszenie soczewek kontaktowych nie wpływa statystycznie na zmianę grubości rogówki.
Doświadczenie zależne, MS Excel Wykorzystujemy funkcję test.t()
Obliczone prawdopodobieństw o jest większe niż 0,05. Nie ma podstaw do odrzucenia H 0 .
Koniecznie musimy wpisać „1” w miejsce Typ – oznacza to doświadczenie wiązane
Analiza za pomocą EG
Wybieramy rodzaj analizy statystycznej Wybieramy typ testu t
Wskazujemy zmienne analizowane
Oglądamy wyniki
Hipoteza o zgodności rozkładu empirycznego z rozkładem teoretycznym H 0 : X ~ N( , ) 30.04.2020
65