Hipotezy statystyczne

Transcript Hipotezy statystyczne

30.04.2020

Hipotezy statystyczne

dr hab. Dariusz Piwczyński

Po co hipotezy? do...

    badania założeń dotyczących średniego poziomu cechy w populacji generalnej: wydajność mleka dla określonej rasy bydła wynosi 6700 kg oceny różnicy między dwiema grupami: czy istnieje różnica między dwiema grupami zwierząt żywionych paszami o różnym składzie pod względem przyrostów dobowych?

badania zależności między cechami: czy istnieje zależność pomiędzy ilością wypalanych papierosów a zachorowalnością na nowotwór płuc?

porównania rozkładów zmiennych: badamy czy zmienna przyrosty dobowe posiada rozkład zgodny z normalnym.

30.04.2020

Weryfikacja hipotez statystycznych

 polega na doborze określonego schematu postępowania zwanego

testem statystycznym

, który rozstrzyga, przy jakich wynikach z próby sprawdzoną hipotezę należy odrzucić, a przy jakich nie ma podstaw do jej odrzucenia.

30.04.2020

Hipotezy możemy podzielić na

: 

parametryczne

, tj. takie, które dotyczą wartości parametrów statystycznych populacji, np. średniej arytmetycznej czy odchylenia standardowego 

nieparametryczne

– dotyczą postaci rozkładu zmiennej lub losowości próby.

30.04.2020

Rodzaje hipotez

 Hipoteza, która podlega sprawdzeniu zwana jest

hipotezą zerową (H 0

)  Konkurencyjną dla niej hipotezą jest

hipoteza alternatywna (H 1 )

. 30.04.2020

Hipotezy jednostronne i dwustronne  Na podstawie pewnych przesłanek zakładamy, że masa ciała samic gatunku kret wynosi 92 g. H 0 : µ = 92 g  Alternatywna hipoteza: H 1 : µ < 92 g (hipoteza jednostronna) H 1 : µ > 92 g (hipoteza jednostronna) H 1 : µ ≠ 92 g (hipoteza dwustronna)

30.04.2020

Hipoteza zerowa

 

Hipotezę zerową

, dotyczącą wartości oczekiwanych można zapisać następująco:

H 0 : E(X 1 ) = E(X 2 ),

np. zakładamy, że średnia masa ciała samic i samców gatunku kret (w populacji generalnej) jest taka sama.



H 0 : E(X 1 ) = E(X 2 ) ~ H 0 : μ 1 = μ 2

30.04.2020

Założenie!

 Przystępując do weryfikacji hipotezy zerowej, zakładamy iż jest ona prawdziwa.

30.04.2020

Błąd pierwszego rodzaju (α)

  Polega na odrzuceniu hipotezy zerowej, mimo że jest ona prawdziwa. Błąd ten zwany jest poziomem istotności. Najczęściej przyjmuje wartości 0,05; 0,01 czy 0,001. Poziom istotności wskazuje, na jak mały błąd „zgadzamy się” przy weryfikacji hipotezy zerowej.

Poziom istotności

charakteru próby.

określa dopuszczalną częstość wystąpienia wyników niezgodnych z przyjętymi założeniami na skutek losowego

30.04.2020

Błąd drugiego rodzaju (β)

 Polega na przyjęciu hipotezy zerowej, gdy jest ona w rzeczywistości fałszywa.

30.04.2020

Błędy towarzyszące testowaniu hipotez Hipoteza zerowa Decyzja Przyjąć H 0 Odrzucić H 0 prawdziwa fałszywa decyzja prawidłowa błąd II rodzaju błąd I rodzaju decyzja prawidłowa

Moc testu



 , jest to prawdopodobieństwo odrzucenia hipotezy zerowej, gdy jest ona fałszywa, a hipoteza alternatywna jest prawdziwa.  Testem najmocniejszym jest ten, którego, przy ustalonym poziome istotności α

wartość  jest najmniejsza.

30.04.2020

Formułowanie i weryfikowanie hipotez statystycznych:

    Sformułowanie hipotezy zerowej i alternatywnej.

Wybór testu lub testów określających reguły postępowania przy weryfikacji hipotezy zerowej. Określenie poziomu istotności, a tym samym wyznaczenie obszaru krytycznego hipotezy.

Formułowanie – na podstawie wyników z próby, testu i przyjętych założeń - wniosku końcowego.

30.04.2020

Obszar krytyczny

 Zbiór wszystkich wartości danej statystyki, dla których hipoteza zerowa jest odrzucana.

30.04.2020

Pojedyncza próba, znane σ



   0

  Obliczone u porównujemy z wartością tablicową u α.

Jeżeli |u| ≥ u α to mamy podstawę do odrzucenia hipotezy zerowej.

30.04.2020

Pojedyncza próba, nie jest znane σ



  0

S x S x



S x n S x

– średni błąd średniej arytmetycznej

30.04.2020

Czy mamy podstawę do odrzucenia H 0 = 92 g?

H

: µ ≠ 92 g H

: µ < 92 g

30.04.2020

Wartości krytyczne

 Wartości krytyczne rozkładu t-Studenta można otrzymać w wyniku zastosowania funkcji: =rozkład.t.odw(α; ν)

Wartości krytyczne, P(|t|



t

 , 

) =



Podjęcie decyzji

 Ponieważ obliczona wartość statystyki t jest większa niż wartość krytyczna, odrzucamy hipotezę. Nie mamy podstaw do stwierdzenia, że przeciętna masa samic w populacji generalnej to 92 g.

Enterprise guide

EG, typ test t Jednopróbkowy

EG, Wskazujemy zmienną do analizy

EG, definiujemy H

= 92 g

Eg, wyniki

„Pr” – prawdopodobieństwo (p-value) zerową – – błąd z jakim należy się liczyć odrzucając hipotezę prawdopodobieństwo otrzymania wyniku.

Porównujemy 2 grupy, Układ doświadczenia  Niezależny a wiązany!

Doświadczenie dwugrupowe

Formułujemy hipotezę zerową i alternatywną

 

H 0 : E(X 1 ) = E(X 2 ) H 1 : E(X 1 )



E(X 2 )

Porównujemy 2 grupy – kryteria doboru testu Rozkład normalny?

TAK

Czy znane wariancje (pop. generalnej?

NIE

Czy równe wariancje?

NIE

Test Cochrana Coxa

TAK

Test U

TAK

Test Z n 1

NIE

Duże próby?

i n 2 >30 (50)?

NIE

Testy nieparametryczne

TAK

Test t

30.04.2020

Istota porównań – najmniejsza istotna różnica (NIR, LSD)

wks



S D

 Jest to wartość różnicy między średnimi, która może być jeszcze uznana za wartość losową.

 x 1

Jeśli różnica między średnimi jest większa niż NIR to znaczy, że są efektem czynnika kontrolowanego w doświadczeniu.

 x 2  wks  S D x 1 S  D x 2  wks

wks – wartość krytyczna danej statystyki, np. t-Studenta, u

30.04.2020

1. Dwie próby, nierówne wariancje

Test Cochrana-Coxa Statystyka testująca t

t  x 1  x 2 S D S D  S 1 2 n 1  S 2 2 n 2

S D – średni błąd różnicy średnich Rozkład statystyki testującej: t-Studenta

30.04.2020

Ustalenie liczby stopni swobody

ν  n 1 1  1   S   S 1 2 n 1 2 1 n 1  S 2 2 n 2   2  n 2   1  1   2 S 2 2 n 2   2

2. Dwie próby, równe wariancje,

Test t

Statystyka testująca t

t  x 1  x 2 S D S D  (n 1  1)  S 2 1 (n 1   n 2 (n  2  2) 1)  S 2 2

Rozkład statystyki testującej: t-Studenta o



= n 1 + n 2 – 2

30.04.2020

 n n 1 1  n 2  n 2

3.Rozkład normalny, znane wariancje odnoszące się do populacji generalnej (test U)

Statystyka testująca:

U  x 1  x 2 σ 1 2  σ 2 2 n 1 n 2

Rozkład statystyki testującej: N(0; 1)

4. Rozkład dowolny, duże próby, nie jest znana wariancja

Statystyka testująca:

Z 

1 2 n x

  x 1 S 2 2 2 n 2

Rozkład statystyki testującej: N(0; 1)

Przykład

    Naszym zamiarem jest porównanie samic i samców gatunku kret w zakresie masy ciała.

Próby są małe (n < 30), zakładamy że cecha posiada rozkład zgodny z normalnym. Nie znamy wariancji w populacji generalnej. Z kolei wariancje populacji próbnych są różne.

H 0 : E(X ♂ ) = E(X ♀ ) H 1 : E(X ♂ )



E(X ♀ )

Przykład cd.,

Test Cochrana-Coxa

Z jakich wzorów korzystamy?

S D  S 1 2 n 1  S 2 2 n 2  258 , 82  17 74 , 21 17  4 , 426 t  x 1  x 2 S D  87 , 68  73 , 76 4 , 426  3 , 145 ν  1 7 1  1       258,82 17 258,82 17    2   74,21 17    2 17 1  1    74,21 17    2  24 , 478

Wartości krytyczne,



= 0,05

ν  1 7 1  1       258,82 17 258,82 17    2   74,21 17    2 17 1  1    74,21 17    2  24 , 478 

0,05 0,01 0,001 t 2.064

2.797

3.745

-2,064 2,064

Obliczona wartość statystyki t to 3,145

=ROZKŁAD.T.ODW(0.05;24)

Decyzja

 Ze względu na fakt, iż obliczona wartość statystyki |t| jest większa niż wartość krytyczna przy p = 0,01 odrzucamy hipotezę zerową. Stwierdzamy tym samym, że grupy różnią się między sobą wysoko istotnie.

Test dla dwóch wariancji

  Zanim przystąpimy do zbadania hipotezy zerowej dotyczącej wartości przeciętnych, musimy zweryfikować hipotezę dotyczącą podobieństwa wariancji!

Jednym z kryteriów uwzględnianych w trakcie doboru właściwego testu do porównania dwóch wartości oczekiwanych jest ustalenia czy wariancje odnoszące się do tychże porównywanych populacji są jednakowe.

Podobieństwo zmienności

  Hipoteza zerowa o równości wariancji w porównywanych populacjach posiada następującą postać:

H 0 : D 2 (X 1 ) = D 2 (X 2 )

zaś alternatywna zakładająca różnice w zakresie zmienności:

H 1 : D 2 (X 1 )



D 2 (X 2 )

Statystyka F

 Wykorzystywana jest do weryfikacji hipotezy o równości dwóch wariancji F  S 2 1 S 2 2     Jeżeli wariancje porównywanych grup nie są sobie równe, to w powyższym wzorze, w liczniku umieszczamy wariancję o wyższej wartości!!!

Obliczoną wartość statystyki porównujemy z wartością tablicową ustaloną dla określonego poziomu istotności i liczby stopni swobody.

Rozkład F

Test FISHERA

Mamy podstawę do odrzucenia H samic i samców! W praktyce oznacza, że zmienność masy ciała samic i samców w populacji generalnej jest różna.

0 zakładającej podobieństwo wariancji w grupie

zatem test Cochrana-Coxa

Decyzja

  Obliczone prawdopodobieństwo jest mniejsze niż 0,01 (oczywiście mniejsze niż 0,05) zatem mamy podstawę do odrzucenia H 0 i przyjęcia H 1 . Co to oznacza? Możemy uznać, że przeciętna masa ciała samic i samców w populacji generalnej jest różna!

Jaka różnica?

Stwierdzamy, że różnica między płciami w zakresie masy ciała jest wysoko istotna.

Test t w SAS, wybór typu tesu

EG, ustalamy zmienne

Wykres

EG, wyniki

3. odczytujemy zatem wyniki dotyczące testu t dla wariancji

Nierównych 1. Rozstrzygamy czy wariancje są równe?

2. Nie są!

Wykres pudełkowy

wartości cechy, które oddalone od krawędzi skrzynki więcej niż wynosi półtora odstępu międzykwartylowego (1,5 x IQR)

Doświadczenie wiązane, przykład  Wymiary grubości rogówki (mierzonej w jej centrum, μm) oka ludzkiego przed założeniem szkieł kontaktowych (GL0) i po 2 tygodniach od ich noszenia (GL2)

Hipotezy

 Hipotezę zerowa – zakładamy, że grubość rogówki oka ludzkiego przed założeniem i po dwóch tygodniach noszenia szkieł kontaktowych jest taka sama.

H 0 : E(X 1 ) = E(X 2 )

 Hipoteza alternatywna – zakładamy, że grubość rogówki oka ludzkiego przed założeniem i po dwóch tygodniach noszenia szkieł kontaktowych jest różna.

H 1 : E(X 1 )



E(X 2 )

Doświadczenie wiązane, obliczamy wartość statystyki t t  x S d d x d – średnia z indywidualnych różnic między wymiarami grubości rogówki w 2 terminach kontroli S d  S 2 d n – błąd standardowy różnicy S d 2 – wariancja zmiennej d i

30.04.2020

Doświadczenie wiązane, MS Excel  nasze dane

Doświadczenie wiązane, MS Excel  Tworzymy zmienną d i  d i = GL0 – GL2

Doświadczenie wiązane, MS Excel Obliczamy średnią kolumny d i

x d

  107 , 86 22   4 , 9029 S 2 d Obliczamy wariancję kolumny d i   x 2 d  n    1 n x d  2 S d Obliczamy błąd standardowy różnicy  S 2 d n  216,19 22  3,13 Obliczamy statystykę t t  x S d d   4,9029   1,56 3,13

Decyzja

    Obliczona wartość statystyki t: |t| = 1,56 Wartość krytyczna t (0,05; 21) = 2,080 Nie mamy podstaw do odrzucenia hipotezy zerowej, ponieważ obliczona przez nas wartość statystyki t jest mniejsza niż wartość krytyczna odczytana przy poziomie istotności 0,05 i liczbie stopni swobody 21. Można zatem stwierdzić, że noszenie soczewek kontaktowych nie wpływa statystycznie na zmianę grubości rogówki.

Doświadczenie zależne, MS Excel  Wykorzystujemy funkcję test.t()

Obliczone prawdopodobieństw o jest większe niż 0,05. Nie ma podstaw do odrzucenia H 0 .

Koniecznie musimy wpisać „1” w miejsce Typ – oznacza to doświadczenie wiązane

Analiza za pomocą EG

 Wybieramy rodzaj analizy statystycznej  Wybieramy typ testu t

Wskazujemy zmienne analizowane

Oglądamy wyniki

Hipoteza o zgodności rozkładu empirycznego z rozkładem teoretycznym  H 0 : X ~ N(  ,  ) 30.04.2020

Hipotezy statystyczne

Transcript Hipotezy statystyczne

Hipotezy statystyczne

Po co hipotezy? do...

Weryfikacja hipotez statystycznych

Hipotezy możemy podzielić na

Rodzaje hipotez

Hipoteza zerowa

Założenie!

Błąd pierwszego rodzaju (α)

Błąd drugiego rodzaju (β)

Moc testu

Formułowanie i weryfikowanie hipotez statystycznych:

Obszar krytyczny

Pojedyncza próba, znane σ

Pojedyncza próba, nie jest znane σ

H

: µ ≠ 92 g H

: µ < 92 g

Wartości krytyczne

Wartości krytyczne, P(|t|

t

) =

Podjęcie decyzji

Enterprise guide

EG, typ test t Jednopróbkowy

EG, definiujemy H

= 92 g

Eg, wyniki

Ustalenie liczby stopni swobody

2. Dwie próby, równe wariancje,

Test t

Przykład

Wartości krytyczne,

= 0,05

Decyzja

Test dla dwóch wariancji

Podobieństwo zmienności

Statystyka F

Rozkład F

Test FISHERA

Decyzja

Jaka różnica?

Test t w SAS, wybór typu tesu

EG, ustalamy zmienne

Wykres

EG, wyniki

Wykres pudełkowy

Hipotezy

Decyzja

Analiza za pomocą EG

Oglądamy wyniki

Directory