Hipotezy statystyczne

Download Report

Transcript Hipotezy statystyczne

30.04.2020

Hipotezy statystyczne

dr hab. Dariusz Piwczyński

1

Po co hipotezy? do...

    badania założeń dotyczących średniego poziomu cechy w populacji generalnej: wydajność mleka dla określonej rasy bydła wynosi 6700 kg oceny różnicy między dwiema grupami: czy istnieje różnica między dwiema grupami zwierząt żywionych paszami o różnym składzie pod względem przyrostów dobowych?

badania zależności między cechami: czy istnieje zależność pomiędzy ilością wypalanych papierosów a zachorowalnością na nowotwór płuc?

porównania rozkładów zmiennych: badamy czy zmienna przyrosty dobowe posiada rozkład zgodny z normalnym.

30.04.2020

2

Weryfikacja hipotez statystycznych

 polega na doborze określonego schematu postępowania zwanego

testem statystycznym

, który rozstrzyga, przy jakich wynikach z próby sprawdzoną hipotezę należy odrzucić, a przy jakich nie ma podstaw do jej odrzucenia.

3

30.04.2020

Hipotezy możemy podzielić na

: 

parametryczne

, tj. takie, które dotyczą wartości parametrów statystycznych populacji, np. średniej arytmetycznej czy odchylenia standardowego 

nieparametryczne

– dotyczą postaci rozkładu zmiennej lub losowości próby.

30.04.2020

4

Rodzaje hipotez

 Hipoteza, która podlega sprawdzeniu zwana jest

hipotezą zerową (H 0

)  Konkurencyjną dla niej hipotezą jest

hipoteza alternatywna (H 1 )

. 30.04.2020

5

Hipotezy jednostronne i dwustronne  Na podstawie pewnych przesłanek zakładamy, że masa ciała samic gatunku kret wynosi 92 g. H 0 : µ = 92 g  Alternatywna hipoteza: H 1 : µ < 92 g (hipoteza jednostronna) H 1 : µ > 92 g (hipoteza jednostronna) H 1 : µ ≠ 92 g (hipoteza dwustronna)

6

30.04.2020

Hipoteza zerowa

 

Hipotezę zerową

, dotyczącą wartości oczekiwanych można zapisać następująco:

H 0 : E(X 1 ) = E(X 2 ),

np. zakładamy, że średnia masa ciała samic i samców gatunku kret (w populacji generalnej) jest taka sama.

H 0 : E(X 1 ) = E(X 2 ) ~ H 0 : μ 1 = μ 2

30.04.2020

7

Założenie!

 Przystępując do weryfikacji hipotezy zerowej, zakładamy iż jest ona prawdziwa.

8

30.04.2020

Błąd pierwszego rodzaju (α)

  Polega na odrzuceniu hipotezy zerowej, mimo że jest ona prawdziwa. Błąd ten zwany jest poziomem istotności. Najczęściej przyjmuje wartości 0,05; 0,01 czy 0,001. Poziom istotności wskazuje, na jak mały błąd „zgadzamy się” przy weryfikacji hipotezy zerowej.

Poziom istotności

charakteru próby.

określa dopuszczalną częstość wystąpienia wyników niezgodnych z przyjętymi założeniami na skutek losowego

9

30.04.2020

Błąd drugiego rodzaju (β)

 Polega na przyjęciu hipotezy zerowej, gdy jest ona w rzeczywistości fałszywa.

10

30.04.2020

Błędy towarzyszące testowaniu hipotez Hipoteza zerowa Decyzja Przyjąć H 0 Odrzucić H 0 prawdziwa fałszywa decyzja prawidłowa błąd II rodzaju błąd I rodzaju decyzja prawidłowa

Moc testu

1

 , jest to prawdopodobieństwo odrzucenia hipotezy zerowej, gdy jest ona fałszywa, a hipoteza alternatywna jest prawdziwa.  Testem najmocniejszym jest ten, którego, przy ustalonym poziome istotności α

,

wartość  jest najmniejsza.

12

30.04.2020

Formułowanie i weryfikowanie hipotez statystycznych:

    Sformułowanie hipotezy zerowej i alternatywnej.

Wybór testu lub testów określających reguły postępowania przy weryfikacji hipotezy zerowej. Określenie poziomu istotności, a tym samym wyznaczenie obszaru krytycznego hipotezy.

Formułowanie – na podstawie wyników z próby, testu i przyjętych założeń - wniosku końcowego.

13

30.04.2020

Obszar krytyczny

 Zbiór wszystkich wartości danej statystyki, dla których hipoteza zerowa jest odrzucana.

14

30.04.2020

Pojedyncza próba, znane σ

u

x

   0

n

  Obliczone u porównujemy z wartością tablicową u α.

Jeżeli |u| ≥ u α to mamy podstawę do odrzucenia hipotezy zerowej.

30.04.2020

15

Pojedyncza próba, nie jest znane σ

t

x

  0

S x S x

S x n S x

– średni błąd średniej arytmetycznej

30.04.2020

16

Czy mamy podstawę do odrzucenia H 0 = 92 g?

H

1

: µ ≠ 92 g H

1

: µ < 92 g

18

30.04.2020

Wartości krytyczne

 Wartości krytyczne rozkładu t-Studenta można otrzymać w wyniku zastosowania funkcji: =rozkład.t.odw(α; ν)

Wartości krytyczne, P(|t|

t

 , 

) =

Podjęcie decyzji

 Ponieważ obliczona wartość statystyki t jest większa niż wartość krytyczna, odrzucamy hipotezę. Nie mamy podstaw do stwierdzenia, że przeciętna masa samic w populacji generalnej to 92 g.

Enterprise guide

EG, typ test t Jednopróbkowy

EG, Wskazujemy zmienną do analizy

EG, definiujemy H

0

= 92 g

Eg, wyniki

„Pr” – prawdopodobieństwo (p-value) zerową – – błąd z jakim należy się liczyć odrzucając hipotezę prawdopodobieństwo otrzymania wyniku.

Porównujemy 2 grupy, Układ doświadczenia  Niezależny a wiązany!

Doświadczenie dwugrupowe

Formułujemy hipotezę zerową i alternatywną

 

H 0 : E(X 1 ) = E(X 2 ) H 1 : E(X 1 )

E(X 2 )

Porównujemy 2 grupy – kryteria doboru testu Rozkład normalny?

TAK

Czy znane wariancje (pop. generalnej?

NIE

Czy równe wariancje?

NIE

Test Cochrana Coxa

TAK

Test U

TAK

Test Z n 1

NIE

Duże próby?

i n 2 >30 (50)?

NIE

Testy nieparametryczne

TAK

Test t

29

30.04.2020

Istota porównań – najmniejsza istotna różnica (NIR, LSD)

wks

S D

 Jest to wartość różnicy między średnimi, która może być jeszcze uznana za wartość losową.

 x 1

Jeśli różnica między średnimi jest większa niż NIR to znaczy, że są efektem czynnika kontrolowanego w doświadczeniu.

 x 2  wks  S D x 1 S  D x 2  wks

wks – wartość krytyczna danej statystyki, np. t-Studenta, u

30.04.2020

30

1. Dwie próby, nierówne wariancje

Test Cochrana-Coxa Statystyka testująca t

t  x 1  x 2 S D S D  S 1 2 n 1  S 2 2 n 2

S D – średni błąd różnicy średnich Rozkład statystyki testującej: t-Studenta

30.04.2020

31

Ustalenie liczby stopni swobody

ν  n 1 1  1   S   S 1 2 n 1 2 1 n 1  S 2 2 n 2   2  n 2   1  1   2 S 2 2 n 2   2

2. Dwie próby, równe wariancje,

Test t

Statystyka testująca t

t  x 1  x 2 S D S D  (n 1  1)  S 2 1 (n 1   n 2 (n  2  2) 1)  S 2 2

Rozkład statystyki testującej: t-Studenta o

= n 1 + n 2 – 2

30.04.2020

 n n 1 1  n 2  n 2

33

3.Rozkład normalny, znane wariancje odnoszące się do populacji generalnej (test U)

Statystyka testująca:

U  x 1  x 2 σ 1 2  σ 2 2 n 1 n 2

Rozkład statystyki testującej: N(0; 1)

4. Rozkład dowolny, duże próby, nie jest znana wariancja

Statystyka testująca:

Z 

S

1 2 n x

x

1

x

  x 1 S 2 2 2 n 2

Rozkład statystyki testującej: N(0; 1)

Przykład

    Naszym zamiarem jest porównanie samic i samców gatunku kret w zakresie masy ciała.

Próby są małe (n < 30), zakładamy że cecha posiada rozkład zgodny z normalnym. Nie znamy wariancji w populacji generalnej. Z kolei wariancje populacji próbnych są różne.

H 0 : E(X ♂ ) = E(X ♀ ) H 1 : E(X ♂ )

E(X ♀ )

Przykład cd.,

Test Cochrana-Coxa

Z jakich wzorów korzystamy?

S D  S 1 2 n 1  S 2 2 n 2  258 , 82  17 74 , 21 17  4 , 426 t  x 1  x 2 S D  87 , 68  73 , 76 4 , 426  3 , 145 ν  1 7 1  1       258,82 17 258,82 17    2   74,21 17    2 17 1  1    74,21 17    2  24 , 478

Wartości krytyczne,

= 0,05

ν  1 7 1  1       258,82 17 258,82 17    2   74,21 17    2 17 1  1    74,21 17    2  24 , 478 

0,05 0,01 0,001 t 2.064

2.797

3.745

-2,064 2,064

Obliczona wartość statystyki t to 3,145

=ROZKŁAD.T.ODW(0.05;24)

Decyzja

 Ze względu na fakt, iż obliczona wartość statystyki |t| jest większa niż wartość krytyczna przy p = 0,01 odrzucamy hipotezę zerową. Stwierdzamy tym samym, że grupy różnią się między sobą wysoko istotnie.

Test dla dwóch wariancji

  Zanim przystąpimy do zbadania hipotezy zerowej dotyczącej wartości przeciętnych, musimy zweryfikować hipotezę dotyczącą podobieństwa wariancji!

Jednym z kryteriów uwzględnianych w trakcie doboru właściwego testu do porównania dwóch wartości oczekiwanych jest ustalenia czy wariancje odnoszące się do tychże porównywanych populacji są jednakowe.

Podobieństwo zmienności

  Hipoteza zerowa o równości wariancji w porównywanych populacjach posiada następującą postać:

H 0 : D 2 (X 1 ) = D 2 (X 2 )

zaś alternatywna zakładająca różnice w zakresie zmienności:

H 1 : D 2 (X 1 )

D 2 (X 2 )

Statystyka F

 Wykorzystywana jest do weryfikacji hipotezy o równości dwóch wariancji F  S 2 1 S 2 2     Jeżeli wariancje porównywanych grup nie są sobie równe, to w powyższym wzorze, w liczniku umieszczamy wariancję o wyższej wartości!!!

Obliczoną wartość statystyki porównujemy z wartością tablicową ustaloną dla określonego poziomu istotności i liczby stopni swobody.

Rozkład F

Test FISHERA

Mamy podstawę do odrzucenia H samic i samców! W praktyce oznacza, że zmienność masy ciała samic i samców w populacji generalnej jest różna.

0 zakładającej podobieństwo wariancji w grupie

zatem test Cochrana-Coxa

Decyzja

  Obliczone prawdopodobieństwo jest mniejsze niż 0,01 (oczywiście mniejsze niż 0,05) zatem mamy podstawę do odrzucenia H 0 i przyjęcia H 1 . Co to oznacza? Możemy uznać, że przeciętna masa ciała samic i samców w populacji generalnej jest różna!

Jaka różnica?

Stwierdzamy, że różnica między płciami w zakresie masy ciała jest wysoko istotna.

Test t w SAS, wybór typu tesu

EG, ustalamy zmienne

Wykres

EG, wyniki

3. odczytujemy zatem wyniki dotyczące testu t dla wariancji

Nierównych 1. Rozstrzygamy czy wariancje są równe?

2. Nie są!

Wykres pudełkowy

Wykres pudełkowy

wartości cechy, które oddalone od krawędzi skrzynki więcej niż wynosi półtora odstępu międzykwartylowego (1,5 x IQR)

Doświadczenie wiązane, przykład  Wymiary grubości rogówki (mierzonej w jej centrum, μm) oka ludzkiego przed założeniem szkieł kontaktowych (GL0) i po 2 tygodniach od ich noszenia (GL2)

Hipotezy

 Hipotezę zerowa – zakładamy, że grubość rogówki oka ludzkiego przed założeniem i po dwóch tygodniach noszenia szkieł kontaktowych jest taka sama.

H 0 : E(X 1 ) = E(X 2 )

 Hipoteza alternatywna – zakładamy, że grubość rogówki oka ludzkiego przed założeniem i po dwóch tygodniach noszenia szkieł kontaktowych jest różna.

H 1 : E(X 1 )

E(X 2 )

Doświadczenie wiązane, obliczamy wartość statystyki t t  x S d d x d – średnia z indywidualnych różnic między wymiarami grubości rogówki w 2 terminach kontroli S d  S 2 d n – błąd standardowy różnicy S d 2 – wariancja zmiennej d i

56

30.04.2020

Doświadczenie wiązane, MS Excel  nasze dane

Doświadczenie wiązane, MS Excel  Tworzymy zmienną d i  d i = GL0 – GL2

Doświadczenie wiązane, MS Excel Obliczamy średnią kolumny d i

x d

  107 , 86 22   4 , 9029 S 2 d Obliczamy wariancję kolumny d i   x 2 d  n    1 n x d  2 S d Obliczamy błąd standardowy różnicy  S 2 d n  216,19 22  3,13 Obliczamy statystykę t t  x S d d   4,9029   1,56 3,13

Decyzja

    Obliczona wartość statystyki t: |t| = 1,56 Wartość krytyczna t (0,05; 21) = 2,080 Nie mamy podstaw do odrzucenia hipotezy zerowej, ponieważ obliczona przez nas wartość statystyki t jest mniejsza niż wartość krytyczna odczytana przy poziomie istotności 0,05 i liczbie stopni swobody 21. Można zatem stwierdzić, że noszenie soczewek kontaktowych nie wpływa statystycznie na zmianę grubości rogówki.

Doświadczenie zależne, MS Excel  Wykorzystujemy funkcję test.t()

Obliczone prawdopodobieństw o jest większe niż 0,05. Nie ma podstaw do odrzucenia H 0 .

Koniecznie musimy wpisać „1” w miejsce Typ – oznacza to doświadczenie wiązane

Analiza za pomocą EG

 Wybieramy rodzaj analizy statystycznej  Wybieramy typ testu t

Wskazujemy zmienne analizowane

Oglądamy wyniki

Hipoteza o zgodności rozkładu empirycznego z rozkładem teoretycznym  H 0 : X ~ N(  ,  ) 30.04.2020

65