Transcript H 0
Dlaczego obserwujemy??? istotny wpływ, istotną różnicę, istotną zależność. Dlaczego obserwujemy??? istotny wpływ, istotną różnicę, istotną zależność. Dlaczego obserwujemy??? istotny wpływ, istotną różnicę, istotną korelację. Poziom istotności - prawdopodobieństwo mierzące szansę popełnienia podczas weryfikacji hipotezy błędu pierwszego rodzaju. Poziom istotności oznacza się zazwyczaj , a najczęściej przyjmowane w praktyce wartości to: 0,05, 0,01 i 0,001. Błąd pierwszego rodzaju - błąd polegający na tym, że w trakcie weryfikacji hipotezy statystycznej podjęto decyzję o odrzuceniu hipotezy prawdziwej. Błąd drugiego rodzaju - błąd polegający na tym, że na skutek weryfikacji hipotezy statystycznej podjęto decyzję o przyjęciu hipotezy fałszywej. Obszar krytyczny testu - obszar mający tę właściwość, że ilekroć uzyskana w teście wartość odpowiedniej statystyki trafi do tego obszaru, podejmuje się decyzję o odrzuceniu hipotezy zerowej i przyjęciu hipotezy alternatywnej. Hipoteza zerowa (H0) - hipoteza statystyczna bezpośrednio sprawdzana za pomocą stosowanego testu. Hipoteza alternatywna (H1) - hipoteza statystyczna konkurująca w teście z hipotezą zerową w ten sposób, że ilekroć podejmuje się decyzję o odrzuceniu hipotezy zerowej, tyle razy przyjmuje się hipotezę alternatywną. Test statystyczny - „narzędzie” statystyczne, za pomocą którego dokonuje się weryfikacji hipotez statystycznych.. Test istotności - typ testu statystycznego najczęściej stosowanego w praktyce, w którym bierze się pod uwagę jedynie błąd pierwszego rodzaju. W teście istotności możliwe jest wyłącznie odrzucenie - na założonym z góry poziomie istotności - hipotezy zerowej (przyjęcie hipotezy alternatywnej) lub stwierdzenie braku podstaw do jej odrzucenia (co nie oznacza jej przyjęcia). Testy istotności Parametryczne Nieparametryczne Parametryczny test istotności - test istotności, w którym poddaje się weryfikacji hipotezę zerową (parametryczną) precyzującą wartość parametru w ustalonym typie rozkładu populacji generalnej. Uwaga: warunkiem stosowalności testów parametrycznych jest normalność rozkładu badanej cechy (badanych cech). Testy istotności Parametryczne Nieparametryczne Nieparametryczny test istotności - test istotności, w którym weryfikacja statystyczna dotyczy hipotezy zerowej zakładającej ogólny typ rozkładu populacji generalnej. Statystyka matematyczna Estymacja Weryfikacja hipotez Punktowa Przedziałowa Testy parametryczne Testy nieparametryczne Analiza regresji i korelacji Estymacja: - punktowa, - przedziałowa Testy parametryczne Statystyka matematyczna Estymacja Weryfikacja hipotez Punktowa Przedziałowa Testy parametryczne Testy nieparametryczne Analiza regresji i korelacji Estymacja: - punktowa, - przedziałowa Testy parametryczne Poziom istotności Poziom ufności 1– Statystyka matematyczna - to oddzielna dyscyplina matematyczna, zajmująca się metodami wnioskowania o całej zbiorowości statystycznej (populacji generalnej) po zbadaniu tylko pewnej jej części, zwanej próbą lub próbką. Populacja generalna - zbiór dowolnych elementów, niejednakowych z punktu widzenia badanej cechy, zwany również zbiorowością statystyczną. Próba (próbka) - podzbiór populacji generalnej stanowiący obiekt badań ze względu na analizowaną cechę w celu wyciągnięcia wniosków o kształtowaniu się wartości tej cechy w populacji. Wyniki próby - wartości badanej cechy (badanych cech) oznaczone na elementach, które trafiły do próby. Statystyka matematyczna - to oddzielna dyscyplina matematyczna, zajmująca się metodami wnioskowania o całej zbiorowości statystycznej (populacji generalnej) po zbadaniu tylko pewnej jej części, zwanej próbą lub próbką. Populacja generalna - zbiór dowolnych elementów, niejednakowych z punktu widzenia badanej cechy, zwany również zbiorowością statystyczną. Próba (próbka) - podzbiór populacji generalnej stanowiący obiekt badań ze względu na analizowaną cechę w celu wyciągnięcia wniosków o kształtowaniu się wartości tej cechy w populacji. Seria pomiarów – wyniki próby dla pojedynczej cechy wynikowej. Skale pomiarowe - rodzaj (typ) informacji dostarczanych przez wyniki próby (pomiary). Skale pomiarowe podlegają ściśle określonej hierarchii, w ramach której wyróżnia się skalę nominalną, porządkową, różnicową i ilorazową. Im słabsza skala pomiarowa, tym mniej precyzyjne informacje o elementach próby. Skala nominalna - najsłabsza ze skal pomiarowych, w której liczby stanowią jedynie etykiety obserwowanych wartości w próbie. W skali nominalnej liczby (cyfry) zastępują określenia słowne charakteryzujące elementy próby. W skali nominalnej wyrażane są obserwacje dotyczące np. płci, koloru, kształtu, czyli zmiennych losowych „jakościowych”. Skale pomiarowe - rodzaj (typ) informacji dostarczanych przez wyniki próby (pomiary). Skale pomiarowe podlegają ściśle określonej hierarchii, w ramach której wyróżnia się skalę nominalną, porządkową, różnicową i ilorazową. Im słabsza skala pomiarowa, tym mniej precyzyjne informacje o elementach próby. Skala porządkowa - skala, w której wyniki obserwacji na elementach próby mogą być porządkowane np. wg wielkości bądź znaczenia. W skali porządkowej liczby (wartości) reprezentujące elementy próby wskazują naturalną kolejność między nimi. Przykładem obserwacji wyrażonych w tej skali jest określenie wzrostu w dowodzie osobistym (niski, średni, wysoki). Skale pomiarowe - rodzaj (typ) informacji dostarczanych przez wyniki próby (pomiary). Skale pomiarowe podlegają ściśle określonej hierarchii, w ramach której wyróżnia się skalę nominalną, porządkową, różnicową i ilorazową. Im słabsza skala pomiarowa, tym mniej precyzyjne informacje o elementach próby. Skala różnicowa (interwałowa) - skala, która umożliwia nie tylko porządkowanie wartości cechy wynikowej, ale dokładne określenie różnic pomiędzy nimi (w odpowiednich jednostkach). Przykładem wartości wyrażonych w skali różnicowej może być wartość indeksu giełdowego WIG. Skale pomiarowe - rodzaj (typ) informacji dostarczanych przez wyniki próby (pomiary). Skale pomiarowe podlegają ściśle określonej hierarchii, w ramach której wyróżnia się skalę nominalną, porządkową, różnicową i ilorazową. Im słabsza skala pomiarowa, tym mniej precyzyjne informacje o elementach próby. Skala ilorazowa - najmocniejsza spośród omawianych skal pomiarowych. Wartości wyrażone w tej skali można nie tylko porządkować i obliczać ich różnice, ale możliwe jest ustalenie ich stosunku, którego wartość ma ściśle określone znaczenie. Przykładem pomiarów wyrażonych w skali ilorazowej mogą być płace (płaca 3000 złotych jest 3 razy większa od płacy 1000 złotych). Kryteria doboru metod statystycznych Testy statystyczne dla jednej serii (próby) pomiarów Skala pomiarowa Weryfikowana hipoteza dotyczy wartości średniej test dla wartości średniej* wariancji (odch.standardowego) test dla wariancji* mediany test Wilcoxona Różnicowa/ilorazowa typu rozkładu: Porządkowa Nominalna (dwuwartościowa) Test statystyczny test zgodności c2 Pearsona test zgodności Kołmogorowa normalności rozkładu test Shapiro-Wilka losowości próby test losowości próby typu rozkładu test zgodności c2 Pearsona wskaźnika struktury (frakcji) test dla wskaźnika struktury typu rozkładu test zgodności c2 Pearsona losowości próby test losowości próby * - warunkiem stosowalności testu jest „normalność” rozkładu badanej cechy wynikowej Kryteria doboru metod statystycznych Testy statystyczne dla dwóch serii pomiarów (jedna próba) Skala pomiarowa Różnicowa/ilorazowa (ta sama cecha wynikowa) Weryfikowana hipoteza dotyczy Test statystyczny średniej różnicy dwóch serii pomiar. test dla par obserwacji* dwóch serii pobranych z jednej test Wilcoxona populacji siły zależności między cechami Różnicowa/ilorazowa parametrów funkcji (regresji) opi(różne cechy wynikowe) sującej zależność między cechami** test dla wsp. korelacji Minimum porządkowa siły zależności między cechami (różne cechy wynikowe) test korelacji rang Spearmana Jedna cecha nominalna/porządkowa druga dowolna (różne cechy wynikowe) Nominalna (ta sama dwuwartościowa cecha) niezależności badanych cech: • obie cechy dwuwartościowe, • jedna cecha dwuwartościowa, • obie cechy wielowartościowe zmiany wartości (preferencji) test dla współczynników regresji test niezależności c2: • tablica 2×2 (p. Yatesa), • tablica 2×k, • tablica w×k. test McNemara *- warunkiem stosowalności testu jest „normalność” rozkładu badanej cechy wynikowej, ** - wymagane ustalenie, która z badanych cech jest zmienną „niezależną”, a która „zależną” Kryteria doboru metod statystycznych Testy statystyczne dla dwóch serii pomiarów tej samej cechy wynikowej (dwie próby) Skala pomiarowa Weryfikowana hipoteza dotyczy Test statystyczny średnich w dwóch populacjach test dla dwóch średnich* wariancji w dwóch populacjach test dla dwóch wariancji* Różnicowa/ilorazowa jednorodności rozkładów empirycznych test zgodności Kołmogorowa-Smirnowa dwóch prób pochodzących z tej samej test mediany populacji (o tej samej medianie) Minimum porządkowa dwóch prób pochodzących z jednej populacji: test Manna-Whitneya test Walda-Wolfowitza Nominalna wskaźników struktury w dwóch populacjach test dla dwóch wskaźników struktury *- warunkiem stosowalności testu jest „normalność” rozkładu badanej cechy wynikowej Kryteria doboru metod statystycznych Testy statystyczne dla więcej niż dwóch (k) serii pomiarów Skala pomiarowa Liczba prób Weryfikowana hipoteza dotyczy średnich w k populacjach k Różnicowa/ilorazowa wk Minimum porządkowa (ta sama cecha wynikowa) Różnicowa/ilorazowa (cecha objaśniana) dowolna (cechy objaśniające) k 1 1 wariancji w k populacjach Test statystyczny test dla k średnich* test dla k wariancji* średnich w wk populacjach (klasyfikacja podwójna) k prób pochodzących z tej samej populacji test analizy wariancji* k serii pomiarowych pochodzących z tej samej populacji siły zależności jednej cechy od cech pozostałych param. funkcji opisującej zależność jednej cechy od pozostałych cech (objaśniających) k wskaźników struktury test Friedmana test Kruskala-Wallisa test dla wsp. korelacji wielokrotnej** test dla współczynników regresji wielokrotnej** test niezależności (2 k) Nominalna k *- warunkiem stosowalności testu jest „normalność” rozkładu badanych cech wynikowych, ** - wymagane ustalenie, która z cech jest cechą zależną (objaśnianą); cechy objaśniające, wyrażone w skali co najwyżej porządkowej muszą być zakodowane liczbowo Test dla wartości oczekiwanej Hipotezy: H0: m=m0 H1: mm0 Test dla par obserwacji Hipotezy: _ H0: _z=0 H1: z0 Test dla dwóch wartości oczekiwanych Hipotezy: H0: m1=m2 H1: m1m2 Test dla współczynnika korelacji Hipotezy: H0: ρ=0 H1: ρ0 Dwustronny obszar krytyczny f(t) -t 0 t t Test dla wartości oczekiwanej Hipotezy: H0: m=m0 H1: mm0 Test dla par obserwacji Hipotezy: _ H0: _z=0 H1: z0 Test dla dwóch wartości oczekiwanych Hipotezy: H0: m1=m2 H1: m1m2 Test dla współczynnika korelacji Hipotezy: H0: ρ=0 H1: ρ0 Dwustronny obszar krytyczny H0 należy odrzucić i przyjąć H1 f(t) /2 /2 | t | > t -t 0 t t t Test dla wartości oczekiwanej Hipotezy: H0: m=m0 H1: mm0 Test dla par obserwacji Hipotezy: _ H0: _z=0 H1: z0 Test dla dwóch wartości oczekiwanych Hipotezy: H0: m1=m2 H1: m1m2 Test dla współczynnika korelacji Hipotezy: H0: ρ=0 H1: ρ0 Dwustronny obszar krytyczny H0 należy odrzucić i przyjąć H1 f(t) /2 /2 | t | > t -t 0 t t t Test dla wartości oczekiwanej Hipotezy: H0: m=m0 H1: mm0 Test dla dwóch wartości oczekiwanych Hipotezy: H0: m1=m2 H1: m1m2 Test dla par obserwacji Hipotezy: _ H0: _z=0 H1: z0 Test dla współczynnika korelacji Hipotezy: H0: ρ=0 H1: ρ0 Dwustronny obszar krytyczny Brak podstaw do odrzucenia H0 /2 f(t) /2 | t | < t -t t 0 t t Test dla wartości oczekiwanej Hipotezy: H0: m=m0 H1: mm0 Test dla dwóch wartości oczekiwanych Hipotezy: H0: m1=m2 H1: m1m2 Test dla par obserwacji Hipotezy: _ H0: _z=0 H1: z0 Test dla współczynnika korelacji Hipotezy: H0: ρ=0 H1: ρ0 Dwustronny obszar krytyczny Brak podstaw do odrzucenia H0 /2 f(t) /2 | t | < t -t t 0 t t Test dla wartości oczekiwanej Hipotezy: H0: m≥m0 H1: m<m0 Test dla par obserwacji Hipotezy: _ H0: _z≥0 H1: z<0 Test dla dwóch wartości oczekiwanych Hipotezy: H0: m1≥m2 H1: m1<m2 Test dla współczynnika korelacji Hipotezy: H0: ρ≥0 H1: ρ<0 Lewostronny obszar krytyczny H0 należy odrzucić i przyjąć H1 f(t) t < -t t -t 0 t Test dla wartości oczekiwanej Hipotezy: H0: m≥m0 H1: m<m0 Test dla par obserwacji Hipotezy: _ H0: _z≥0 H1: z<0 Test dla dwóch wartości oczekiwanych Hipotezy: H0: m1≥m2 H1: m1<m2 Test dla współczynnika korelacji Hipotezy: H0: ρ≥0 H1: ρ<0 Lewostronny obszar krytyczny H0 należy odrzucić i przyjąć H1 f(t) t < -t t -t 0 t Test dla wartości oczekiwanej Hipotezy: H0: m≥m0 H1: m<m0 Test dla par obserwacji Hipotezy: _ H0: _z≥0 H1: z<0 Test dla dwóch wartości oczekiwanych Hipotezy: H0: m1≥m2 H1: m1<m2 Test dla współczynnika korelacji Hipotezy: H0: ρ≥0 H1: ρ<0 Lewostronny obszar krytyczny f(t) Brak podstaw do odrzucenia H0 t > -t -t t 0 t Test dla wartości oczekiwanej Hipotezy: H0: m≥m0 H1: m<m0 Test dla par obserwacji Hipotezy: _ H0: _z≥0 H1: z<0 Test dla dwóch wartości oczekiwanych Hipotezy: H0: m1≥m2 H1: m1<m2 Test dla współczynnika korelacji Hipotezy: H0: ρ≥0 H1: ρ<0 Lewostronny obszar krytyczny f(t) Brak podstaw do odrzucenia H0 t > -t -t t 0 t Test dla wartości oczekiwanej Hipotezy: H0: m≤m0 H1: m>m0 Test dla par obserwacji Hipotezy: _ H0: _z≤0 H1: z>0 Test dla dwóch wartości oczekiwanych Hipotezy: H0: m1≤m2 H1: m1>m2 Test dla współczynnika korelacji Hipotezy: H0: ρ≤0 H1: ρ>0 Prawostronny obszar krytyczny H0 należy odrzucić i przyjąć H1 f(t) t > t 0 t t t Test dla wartości oczekiwanej Hipotezy: H0: m≤m0 H1: m>m0 Test dla par obserwacji Hipotezy: _ H0: _z≤0 H1: z>0 Test dla dwóch wartości oczekiwanych Hipotezy: H0: m1≤m2 H1: m1>m2 Test dla współczynnika korelacji Hipotezy: H0: ρ≤0 H1: ρ>0 Prawostronny obszar krytyczny H0 należy odrzucić i przyjąć H1 f(t) t > t 0 t t t Test dla wartości oczekiwanej Hipotezy: H0: m≤m0 H1: m>m0 Test dla par obserwacji Hipotezy: _ H0: _z≤0 H1: z>0 Test dla dwóch wartości oczekiwanych Hipotezy: H0: m1≤m2 H1: m1>m2 Test dla współczynnika korelacji Hipotezy: H0: ρ≤0 H1: ρ>0 Prawostronny obszar krytyczny Brak podstaw do odrzucenia H0 f(t) t < t 0 t t t Test dla wartości oczekiwanej Hipotezy: H0: m≤m0 H1: m>m0 Test dla par obserwacji Hipotezy: _ H0: _z≤0 H1: z>0 Test dla dwóch wartości oczekiwanych Hipotezy: H0: m1≤m2 H1: m1>m2 Test dla współczynnika korelacji Hipotezy: H0: ρ≤0 H1: ρ>0 Prawostronny obszar krytyczny Brak podstaw do odrzucenia H0 f(t) t < t 0 t t t Test dla wariancji Hipotezy: H0: σ 2≤σ02 H1: σ 2>σ02 Test Test Test Bartletta Kruskala-Wallisa Friedmana Hipotezy: Hipotezy: Hipotezy: H0: σ12=σ22=…=σk2 H0: k prób - jedna pop. H0: k serii - jedna pop. H1: wariancje różne H1: k prób - różne pop. H1: k serii - różne pop. Prawostronny obszar krytyczny f(c 2) 0 c 2 c2 Test dla wariancji Hipotezy: H0: σ 2≤σ02 H1: σ 2>σ02 Test Test Test Bartletta Kruskala-Wallisa Friedmana Hipotezy: Hipotezy: Hipotezy: H0: σ12=σ22=…=σk2 H0: k prób - jedna pop. H0: k serii - jedna pop. H1: wariancje różne H1: k prób - różne pop. H1: k serii - różne pop. Prawostronny obszar krytyczny f(c 2) H0 należy odrzucić i przyjąć H1 c 2 > c 2 p< p 0 c 2 c2 c2 Test dla wariancji Hipotezy: H0: σ 2≤σ02 H1: σ 2>σ02 Test Test Test Bartletta Kruskala-Wallisa Friedmana Hipotezy: Hipotezy: Hipotezy: H0: σ12=σ22=…=σk2 H0: k prób - jedna pop. H0: k serii - jedna pop. H1: wariancje różne H1: k prób - różne pop. H1: k serii - różne pop. Prawostronny obszar krytyczny f(c 2) H0 należy odrzucić i przyjąć H1 c 2 > c 2 p< p 0 c 2 c2 c2 Test dla wariancji Hipotezy: H0: σ 2≤σ02 H1: σ 2>σ02 Test Test Test Bartletta Kruskala-Wallisa Friedmana Hipotezy: Hipotezy: Hipotezy: H0: σ12=σ22=…=σk2 H0: k prób - jedna pop. H0: k serii - jedna pop. H1: wariancje różne H1: k prób - różne pop. H1: k serii - różne pop. Prawostronny obszar krytyczny f(c 2) Brak podstaw do odrzucenia H0 c2 < c2 p> p 0 c2 c 2 c2 Test dla wariancji Hipotezy: H0: σ 2≤σ02 H1: σ 2>σ02 Test Test Test Bartletta Kruskala-Wallisa Friedmana Hipotezy: Hipotezy: Hipotezy: H0: σ12=σ22=…=σk2 H0: k prób - jedna pop. H0: k serii - jedna pop. H1: wariancje różne H1: k prób - różne pop. H1: k serii - różne pop. Prawostronny obszar krytyczny f(c 2) Brak podstaw do odrzucenia H0 c2 < c2 p> p 0 c2 c 2 c2 Test jednorodności wielu średnich (klasyfikacja pojedyncza) Hipotezy: H0: m1=m2=…=mk H1: średnie różne Test dla dwóch wariancji Hipotezy: H0: σ12=σ22 H1: σ12≠σ22 Prawostronny obszar krytyczny f(F ) 0 F F Test jednorodności wielu średnich (klasyfikacja pojedyncza) Hipotezy: H0: m1=m2=…=mk H1: średnie różne Test dla dwóch wariancji Hipotezy: H0: σ12=σ22 H1: σ12≠σ22 Prawostronny obszar krytyczny f(F ) H0 należy odrzucić i przyjąć H1 F > F 0 F F p< p F Test jednorodności wielu średnich (klasyfikacja pojedyncza) Hipotezy: H0: m1=m2=…=mk H1: średnie różne Test dla dwóch wariancji Hipotezy: H0: σ12=σ22 H1: σ12≠σ22 Prawostronny obszar krytyczny f(F ) H0 należy odrzucić i przyjąć H1 F > F 0 F F p< p F Test jednorodności wielu średnich (klasyfikacja pojedyncza) Hipotezy: H0: m1=m2=…=mk H1: średnie różne Test dla dwóch wariancji Hipotezy: H0: σ12=σ22 H1: σ12≠σ22 Prawa część dwustronnego obszaru krytycznego f(F ) H0 należy odrzucić i przyjąć H1 F > F/2 0 F/2 /2 F p < /2 p F Test jednorodności wielu średnich (klasyfikacja pojedyncza) Hipotezy: H0: m1=m2=…=mk H1: średnie różne Test dla dwóch wariancji Hipotezy: H0: σ12=σ22 H1: σ12≠σ22 Prawostronny obszar krytyczny f(F ) Brak podstaw do odrzucenia H0 F < F 0 F F p> p F Test jednorodności wielu średnich (klasyfikacja pojedyncza) Hipotezy: H0: m1=m2=…=mk H1: średnie różne Test dla dwóch wariancji Hipotezy: H0: σ12=σ22 H1: σ12≠σ22 Prawostronny obszar krytyczny f(F ) Brak podstaw do odrzucenia H0 F < F 0 F F p> p F Test jednorodności wielu średnich (klasyfikacja pojedyncza) Hipotezy: H0: m1=m2=…=mk H1: średnie różne Test dla dwóch wariancji Hipotezy: H0: σ12=σ22 H1: σ12≠σ22 Prawa część dwustronnego obszaru krytycznego f(F ) Brak podstaw do odrzucenia H0 F < F/2 0 F F/2 /2 p > /2 p F