Hipotezy statystyczne Testy zgodności Autor: Janusz Górczyński Hipotezy nieparametryczne Hipotezy tego typu dotyczą z reguły zgodności rozkładu empirycznego z rozkładem określonym przez hipotezę lub zgodności rozkładów.
Download ReportTranscript Hipotezy statystyczne Testy zgodności Autor: Janusz Górczyński Hipotezy nieparametryczne Hipotezy tego typu dotyczą z reguły zgodności rozkładu empirycznego z rozkładem określonym przez hipotezę lub zgodności rozkładów.
Slide 1
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 2
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 3
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 4
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 5
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 6
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 7
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 8
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 9
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 10
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 11
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 12
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 13
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 14
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 15
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 16
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 17
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 18
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 19
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 20
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 21
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 2
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 3
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 4
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 5
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 6
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 7
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 8
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 9
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 10
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 11
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 12
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 13
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 14
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 15
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 16
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 17
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 18
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 19
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 20
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21
Slide 21
Hipotezy statystyczne
Testy zgodności
Autor: Janusz Górczyński
1
Hipotezy nieparametryczne
Hipotezy tego typu dotyczą z reguły zgodności
rozkładu empirycznego z rozkładem określonym
przez hipotezę lub zgodności rozkładów pewnej
cechy w kilku populacjach bez określania, o jaki
rozkład chodzi. Z tego też powodu testy służące do
weryfikacji takich hipotez nazywamy testami
zgodności.
Do najczęściej stosowanych testów zgodności należą:
2 (chi-kwadrat) Pearsona
(lambda) Kołmogorowa-Smirnowa
w Shapiro-Wilka
2
Test zgodności
2
Niech hipotezą zerową będzie przypuszczenie, że
cecha X ma w populacji rozkład określony
dystrybuantą F0(x):
H 0 : F ( x ) F0 ( x )
wobec H 1 : F ( x ) F0 ( x )
Statystyka
(n j n j )
t
2
j
2
t
nj
przy prawdziwości H0 ma asymptotyczny rozkład
z liczbą stopni swobody v = k -u - 1.
3
2
Test zgodności
2
Wielkość n n p jest teoretyczną liczebnością w
j-tym przedziale, k jest liczbą przedziałów
klasowych, a u liczbą parametrów szacowanych z
próby.
Wartość empiryczną statystyki
t
j
j
(n j n j )
t
em p
2
j
2
t
nj
porównujemy z wartością krytyczną ,v k u 1
2
wnioskując analogicznie jak w pozostałych
hipotezach.
4
Test zgodności Chi-kwadrat
Elementem kluczowym przy wykorzystaniu
statystyki Chi-kwadrat jest wielkość
p P ( x ( x1 j ; x 2 j ))
t
j
która jest teoretycznym prawdopodobieństwem
wystąpienia obserwacji w j-tym przedziale przy
założeniu prawdziwości H0.
5
Przykład weryfikacji hipotezy X ~ N ( m ; )
Czy można przyjąć, że
średnia ocen studentów
z okresu studiów może
być modelowana
zmienna losową
normalną, jeżeli w
badaniu statystycznym
uzyskano pokazane
obok wyniki
(zestawione w szereg
rozdzielczy).
6
Przygotowania do standaryzacji
Dla wyznaczenia teoretycznego prawdopodobieństwa
wystąpienia elementów w danym przedziale szeregu
rozdzielczego musimy standaryzować krańce zgodnie
ze wzorem:
z
xm
niestety, nie znamy parametru m ani sigma, musimy te
dwa parametry oszacować z próby.
Otrzymamy następujące oceny:
mˆ x 3 , 793
ˆ s 0 , 441
7
Standaryzacja krańców przedziałów
8
Obliczenia wartości testu Chi-kwadrat
9
Wnioskowanie
10
Test 2 zgodności kilku rozkładów
Obserwujemy tę samą cechę w kilku populacjach.
Interesuje nas odpowiedź na pytanie, czy rozkłady te
są takie same (co pociąga za sobą równość
parametrów!).
Jeżeli dystrybuantę danej cechy w i-tej populacji
oznaczymy jako Fi, to hipoteza zerowa ma postać:
H 0 : F1 F2 ... Fk
Zastosowanie testu 2 wymaga zestawienia próby w
postaci tabeli dwukierunkowej. W jednym
kierunku umieszczamy poziomy danej cechy, w
drugim populacje.
11
Test 2 zgodności kilku rozkładów
Klasy
cechy X
1
2
:
r
1
n11
n12
n1r
Numer populacji
2
....
k
n21
....
nk1
n22
....
nk2
nij
n2r
....
nkr
12
Test 2 zgodności kilku rozkładów
Statystyka testowa ma postać:
k
2
r
i 1 j 1
gdzie
n
t
ij
n
ij
n
t
ij
2
t
n ij
ni n j
n
Przy prawdziwości H0 statystyka ta ma rozkład 2
Pearsona z liczbą stopni swobody v=(k-1)(r-1).
Wnioskowanie przebiega analogicznie jak przy
innych hipotezach.
13
Weryfikacja na podstawie
krytycznego poziomu istotności
Dotychczas podejmowaliśmy decyzje weryfikacyjne
poprzez zbadanie, czy wartość empiryczna
statystyki testowej znajduje się w obszarze
krytycznym danej hipotezy (przy z góry ustalonym
poziomie istotności ).
W pakietach statystycznych stosuje się inne
podejście polegające na obliczeniu dla konkretnej
statystyki
z
próby
prawdopodobieństwa
odrzucenia hipotezy zerowej. Prześledźmy to na
przykładzie weryfikacji hipotezy
H 0 : m m0
w obec H 1 : m m 0
14
Krytyczny poziom istotności
Dla wartości empirycznej statystyki temp
wyznaczonej na podstawie n-elemenetowej próby
obliczane jest prawdo-podobieństwo otrzymania
wartości statystyki testującej co najmniej tak dużej,
jak ta uzyskana z próby, czyli
p P ( t t emp )
Kryterium odrzucenia hipotezy zerowej jest
relacja wyznaczonego prawdopodobieństwa do
przyjętego poziomu istotności .
Jeżeli p , to H0 odrzucamy.
Jeżeli p , to nie mamy podstaw do odrzucenia
H0.
15
Weryfikacja hipotez w StatystykaJG
W skoroszycie StatystykaJG znajdziemy wiele procedur
odpowiedzialnych za weryfikację podstawowych
hipotez statystycznych. Poniżej widok zakładki Dodatki
z poleceniami udostępnionymi przez ten skoroszyt.
16
Hipotezy parametryczne w StatystykaJG
Widok możliwych hipotez parametrycznych
17
Przykład weryfikacji hipotezy o średniej, wskazanie
obszaru danych i innych parametrów
18
i rezultat weryfikacji hipotezy o średniej
19
Przykład weryfikacji hipotezy o równości średnich,
wskazanie obszarów danych i innych parametrów
20
i rezultat weryfikacji hipotezy o równości dwóch średnich
21