Podstawowy mechanizm tworzący rozkład normalny

Download Report

Transcript Podstawowy mechanizm tworzący rozkład normalny

Zmienne losowe
Odpowiednik cechy statystycznej w statystyce opisowej
Zmienna losowa – funkcja przyporządkowująca
każdemu zdarzeniu elementarnemu dowolną liczbę
rzeczywistą
Inaczej: Zmienna losowa X to liczbowa prezentacja
wyniku doświadczenia losowego
Jeszcze inaczej: Zmienna losowa to funkcja, która
w wyniku doświadczenia przybiera jedną wartość ze
zbioru wszystkich wartości, jakie ta zmienna może
przyjąć
Zmienne losowe
Funkcja rozkładu prawdopodobieństwa
Funkcja przyporządkowująca poszczególnym
realizacjom zmiennej losowej określone
prawdopodobieństwo
Dlaczego? - ponieważ konkretne realizacje
zmiennej losowej są zdarzeniami losowymi więc
można określić ich prawdopodobieństwo)
Zmienne losowe
Skokowe (dyskretne)przyjmują tylko określone
wartości; Np. l-ba oczek która
wypadnie w rzucie kostką do
gry
Ciągłe- przyjmują
dowolne wartości.
Zmienne losowe
Jeżeli mierzona wielkość
jest związana ze zmienną
losową- jest to
jednowymiarowa zmienna
losowa
Jeżeli mierzona wielkość
jest związana z 2 lub 3
zmiennymi losowymidwuwymiarowa /
trójwymiarowa zmienna
losowa
Rozkłady zmiennych losowych
Dane zbierane podczas pomiarów zawsze
układają się w pewien określony sposób.
To w jaki, zależy przede wszystkim od zjawiska,
które jest obserwowane.
Sposób, w jaki układają się dane- rozkład
zmiennej losowej.
Model probabilistyczny
Opisujemy rozkład empiryczny (doświadczalny) pewną
krzywą ciągłą- sprawdzamy, czy nasze wyniki można opisać
rozkładem teoretycznym.
Nasze wyniki
traktujemy jak
zmienną
losową.
Rozkłady zmiennych losowych
-Bernoulliego
- Beta
- Dwumianowy
- Chi-kwadrat
- Wykładniczy
- F (Fischera-Snedeckora)
- Gamma
- Geometryczny
- Gompertza
- Logistyczny
-Logarytmicznonormalny
- Pareto
-Poissona
- Prostokątny
- Rayleigha
- Średniej
- t-studenta
- Weibulla
- Normalny
Rozkład normalny
Krzywa Gaussa: Rozkład o charakterystycznym
kształcie "krzywej dzwonowej", symetrycznej w
stosunku do średniej.
m
Rozkład normalny
Ogólnie jest dobrym modelem dla rozkładu
zmiennej losowej, w sytuacji gdy:
-Występuje silna tendencja do przyjmowania
wartości położonych blisko środka rozkładu;
m
Rozkład normalny
Ogólnie jest dobrym modelem dla rozkładu
zmiennej losowej, w sytuacji gdy:
- Dodatnie i ujemne odchylenia od środka rozkładu
są jednakowo prawdopodobne;
m
Rozkład normalny
Ogólnie jest dobrym modelem dla rozkładu
zmiennej losowej, w sytuacji gdy:
- Liczność odchyleń gwałtownie spada wraz ze
wzrostem ich wielkości.
m
Rozkład normalny
Podstawowy mechanizm tworzący
rozkład normalny: nieskończoną liczbę
niezależnych zdarzeń losowych które
generują wartości danej zmiennej.
m
Rozkład normalny
Przykład: istnieje prawdopodobnie prawie nieograniczona
liczba czynników determinujących wzrost człowieka.
Należy spodziewać się, że w populacji wzrost podlega
rozkładowi normalnemu.
Rozkład normalny
Najważniejszy rozkład zmiennej losowej ciągłej, ponieważ
• przy nieograniczonym wzroście l-by niezależnych
doświadczeń statystycznych WSZYSTKIE znane
teoretyczne rozkłady zmiennych losowych ciągłych i
dyskretnych są SZYBKO ZBIEŻNE do rozkładu normalnego
•w badaniu prób losowych popełniane są błędy
przypadkowe, których rozkład jest normalny lub zbliżony
do normalnego
Rozkład normalny
Gęstość prawdopodobieństwa
𝑥−𝜇 2
𝑓 𝑥 =
exp⁡
(−
)
𝑥 −2𝜎
𝜇 2
𝜎1 2𝜋
𝑓 𝑥 =
exp⁡
(−
)
𝜎 rozkładu
2𝜋
m i  to parametry
(mając2𝜎
ich wartości
1
uzyskamy gotową krzywą Gaussa)
Rozkład ten jest określony w przedziale (-,+ )
Rozkład normalny
Rozkład normalny
Zasada 3 :
68% wartości cechy leży w odległości  od m;
95,5% wartości cechy leży w odległości  2 od m;
99,7% wartości cechy leży w odległości  3 od m;
Weryfikacja hipotez statystycznych za
pomocą testów stat.
Hipotezy nieparametryczne
Badanie zgodności rozkładu
empirycznego z rozkładami
teoretycznymi
Badanie zgodności rozkładu empirycznego z
teoretycznym
Pytanie badawcze:
Jakim rozkładem teoretycznym (konkretnym wzorem
matematycznym) możemy opisać rozkład (histogram) naszych
danych doświadczalnych ?
Badanie zgodności rozkładu empirycznego z
teoretycznym
Pytanie badawcze:
Nie satysfakcjonuje
nas sama eksploracja
danych?
Na podstawie dopasowanego
modelu teoretycznego
prognozujemy, jak np. zjawisko
będzie wyglądało w przyszłym roku
Chcemy użyć metody
statystycznej
wymagającej rozkładu
normalnego?
Sprawdzamy czy nasza
zmienna/zmienne spełnia/spełniają
rozkład normalny
Badanie zgodności rozkładu empirycznego z
teoretycznym
JAK OKREŚLIĆ, CZY ROZKŁAD JEST
NORMALNY?
1. obliczenie skośności i kurtozy
2. analiza histogramu
3. analiza wykresów P-P
4. testy normalności
Badanie zgodności rozkładu empirycznego z
teoretycznym
1. Porównanie skośności i kurtozy
Skośność mierzy odchylenie rozkładu od symetrii.
Jeśli wartość skośności jest wyraźnie różna od zera,
wówczas dany rozkład jest asymetryczny.
Rozkład normalny jest symetryczny!!!!!!
Badanie zgodności rozkładu empirycznego z
teoretycznym
1. Porównanie skośności i kurtozy
Kurtoza mierzy "spiczastość" rozkładu.
Jeśli wartość kurtozy jest wyraźnie różna od zera,
wówczas rozkład jest albo bardziej płaski albo
bardziej spiczasty niż rozkład normalny.
Wartość kurtozy dla rozkładu normalnego wynosi 0!
Badanie zgodności rozkładu empirycznego z
teoretycznym
2. Analiza histogramu
Badanie zgodności rozkładu empirycznego z
teoretycznym
3. Analiza wykresów P-P
Wykres prawdopodobieństwo-prawdopodobieństwo
Dystrybuanta empiryczna kreślona jest względem
dystrybuanty teoretycznej.
Jeśli teoretyczny rozkład dobrze przybliża rozkład
obserwowany, wówczas punkty na wykresie
powinny leżeć blisko przekątnej.
Badanie zgodności rozkładu empirycznego z
teoretycznym
3. Analiza wykresów P-P
Badanie zgodności rozkładu empirycznego z
teoretycznym
4. Testy normalności
W celu zidentyfikowania rozkładu zazwyczaj
dopasowuje się rozkład empiryczny do rozkładu
teoretycznego poprzez:
porównanie częstości zaobserwowanych w danych
rzeczywistych do częstości oczekiwanych rozkładu
teoretycznego
Badanie zgodności rozkładu empirycznego z
teoretycznym
4. Testy normalności
częstości
zaobserwowane w
danych
rzeczywistych
częstości
oczekiwane
rozkładu
teoretycznego
Badanie zgodności rozkładu empirycznego z
teoretycznym
4. Testy normalności
-chi kwadrat
-Kołmogorowa-Smirnowa
-Lillieforsa
- Shapiro-Wilka
Badanie zgodności rozkładu empirycznego z
teoretycznym
4. Testy normalności
1. Hipoteza zerowa – rozkład jest normalny
H0: F(x) = Fn(x)
2. Hipoteza alternatywna – rozkład jest różny od
rozkładu normalnego
H1: F(x)  Fn(x)
Badanie zgodności rozkładu empirycznego z
teoretycznym
4. Testy normalności
W WebStatistica
p < 0,05
p  0,05
Odrzucamy H0
Rozkład empiryczny nie jest
rozkładem normalnym
Przyjmujemy H0
Rozkład empiryczny jest
rozkładem normalnym