Transcript tlumacz

Rodzaje plików
Plik z danymi
Opcje pliku z danymi
Nazwa
kolumny
Dane
tekstowe
Typ danych
Formuła
Aby otworzyć okno modyfikujące dane w kolumnie należy kliknąć 2 razy lewy przycisk myszy na nazwie kolumny
Statystyka opisowa
Dane liczbowe
Prawdopodobieństwo
Analiza jednej zmiennej
Wybór danych do analizy
Analiza jednej zmiennej
Okna analizy
Okna wykresów
Aby powiększyć/pomniejszyć okno należy kliknąć
na nim 2 razy lewym przyciskiem myszy
Analiza jednej zmiennej
Zmiana danych
wejściowych
Rodzaje analizy
Zapis do tabel
Rodzaje wykresów
Rodzaje analizy
Dziennik analizy
Obliczenia statystyczne
Procenty
Szereg rozdzielczy
Rodzaje wykresów
Wykres danych
Wykres pudełkowy z wąsami
Histogram
Dziennik analizy
Analizowane dane
Ilość wartości danych
Najmniejsza wartość
Największa wartość
Obliczenia statystyczne
Średnia arytmetyczna
Mediana
Najczęściej występująca wartość
Wariancja
Średnia geometryczna
Błąd
standardowy
Kwartyl
dolny (1/4)
Odchylenie standardowe
Rozstęp = max – min
Rozstęp między kwartylami
Kwartyl
górny (3/4)
Skośność
Skośność standardowa
Kurtoza
Współczynnik zmienności
Kurtoza
standardowa
Suma
Opcje obliczeń
Aby uzyskać dostęp do opcji należy na danym oknie kliknąć prawym przyciskiem myszy
Szereg rozdzielczy
Klasa
Średnia
Limit
dolny
Limit
górny
Punkt
środkowy
Liczność
Odchylenie standardowe
Udział
procentowy
Liczność
skumulowana
Częstość
skumulowana
Opcje szeregu rozdzielczego
Ilość klas
Limit dolny
Limit górny
Histogram
Liczba danych
Opcje Histogramu
Ilość klas
Limit dolny
Limit górny
Typ wykresu
Wykres
liniowy
Skumulowany
Wykres pudełkowy z wąsami
średnia
mediana
minimum
maksimum
kwartyl dolny
kwartyl górny
Prawdopodobieństwo
Rozkład dwumianowy
Rozkład dwumianowy
Opcje danych
Opcje danych
Wartość zmiennej
Opcje analizy
Rozkład
Próby
Obliczanie prawdopodobieństwa
Nazwa rozkładu
P(X < a)
P(X = a) lub wartość dystrybuanty
Prawdopod.
P(X > a)
Wartość zmiennej
Rozkład Poissona
Rozkład Poissona
Opcje danych
Opcje danych
Wartość zmiennej
Opcje analizy
Średnia
Rozkład Normalny
Rozkład Normalny
Opcje danych
Opcje danych
Wartość zmiennej
Opcje analizy
Średnia
Odchylenie standardowe
Analiza danych w podzbiorach
Dane, które chcemy
analizować
Kod, według którego
chcemy analizować dane
Definicja formuł do tabeli danych
Obliczenie stopy zwrotu
przyrost 
wartośa obecna  wartośa poprzednia
wartośa poprzednia
Definicja formuły w tabeli danych – klikamy 2 razy lewym przyciskiem myszy na nazwę kolumny
LAG – funkcja pozwalająca na popranie do wyliczeń
wartości poprzednich
O ile wartości do tyłu ma pobierać
Definicja formuły
Stopa zwrotu 
Nazwa kolumny  LAGNazwa kolumny;1
LAG( Nazwa kolumny;1)
Korelacja
Korelacja
Współczynnik korelacji
Rozmiar próbki
Wartość krytyczna prawdopodobieństwa
Losowanie liczb
Wybieramy rozkład z
jakiego ma wylosować
liczby
Opcja losowania
liczb znajduje się
w dostępnych
analizach
Zmiana rozkładu
Dostępne opcje
analizy/wykresów
Zapis do tabeli z
danymi
Losowanie liczb
Ilość wylosowanych liczb
Zapisywanie wylosowanych liczb
Po każdym zapisie losuje nowe liczby
Zaznaczamy co zapisujemy
Nazwa kolumny
Testowanie zgodności rozkładów danych
Czyli sprawdzanie, czy dane mają jakiś rozkład
Hipotezy:
H0: dane mają rozkład normalny
H1: dane nie mają rozkładu normalnego
Do oceny hipotez stosuje się następujące testy:
1.
Test Chi-kwadrat (podstawą tego testu są różnice między liczebnością empiryczną a teoretyczną
2.
Test Kołmodorov-Smirnov (podstawą tego testu są odległości między dystrybuantami)
Wnioskowanie:
Uwaga:
Jeżeli P-Value<a to odrzucamy hipotezę H0,
czyli dane nie mają rozkładu normalnego
Jeżeli któryś z testów odrzuca hipotezę H0 dane
nie mają rozkładu normalnego
Testowanie zgodności rozkładów danych
Wybór danych do analizy
Testowanie zgodności rozkładów danych
Test Chi-kwadrat
Częstość empiryczna
Częstość teoretyczna
Kwadrat różnicy
Wartość testu z ilością stopni swobody
Wartość prawdopodobieństwa
Różnice między
wartościami dystrybuanty
Wartość statystyki
Regresja jednej zmiennej
Dostępne dane
Wartość funkcji (skutek)
Argumenty funkcji (przyczyna)
Regresja liniowa
Etapy postępowania przy badaniu modelu funkcji:
1.
Wyznaczamy współczynniki regresji
2.
Przeprowadzamy testy statystyczne współczynników
3.
Oceniamy jakość dopasowania modelu do danych – współczynnik determinacji
(mówi nam jaki procent zmienności danych został wyjaśniony zmiennością modelu)
4.
Sprawdzamy reszty w modelu
•
jeżeli model jest wyznaczony dobrze to między resztami nie występuje korelacja
(autokorelacja) – przeprowadzamy test Durbina-Watsona i sprawdzamy czy reszty
mają rozkład normalny.
•
Przeprowadzamy test Fischera
Regresja liniowa
Postać modelu
Zmienna zależna
Błąd standardowy
Zmienna niezależna
Wartość statystyki t-Studenta
Wartość wyestymowana
Wartość krytyczna
Odpowiadająca wartość
prawdopodobieństwa
Wyraz wolny
Współczynnik kierunkowy
Współczynnik korelacji
Współczynnik determinacji
Statystyka Durbina-Watsona
Współczynnik autokorelacji reszt
Postać funkcji
Wartość statystyki Fishera
Regresja liniowa – testy statystyczne
Test istotności współczynników
Hipotezy:
H0: a=0,b=0
H1:a  0, b  0
Wnioskowanie:
Jeżeli P-Value<a to odrzucamy hipotezę H0, czyli współczynniki są istotne
Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0, czyli współczynniki nie są istotne
Test Durbina-Watsona
Statystyka Durbina-Watsona przyjmuje wartości od 0 do 4. Jeżeli wartość tej statystyki jest
równa 2 to oznacza to, że nie ma korelacji między resztami
Test Fischera
Hipotezy:
H0: Wszystkie współczynniki w modelu są równe 0
H1: Któryś z współczynników w modelu jest różny od 0
Wnioskowanie:
Jeżeli P-Value<a to odrzucamy hipotezę H0
Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0
Regresja liniowa – badanie reszt
Zapis wyników analizy
Reszty
Po zapisie reszt do pliku z danymi badamy czy reszty maja rozkład normalny.
Jeżeli reszty mają rozkład normalny oznacza to, że model jest dobrze wyznaczony
Regresja wielu zmiennych
Dostępne dane
Zmienna zależna
Zmienna niezależna
Badanie modelu funkcji jest takie same jak w przypadku regresji jednej zmiennej
Regresja wielu zmiennych
Jeżeli jakiś współczynnik jest nieistotny to usuwamy go z modelu
Usuwanie stałej z modelu – Analysis Options
Stała w modelu
Regresja wielomianowa
Regresja nieliniowa
Dostępne dane
Zmienna zależna
Wzór funkcji
Parametry
początkowe
Test jednej średniej
Jeżeli dane są w postaci tabeli
Test jednej średniej
Test średniej
Hipoteza główna
Hipoteza alternatywna
Wartość statystyki t-Studenta
Wartość krytyczna
Przedział ufności
Test jednej średniej
Zmiana hipotezy alternatywnej
Wartość średniej
Poziom istotności
Średnia nie jest równa
Średnia jest mniejsza
Hipoteza alternatywna
Średnia jest większa
Wnioskowanie:
Jeżeli P-Value<a to odrzucamy hipotezę H0
Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0
Test jednej średniej
Jeżeli dane są w postaci wartości
Wartość hipotezy głównej
Średnia
Odchylenie standardowe
Rozmiar próbki
Test jednej średniej
Poziom ufności
Błąd przybliżenia
Przedział ufności
Hipoteza główna
Hipoteza alternatywna
Wartość statystyki t-Studenta
Wartość krytyczna
Poziom istotności
Wnioskowanie:
Jeżeli P-Value<a to odrzucamy hipotezę H0
Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0
Test równości dwóch średnich
Jeżeli dane są w postaci kolumn
Średnia pierwsza
Średnia druga
Test równości dwóch średnich
Jeżeli dane są w postaci tabeli
Dane
Grupowanie
Test równości dwóch średnich
Test średnich
Poziom ufności
Błąd przybliżenia
Hipoteza główna
Hipoteza alternatywna
Wartość statystyki t-Studenta
Wartość krytyczna
Przedział ufności
Test równości dwóch średnich
Hipoteza główna
(wartość różnicy między średnimi)
Zmiana hipotezy alternatywnej
Średnie nie są równe
Średnia pierwsza < drugiej
Hipoteza alternatywna
Średnia pierwsza > drugiej
Poziom istotności
Wnioskowanie:
Jeżeli P-Value<a to odrzucamy hipotezę H0
Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0
Test równości dwóch średnich
Jeżeli dane są w postaci wartości
Wartość hipotezy głównej (różnica między średnimi)
Średnia
Odchylenie standardowe
Rozmiar próbki
Test równości dwóch średnich
Poziom ufności
Błąd przybliżenia
Przedział ufności
Hipoteza główna
Hipoteza alternatywna
Wartość statystyki t-Studenta
Wartość krytyczna
Poziom istotności
Wnioskowanie:
Jeżeli P-Value<a to odrzucamy hipotezę H0
Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0
Liczności danych nieliczbowych
Liczności danych nieliczbowych
Wartość
Częstość
Częstość w
procentach
Częstość
skumulowana
Częstość
skumulowana w
procentach
Liczności danych nieliczbowych – badanie niezależności
Liczności danych nieliczbowych – badanie niezależności
Rozkłady brzegowe
ni , j  licznośi komórkii, j
i  wiersze
j  kolumny
s
n j   ni , j  licznośi j  tej kolumny
i 1
r
ni   ni , j  licznośi i  tego wiersza
j 1
nˆi , j 
ni  n j
 licznośi teoretyczna
n
czyli taka wartośa komórkiktóra powinna
być gdyby cechy były niezależie
nˆi , j  ni , j  miara odbiegania od niezależie ści
Badanie niezależności - test
Statystyka
s
r
 2  
i 1 j 1
n
ˆ
i , j  ni , j 
nˆi , j
2
Wartość
testu
Stopnie
swobody
Wartość
krytyczna
r  liczba kolumn
s  liczba wierszy
rozkłoz  o r  1  s  1 stopniach swobody
2
Hipotezy:
H0: Cechy są niezależne
H1: Cechy zależą od siebie
Wnioskowanie:
Jeżeli P-Value<a to odrzucamy hipotezę H0
Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0
Tablica wielodzielcza
Cecha pierwsza
Cecha druga
Tablica wielodzielcza
Tablica wielodzielcza testowanie niezależności
Wartość
testu
Stopnie
swobody
Wartość
krytyczna
Hipotezy:
H0: Cechy są niezależne
H1: Cechy zależą od siebie
Wnioskowanie:
Jeżeli P-Value<a to odrzucamy hipotezę H0
Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0
ANOVA – Analysis of Variance
Analiza wariancji umożliwia porównanie średnich w kilku grupach
Analiza ze względu
na jeden czynnik
Analiza ze względu
na wiele czynników
Dane
yki    ai   ki
 ki  N (0,  )
var(  ki ,  mi )
k  numer elementu w podgrupie
i  numer podgrupy
H 0 : m1  m2    mr
H 1 : mi  m j
r
  yki  y 
i 1 k 1
r  liczba podgrup
ni  licznośi i  tej podgrupy
2
r
ni
SSW
nr
SSB
MSB 
r 1
MSW 
r
   y ki   i    ni  i  y 
2
i 1 k 1
Błędy
standardowe
F
2
i 1
Zróżnicowane wewnętrzne
SSW
i  średnia w i  tej podgrupie
y  średnia z calośal
ni
Zróżnicowane międzygrupowe
SSB
MSB
MSW
Statystyka Fischera o r-1 stopniach
swobody licznika i o n-r stopniach
swobody mianownika
One-Way ANOVA
Zmienna zależna (ta na którą
badamy wpływ czynnika)
Czynnika wpływający na
zmienną zależną
Stopnie swobody
Wewnątrz grup
Między grupami
SSB
MSB
SSW
MSW
Wartość statystyki Fischera
Graniczny
poziom
istotności
One-Way ANOVA
Testy wpływu czynnika na zmienną zależną
H 0 : m1  m2    mr
H 1 : mi  m j
H 0 : Brak wpływu czynnika na zmienną zależną
H 1 : Czynnik ma wpływ na zmienną zależną
Wnioskowanie:
Jeżeli P-Value<a to odrzucamy hipotezę H0
Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0
One-Way ANOVA
Test znaczenia średnich
Przedział ufności
Średnie
Różnice średnich
Granice przyjęcia
Jeżeli różnica średnich przekracza granice (co jest oznaczone *) to odrzucamy
hipotezę, że średnie we wszystkich podgrupach są równe