Transcript tlumacz
Rodzaje plików Plik z danymi Opcje pliku z danymi Nazwa kolumny Dane tekstowe Typ danych Formuła Aby otworzyć okno modyfikujące dane w kolumnie należy kliknąć 2 razy lewy przycisk myszy na nazwie kolumny Statystyka opisowa Dane liczbowe Prawdopodobieństwo Analiza jednej zmiennej Wybór danych do analizy Analiza jednej zmiennej Okna analizy Okna wykresów Aby powiększyć/pomniejszyć okno należy kliknąć na nim 2 razy lewym przyciskiem myszy Analiza jednej zmiennej Zmiana danych wejściowych Rodzaje analizy Zapis do tabel Rodzaje wykresów Rodzaje analizy Dziennik analizy Obliczenia statystyczne Procenty Szereg rozdzielczy Rodzaje wykresów Wykres danych Wykres pudełkowy z wąsami Histogram Dziennik analizy Analizowane dane Ilość wartości danych Najmniejsza wartość Największa wartość Obliczenia statystyczne Średnia arytmetyczna Mediana Najczęściej występująca wartość Wariancja Średnia geometryczna Błąd standardowy Kwartyl dolny (1/4) Odchylenie standardowe Rozstęp = max – min Rozstęp między kwartylami Kwartyl górny (3/4) Skośność Skośność standardowa Kurtoza Współczynnik zmienności Kurtoza standardowa Suma Opcje obliczeń Aby uzyskać dostęp do opcji należy na danym oknie kliknąć prawym przyciskiem myszy Szereg rozdzielczy Klasa Średnia Limit dolny Limit górny Punkt środkowy Liczność Odchylenie standardowe Udział procentowy Liczność skumulowana Częstość skumulowana Opcje szeregu rozdzielczego Ilość klas Limit dolny Limit górny Histogram Liczba danych Opcje Histogramu Ilość klas Limit dolny Limit górny Typ wykresu Wykres liniowy Skumulowany Wykres pudełkowy z wąsami średnia mediana minimum maksimum kwartyl dolny kwartyl górny Prawdopodobieństwo Rozkład dwumianowy Rozkład dwumianowy Opcje danych Opcje danych Wartość zmiennej Opcje analizy Rozkład Próby Obliczanie prawdopodobieństwa Nazwa rozkładu P(X < a) P(X = a) lub wartość dystrybuanty Prawdopod. P(X > a) Wartość zmiennej Rozkład Poissona Rozkład Poissona Opcje danych Opcje danych Wartość zmiennej Opcje analizy Średnia Rozkład Normalny Rozkład Normalny Opcje danych Opcje danych Wartość zmiennej Opcje analizy Średnia Odchylenie standardowe Analiza danych w podzbiorach Dane, które chcemy analizować Kod, według którego chcemy analizować dane Definicja formuł do tabeli danych Obliczenie stopy zwrotu przyrost wartośa obecna wartośa poprzednia wartośa poprzednia Definicja formuły w tabeli danych – klikamy 2 razy lewym przyciskiem myszy na nazwę kolumny LAG – funkcja pozwalająca na popranie do wyliczeń wartości poprzednich O ile wartości do tyłu ma pobierać Definicja formuły Stopa zwrotu Nazwa kolumny LAGNazwa kolumny;1 LAG( Nazwa kolumny;1) Korelacja Korelacja Współczynnik korelacji Rozmiar próbki Wartość krytyczna prawdopodobieństwa Losowanie liczb Wybieramy rozkład z jakiego ma wylosować liczby Opcja losowania liczb znajduje się w dostępnych analizach Zmiana rozkładu Dostępne opcje analizy/wykresów Zapis do tabeli z danymi Losowanie liczb Ilość wylosowanych liczb Zapisywanie wylosowanych liczb Po każdym zapisie losuje nowe liczby Zaznaczamy co zapisujemy Nazwa kolumny Testowanie zgodności rozkładów danych Czyli sprawdzanie, czy dane mają jakiś rozkład Hipotezy: H0: dane mają rozkład normalny H1: dane nie mają rozkładu normalnego Do oceny hipotez stosuje się następujące testy: 1. Test Chi-kwadrat (podstawą tego testu są różnice między liczebnością empiryczną a teoretyczną 2. Test Kołmodorov-Smirnov (podstawą tego testu są odległości między dystrybuantami) Wnioskowanie: Uwaga: Jeżeli P-Value<a to odrzucamy hipotezę H0, czyli dane nie mają rozkładu normalnego Jeżeli któryś z testów odrzuca hipotezę H0 dane nie mają rozkładu normalnego Testowanie zgodności rozkładów danych Wybór danych do analizy Testowanie zgodności rozkładów danych Test Chi-kwadrat Częstość empiryczna Częstość teoretyczna Kwadrat różnicy Wartość testu z ilością stopni swobody Wartość prawdopodobieństwa Różnice między wartościami dystrybuanty Wartość statystyki Regresja jednej zmiennej Dostępne dane Wartość funkcji (skutek) Argumenty funkcji (przyczyna) Regresja liniowa Etapy postępowania przy badaniu modelu funkcji: 1. Wyznaczamy współczynniki regresji 2. Przeprowadzamy testy statystyczne współczynników 3. Oceniamy jakość dopasowania modelu do danych – współczynnik determinacji (mówi nam jaki procent zmienności danych został wyjaśniony zmiennością modelu) 4. Sprawdzamy reszty w modelu • jeżeli model jest wyznaczony dobrze to między resztami nie występuje korelacja (autokorelacja) – przeprowadzamy test Durbina-Watsona i sprawdzamy czy reszty mają rozkład normalny. • Przeprowadzamy test Fischera Regresja liniowa Postać modelu Zmienna zależna Błąd standardowy Zmienna niezależna Wartość statystyki t-Studenta Wartość wyestymowana Wartość krytyczna Odpowiadająca wartość prawdopodobieństwa Wyraz wolny Współczynnik kierunkowy Współczynnik korelacji Współczynnik determinacji Statystyka Durbina-Watsona Współczynnik autokorelacji reszt Postać funkcji Wartość statystyki Fishera Regresja liniowa – testy statystyczne Test istotności współczynników Hipotezy: H0: a=0,b=0 H1:a 0, b 0 Wnioskowanie: Jeżeli P-Value<a to odrzucamy hipotezę H0, czyli współczynniki są istotne Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0, czyli współczynniki nie są istotne Test Durbina-Watsona Statystyka Durbina-Watsona przyjmuje wartości od 0 do 4. Jeżeli wartość tej statystyki jest równa 2 to oznacza to, że nie ma korelacji między resztami Test Fischera Hipotezy: H0: Wszystkie współczynniki w modelu są równe 0 H1: Któryś z współczynników w modelu jest różny od 0 Wnioskowanie: Jeżeli P-Value<a to odrzucamy hipotezę H0 Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0 Regresja liniowa – badanie reszt Zapis wyników analizy Reszty Po zapisie reszt do pliku z danymi badamy czy reszty maja rozkład normalny. Jeżeli reszty mają rozkład normalny oznacza to, że model jest dobrze wyznaczony Regresja wielu zmiennych Dostępne dane Zmienna zależna Zmienna niezależna Badanie modelu funkcji jest takie same jak w przypadku regresji jednej zmiennej Regresja wielu zmiennych Jeżeli jakiś współczynnik jest nieistotny to usuwamy go z modelu Usuwanie stałej z modelu – Analysis Options Stała w modelu Regresja wielomianowa Regresja nieliniowa Dostępne dane Zmienna zależna Wzór funkcji Parametry początkowe Test jednej średniej Jeżeli dane są w postaci tabeli Test jednej średniej Test średniej Hipoteza główna Hipoteza alternatywna Wartość statystyki t-Studenta Wartość krytyczna Przedział ufności Test jednej średniej Zmiana hipotezy alternatywnej Wartość średniej Poziom istotności Średnia nie jest równa Średnia jest mniejsza Hipoteza alternatywna Średnia jest większa Wnioskowanie: Jeżeli P-Value<a to odrzucamy hipotezę H0 Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0 Test jednej średniej Jeżeli dane są w postaci wartości Wartość hipotezy głównej Średnia Odchylenie standardowe Rozmiar próbki Test jednej średniej Poziom ufności Błąd przybliżenia Przedział ufności Hipoteza główna Hipoteza alternatywna Wartość statystyki t-Studenta Wartość krytyczna Poziom istotności Wnioskowanie: Jeżeli P-Value<a to odrzucamy hipotezę H0 Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0 Test równości dwóch średnich Jeżeli dane są w postaci kolumn Średnia pierwsza Średnia druga Test równości dwóch średnich Jeżeli dane są w postaci tabeli Dane Grupowanie Test równości dwóch średnich Test średnich Poziom ufności Błąd przybliżenia Hipoteza główna Hipoteza alternatywna Wartość statystyki t-Studenta Wartość krytyczna Przedział ufności Test równości dwóch średnich Hipoteza główna (wartość różnicy między średnimi) Zmiana hipotezy alternatywnej Średnie nie są równe Średnia pierwsza < drugiej Hipoteza alternatywna Średnia pierwsza > drugiej Poziom istotności Wnioskowanie: Jeżeli P-Value<a to odrzucamy hipotezę H0 Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0 Test równości dwóch średnich Jeżeli dane są w postaci wartości Wartość hipotezy głównej (różnica między średnimi) Średnia Odchylenie standardowe Rozmiar próbki Test równości dwóch średnich Poziom ufności Błąd przybliżenia Przedział ufności Hipoteza główna Hipoteza alternatywna Wartość statystyki t-Studenta Wartość krytyczna Poziom istotności Wnioskowanie: Jeżeli P-Value<a to odrzucamy hipotezę H0 Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0 Liczności danych nieliczbowych Liczności danych nieliczbowych Wartość Częstość Częstość w procentach Częstość skumulowana Częstość skumulowana w procentach Liczności danych nieliczbowych – badanie niezależności Liczności danych nieliczbowych – badanie niezależności Rozkłady brzegowe ni , j licznośi komórkii, j i wiersze j kolumny s n j ni , j licznośi j tej kolumny i 1 r ni ni , j licznośi i tego wiersza j 1 nˆi , j ni n j licznośi teoretyczna n czyli taka wartośa komórkiktóra powinna być gdyby cechy były niezależie nˆi , j ni , j miara odbiegania od niezależie ści Badanie niezależności - test Statystyka s r 2 i 1 j 1 n ˆ i , j ni , j nˆi , j 2 Wartość testu Stopnie swobody Wartość krytyczna r liczba kolumn s liczba wierszy rozkłoz o r 1 s 1 stopniach swobody 2 Hipotezy: H0: Cechy są niezależne H1: Cechy zależą od siebie Wnioskowanie: Jeżeli P-Value<a to odrzucamy hipotezę H0 Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0 Tablica wielodzielcza Cecha pierwsza Cecha druga Tablica wielodzielcza Tablica wielodzielcza testowanie niezależności Wartość testu Stopnie swobody Wartość krytyczna Hipotezy: H0: Cechy są niezależne H1: Cechy zależą od siebie Wnioskowanie: Jeżeli P-Value<a to odrzucamy hipotezę H0 Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0 ANOVA – Analysis of Variance Analiza wariancji umożliwia porównanie średnich w kilku grupach Analiza ze względu na jeden czynnik Analiza ze względu na wiele czynników Dane yki ai ki ki N (0, ) var( ki , mi ) k numer elementu w podgrupie i numer podgrupy H 0 : m1 m2 mr H 1 : mi m j r yki y i 1 k 1 r liczba podgrup ni licznośi i tej podgrupy 2 r ni SSW nr SSB MSB r 1 MSW r y ki i ni i y 2 i 1 k 1 Błędy standardowe F 2 i 1 Zróżnicowane wewnętrzne SSW i średnia w i tej podgrupie y średnia z calośal ni Zróżnicowane międzygrupowe SSB MSB MSW Statystyka Fischera o r-1 stopniach swobody licznika i o n-r stopniach swobody mianownika One-Way ANOVA Zmienna zależna (ta na którą badamy wpływ czynnika) Czynnika wpływający na zmienną zależną Stopnie swobody Wewnątrz grup Między grupami SSB MSB SSW MSW Wartość statystyki Fischera Graniczny poziom istotności One-Way ANOVA Testy wpływu czynnika na zmienną zależną H 0 : m1 m2 mr H 1 : mi m j H 0 : Brak wpływu czynnika na zmienną zależną H 1 : Czynnik ma wpływ na zmienną zależną Wnioskowanie: Jeżeli P-Value<a to odrzucamy hipotezę H0 Jeżeli P-Value>a to nie ma podstaw do odrzucenia H0 One-Way ANOVA Test znaczenia średnich Przedział ufności Średnie Różnice średnich Granice przyjęcia Jeżeli różnica średnich przekracza granice (co jest oznaczone *) to odrzucamy hipotezę, że średnie we wszystkich podgrupach są równe