Statystyka- wykład 1

Download Report

Transcript Statystyka- wykład 1

Statystyka
Wykład 1
dr Małgorzata Radziukiewicz
Co to jest statystyka ?
• Statystykę rozumiemy jako dane
ilościowe o zjawiskach w różnych
dziedzinach rzeczywistości.
• Statystyka jest nauką o metodach
badania zjawisk masowych.
Zatem teorię statystyki lub, krócej
statystykę rozumiemy jako naukę
wyjaśniającą metody statystyczne.
Historia statystyki
 Słowo „statystyka”, „statystyk”, „statystyczny” w ich
obecnym znaczeniu liczą zaledwie sto lat.
 Słowo „statystyka” pochodzi od łacińskiego status,
oznaczającym stan państwa.
 Początki gałęzi wiedzy, zwanej statystyką, sięgają
XVI wieku. Włochów, których zadaniem było
opisanie stanu państwa (włoskie stato) za pomocą
liczb nazywano statiti, a pracę, którą wykonywali
statystyką.
 Statystyka – rozumiana jako metoda liczbowego opisu
stanu państwa, rozwinęła się dopiero w XVII i XVIII
wieku, głównie w Niemczech i Anglii.
 Najwcześniejszy znany fakt użycia słowa „statystyka”
znajdujemy w książce pruskiego barona Jacoba Friedricha von
Bielfelda „The Elements of Universal Erudition”(1770).
Rozdział Statystyka zawiera definicję tego przedmiotu :
„...nauka, która uczy nas , jaki jest polityczny układ
wszystkich współczesnych państw w świecie...”
 Książka niemieckiego geografa i zoologa Eberharda Augusta
Wilhelma von Zimmermanna „A Political Survey of the
Present State of Europe“ (1787), zawiera szerszą definicję
statystyki “…gałąź wiedzy politycznej, której przedmiotem
jest aktualna i relatywna siła licznych współczesnych państw,
siła wynikająca z ich naturalnych warunków, przemysłu i
cywilizacji ich obywateli oraz mądrości ich rządów...”
 Sir John Sinclair (1754-1835)
angielski ekonomista i agronom,
założyciel i pierwszy prezes
angielskiego urzędu do spraw
rolnictwa, wydawca i organizator
pierwszego rachunku statystycznego
Szkocji (1791-99). W liście do
duchownych Kościoła Szkocji (1790)
wyjaśnia, że w Niemczech „..badania
statystyczne ....są prowadzone na
bardzo szeroką skalę” i dodaje iż
badania statystyczne dotyczą
„...ludności, warunków politycznych,
produkcji kraju i innych spraw
państwa..” W swojej pionierskiej 21
tomowej pracy „Statistical Accounts
of Scotland” jako pierwszy użył słowa
statystyka w języku angielskim
 W ciągu pierwszych lat 19-tego wieku trwał nieprzerwanie
rozrost danych oficjalnych, a zestawienia liczbowe
zaczęły zastępować wcześniejsze opisy słowne.
„Statystyka” stopniowo przyjmowała węższy sens zaczęto ją pojmować jako przedstawienie charakterystyk
państwa za pomocą metod numerycznych (ilościowych).
 Z biegiem czasu metody opracowane dla potrzeb analizy
stanu państwa wykorzystywano do analizy różnego
rodzaju danych. W ten sposób powstała dziedzina wiedzy
zwana statystyka opisową.
 W okresie, gdy powstawały metody statystyki
opisowej, rozwijana była równolegle metodologia
rachunku prawdopodobieństwa.
 Matematycy: Pascal (1623-1662), James Bernoulli
(1654-1705), Abraham De Moivre (1667- 1754),
Laplace (1749-1827), Gaus (1777-1855), Joseph
Louis Lagrange (1736-1813), Leonhard Euler (17071783) wnieśli ogromny wkład do rozwoju teorii
prawdopodobieństwa.
 Połączenie tych dwóch dziedzin wiedzy
zaowocowało powstaniem statystyki matematycznej,
zwanej czasami teorią wnioskowania statystycznego.
 W końcu 19-tego wieku następuje dalsza przemiana
znaczenia słowa „statystyka”. Od nazwy nauki
przeniesiono termin na oznaczenie danych, którymi
ta nauka się zajmuje. Następnie termin „statystyka”
zostaje użyty do podobnych danych liczbowych
występujących w innych naukach (m.in. antropologii
i meteorologii).
 W roku 1834 utworzono Królewskie Towarzystwo
Statystyczne (Royal Statistical Society)
 W latach 1838-39 wydano pierwszy tom czasopisma
„The Journal of the Royal Statistical Society”
 Od roku 1885 działa Międzynarodowy Instytut
Statystyczny z siedzibą w Hadze.
Statystyka, nauka zajmująca się
metodami badania przedmiotów lub
zjawisk masowych w przestrzeni lub
w czasie i ich ilościową lub
jakościową analizą z punktu
widzenia nauki do której należą.
(Encyklopedia Powszechna PWN, W-wa, 1987)
• W statystyce wyodrębnia się dwa działy:
• statystykę opisową (elementarną)
• statystykę matematyczną
zajmuje się metodami
• gromadzenia danych
statystycznych, (zbiorowości
statystyczne),
Statystyka
opisowa
• prezentacji danych
statystycznych ( w sposób
tabelaryczny i graficzny),
• sumarycznego opisu danych
statystycznych (za pomocą
parametrów statystycznych)
Statystyka
matematyczna
• zajmuje się metodami
poznania własności rozkładu
jednej lub kilku cech w
zbiorowości statystycznej
(populacji generalnej) na
podstawie zbadania części tej
zbiorowości (zwanej próbą
lub próbką), wybranej w
sposób losowy
W statystyce matematycznej wyróżnia się dwa
działy:
•
•
teorię estymacji,
teorię weryfikacji hipotez statystycznych
Najczęściej stosowanymi metodami w statystyce matematycznej są:
•
analiza wariancji
to technika postępowania statystycznego stosowana przy badaniu
systematycznego wpływu danych czynników na przypadkowe wyniki.
Analiza wariancji dostarcza kryteriów pozwalających rozstrzygać czy dane
uzyskane z obserwacji przeprowadzonego eksperymentu można uznać za
przypadkowe, czy należy je uznać za odchylenia systematyczne.
•
analiza współzależności
to jednoczesne badanie populacji ze względu na dwie lub więcej cech
(analiza regresji i analiza korelacji)
•
metoda reprezentacyjna
wyznacza charakterystyki badanej zbiorowości statystycznej bez
statystycznego opracowywania całej zbiorowości, lecz na podstawie
danych z próby (z reprezentacji).
Przedmiotem statystyki jest populacja
generalna zwana też zbiorowością statystyczną
• populacja generalna = zbiorowość
statystyczna = zbiór jednostek (elementów
zbiorowości)
1. Populacja generalna musi być w sposób
jednoznaczny określona.
Populacja generalna
gospodarstwa domowe
Pytania o przedmiot badania
co?
miejscowość, województwo, kraj
gdzie?
moment czasu
kiedy?
2. Mając w sposób jednoznaczny określoną populację
generalną należy następnie odpowiedzieć jakie
własności lub cechy będą nas w badaniu interesowały
• Cecha
statystyczna to
właściwość
pozwalająca
odróżnić
jednostki
zbiorowości
• cechy o charakterze jakościowym
(niemierzalna): - płeć, zawód,
wykształcenie, źródło utrzymania, typ
rodziny biologicznej, dział zatrudnienia,
sektor zatrudnienia głowy gospodarstwa
domowego, itp.
wyrażana słownie lub za pomocą symboli
• cechy o charakterze ilościowym
(mierzalna): - wiek, liczba osób w
gospodarstwie domowym, liczba osób
bezrobotnych, liczba osób pracujących,
dochód rozporządzalny gospodarstwa,
wydatki gospodarstwa domowego, wydatki
na żywność, itp.
cecha mierzalna jest zmienną bowiem
przyjmuje różne wartości liczbowe
• cechy statystyczne występujące w
różnych wariantach
Uwaga!!!
• Cechy statystyczne występują w różnych wariantach,
a więc poszczególne jednostki (jeśli nie wszystkie)
różnią się między sobą z punktu widzenia
poszczególnych cech.
Statystyka interesują wyłącznie zbiorowości, w
których występuje zmienność, tzn. występowanie
różnic między poszczególnymi jednostkami ze
względu na rozpatrywane cechy
1. Liczba jednostek wchodzących w skład zbiorowości statystycznej może
być skończona lub nieskończona.
2. W przypadku, gdy zbadanie całej populacji jest niemożliwe lub zbyt
kosztowne, badamy część populacji (tzw. próbę) i na tej podstawie
oceniamy całą populację
• populacja próbna = próba = część badanej
populacji
Etapy badania statystycznego
Wykład 2
Etapy badania statystycznego
1. Obserwacja statystyczna
2. Opracowanie materiału statystycznego
3. Opis
4. Wnioskowanie statystyczne
1. Obserwacja statystyczna - zebranie informacji o
jednostkach zbiorowości statystycznej podlegającej
badaniu
–
–
obserwacja całkowita
(pełna ,kompletna, wyczerpująca) – np.
sprawozdawczość statystyczna, powszechny spis
ludności,
obserwacja częściowa
(reprezentatywna, niewyczerpująca, niepełna,
niekompletna) –np. badania budżetów gospodarstw
domowych, reprezentacyjne spisy rolne
htpp/www.stat.gov.pl
2. Opracowanie materiału statystycznego (opis) –
uporządkowanie zebranych informacji, tak by w
sposób syntetyczny i przystępny pozwalały na
zapoznanie się z podstawowymi własnościami
badanej populacji
–
–
–
klasyfikacja (grupowanie), a więc dobór odpowiednich
cech i właściwe przyporządkowanie poszczególnym
wartościom cech liczebności
tablice statystyczne
metody graficzne (wykresy)
3. Opis
– obliczenie charakterystyk opisowych badanej
populacji
- charakterystyki obliczone dla populacji generalnej
noszą nazwę parametrów
- charakterystyki obliczone dla populacji próbnej
noszą nazwę statystyk
- przeprowadzenie znaczenia uzyskanych wartości
parametrów
4. Wnioskowanie statystyczne – na podstawie
zbadania populacji próbnej wyciąganie
wniosków o własnościach całej populacji
generalnej, z której pochodzi próba.
W metodach wnioskowania zakłada się, że elementy populacji
próbnej wybrane są:
- w sposób celowy – tzn. polegający na świadomym
typowaniu jednostek statystycznego badania do próby
- w sposób losowy z populacji generalnej
Losowy dobór próby oznacza iż:
• każda jednostka populacji generalnej ma dodatnie
znane prawdopodobieństwo znalezienia się w próbie
• istnieje możliwość ustalenia prawdopodobieństwa
znalezienia się w próbie dla każdego elementu
populacji
Występują najróżniejsze (schematy) sposoby
losowania