Metody prezentacji danych statystycznych

Download Report

Transcript Metody prezentacji danych statystycznych

Podstawy statystyki
Kurs specjalistyczny dla pielęgniarek, mgr Adam Dudek,
PWSZ Nysa 2007
Co to jest statystyka ?
Obecnie pojęcia statystyka używamy aby mówić o:
 zbiorze danych liczbowych ukazujących
kształtowanie się określonego zjawiska
 pewnych charakterystykach liczbowych
powstałych z badań nad zbiorowością próbną (np.
odchylenie od próby, średnia)
 dyscyplinie naukowej
Wyróżniamy



Statystykę opisową - zajmuje się metodami obserwacji
statystycznej, konstruowaniem badań statystycznych,
opracowywaniem i prezentacją danego materiału
statystycznego oraz sumarycznym opisem danych
statystycznych.
Statystykę matematyczną - to nauka, która zajmuje się
metodami wnioskowania o całej zbiorowości generalnej na
podstawie zbadania wybranej w sposób losowy pewnej
części zwanej próbą.
Statystykę ekonomiczną - bada zjawiska i procesy
zachodzące w gospodarce na różnych szczeblach jej
agregacji. Do opisu i analizy badanych zjawisk statystyka
ekonomiczna wykorzystuje metody wypracowane przez
statystykę opisową i matematyczną.
Zbiorowość statystyczna
Zbiorowością statystyczną (populacją, masą
statystyczną) , nazywamy zespół jednostek
objętych badaniem statystycznym. Cel badania
określa zbiorowość. Zbiorowość należy ściśle
określić:



pod względem rzeczowym (czyli kogo lub co
badamy)
pod względem terytorialnym
pod względem czasowym
Jednostka statystyczna


Jednostkami statystycznymi nazywamy elementy
składowe badanej zbiorowości statystycznej. Ilość
jednostek składających się na badaną zbiorowość
nazywamy liczebnością. (liczebnością ogólną - N).
Cechy statystyczne. Jednostki statystyczne nie są
identyczne, posiadają cechy wspólne i wiele cech
różniących je między sobą. Właściwości jakie posiadają
jednostki statystyczne nazywamy cechami
statystycznymi.
Rodzaje cech statystycznych:




mierzalne
niemierzalne
stałe
zmienne
Metody badań statystycznych

badanie pełne - obserwacji poddana jest każda
jednostka zbiorowości statystycznej , której badanie
dotyczy.

badanie częściowe – obserwację ogranicza się tylko
pewnej części (wybranych jednostek
statystycznych) badanej zbiorowości statystycznej.
Szacunek statystyczny – stosowany jest przypadku, gdy
nie możemy uzyskać interesującej nas zbiorowości lub
jej części w sposób bezpośredni.
Badanie statystyczne - przygotowanie
Etap ten obejmuje czynności związane z przygotowaniem i
zaprojektowaniem badania statystycznego.
 sprecyzowanie celu i tematu
 zdefiniowanie zbiorowości stat. i jednostki stat.
 wybór cech statystycznych
 określenie metody badania statystycznego
 źródło uzyskania danych, które dzielimy na:



pierwotne (obserwacja, wywiad, ankieta),
wtórne (sprawozdawczość przedsiębiorstw itp.)
opracowanie formularzy stat. (np.ankiety) oraz makiet
tablic wynikowych, opracowanie sposobów weryfikacji i
kontroli materiału
Badanie statystyczne – gromadzenie danych
Etap ten polega na ustaleniu wartości cech ilościowych lub
odmian cech jakościowych wszystkich jednostek
tworzących populacje statystyczną lub u prawidłowo
dobranej ich reprezentacji. Może to się odbywać za
pomocą bezpośredniego pomiaru (obserwacji) lub
zbieranie inf. od jednostek sprawozdawczych.
obejmuje dwa zasadnicze kroki:


zaliczanie (kwalifikowanie)
grupowanie-polega na wyodrębnianiu jednorodnych lub
względnie jednorodnych części grup w ramach większej i
zróżnicowanej zbiorowości statystycznych.
Metody prezentacji danych statystycznych

tabelaryczna prezentacja danych statystycznych –
tablice wykorzystywane są do prezentacji danych
statystycznych uporządkowanych według określonego
kryterium. Aby tablica statystyczna była użyteczna
powinna spełniać określone warunki dotyczące jej
formalnej budowy oraz merytorycznej zawartości. Z
formalnego punktu widzenia każda tablica statystyczna
powinna zawierać




tytuł, w którym podaje się w sposób jasny i zwięzły treść tablicy
określającej zbiorowość statystyczną pod względem rzeczowym
czasowym i przestrzennym
numer kolejny w przypadku, gdy w opracowaniu jest więcej tablic
główne oznaczenia kolumn i wierszy
źródło danych statystycznych
Metody prezentacji danych statystycznych

graficzna prezentacja danych statystycznych najczęściej Wykresy sporządza się na podstawie tablic
statycznych, ale nie mogą być one prostym
powtórzeniem zawartych w nich danych. Wykres ujmuje
zjawiska w sposób bardziej syntetyczny niż tablica.
Każdy wykres podobnie jak tablica powinien mieć tytuł i
źródło danych na podstawie, których należy podać
legendę, czyli wyjaśnienie zastosowanych symboli.
W grafice statystycznej wyróżnia się następujące rodzaje
wykresów:







liniowe
powierzchniowe
pasmowe;
bryłowe (np. kołowe słupkowe)
punktów;
wagowe;
kombinowane i specjalne;
Metody prezentacji danych statystycznych

opisowa prezentacja danych statystycznych – polega
na włączeniu danych statystycznych do tekstu
opisującego dane zjawisko. Jest to możliwe tylko
wówczas, gdy liczba danych jest niewielka, gdyż w
przeciwnym razie prezentacja staje się nieczytelna.

mieszane metody prezentacji danych statystycznych.
Rodzaje analizy statystycznej – natężenia

Wskaźniki natężenia obliczamy wtedy, gdy chcemy
przedstawić badaną zbiorowość na tle innej zbiorowości
logicznie związana z badaną.
N1
Wn = –––––––––––
N2
N1 – wielkość jednej zbiorowości
N2 – wielkość drugiej zbiorowość
Wn – współczynnik natężenia

Najczęściej spotykanym współczynnikiem natężenia są np. gęstość
zaludnienia, liczba urodzeń, małżeństw, rozwodów na 10 tys.
mieszkańców, produkcja energii elektrycznej w KW. Na 1
mieszkańca.
Rodzaje analizy statystycznej – struktury




Struktura zbiorowości określona jest przez podział badanej zbiorowości
statystycznej na grupy jednostek różniących się od siebie wartościami
poszczególnych cech. Liczbową formą opisu struktury są liczby względne
powszechnie stosowane jako wskaźnik struktury. Wskaźnik struktury
możemy obliczyć jako:
Ułamkowe wskaźniki struktury
ni
Wsi = ––––––––
N
Wsi – wskaźnik struktury
ni – liczebność poszczególnych części danej zbiorowości
N – liczebność całej zbiorowości statystycznej
wskaźnik procentowy
ni
Wsi = –––––––– * 100%
N
wskaźnik struktury wyrażany Liczebność promilach
ni
Wsi = –––––––– * 1000 ‰
N
Analiza tendencji centralnych - średnie

Miary tendencji centralnej to wskazanie w zbiorowości statystycznej
takiej wartości badanej cechy, wokół której skupiają się cechy
wszystkich jednostek wchodzącej w skład tej zbiorowości.
Tendencja centralna określona jest również jako miara przeciętna
lub średnia.

Średnia arytmetyczna jest to suma wartości cechy wszystkich
jednostek objętych badaniem podzielona przez liczbę jednostek
tworzących badanie zbiorowości statystycznej.

Średnią geometryczną obliczamy mnożąc wszystkie wartości cech
przez siebie, a następnie wyznaczając z tego iloczynu pierwiastek
n-tego stopnia z tego wyniku, gdzie n jest liczbę jednostek
tworzących daną zbiorowość.
Analiza tendencji centralnych - mediana

Mediana (zwana też wartością środkową) to w
statystyce wartość cechy w szeregu uporządkowanym,
powyżej i poniżej której znajduje się jednakowa liczba
obserwacji.

Aby obliczyć medianę ze zbioru n obserwacji, sortujemy
je w kolejności od najmniejszej do największej i
numerujemy od 1 do n. Następnie, jeśli n jest
nieparzyste, medianą jest wartość obserwacji w środku
(czyli obserwacji numer (n+1)/2). Jeśli natomiast n jest
parzyste, wynikiem jest średnia arytmetyczna między
dwiema środkowymi obserwacjami, czyli obserwacją
numer n/2 i obserwacją numer (n/2)+1.
Analiza tendencji centralnych - dominanta


Dominanta (wartość
modalna, moda, wartość
najczęstsza) – wskazuje na
wartość o największym
prawdopodobieństwie
wystąpienia, lub wartość
najczęściej występującą w
próbie.
Wartość
Prawdopodobieństwo wyst.
1
0.2
2
0.3
3
0.1
4
0.11
5
0.29
Moda dla tego przykładu wynosi 2
Wartość modalna bywa bardzo użyteczna gdy wartości
zmiennej losowej nie są liczbowe (nie można policzyć średniej
czy też mediany). Np. dla ciągu {jabłko, gruszka, jabłko,
pomarańcza, gruszka, banan, jabłko} dominantą jest {jabłko}
Miary zmienności

Rozstęp – różnica pomiędzy wartością maksymalną, a
minimalną cechy - jest miarą charakteryzującą
empiryczny obszar zmienności badanej cechy, nie daje
on jednak informacji o zróżnicowaniu poszczególnych
wartości cechy w zbiorowości. Np. dla ciągu
{1,2,3,4,5,6} rozstęp wynosi 5
Wariancja - jest to średnia arytmetyczna kwadratów
odchyleń poszczególnych wartości cechy od średniej
arytmetycznej zbiorowości.
Przykład: ciąg {1,2,3,4,5,6}

suma 1+2+3+4+5+6 = 21
średnia zbiorowości = 21/6 = 3.5
odchylenia - 2.5, 1.5, 0.5, 0.5, 1.5, 2.5
kwadraty odchyleń - 6.25, 2.25, 0.25, 0.25, 2.25, 6.25
średnia kwadratów odchyleń - 17.5/6 = 2.91
Wariancja – 2.91
Miary zmienności

Odchylenie standardowe – jest to pierwiastek kwadratowy z
wariancji i określa przeciętne zróżnicowanie poszczególnych
wartości cechy od średniej arytmetycznej – dla ciągu
{1,2,3,4,5,6} odchylenie standardowe wynosi 1.705

Odchylenie przeciętne - jest to średnia arytmetyczna
bezwzględnych odchyleń wartości cechy od średniej
arytmetycznej. Określa o ile jednostki danej zbiorowości
różnią się średnio, ze względu na wartość cechy, od średniej
arytmetycznej.
Przykład: ciąg {1,2,3,4,5,6}
suma 1+2+3+4+5+6 = 21
średnia zbiorowości = 21/6 = 3.5
odchylenia - 2.5, 1.5, 0.5, 0.5, 1.5, 2.5
Odchylenie przeciętne - 9/6 = 1,5