Zakladne_pojmy_triedenie_1

Download Report

Transcript Zakladne_pojmy_triedenie_1

Štatistika má nezastupiteľne miesto v modernej spoločnosti využíva sa pri
analýze sociálnych a ekonomických javov, a to nielen vo vede a výskume, ale aj
ako dôležitý nástroj hospodárskej politiky štátu.
Termín štatistika pochádza z latinského slova „status“, ktoré znamená stav
Dávno pred vznikom pojmu štatistika sa uskutočňovali úradné zisťovania počtu
ľudí a ich majetku za účelom zistenia počtu bojaschopných mužov alebo počtu
osôb schopných a povinných platiť dane
Najstaršie štatistické práce sa zaoberali „popisom štátu“ a predstavovali
zobrazenie daného zemepisného, hospodárskeho a politického stavu
spoločnosti.
V 17. storočí sa zmenilo chápanie štatistiky na tzv. politickú aritmetiku kde
východiskom boli údaje o narodeniach a úmrtiach.
Veľký vplyv na vývoj štatistiky mal vznik teórie pravdepodobnosti, ktorá skúma
zákonitosti hromadných javov





Štatistiku 19. storočia charakterizuje skúmanie hromadných javov
prostredníctvom vyčerpávajúceho zisťovania.
Začiatkom 20. storočia vzniká moderná štatistika – analytická
štatistika, induktívna štatistika. Rozvíjali sa metódy umožňujúce
robiť závery o celku na základe výberových a čiastkových
zisťovaní.
Štatistika sa teda vyvinula od úradného zisťovania a evidencie cez
univerzitnú štatistiku, politickú aritmetiku a počet
pravdepodobností až po súčasnú modernú štatistiku ako výsledok
200 ročného vývoja.
K rozvoju štatistiky ako samostatnej vednej disciplíny a najmä jej
aplikácii v praxi prispel rýchly rozvoj výpočtovej techniky počnúc
sedemdesiatimi rokmi 20. storočia
Jadro štatistických analýz tvorí špecializovaný software ako je
napr. Statgraphics, SPSS, SAS, Stata, Statistica, NCSS a ine.






Základným cieľom štatistiky je získavanie a poskytovanie údajov v
podobe uľahčujúcej ich hodnotenie a analýzu ako aj identifikovanie
zákonitostí a ich kvantitatívne vyjadrenie
Predmetom štatistiky ako vednej disciplíny sú hromadné javy –
spoločenské a prírodné
Hromadné javy – udalosti – sú také, ktoré sa za presne definovaných
podmienok vecných, časových a priestorových viackrát opakujú, napr.
narodenia, úmrtia, spotreba potravinárskych výrobkov, výroba aut a pod.
Hromadná udalosť nadobúda mnoho konkrétnych foriem, skladá sa z
mnohých individuálnych udalostí
Predmetom štatistického skúmania nie sú teda udalosti individuálne, tie
sú len konkrétnym prejavom hromadných udalostí.
Napr. bez pozorovania viacerých rodín nemožno sformulovať hypotézu,
že počet detí vo vidieckych rodinách je väčší ako v mestských

V súčasnosti pojem štatistika chápeme najmenej v štyroch významoch
 Praktická činnosť, ktorá súvisí so získavaním štatistických údajov, s ich
triedením, grafickým znázorňovaním, s konštrukciou a výpočtom
číselných charakteristík, ako aj s tvorbou systémov štatistických dát
 Číselné alebo slovné údaje o hromadných udalostiach, ktoré môžeme
nájsť v rôznych publikáciách
 Konkrétnu číselnú charakteristiku, vypočítanú zo zistených číselných
údajov o hromadnej udalosti
 Vednú disciplínu, ktorá sa zaoberá metódami skúmania zákonitostí
hromadných udalostí, teda metódami zberu, spracovania a
analyzovania údajov
Nevyhnutným predpokladom každého
štatistického skúmania je hromadnosť
pozorovania
Pri hromadnom pozorovaní môže ísť o:
a)
jednoduché pozorovanie - získanie údajov
pozorovaním, meraním, štatistický prieskum...
b)
Experiment - najmä v biologických a iných
pokusoch, môže byť realizovaný aj v
marketingu...
5
Predmetom skúmania je hromadný jav.
Hromadný jav sa skladá z mnohých individuálnych
javov. Nositelia týchto javov sa nazývajú štatistickými
jednotkami
- je základný prvok, na ktorom možno skúmať konkrétny
prejav určitého hromadného javu a je základným a
presne vymedzeným objektom pozorovania
Výber štatistickej jednotky je určený cieľom skúmania
Napr.: sociálne slabšie rodiny v SR v r.2005
6
 priestorové - musí byť presne
vymedzený
priestor, napr. Slovensko
 časové - vymedzenie obdobia, resp. okamihu,
napr. kalendárny rok 2009
 vecné - obsahové vymedzenie , napr.
domácností s čistým príjmom pod 4500 Sk na 1
člena
7
je množina štatistických jednotiek,
z ktorých každá vyhovuje určitým vlastnostiam, ktoré
vymedzujú štatistický súbor z hľadiska časového
priestorového a vecného a v iných vlastnostiach sa
štatistické jednotky líšia.
Vlastnosti, v ktorých sa štatistické jednotky líšia sú
predmetom skúmania.
Rozsah štatistického súboru
- počet štatistických jednotiek v štatistickom súbore
-
8





pre štatistický súbor študentov môžu byť spoločné
nasledovné vlastnosti:
Fakulta VSZaSP
ročník: 1.
Školský rok 2009/2010
súbor študentov sa však bude líšiť napr. v študijnom
prospechu a táto vlastnosť môže byť predmetom
skúmania
9
-
Súbor všetkých štatist. jednotiek, ktoré z
hľadiska vecného, časového a priestorového
vymedzenia do súboru patria
Výberový súbor
- Vybraná časť jednotiek zo základného súboru,
- predstavuje reprezentatívnu vzorku
základného súboru
10
-
sú vlastnosti štatististických jednotiek
Môžeme ich rozdeľovať z rôznych hľadísk:
a) podľa toho, či sa nachádzajú na všetkých štat.
jednotkách daného súboru ich delíme na:
spoločné - vymedzujú štatist. súbor
variabilné - sú predmetom štat. skúmania
11
b) podľa toho, ako charakterizujú vlastnosti štat.
jednotiek:
- nepriame, zistiteľné len nepriamo, napr. meranie
kvality výrobku
- priame- priamo merateľné, napr. príjem
c) podľa charakteru na:
- vecné
- časové
- priestorové
12
d) vecné štat. znaky delíme podľa ich charakteru na:
 kvantitatívne - merateľné, môžu byť:
4
spojité - nadobúdajú ľubovoľné hodnoty z
ohraničeného alebo neohraničeného intervalu,
napr. mesačný príjem, výdavky na potraviny
4
diskrétne - nadobúdajú izolované, väčšinou
celočíselné hodnoty, napr. vek, počet
nezaopatrených detí, počet rokov praxe v odbore...
13

kvalitatívne znaky, slovné, môžu byť:
4
4
dichotomické- alternatívne
napr. pohlavie
polynomické - multinomické, množné
napr. vzdelanie, alebo druh športu ….
14
Rozdelenie štatistických znakov
ŠTATISTICKÉ ZNAKY
SPOLOČNÉ
VARIABILNÉ
PRIAME
ČASOVÉ
VECNÉ
VECNÉ
KVALITATÍVNE
ALTERNATÍVNE
MNOŽNÉ
NEPRIAME
PRIESTOROVÉ
KVANTITATÍVNE
SPOJITÉ
DISKRÉTNE
15
Štatistické skúmanie sa skladá z troch etáp:
Štatistické zisťovanie
Spracovanie
Štatistický rozbor
16
Formy štat. zisťovania:
výkazníctvo : daňové priznanie, výsledovka,
súpis – cenzus obavateľstva,
marketingový prieskum, anketa i iné
panel domácností
Štat. zisťovanie: z hľadiska počtu jednotiek:
 vyčerpávajúce - ak zisťujeme informácie o
jednotkách celého základného súboru
 výberové - ak zisťujeme informácie len o
výberovom súbore
17
Podľa dĺžky resp. periodicity časového intervalu
štatistického zisťovania poznáme:
štatistické zisťovania:
- jednorázové
- bežné - periodické - pravidelne sa
opakujúce
- nepravidelné -opakujúce sa v
nepravidelných intervaloch
18
-
-
-
Prvá fáza spracovania štatistických údajov,
usporiadanie jednotiek štatistického súboru do
skupín (tried) podľa určitého štatistického znaku
alebo znakov, vymedzenie typických skupín...
štatistický znak, ktorý je kritériom
pri triedení nazývame triediacim znakom.
19
Základné kritériá pri triedení:
1.
zásada úplnosti - triedy musia byť vytvorené tak,
aby každá jednotka mala šancu byť do niektorej z
tried zatriedená
2.
zásada jednoznačnosti - triedy musia byť vytvorené
tak, aby o každej jednotke bolo jednoznačne
rozhodnuté do ktorej z tried má byť zaradená
20
Klasifikácia triedenia podľa druhu
triediaceho znaku:
- z hľadiska časového - vytvorenie časových radov
- z hľadiska vecného - kvalitatívne
- kvantitatívne
-
z hľadiska priestorového - priestorové zoskupenie
jednotiek, napr. regionálne zatriedenie podnikov
21
Označenie kvalitatívnych znakov - A, B, C, ...
Varianty, obmeny znakov označujeme:
napr. dichotomické - a,  alebo a1 , a2
polynomické – a1, a2, a3, ....
trieda – určitá skupina štat. jednotiek, ktorá má
rovnakú obmenu (variant) alebo kombináciu
obmien štat. znaku
22
Príklad: máme 81 pracovníkov a evidujeme u nich:
A- pohlavie, B - vzdelanie, C - funkcia
každý znak má len dve obmeny
a1 - muži
b1 - VŠ
c1- vo funkcií
a2 - ženy
b2- bez VŠ
c2- bez funkcie
Označenie triedy – triednym symbolom
(a1) = 38
(b1) = 17 (c1) = 14
(a2) = 43
(b2) = 64 (c2) = 67
triedny symbol
triedna početnosť
23
Podvojné triedenie
-
kombinovanie dvoch triediacich znakov súčasne,
výsledkom sú:
-
asociačné tabuľky (rozmer 2 x 2), oba triediace
znaky sú alternatívne
-
kontigenčné tabuľky- aspoň jeden zo znakov
má viac ako 2 varianty
24
pohlavie
funkcia
c1
spolu
c2
a1
(a1c1)=7
(a1c2)=31
38
a2
(a2c1)=7
(a2c2)=36
43
14
67
81
spolu
25
Kvantitatívne znaky označujeme písmenami z
konca abecedy – X, Y, Z, ...
ich obmeny – x1, x2, x3, ..xj.. xn kde j = 1....n
Triedenie súboru o rozsahu n na m počet
tried.
Rozlišujeme:
- triedenie jednoduché
- rozdelenie početností
- skupinové - intervalové rozdelenie početností
26
Použijeme ho vtedy, keď triediaci znak je diskrétny
s malým počtom obmien, variantov
n i – absolútne početnosti ( počet
nezaopatrených detí) i=1,2,3,4....m
x i – hodnota znaku
27
xiX
x in ix

i
n
i
0
15
1
22
2
35
3
11

Použijeme ho vtedy, keď
triediaci znak je diskrétny s
malým počtom obmien,
variantov
ni – absolútne početnosti (
počet nezaopatrených detí)
i=1,2,3,4.…m
m počet tried, obmien
xi – hodnota, obmena znaku
28
m 
n  120  10(?11 )
xmax  xmin
h 
 0.5
m
Počet intervalov (m)
Rozpätie intervalu (h)
29
Dolná
Horná
hranica
hranica
Bežné početnosti
Kumulatívne početnosti
Absolutne
Relatívne
Absolutne
Relatívne
ni
fi
Ni
Fi
10
n1
f1=(n1/n)*100
N1=n1
F1=(N1/n)*100
10
10,5
n2
f2=(n2/n)*100
N2=n1+n2
F2=(N2/n)*100
10,5
11
n3
f3=(n3/n)*100
N3=n1+n2+n3
F3=(N3/n)*100
11
11,5
...
...
...
...
11,5
12
...
...
...
...
12
12,5
...
...
...
...
12,5
13
nj
fj=(nj/n)*100
...
...
13
13,5
...
...
...
...
13,5
14
...
...
...
...
nm
nm=(nm/n)*100
Nm=n
F=100%
n
100%
x
x
14
Spolu
30