Statisztika02

Download Report

Transcript Statisztika02

Statisztika
2.
Dr. Balogh Péter
Gazdaságelemzési és Statisztika Tanszék
DE-AMTC-GVK
A statisztikai vizsgálatok feltételei
 A valóságban megfigyelhető jelenségek számokkal
kifejezhetők legyenek.
 A megfigyelési egységek
jól körülhatárolhatók
legyenek.
 A mérési
eljárások pontosan definiáltak és a
vizsgálati célnak megfelelőek legyenek.
2
Statisztikai alapfogalmak
 A sokaság
(populáció) a statisztikában
mindazon egyedek összességét (halmazát)
jelenti, amelyekre statisztikai megfigyelés
irányul.
 A sokaság
egyedeinek mind közös, mind
különböző tulajdonságokkal rendelkezniük kell,
mert ez teszi lehetővé statisztikai célokra való
csoportosításukat.
3
Statisztikai alapfogalmak II.
 Egyed:
a sokaságot alkotó elemek
 Ismérv:
a sokaság egyedeit jellemző tulajdonság
 Homogenitás: a
sokaság egyedei hasonlóak,
illetve megegyezőek; a sokaság egyöntetű
 Heterogenitás: a
sokaság egyedei eltérőek, a
sokaság változékony
4
A sokaságot alkotó egységek
 Valóságos
egységek
a számbavétel során valóságosan léteznek –
mérhetők, megszámolhatók
 Nem
valóságos egységek
ezek olyan események, amelyek egy
időtartam alatt bekövetkezett változást
tükröznek
5
A statisztikai sokaság típusai
 Álló sokaság
 mindig valamilyen állapotot fejez ki
 valóságos egységek alkotják
 egy adott időpontra vonatkozik
 Mozgó sokaság
 egy folyamatot, történést mutat be
 nem valóságos egységek alkotják
 Egy időtartamra vonatkozik
6
A statisztikai sokaság további típusai
 Véges

sokaság
gyakorlatilag számba vehető
 Végtelen sokaság

gyakorlatilag nem vehető számba (búzaszemek)
 Teljes

sokaság
a körülhatárolt sokaság minden egységét
tartalmazza
(az összes választópolgár)
 Minta

sokaság
a teljes statisztikai sokaság egységeinek bizonyos
szempontok szerint kiválasztott része
7
A statisztikai sokaság további típusai
 Fősokaság

a sokaság egységei valamely alapvető
tulajdonság tekintetében azonosak (adott
üzem dolgozói)
 Részsokaság

a fősokaságon belül elkülönített tulajdonság
változatok (szellemi ill. fizikai dolgozók)
8
Ismérvek
minden olyan szempont vagy kritérium,
ami szerint a sokaságot vizsgáljuk

Közös ismérv
a sokaság valamennyi egyedét jellemzik
és ez(ek) alapján tartoznak az egyedek a
sokasághoz

Megkülönböztető ismérv
amelyek alapján az egyedek elkülöníthetők a
sokaságon belül (a sokaság egy-egy részhalmazát
jellemzik)
9
Ismérvek (2)

Alternatív ismérv
csak két ismérvváltozata létezik

Tárgyi ismérvek

Mennyiségi ismérv
• Folytonos (mérhető) ismérv
• Diszkrét (számlálható) ismérv

Minőségi ismérv

Térbeli ismérv

Időbeli ismérv
10
Az adatok
A mintabeli egyedekről a vizsgálat során adatokat
gyűjtünk. Két fő adattípust különböztetünk
meg:
1. Kvalitatív adatok:
Ezek nem fejezhetők ki mennyiségekként, inkább
kategóriák:
gépjármű típusa, vallási felekezet, vállalkozás formája,
szem színe, pártállás
11
1. Kvantitatív adatok:
Ezek valamilyen mérés eredményei
(mennyiségek).
árbevétel, alapterület, hengerűrtartalom, létszám,
fizetés…..
12
A kvantitatív adatok kétfélék lehetnek:
1.) Folytonosak
(a mérési skála egy intervallum)
hőmérséklet
lehullt csapadékmennyiség egy adott napon
13
A kvantitatív adatok kétfélék lehetnek:
2.) Diszkrétek
(a mérhető értékek a számegyenes izolált pontjai)
a foglalkoztatottak létszáma,
a vállalat gépjárműveinek száma
14
Az adatok másik csoportosítási lehetősége:
1. Forrásadat
2. Származtatott adat
3. Hiányzó adat
4. Becsült adat
15
Forrás adat
Az adatgyűjtésből, felmérésből, mérésből
származó adat. Ezeket az adatokat a
rendelkezésre
álló
adatokból
függvénykapcsolatok segítségével nem lehet
előállítani.
Például: név, születési dátum, stb…
16
Származtatott adat
1. Az azonos esethez tartozó több más változó
komponensekből
számoljuk
ki
valamilyen
algoritmussal.
2. Például: a kezdő és a jelenlegi
fizetésnövekedés számolható ki.
fizetésből
a
17
Hiányzó adat
1. Akkor keletkezhet, ha nem áll rendelkezésünkre
forrásadat, vagy származtatott adat (például a nullával
való
osztás,
vagy
negatív
számból
való
négyzetgyökvonás miatt nem képezhető). Az
adathiányt jelöljük a következő speciális karakterrel: „ ,
”.
2. Például a kartonról nem jól olvasható egy dolgozó
születési dátuma, vagy a dolgozó egyszerűen
megtagadta az adat közlését, például nemzetiség
esetén.
18
Becsült adat
1. Akkor keletkezik, ha a változó többi adatából valamilyen
statisztikai eljárással a hiányzó adatot kipótoljuk. Lehet
ez a többi adat átlaga, vagy a többi adat eloszlásának
megfelelő véletlenszerű generálás eredménye.
2. Például ha egy dolgozónál hiányzik a „kezdő fizetés”
adata, akkor az azonos korú, azonos iskolai végzettségű
és hasonló beosztású dolgozók kezdő fizetésének
átlagaiból becsülhetjük.
19
Adatszerzési módok
Adatszerzés
Teljes körű
Részleges
Kísérletek
Véletlen kiválasztás
Repr. megfigyelés
Egyéb
Nem véletlen kiválasztás
20
Mérési skálák
Nominális (kategoriális) mérési szint a
legegyszerűbb és a legkevésbé informatív
mérési skála. Ebben az esetben az adat
csupán az eset azonosítására, vagy
valamilyen
kategóriához
tartozás
azonosítására szolgál (pl. növényevő ill.
húsevő
állatok).
A
változók
értékei
kategóriákba vannak sorolva, közöttük nem
feltétlenül van bármilyen viszony. Például:
név, törzsszám, nemzetiség, nem, családi
állapot...
21
Mérési skálák
Ordinális (sorrendi) mérési szint esetén a
skálaértékek
egyezősége
vagy
különbözősége
mellett
az
értékek
sorrendiségét is figyelembe vehetjük.
Ordinális az adat, ha az adatok között erős
sorrend azaz rendezettség létesíthető. Azaz,
ha bármely két adat közül meg tudjuk
mondani, hogy ők egyenlők, vagy valamelyik
nagyobb. Például az iskolai végzettség, vagy
skálák: nagyon nem tetszik, nem tetszik,….
22
Mérési skálák
Intervallum (különbségi) az adat, ha rendezett,
és értékkészlet egy intervallum, de nincsen
origó, vagyis az adatok viszonylagosak.
Például a fizetésnövekedés adat %-ban
kifejezve
ilyen,
hiszen
egy
10%-os
fizetésemelés
egy
alacsony
fizetésű
dolgozónál kisebb lehet, mint egy 1%-os
fizetésemelés
egy
kiemelt
fizetéssel
rendelkező dolgozónál. További példa: IQ,
hőmérséklet…
23
Mérési skálák
Arányskála (abszolút skála): a legtöbb
információt adja. Arány az adat, ha valós
számérték és ismert az origó, a viszonyítási
alap. Például a kezdő- és jelenlegi fizetés,
testsúly.
24
25
Példa:
Nominális
2. Név
Nominális
1. Nem
Ordinális
3. Legmagasabb iskolai végzettség
4. Reggel és este mért vérnyomás
Arány
Intervallum
5. Kezdő és jelenlegi fizetés
6. Tájegység
8. Földkategória
Ordinális
Nominális
A
r
á
n
y
7. Saját terület (ha)
Arány
9. Erőgépek száma
26
Ismérvek és mérési skálák
kapcsolódása
27
A statisztikai adat
 Empirikus,
tapasztalati szám, amely mérés,
megfigyelés vagy számlálás alapján keletkezik és
elszakíthatatlan a társadalmi, gazdasági tartalmától.
 Lehetnek


abszolút számok
leszármaztatott számok
28
Mutatószám
A rendszeresen ismétlődő jelenségeket jellemző
statisztikai - általában leszármaztatott – adat.
A statisztikai mutatószámok a valóság valamely
mozzanatának modelljeként is felfoghatók.
A – vizsgálat céljától függően – csak a valóság valamely
lényegesnek tartott vonását jellemzik.
29
Statisztikai sorok

A statisztikai adatok valamilyen szempont szerinti
felsorolása, rendezett halmaza.

Keletkezhetnek

azonos típusú adatokból
• idősor
• területi sor
• minőségi sor
• mennyiségi sor

különböző típusú adatokból
• leíró sor
30
Statisztikai sorok alaptípusai

Csoportosító
a fősokaság és a részsokaságok nagyságát adják meg (összesen sorok)

Összehasonlító
a sor tagjainak egymás közötti összehasonlítása az elsődleges cél (általában
nem összegezhetők)

Leíró
adatai különböző fajta, legtöbbször különböző mértékegységben megadott
adatok, amelyek mindegyike egy meghatározott jelenségre, társadalmi vagy
gazdasági egységre vonatkozik (Hajdú-Bihar megye fontosabb adatai
2004-ben).
31
A csoportosító sor általános sémája
 Ci
ismérvváltozat vagy
kategória
 fi gyakoriság
 N a sokaság
nagysága
32
A statisztikai sorok jellegzetességei
Minőségi sor
 Gyakorisági sor
 Értékösszeg sor





általában csoportosítás
jönnek létre
útján
Területi sor
Tartam idősor
létrejöhetnek csoportosítás útján
vagy anélkül
Állapot idősor
Leíró sor
soha nem csoportosítás útján jön
létre és nem adhatók össze
A statisztikai sorok a leíró sort kivéve egyneműek.
33
Statisztikai sorok (2)

Minőségi sor: a sokaság olyan tárgyi ismérv szerinti
megoszlását mutatja, amelyek változatai csak fogalmilag
vannak meghatározva (pl.:az alkalmazottak végzettség
szerinti megoszlása).

Mennyiségi sorok: a sokaság olyan tárgyi ismérv szerinti
megoszlását mutatják, amelyek változatait számszerűen
fejezzük ki.

nagy mennyiségű adat esetén
• gyakorisági sorok
• értékösszeg sorok
34

2.1.Gyakorisági sor: azt mutatja meg, hogy a
mennyiségi ismérvek egyes értékközeibe
tartozó egységek száma, gyakorisága mennyi
(a vállalat alkalmazotti létszámának fizetés
szerinti megoszlása).
Kereset (ezer Ft/fő)
51 – 60
61 – 70
71 – 80
81 – 90
91 – 100
101 – 110
Összesen:
Alkalmazottak száma (fő)
11
26
18
41
37
52
185
35
 2.2.Értékösszeg
sor: megmutatja, hogy a
mennyiségi ismérv értékeinek egyes csoportjába
tartozó egységek által képviselt értékek
összege mekkora (a dolgozók bérszínvonal
szerinti bértömegének alakulása).
Kereset (ezer
Ft/fő)
51 – 60
61 – 70
71 – 80
81 – 90
91 – 100
101 – 110
Összesen:
Összes kifizetett bér (millió
Ft)
0,605
1,690
1,350
3,485
3,515
5,460
16,105
36
A gyakorisági sor és az értékösszeg sor
egymásból kiszámítható!
11 x 55 = 605
26 x 65 = 1.690
37
Statisztikai sorok (3)
 Területi
sorok: valamely statisztikai sokaság
területi megoszlását tünteti fel (gépjárműállomány
megyék szerinti megoszlása).
 Idősorok:
a sokaság alakulását az idő
függvényében, időbeli változásában, mozgásában
ábrázolják.

állapot idősor

tartam idősor
38
Statisztikai táblák



a statisztikai sorok összefüggő rendszere
a statisztikai adatok feldolgozásának, elemzésének és
közlésének, valamint szemléltetésének eszközei
Részei:
•
•
magyarázó mező
táblamező
 Típusai:
 Dimenzió szerint: 1 vagy 2
 Rendeltetés szerint: gyűjtő, feldolgozási, közlési
 Csoportosítás szerepe a tábla elkészítésében:
 Egyszerű statisztikai tábla: - ha csoportosítást nem tartalmaz
 Csoportosító tábla: - egy ismérv szerinti csoportosítást tartalmaz
 Kombinációs tábla: - két vagy több ismérv szerint csoportosítást
tartalmaznak
39
40
A helyes táblaszerkesztés követelményei
könnyen áttekinthető legyen,
címe világos és kifejező legyen,
a sorok és oszlopok megnevezése pontosan
fejezze ki azok tartalmát,
az adatok mértékegységét fel kell tüntetni
a táblamező minden rovatát ki kell tölteni,
41
A statisztikai tábla jelölései
 észlelést nem tudunk végezni (-),
 az adat nem áll rendelkezésünkre (…),
 adatunk nagyon kicsi (0,0),
 ha az adat előzetes becslés eredménye (+),
 adatunk a tábla többi adatának minőségétől, vagy a
tömb egyöntetű értelmezésétől eltér (* és lábjegyzet),
 ha az adat nem saját megfigyelésünkből ered, a forrást
a tábla alján megjelöljük.
42