2. MY-X szeminárium mellékletei, avagy kutatásmódszertan II. (Annex: Methodology of research II.)

Download Report

Transcript 2. MY-X szeminárium mellékletei, avagy kutatásmódszertan II. (Annex: Methodology of research II.)

A leíró statisztikák alapelemei

Középértékek

Helyzeti középérték
–
Módusz
– Medián

Számított középérték
–
1
Számtani átlag
2016.08.07.
Módusz
2

Az adatsor leggyakoribb értéke, a
leggyakrabban előforduló adat

Bármelyik mérési szinten
meghatározható, már a nominális
mérési szinten is.
2016.08.07.
Medián
3

a növekvő vagy csökkenő sorba rendezett
adatsor középső adata (értéke)

feltétele az adatsor sorbarendezhetősége

ordinális, intervallum és arányskálán mért
változón határozhatjuk meg.
2016.08.07.
Példa
Megkérdeztük a válaszadó iskolai végzettségét. A
következő eredményt kaptuk:
4
Iskolai végzettség
Említések száma
Kevesebb 8 ált-nál
8 általános
Szakmunkás
Érettségi
Felsőfokú
56
61
18
102
8
Összesen
245
2016.08.07.
Számtani átlag
5

A számtani átlag az a szám, amely körül az
adatsorunk szóródik, amely egy számként
helyettesítheti és jellemzi a sokaságot

Kiszámításának módja a következő: összeadjuk az
adatokat és elosztjuk az elemszámmal

Intervallum és arány skálán mért változókon
egyaránt számítható, de nominális és ordinális
mérési szinten nem!

Érzékeny a kiugró adatokra
2016.08.07.
Mennyi az átlaga?
1, 2, 3, 4, 5
1, 2, 3, 4, 105
Átlag: 1+2+3+4+5=15
1+2+3+4+105=115
15/5=3
6
115/5=23
2016.08.07.
Szóródási mutatók
A szóródási mutatókkal az értékek különbözőségét,
változékonyságát jellemezzük

Értékterjedelem
–


Interkvartilis terjedelem
–
A kvartilisek negyedelik az adatsort, négy egyenlő elemszámú
részre osztják
–
Az alsó és felső kvartilis közötti távolság az Interkvartilis
terjededelem
A szórás
–
7
a legkisebb és a legnagyobb érték közötti távolság
Az átlag körüli szóródást, az átlagtól való átlagos eltérést méri
2016.08.07.
Adatfeldolgozás lépései

Adatelőkészítés
–
–
–
–
–
8
Szűrés: szükséges esetek
Változók leválogatása
Összefésülés
Aggregálás
Adattisztítás
2016.08.07.
Hiányzó értékek kezelése




9
Eset törlése
Változó törlése
Átlaggal való helyettesítés
Közelítő eljárás
2016.08.07.
Adatfeldolgozás lépései

Adatelőkészítés
–
–
–
–
–
–
–
10
Szűrés: szükséges esetek
Változók leválogatása
Összefésülés
Aggregálás
Hiányzó értékek
Kiugró értékek
Adat transzformáció: új változó létrehozása
2016.08.07.
Statisztikai elemzések


Feltétel: elkészült komplett adatállomány
Alapstatisztikák:
–
–
–
–
–
–
11
Gyakoriságok
Megoszlások
Legkisebb-legnagyobb értékek
Terjedelem
Középértékek
Szóródási mutatók
2016.08.07.
Statisztikai elemzések

Alapábrák:
–
–
–
–
–
–
–
12
Pontdiagram
Vonaldiagram
Oszlopdiagram
Boxplot,
Hisztogram,
Szár-levél diagram,
Kördiagram
2016.08.07.
Statisztikai elemzések

Összefüggés-vizsgálatok
–
–


Indexszerkesztés
Többváltozós analízisek
–
–
–
–
13
Kereszttáblák
Korreláció
Faktoranalízis
Többtényezős regresszió
Klaszteranalízis
Diszkriminancia analízis
2016.08.07.