Transcript Slide 1

A pedagógiai kutatás
módszertana
Babeş-Bolyai Tudományegyetem
Tanító- és óvóképző szak
A leíró és a matematikai statisztika

Alapvetően kétfajta statisztikát használunk a
pedagógiai kutatásban: az egyik az ún. leíró
statisztika, a másik pedig az ún. matematikai
statisztika.

Leíró statisztikáról abban az esetben beszélünk,
hogyha egy jól meghatározott csoportot akarunk
elemezni, s nem kívánunk a tágabb, befoglaló
populációra vonatkozó következtetéseket levonni.
Például arra szeretnénk választ kapni, hogy egy
általános iskola két IV. osztálya közül melyikben
ismernek több népdalt a gyermekek. Egyszerű
csoportokkal dolgozik, következtetései is pontosak
és nem valószínűségi jellegűek.
A leíró és a matematikai statisztika
 A matematikai statisztikát akkor alkalmazzuk, amikor
egy mintáról úgy kívánunk következtetést
megfogalmazni, hogy az a tágabb populációra is
érvényes legyen, vagyis az ilyen becsléseink nem
pontosak, hanem valószínűségi jellegűek. Ha például
egy énektanítási módszer hatékonyságát vizsgáljuk,
és a két IV. osztály a negyedikes populáció
reprezentatív mintáit képezik, akkor már nem elég
egyszerűen az átlagok közül a nagyobbra rámutatni és
azt mondani, hogy az ott alkalmazott módszer
hatékonyabb, hanem egy matematikai eljárással (pl. tpróba) meg kell vizsgálni azt, hogy a befoglaló
populáción is érvényes lesz-e a megállapításunk. Ez
az eljárás tehát bonyolultabb, és valószínűségi jellegű.
A valószínűség
 a valószínűség események bekövetkeztének az
esélyét jelöli.
 olyan eseményekről van szó, amelyek nem
pontosan előreláthatóak, vagyis bizonytalan
kimenetelűek.
 A valószínűségszámításban azt az eseményhez
rendelt számot, ami kifejezi a bekövetkezés esélyét,
úgy nevezzük, hogy valószínűség.
A valószínűség
 a valószínűség számszerűen kifejezett értéke 0 és 1
között változik, ahol a 0 lehetetlen eseményt, az 1
pedig a biztosan bekövetkező eseményt jelöli.
 ha A esemény valószínűségét P(A)- val jelöljük (a P
az angol probability szó rövidítéséből), akkor
0≤P(A)≤1. Ha például egy esemény
bekövetkezésének valószínűsége P(A)=0,95, akkor
ez azt jelenti, hogy 95%-os valószínűséggel
bekövetkezik. Másképpen fogalmazva, hogyha a
beavatkozást megismételnénk, akkor valószínűleg,
hogy 100 esetből az esemény 95-ször előfordulna.
Statisztikai becslés és statisztikai
összehasonlítás
 a statisztikai becslés célja az, hogy a minta alapján
következtessen a populációra.
 az n-szer elismételt beavatkozás, hogyha k
alkalommal bekövetkezik, akkor a k/n hányados a
relatív gyakoriságot fejezi ki. Megfigyelhető, hogy ha
a k értéke közel van az n-hez, akkor az esemény
relatíve sokszor következik be, ha viszont a k értéke
0-hoz közelít, akkor az esemény relatíve ritkán
következik be
Statisztikai becslés és statisztikai
összehasonlítás
 a becslés mellett a matematikai statisztika másik
fontos problémája a statisztikai összehasonlítás. Ez
esetben adatokat hasonlítunk össze egymással.
 az összehasonlítás feltétele az
összehasonlíthatóság.
 az összehasonlítandó adatok lehetőleg csak olyan
tényezők tekintetében különbözzenek, amelyek
hatását vizsgáljuk, más tényezők tekintetében pedig
homogének legyenek.
Középértékek
 a számtani középérték (átlag): segítségével
valamely számsor átlagos tendenciáját ragadjuk
meg. Az átlag kiszámítása egyszerű: összeadjuk a
mintába tartozó adatokat, és az így nyert összeget
elosztjuk az adatok számával.
 az átlag a mintát a leginkább, legáltalánosabban
jellemző számadat.
 például a vizsgálati személyek átlagéletkorát, az
elért teljesítmény átlagát, vagy tesztpontszámok
átlagát.
Középértékek
 A medián olyan érték, amelyiknél a minta egyik fele
nagyobb, a minta másik fele pedig kisebb, tehát
éppen a középen elhelyezkedő adat. Ha páratlan
számú adatunk van, akkor a mediánt úgy
határozhatjuk meg, hogy a növekvő sorrendbe
helyezett adatok közül megkeressük a középsőt. Ha
páros számú adatunk van, akkor a növekvő
sorrendbe rendezett adatok közül a két középső
számtani középértéke adja a mediánt.
Középértékek
 a módusz: a minta adatai közül a leggyakrabban
előforduló középérték, vagy a legnagyobb
gyakorisággal rendelkező csoport
csoportközépértéke.
 A módusz meghatározása egyszerű, mivel a
leggyakrabban előforduló érték, viszont ezzel a
középértékkel ritkán tudjuk a mintánkat jellemezni,
mivel csak a leggyakrabban előforduló adatra utal.
Szimetrikus gyakorisági eloszlás
Nem szimetrikus gyakorisági eloszlás
Egymintás t-próba
 ha az adatok ugyanazoktól a személyektõl származnak két
mérés eredményeként (kontroll-feltétel), akkor az
összehasonlítást egymintás t-próbával végezzük.
 a minta által reprezentált populációra vonatkozó becslésünk
érdekében meg kell állapítanunk a valószínûségi szintet, ami a
pedagógiai vizsgálatokban legalább 95%.
 a szignifikancia megállapításának elsõ lépéseként meg kell
határozni a minta szabadságfokát. Egymintás t-próbánál ez
nagyon egyszerű művelet, a minta elemszámából kivonunk
egyet. szf=n-1.
 a továbbiakban szükségünk van a t-eloszlás táblázatra
melynek segítségével a szabadságfok figyelembe vételével
összehasonlítjuk a kiszámolt t értéket a táblázatban található
értékekkel.
Kétmintás t-próba
 hogyha nincs lehetőségünk önkontrollos kísérletet végezni,
akkor rendszerint kontrollcsoportos kísérletet végzünk,
ugyanis a kísérleti csoport adatait viszonyítani kell valamihez.
 ez esetben tehát két különböző csoportból származó
adatsorokkal dolgozunk. Két csoport átlagainak
összehasonlítására kétmintás t-próbát használunk.
 ha egyforma a két minta ez azt is jelenti, hogy a szórásuk is
egyforma kell legyen. A minták szórásai teljesen egyformák
nem lehetnek, de becslést kell tennünk arra vonatkozóan,
hogy a különbségek csak véletlenek.
 ehhez viszont egy újabb statisztikai eljárás szükséges, az Fpróba. A kétmintás t-próbát megelőző F-próba tehát arra jó,
hogy megállapítsuk, hogy a két minta teljesíti-e a szórások
egyformaságának feltételét.
A korrelációszámítás
 egy adott mintán a változók lehetnek valamilyen módon
kapcsolatban egymással vagy pedig értékeik egymástól
teljesen függetlenek. Az adatok közötti kapcsolat egyik
lehetõsége, hogy az egyik változó magas értéke a másik
változó magas értékével jár együtt, vagy az egyik változó
alacsony értéke együttjár a másik változó alacsony
értékével.
 Az azonos irányú együttváltozást pozitív korrelációnak,
az ellentétes irányút pedig negatív korrelációnak
nevezzük. Előfordulhat az az eset is, hogy két adatsor
között nem találunk semmilyen kapcsolatot, vagyis ez a
korreláció hiányára utal.
A pozitív, negatív korreláció és a korreláció
hiánya pontdiagramokkal ábrázolva
A korrelációs együttható (r)
 a korrelációs együttható megmutatja a változók közötti




kapcsolat erõsségét és irányát is.
jelölése r, értéke pedig -1 és +1 között változhat. Ha az r
értéke pozitív, akkor ez azt jelenti, hogy a változók azonos
irányba változnak, és minél jobban megközelíti a maximális
értéket (+1) annál erősebb pozitív korrelációról beszélünk.
egy változó önmagával való kapcsolata a legerősebb, ez az
érték a +1.
ha az r értéke negatív, akkor ez azt jelenti, hogy a változók
ellentétes irányba mozdulnak el, és minél jobban megközelíti a
minimális értéket (-1), annál erősebb negatív korrelációról
beszélünk.
az r értéke ha 0, vagy 0 körüli érték, akkor a korreláció
hiányáról beszélünk.
A korrelációs együttható (r)
 a korrelációs együttható kiszámítása után azt kell
leellenőrizzük, hogy az összefüggés mennyire valódi és nem a
véletlen mûve. Erre ad választ az r szignifikancia vizsgálata.
 a szignifikancia tehát a korreláció megbízhatóságát jelöli és
két dologtól függ: egyrészt az r számértékétõl, ami minél
nagyobb mértékben eltér a 0-tól, annál nagyobb
valószínűséggel jelöl valós kapcsolatot, másrészt viszont a
minta elemszámától függ. Minél nagyobb mintával dolgozunk,
annál megbízhatóbb az érték. A szignifikancia kiszámolásához
szükségünk van a mintába tartozó elemek szabadságfokára.
Ez a minta elemszámánál kettővel kisebb érték, azaz szf = n –
2.
 az r kritikus értékei a korrelációs együttható valószínűségi
szintjének táblázatából olvashatóak le.