Transcript Slide 1
A pedagógiai kutatás
módszertana
Babeş-Bolyai Tudományegyetem
Tanító- és óvóképző szak
A leíró és a matematikai statisztika
Alapvetően kétfajta statisztikát használunk a
pedagógiai kutatásban: az egyik az ún. leíró
statisztika, a másik pedig az ún. matematikai
statisztika.
Leíró statisztikáról abban az esetben beszélünk,
hogyha egy jól meghatározott csoportot akarunk
elemezni, s nem kívánunk a tágabb, befoglaló
populációra vonatkozó következtetéseket levonni.
Például arra szeretnénk választ kapni, hogy egy
általános iskola két IV. osztálya közül melyikben
ismernek több népdalt a gyermekek. Egyszerű
csoportokkal dolgozik, következtetései is pontosak
és nem valószínűségi jellegűek.
A leíró és a matematikai statisztika
A matematikai statisztikát akkor alkalmazzuk, amikor
egy mintáról úgy kívánunk következtetést
megfogalmazni, hogy az a tágabb populációra is
érvényes legyen, vagyis az ilyen becsléseink nem
pontosak, hanem valószínűségi jellegűek. Ha például
egy énektanítási módszer hatékonyságát vizsgáljuk,
és a két IV. osztály a negyedikes populáció
reprezentatív mintáit képezik, akkor már nem elég
egyszerűen az átlagok közül a nagyobbra rámutatni és
azt mondani, hogy az ott alkalmazott módszer
hatékonyabb, hanem egy matematikai eljárással (pl. tpróba) meg kell vizsgálni azt, hogy a befoglaló
populáción is érvényes lesz-e a megállapításunk. Ez
az eljárás tehát bonyolultabb, és valószínűségi jellegű.
A valószínűség
a valószínűség események bekövetkeztének az
esélyét jelöli.
olyan eseményekről van szó, amelyek nem
pontosan előreláthatóak, vagyis bizonytalan
kimenetelűek.
A valószínűségszámításban azt az eseményhez
rendelt számot, ami kifejezi a bekövetkezés esélyét,
úgy nevezzük, hogy valószínűség.
A valószínűség
a valószínűség számszerűen kifejezett értéke 0 és 1
között változik, ahol a 0 lehetetlen eseményt, az 1
pedig a biztosan bekövetkező eseményt jelöli.
ha A esemény valószínűségét P(A)- val jelöljük (a P
az angol probability szó rövidítéséből), akkor
0≤P(A)≤1. Ha például egy esemény
bekövetkezésének valószínűsége P(A)=0,95, akkor
ez azt jelenti, hogy 95%-os valószínűséggel
bekövetkezik. Másképpen fogalmazva, hogyha a
beavatkozást megismételnénk, akkor valószínűleg,
hogy 100 esetből az esemény 95-ször előfordulna.
Statisztikai becslés és statisztikai
összehasonlítás
a statisztikai becslés célja az, hogy a minta alapján
következtessen a populációra.
az n-szer elismételt beavatkozás, hogyha k
alkalommal bekövetkezik, akkor a k/n hányados a
relatív gyakoriságot fejezi ki. Megfigyelhető, hogy ha
a k értéke közel van az n-hez, akkor az esemény
relatíve sokszor következik be, ha viszont a k értéke
0-hoz közelít, akkor az esemény relatíve ritkán
következik be
Statisztikai becslés és statisztikai
összehasonlítás
a becslés mellett a matematikai statisztika másik
fontos problémája a statisztikai összehasonlítás. Ez
esetben adatokat hasonlítunk össze egymással.
az összehasonlítás feltétele az
összehasonlíthatóság.
az összehasonlítandó adatok lehetőleg csak olyan
tényezők tekintetében különbözzenek, amelyek
hatását vizsgáljuk, más tényezők tekintetében pedig
homogének legyenek.
Középértékek
a számtani középérték (átlag): segítségével
valamely számsor átlagos tendenciáját ragadjuk
meg. Az átlag kiszámítása egyszerű: összeadjuk a
mintába tartozó adatokat, és az így nyert összeget
elosztjuk az adatok számával.
az átlag a mintát a leginkább, legáltalánosabban
jellemző számadat.
például a vizsgálati személyek átlagéletkorát, az
elért teljesítmény átlagát, vagy tesztpontszámok
átlagát.
Középértékek
A medián olyan érték, amelyiknél a minta egyik fele
nagyobb, a minta másik fele pedig kisebb, tehát
éppen a középen elhelyezkedő adat. Ha páratlan
számú adatunk van, akkor a mediánt úgy
határozhatjuk meg, hogy a növekvő sorrendbe
helyezett adatok közül megkeressük a középsőt. Ha
páros számú adatunk van, akkor a növekvő
sorrendbe rendezett adatok közül a két középső
számtani középértéke adja a mediánt.
Középértékek
a módusz: a minta adatai közül a leggyakrabban
előforduló középérték, vagy a legnagyobb
gyakorisággal rendelkező csoport
csoportközépértéke.
A módusz meghatározása egyszerű, mivel a
leggyakrabban előforduló érték, viszont ezzel a
középértékkel ritkán tudjuk a mintánkat jellemezni,
mivel csak a leggyakrabban előforduló adatra utal.
Szimetrikus gyakorisági eloszlás
Nem szimetrikus gyakorisági eloszlás
Egymintás t-próba
ha az adatok ugyanazoktól a személyektõl származnak két
mérés eredményeként (kontroll-feltétel), akkor az
összehasonlítást egymintás t-próbával végezzük.
a minta által reprezentált populációra vonatkozó becslésünk
érdekében meg kell állapítanunk a valószínûségi szintet, ami a
pedagógiai vizsgálatokban legalább 95%.
a szignifikancia megállapításának elsõ lépéseként meg kell
határozni a minta szabadságfokát. Egymintás t-próbánál ez
nagyon egyszerű művelet, a minta elemszámából kivonunk
egyet. szf=n-1.
a továbbiakban szükségünk van a t-eloszlás táblázatra
melynek segítségével a szabadságfok figyelembe vételével
összehasonlítjuk a kiszámolt t értéket a táblázatban található
értékekkel.
Kétmintás t-próba
hogyha nincs lehetőségünk önkontrollos kísérletet végezni,
akkor rendszerint kontrollcsoportos kísérletet végzünk,
ugyanis a kísérleti csoport adatait viszonyítani kell valamihez.
ez esetben tehát két különböző csoportból származó
adatsorokkal dolgozunk. Két csoport átlagainak
összehasonlítására kétmintás t-próbát használunk.
ha egyforma a két minta ez azt is jelenti, hogy a szórásuk is
egyforma kell legyen. A minták szórásai teljesen egyformák
nem lehetnek, de becslést kell tennünk arra vonatkozóan,
hogy a különbségek csak véletlenek.
ehhez viszont egy újabb statisztikai eljárás szükséges, az Fpróba. A kétmintás t-próbát megelőző F-próba tehát arra jó,
hogy megállapítsuk, hogy a két minta teljesíti-e a szórások
egyformaságának feltételét.
A korrelációszámítás
egy adott mintán a változók lehetnek valamilyen módon
kapcsolatban egymással vagy pedig értékeik egymástól
teljesen függetlenek. Az adatok közötti kapcsolat egyik
lehetõsége, hogy az egyik változó magas értéke a másik
változó magas értékével jár együtt, vagy az egyik változó
alacsony értéke együttjár a másik változó alacsony
értékével.
Az azonos irányú együttváltozást pozitív korrelációnak,
az ellentétes irányút pedig negatív korrelációnak
nevezzük. Előfordulhat az az eset is, hogy két adatsor
között nem találunk semmilyen kapcsolatot, vagyis ez a
korreláció hiányára utal.
A pozitív, negatív korreláció és a korreláció
hiánya pontdiagramokkal ábrázolva
A korrelációs együttható (r)
a korrelációs együttható megmutatja a változók közötti
kapcsolat erõsségét és irányát is.
jelölése r, értéke pedig -1 és +1 között változhat. Ha az r
értéke pozitív, akkor ez azt jelenti, hogy a változók azonos
irányba változnak, és minél jobban megközelíti a maximális
értéket (+1) annál erősebb pozitív korrelációról beszélünk.
egy változó önmagával való kapcsolata a legerősebb, ez az
érték a +1.
ha az r értéke negatív, akkor ez azt jelenti, hogy a változók
ellentétes irányba mozdulnak el, és minél jobban megközelíti a
minimális értéket (-1), annál erősebb negatív korrelációról
beszélünk.
az r értéke ha 0, vagy 0 körüli érték, akkor a korreláció
hiányáról beszélünk.
A korrelációs együttható (r)
a korrelációs együttható kiszámítása után azt kell
leellenőrizzük, hogy az összefüggés mennyire valódi és nem a
véletlen mûve. Erre ad választ az r szignifikancia vizsgálata.
a szignifikancia tehát a korreláció megbízhatóságát jelöli és
két dologtól függ: egyrészt az r számértékétõl, ami minél
nagyobb mértékben eltér a 0-tól, annál nagyobb
valószínűséggel jelöl valós kapcsolatot, másrészt viszont a
minta elemszámától függ. Minél nagyobb mintával dolgozunk,
annál megbízhatóbb az érték. A szignifikancia kiszámolásához
szükségünk van a mintába tartozó elemek szabadságfokára.
Ez a minta elemszámánál kettővel kisebb érték, azaz szf = n –
2.
az r kritikus értékei a korrelációs együttható valószínűségi
szintjének táblázatából olvashatóak le.