Tilastolliset menetelmät061107

Download Report

Transcript Tilastolliset menetelmät061107

Ea 3.2
Kvantitatiiviset tutkimusmenetelmät
(täyd. aineopinnot)
Laajuus: 4 op / 3 ov
Käyttäytymistieteellinen tiedekunta / Erityispedagogiikka
Tavoite:
 Opiskelija osaa valita tutkimukseensa sopivat menetelmät
ja osaa laatia tutkimussuunnitelman.
 Opiskelija oppii SPSS-ohjelman käytön perusteet ja osaa
suorittaa sillä analyyseja. Opiskelija saa tietoa myös
parametrittomista tutkimusmenetelmistä.
 Tavoitteena on lisäksi, että opiskelija saa valmiuden
kvantitatiivisten tutkimusraporttien analyyttiseen
lukemiseen.
 Opiskelija saa tietoa määrällisistä perusanalyysimenetelmistä (esimerkiksi ristiintaulukointi, t-testi, ANOVA,
ANCOVA, korrelaatioanalyysi, reliabiliteettianalyysi,
faktorianalyysi).
2
Aikataulu
 ti 6.11. klo 11.15–13.45 Risto
 ke 28.11. klo 9.15–10.45 Risto
 to 8.11. klo 11.15–12.45 Risto
 to 29.11. klo 11.15–13.45 Risto
 ti 13.11. klo 11.15–13.45 Risto
 ma 3.12. klo 9.15–10.45 Helena
 to 15.11. klo 11.15–13.45 Risto
 ti 4.12. klo 11.15–13.45 Helena
 to 22.11. klo 11.15–12.45 Risto
 ke 5.12. klo 9.15–11.45 Helena
 ti 27.11. klo 11.15–13.45 Risto
TENTTI to 13.12. klo 13.00–15.15 T23, sali A213, Uusintatentit 13.2. ja 5.3.
klo 14.00–17.00 T23, auditorio; ilmoittautuminen viimeistään 4.2. ja 25.2.
3
Työtavat, arviointi & materiaalit:
 Hyväksytty suoritus edellyttää luentoon ja ryhmäopetukseen
osallistumista, spss-harjoitustehtävien tekemistä sekä luentoon ja
kirjallisuuteen perustuvan soveltavan tentin suorittamista.
 Opintojakso arvioidaan asteikolla 0–5.
 Luento-opetus 15 t, ryhmäopetus 20 t ja yksi kirja (Karma &
Komulainen), itsenäinen työ 72 t.
Kurssin materiaali
 Kurssimateriaali (luennot, harjoitukset),
http://bulsa.helsinki.fi/~hotulain/
 Kirjallisuus:
 Karma,
K. & Komulainen, E. 2002. Käyttäytymistieteiden
tilastomenetelmien jatkokurssi. Helsinki: Gaudeamus.
 Saatavana
internetistä: www.helsinki.fi/ktl/julkaisut/ktj.index.htm
4
Riston osuus
- Tutkimuksen suunnittelu ja tilastollisen tutkimuksen
perusteita
- Tietojen syöttäminen SPSS:ään (tehdään havaintomatriisi,
ks. liite)
- Muuttujien luonne
- Muuttujien luokittelu SPSS:llä
- Frekvenssien ja prosentuaalisten osuuksien tutkiminen
SPSS:llä.
- Tilastolliset tunnusluvut
- Summamuuttujan luominen
- Reliabiliteetti
- Tutkitaan testien edellytyksiä, sopivan testin valintaa
oikeaan tarkoitukseen
- Muuttujien väliset yhteydet
5
- Ryhmien väliset erot muuttujien suhteen: t-testi
- 1-suuntaista varianssianalyysi post hoc-jatkotesteineen.
Helenan osuus
- Faktorianalyysi ja regressioanalyysi, joista edellytykset,
suorittaminen ja tulkinta.
- Regressionanalyysi: muuttujien valinta analyysiin, enter barvot ja standardoidut beta-kertoimet, sig.,
kokonaisselitysaste. Multikollineaarisuuden testaus ja
muita testejä.
- Grafiikka ja taulukot:
Taulukot ja graafiset kuviot (box-plotit, viivadiagrammit,
sirontakuviot etc.), niiden ymmärtäminen, tulkinta ja
tuottaminen, muokkaaminen ja siirtäminen wordiin.
6
I Tutkimuksen suunnittelu ja tilastollisen
tutkimuksen perusteita:
 Paljastaa ilmiötä koskevia (tosi)asioita eli kuvata niitä
 Pyrkiä selittämään ja ymmärtämään kuvaamiaan ilmiöitä
(vastata kysymykseen miksi?)
 Rakentaa kohdetta kuvaavia käsitteitä ja teorioita
 Ennustaminen
 Tähdätä sovelluksiin ja toimenpidesuosituksiin
 Tieteellinen tieto nojautuu jo olemassa olevaan tietoon
 Käytetään yleisesti tunnettuja/ hyväksyttäjä menetelmiä
 Kolme selvää hyötyä:
a) Vertailukelpoisuus
b) Erehdysten mahdollisuus pienenee
c) Toistettavuus
7
Ihmistieteen tunnusmerkkejä
Ihmistieteet
 Esimerkiksi: taloustiede, sosiologia, historia, arkeologia,
antropologia, lingvistiikka, semiotiikka, kulttuurintutkimus,
psykologia, kasvatustiede, sosiaalipolitiikka, valtio-oppi,
politiikan tutkimus, filosofia.
Kasvatustieteellinen neljään osa-alueeseen (Metsämuuronen 2003):
1) toiminnan vastaanottaja (oppija)
2) toiminnan suorittaja (opettaja)
3) itse toimintaa (opetusta)
4) kaikkea kasvatusta säätelevää ja rajoittavaa (esim. oppimista,
opettamista) toimintaa koskeva tutkimus
 Ongelmana ihmisen inhimillisyys (kokemuksen luotettavuus)
8
Tilastotiede (menetelmätiede) auttaa tekemään
tieteellisiä päätelmiä
 Yksikköjen muodostamaan joukkoon liittyvää numeerisen
tietoaineiston keräämistä, analysointia ja tulkintaa
koskeva tiede.
 Tilastotiede on oppi siitä, miten reaalimaailman tilasta tai
ilmiöistä tehdään päätelmiä, tilasta tai ilmiöstä kerättyjen
numeeristen tietojen perusteella
HUOM: Tilastotiede EI ole oppia tilastoista tai niiden
laatimisesta!
9
Aineiston tilastollinen käsitteleminen
 Tietoa tiivistäviä ja kuvailevia menetelmiä (- tunnusluvut, taulukot,
kuviot)
 Päätelmien tekemiseen tarkoitetut menetelmät
- tutkitaan pientä joukkoa henkilöitä (otos) ja arvioidaan kuinka
todennäköisesti otoksen henkilöillä esiintynyt ilmiö toistuu kaikilla
kiinnostuksen kohteena olevilla henkilöillä (perusjoukko,
populaatio)
 Ilmiöitä matemaattisesti mallintavat menetelmät
- aineiston perusteella pyritään luomaan matemaattinen malli, jolla
pyritään selittämään ja ennustamaan, esim. regressiomalli
10
Tutkimuksen vaiheet
Tutkimusongelma
– aiheen valinta, määrittely
Aikaisempi ongelmaa sivuava kirjallisuus
– teoreettinen kirjallisuus ja empiirinen tutkimus
Ongelman täsmennys
– määrittely, viitekehys, hypoteesit
Tutkimusasetelma
– millainen aineisto ja menetelmä ratkaisulle
Aineistonkeruu ja analysointi
– aineiston kokoaminen ja analysointi tutkimusasetelman
mukaan
Johtopäätökset
– tulokset, tulkinta ja suhteellistaminen teoriaan ja aiempaan
tutkimukseen.
11
Tutkimusongelma ja Hypoteesi
Tutkimuskysymysten muoto:
a) Aikaisempaa tietoa ei ole  kuvaileva tutkimus, mitä aiotaan
tehdä, missä ja milloin
b) Aikaisempaa tietoa on kohtuullisesti (esimerkiksi on tietoa
kahdesta eri ilmiöstä, mutta ei ole olemassa tietoa siitä ovatko
kyseiset ilmiöt yhteydessä toisiinsa)
c) Aikaisempaa tietoa on (jonka perusteella voidaan olettaa
tutkimuksen tulos)
- hypoteesi on lause, jossa kuvattavan muuttujien välisiä
yhteyksiä ja esitetään selkeä väite, jonka pitävyyttä testataan
12
II Tilastollisen aineiston ja analyysin
edellytysten tarkistaminen
- Muuttujien jakauman tarkistus
- Muunnokset, uudelleen koodaaminen, summamuuttujien
luominen
- Puuttuva tieto ja sen käsittely
- Kuvaileva tilastoanalyysi vs. tilastollinen päättely
13
Normaalijakauma
 Muuttujan jakauman normaalisuus on monien tilastollisten testien
oletus
 Normaalijakauma on symmetrinen, sen sijainti ja muoto riippuvat
keskiarvosta ja hajonnasta
 Havaintojen jakautumista keskiarvon (mean) ympärille
kuvataan keskihajonnalla (standard deviation)
 Normaalijakauman havainnoista 95 % sijoittuu
lähemmäs kuin kahden keskihajonnan päähän
keskiarvosta.
14
Vinous ja huipukkuus
 Normaalijakauman vinous (skewness) ja huipukkuus
(kurtosis) ovat nollia.
 Jakauman vinouden ja huipukkuuden nollasta eroavuutta
voi testata jakamalla saatu arvo sitä vastaavalla
keskivirheellä (Standard Error). Jos näin saatu luku on <
|2|, voidaan jakauman vinous ja huipukkuus hyväksyä
vielä normaaliseksi ja siten tarkasteltava jakauma on
riittävän normaalinen tilastollisiin testeihin (vrt. Jos taas on
> |2| niin vinous/huipukkuuskerroin eroaa tilastollisesti
merkitsevästi nollasta)
 Jakauman vinous ja huipukkuus pulmallisia perinteisissä
tilastoanalyyseissä.
15
Vinous (vrt. normaalijakauman vinous = 0)
 Skewness = vinouskerroin ilmoittaa, mihin suuntaan
jakauma on vino; Jos Sk > 0, positiivisesti vino/oikealle
vino
=> Jos Sk < 0, negatiivisesti vino/vasemmalle vino
 Huipukkuus (vrt. normaalijakauman huipukkuus = 0)
=> Kurtosis = huipukkuuskerroin ilmoittaa, kuinka
terävähuippuinen jakauma on
=> Jos Kur > 0, jakauma on terävähuippuinen
=> Jos Kur < 0, jakauma on huiputon eli litteähuippuinen
oikealle vino
vasemmalle vino
huipukas
huiputon
16
Aineiston tarkistus ja poikkeavat arvot (outlier:it)
Yksittäiset äärimmäisen suuret tai pienet arvot voivat tuottaa
pulmia analyyseissa
 Kannattaa tarkastella myös graafisesti (esim. boxplot)
 Esim. Kuntien asukkaiden keskitulovertailuissa
Kauniainen vääristää keskiarvoa, optiomiljönääri
vanhempien palkkojen vertailua jne....
17
Muuttujan normaalijakauman testaus
 Kolmogorov-Smirnov -testi
 SPSS: Analyze /Descriptive statistics/Explore – normality
plots with tests
 Konservatiivinen testi eli hylkää helposti
normaalijakaumaoletuksen... (vrt. Shapiro-Wilk)
Tests of Normality
a
päättelytesti
verbaalinen testi
kielten keskiarvo
matematiikan arvosana
opintomenestys
Kolmogorov-Smirnov
Statistic
df
Sig.
,147
30
,095
,149
30
,088
,075
30
,200*
,250
30
,000
,140
30
,135
Statistic
,952
,962
,974
,916
,936
Shapiro-Wilk
df
30
30
30
30
30
Sig.
,191
,355
,665
,021
,069
*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction
18
Aineiston tarkistaminen & poikkeavat havainnot
Tarkistus #1: Descriptives –komento
SPSS/Analyze/Descriptive Statistics/Descriptives
-valinnat mean, std.devation, minimum ja maximum
 Joskus äärimmäiset arvot johtuvat laite-, mittaus-, koodaus
tms. virheistä  Arvojen korjaus oikeaksi, jos se on
mahdollista (esim. tarkistus alkuperäisistä lomakkeista)
 Poistetaan datasta, raportoidaan
 Havaintojen käyttäminen sellaisenaan, jos niille on
järkevä selitys, mutta huomioidaan niiden vaikutus
tuloksiin
 Korvataan keskiarvolla
-kannattaa pohtia löytyykö juuri kyseistä puuttuvaa arvoa kuvaava
keskiarvo SPSS/Analyze/Compare Means/Means
19
Mikä on tarpeeksi normaalia
Testien rinnalla jakaumaa kannattaa tarkastella
myös graafisesti. Testien oletukseksi riittää, kunhan
jakauma on noin ’suurin piirtein’ normaalinen.
TOISAALTA: Vaikka ”riittävä” normaalisuus
täyttyisikin tilastollisista oletuksista on hyvä olla
tietoinen ja pohdiskella niiden mahdollista
vaikutusta tuloksiin…
 ONKO REALISTA OLETTAA, ETTÄ KAIKKI PSYKOLOGISET
ILMIÖT KUTEN ESIM. MASENNUS,
ONGELMAKÄYTTÄYTYMINEN OLISIVAT KUTA KUINKIN
NORMAALISTI JAKAUTUNEITA?
20
Uudelleen koodaaminen (recode)
SPSS: Transform/recode
 Voidaan tehdä joko alkuperäiseen tai uuteen muuttujaan
(mieluummin uuteen)
 Tarvitaan esim. muuttujan ”suunnan” vaihtoon
 Tarvitaan myös jatkuvan muuttujan luokittelussa jne…
Esim. ikämuuttuja luokitellaan kolmeen ryhmään
- ikä <35: uusi arvo 1
- ikä 35- 59: uusi arvo 2
- Ikä >60: uusi arvo 3
Esim. uuden ‘ikämuuttujan’ luominen:
IKÄ = VUOSI – SYNTYMÄVUOSI
21
SUMMAMUUTTUJIEN LUOMINEN
 SPSS: Transform / Compute:
SUMMA = (KYS1 + KYS2 + KYS3 + KYS4 + KYS5)/5
SUMMA = MEAN(KYS1,KYS2,KYS3,KYS4,KYS5)
 Suoran summamuuttujan muodostaminen edellyttää
skaalan riittävää reliabiliteettia (esim. Cronbachin alfa > .70)
 Muista: Kysymysten (item) kääntäminen, niin että kaikki
summamuuttujan osakysymykset ovat samansuuntaisia
siten, että mitä suurempi arvo sitä enemmän se mittaa
mitattavaa muuttujaa
22
III Tilastollinen päättely
- Perusteet tilastolliselle päättelylle
- Hypoteesien testaus
- Tilastollisen päättelyn ongelmia
23