Overzicht en herhaling interpretatie output

Download Report

Transcript Overzicht en herhaling interpretatie output

Onderzoeksmethoden II: overzicht en herhaling interpretatie output
1. Overzicht methodes
1.1. Onderzoeksmethoden I en onderzoeksmethoden II

Statistiek II en Onderzoeksmethoden I:
o Het univariaat lineair model


is het intercept
 Zowel y als x zijn numerieke variabelen op interval niveau1

o
o
o
1
Regressie, anova, ancova
 A, B, C en D zijn factoren: categorische predictoren van nominaal niveau2.

, zijn covariaten: numerieke predictoren van interval niveau.
 Moderatie en mediatie
Het veralgemeend (univariaat) lineair model
 Logistische regressie
 U is binair, nominaal of ordinaal3.

: binaire logistische regressie voor proporties.
Principale componenten analyse (PCA)
Exploratieve factoranalyse (EFA)
 Exploratief4: aantal factoren a priori onbekend.
Variabelen op interval niveau lopen van min oneindig tot plus oneindig.
Variabelen op nominaal niveau zijn categorieën (A, B, C, D, etc.).
3
Variabelen op ordinaal niveau laten zich ordenen (1e, 2e, 3e, 4e, etc.).
2


Onderzoeksmethoden II
o Het multivariaat lineair model
 Multivariate uitbreiding van regressie.
 y: twee afhankelijke variabelen die conceptueel samen horen.
 Multivariate toetsen: houden rekening met de correlatie structuur tussen de afhankelijke variabelen.

o
o
Manova en Mancova
 Uitbreiding op Anova en Ancova
Analyses van geclusterde / afhankelijke data
Structurele vergelijkingsmodellen
 Padanalyse
 Onderscheid tussen exogene5 en endogene6 variabelen.
 Indirecte effecten (mediatie).

4
Rotatie (orthogonaal of oblique)
Confirmatorische factoranalyse (CFA)
 Aantal factoren + samenhang met indicatoren ligt vast.
 Confirmatorisch: past dit model met de data: ja of nee?
Exploratief onderzoek wordt getypeerd door een vraagstelling als: ‘Wat speelt een rol op het terrein van .....’ Dit houdt in dat er vooraf geen
restricties worden gegeven. De onderzoeker staat het geheel vrij zijn blik te werpen op alles wat hij interessant vindt.
5
Een gegeven variabele, van buiten het model. Wordt gebruikt om een endogene variabele te verklaren.
6
De variabele die verklaard moet worden m.b.v. de exogene variabelen. Ook wel afhankelijke variabele.

 SEM = padanalyse + CFA
Structurele vergelijkingsmodellen
1.2.Univariaat lineair model: theorie



De algemene vorm van het univariate lineaire model:
o
o
= de i – de observatie van de afhankelijke variabele.
o
zijn de observaties van de i analyse – eenheden op de p onafhankelijke variabele (predictoren).
o In veel regressiemodellen worden een constante term
met en een regressiegewicht (intercept) toegevoegd.
o De regressiegewichten
worden geschat op basis van de data.
o
is de foutterm voor observatie i.
Lineair model in matrix notitie
o We herschrijven dit als:
o De kolom met constanten en de overeenkomstige intercept zijn reeds toegevoegd.
o De matrix X wordt de model matrix genoemd.
Parameterschatting: kleinste kwadraten methode
o Wanneer we het lineair model
schatten krijgen we: :
.
o De kleinste kwadraat benadering zoekt waarden voor b die de som van de gekwadrateerde fouttermen minimaliseert.


o Er kan bewezen worden dat de oplossing voor dit probleem gelijk is aan:
Toetsen van de hypothese:
o Test of de variabele een significant effect heeft in het model.
o
Toets statistiek:

Modelvergelijking: volledig (

Toets – statistiek:
volgt onder
een t – verdeling met df = n – (p+1) vrijheidsgraden.
) vs gereduceerd (
) model
volgt onder
een F-verdeling met h en n – (p+1)
vrijheidsgraden.
1.3.Univariaat lineair model: interpretatie output

Voorbeeld
o Data: 377 werknemers
o Variabelen: 25
o Stress is de afhankelijke variabele
o Continue predictoren: decaur, psydem, age2 en chi
o Output



Er is een significant effect van psydem op stress, t(372) = 7.624, p < 0.001
Als alle overige variabelen constant blijven, dan zal de verwachte score op stress stijgen met een waarde
van 0.048 voor elke stijging (met eenheid 1) van de score psydem.
Voorbeeld
o We nemen hier depres als afhankelijke variabele.
o 3 categorische variabelen: sex, educlev en agec
o De categorische informatie dienen we te hercoderen met behulp van hulpveranderlijke dummy variabelen7
o
7
Interpretatie categorische variabelen
 Met dummy/treatment – codering weerspiegelen de parameters (voor de hulpveranderlijken die horen
bij een factor) het verschil tov het referentie – niveau.
Een dummy variabele (afgekort "dummy") is precies hetzelfde als een gewone variabele, alleen wordt deze op meerdere plaatsen in het
programma voor verschillende handelingen gebruikt.

o
De verwachte score voor depressie ligt ongeveer -3.37 lager bij mannen (1) dan bij vrouwen (2) en dit
ongeacht de scores op de andere variabelen.
 De verwachte score van depressie ligt respectievelijk 2.21 en 0.54 hoger bij een laag en gemiddeld opleidingsniveau, in vergelijking met het hoogste opleidingsniveau (3).
 Bemerk dat het verschil tussen educlev=2 en educlev=3 niet significant is.
Voorspelde celgemiddelden voor educlev
 Vaak wil we de voorspelde celgemiddelden rapporteren.
 Soms kunnen we dit opvragen in ons softwarepakket (SPSS)
 Het is van belang dat je dit ook manueel kunt uitvoeren.
1.4.Moderatie = interactie interpretatie analyse output


Moderatie = interactie
4 gevallen
o Predictor en moderator categorisch.
 Toetsing via modelvergelijking met model 1: A + B + (AxB) en model 2: A+B
 Indien interactie (AxB) significant: moderatie.

Voorbeeld
 We nemen opnieuw stress als afhankelijke variabelen.
 Predictoren: psydem, decaut, chi, sex, agec, interactie sex x agec.



Met dummy – codering: alle regressiecoëfficiënten die behoren tot een factor drukken het (geschatte)
verschil uit tov de referentie – categorie.
Hier is de referentie – categorie: vrouwen uit de oudste leeftijdsgroep.
Voorspelde celgemiddelden

o
Elk profiel vullen we in in de regressievergelijking en o pdie manier bekomen we de zes scores die het
model voorspelt voor elk van de zes profielen.
Moderator categorisch, predictor continu OF moderator categorisch, predictor categorisch.




Vb: y is score, x is intelligent en B is geslacht;
Toetsing via modelvergelijking:
 Model 1:
 Model 2:
Er is in dit model een significant interactie – effect tussen een continue (psydem) en categorische predictor (sex)
Regressiecoëfficiënt of slope van de continue variabele verschilt naargelang de niveaus van de factor!
 Slope psydem indien sex=1: 0.109 – 0.070 = 0.039
 Slope psydem indien sex=2: 0.109
o Moderator en predictor continu.


Vb: y is score en
is intelligentie,
Toetsing via modelvergelijking
 Met model 1:
 Model 2: :
is studietijd.


o
Indien interactie
significant: moderatie.
Voorbeeld : interactie chi :depres
 Predictoren : psydem, depres, chi, sex en interactie – term van depres x chi.
 Interactie – term depres :chi is significant.
Interpretatie interactie –term
 De slope van de ene continue predictor (bvb depres) verschilt naargelang de score op de andere continue predictor (chi)
 Interpretatie: naarmate de score van chi stijgt, daalt de slope van depres (en wordt de relatie tussen depres en stress minder sterk).
 Vaak zal met een plot weergeven met drie regressielijnen: met een aparte slope voor respectievelijk een
lage, gemiddelde en een hoge score van chi.