Facit till övningsuppgiften

Download Report

Transcript Facit till övningsuppgiften

Statistisk verktygslåda 2 – multivariat analys
© Författarna och Studentlitteratur 2009
Facit till övningsuppgifter
Uppgift i kapitel 2
a) Ladda ner filen sydindiska data.sav, spara den på skrivbordet och öppna den:
GET FILE='C:\Documents and Settings\userid\Skrivbord\sydindiska data.sav'.
DATASET NAME DataSet0 WINDOW=FRONT.
DATASET ACTIVATE DataSet0.
(För att använda kommandot måste du ersätta ”userid” med ditt eget användarnamn
på datorn).
b) Kör explore:
EXAMINE
VARIABLES=tinc2
/PLOT BOXPLOT STEMLEAF
/COMPARE GROUP
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING LISTWISE
/NOTOTAL.
Explore
Case Processing Summary
Cases
Missing
N
Percent
Valid
N
Total income, for
farming best of five last
years, otherwise 2004
Percent
231
58,0%
167
1
42,0%
Total
N
Percent
398
100,0%
Statistisk verktygslåda 2 – multivariat analys
© Författarna och Studentlitteratur 2009
Descriptives
Total income, for
farming best of five last
years, otherwise 2004
Mean
95% Confidence
Interval for Mean
Lower Bound
Upper Bound
5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis
Statistic
48013,49
41708,20
Std. Error
3200,111
54318,77
41332,87
34465,00
2E+009
48637,48
1354,02
356717,1
355363,08
38659,40
3,123
13,590
,160
,319
tinc2 Total income, for farming best of five last years, otherwise
2004
Total income, for farming best of five last years, otherwise 2004 Stem-andLeaf Plot
Frequency
Stem &
30,00
0
24,00
1
37,00
2
44,00
3
21,00
4
19,00
5
15,00
6
11,00
7
5,00
8
3,00
9
5,00
10
1,00
11
16,00 Extremes
Stem width:
Each leaf:
.
.
.
.
.
.
.
.
.
.
.
.
Leaf
55666777889&
0134456789&
0011223445668899&
0001222333445677889
01224579&
012499&&
02558&&
148&
6&
&
&&
&
(>=121578)
10000,00
2 case(s)
& denotes fractional leaves.
2
Statistisk verktygslåda 2 – multivariat analys
© Författarna och Studentlitteratur 2009
400000,00
1
51
300000,00
319
175
245
200000,00
127
9
119
338 289
155
52
305 36
100000,00
0,00
Total income, for farming best of five last years, otherwise 2004
Svar på fråga 1b: Variabeln är mycket snedfördelad.
c) Gör en logaritmisk transformation av TINC2 och kör Explore å denna:
COMPUTE tinc2ln = ln(tinc2) .
EXECUTE .
EXAMINE
VARIABLES=tinc2ln
/PLOT BOXPLOT STEMLEAF
/COMPARE GROUP
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING LISTWISE
/NOTOTAL.
Explore
3
Statistisk verktygslåda 2 – multivariat analys
© Författarna och Studentlitteratur 2009
Case Processing Summary
Valid
N
tinc2ln
231
Percent
58,0%
Cases
Missing
N
Percent
167
42,0%
Total
N
398
Percent
100,0%
Descriptives
tinc2ln
Mean
95% Confidence
Interval for Mean
Statistic
10,3964
10,2783
Lower Bound
Upper Bound
Std. Error
,05994
10,5145
5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis
10,4050
10,4477
,830
,91094
7,21
12,78
5,57
1,05
-,337
,417
tinc2ln
tinc2ln Stem-and-Leaf Plot
Frequency
Stem &
2,00 Extremes
1,00
8 .
20,00
8 .
16,00
9 .
25,00
9 .
60,00
10 .
51,00
10 .
34,00
11 .
12,00
11 .
8,00
12 .
2,00 Extremes
Stem width:
Each leaf:
Leaf
(=<7,9)
&
556778899
0012234
55678899999
00011111222233333333444444444
555555666677778888899999
000000111222334
55778&
0013
(>=12,7)
1,00
2 case(s)
& denotes fractional leaves.
4
,160
,319
Statistisk verktygslåda 2 – multivariat analys
© Författarna och Studentlitteratur 2009
13,00
1
51
12,00
11,00
10,00
9,00
124
8,00
206
7,00
tinc2ln
Svar på fråga 1c: Den logaritmerade variabeln är långt mindre snedfördelad.
d) Koda om TINC2LN så att SYSMIS = -7. Definiera ännu inte det senare värdet som "missing".
RECODE
tinc2ln (SYSMIS=-7) .
EXECUTE .
e) Tillskriv värden till de hushåll som saknar information om inkomst
IF (tinc2ln=-7) tinc2lnsubst = RV.NORMAL(10.3963,0.91094) .
EXECUTE .
f)
Kör explore på den nya variabeln
EXAMINE
VARIABLES=tinc2lnsubst
/PLOT BOXPLOT STEMLEAF
/COMPARE GROUP
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
5
Statistisk verktygslåda 2 – multivariat analys
© Författarna och Studentlitteratur 2009
/MISSING LISTWISE
/NOTOTAL.
Explore
Case Processing Summary
Valid
N
tinc2lnsubst
167
Percent
42,0%
Cases
Missing
N
Percent
231
58,0%
Total
N
398
Percent
100,0%
Descriptives
tinc2lnsubst
Mean
95% Confidence
Interval for Mean
Statistic
10,2602
10,1203
Lower Bound
Upper Bound
Std. Error
,07088
10,4002
5% Trimmed Mean
Median
Variance
Std. Deviation
Minimum
Maximum
Range
Interquartile Range
Skewness
Kurtosis
10,2707
10,2314
,839
,91601
7,61
12,53
4,93
1,31
-,163
-,266
tinc2lnsubst
tinc2lnsubst Stem-and-Leaf Plot
Frequency
Stem &
1,00 Extremes
3,00
8 .
11,00
8 .
21,00
9 .
29,00
9 .
34,00
10 .
28,00
10 .
26,00
11 .
12,00
11 .
1,00
12 .
1,00
12 .
Stem width:
Each leaf:
Leaf
(=<7,6)
024
55677778999
000111222223333333444
55555666666777888999999999999
0000111111111111222222333334444444
5555666666677777777778888999
00000000011111122333333344
666677778999
0
5
1,00
1 case(s)
6
,188
,374
Statistisk verktygslåda 2 – multivariat analys
© Författarna och Studentlitteratur 2009
Svar på fråga 1f: Marginella förändringar har skett i medelvärde och standardavvikelse.
13,00
12,00
11,00
10,00
9,00
8,00
379
7,00
tinc2lnsubst
7