تحلیل داده ها در نرم افزار آماری
Download
Report
Transcript تحلیل داده ها در نرم افزار آماری
کاربرد کامپیوتر در اقتصاد کشاورزی
بر اساس کتاب
کاربرد نرم افزارهای تخصصی در اقتصاد کشاورزی
تالیف :دکتر یاوری – قوامی – امیر سرداری
انتشارات دانشگاه پیام نور
فصل سوم :تحلیل داده ها در نرم افزار آماری SPSS
فصل سوم
تحليل دادهها
در نرمافزار آماري SPSS
در اين فصل ،با نگاهي موشكافانه و با ذكر پرسشنامهاي آماري در مورد تأثير
استفاده از كود حيواني در ميزان رشد هفتگي و همچنين اثر نوع سم مصرفي در
مقدار محصول برداشت شده از نهالهاي پرتقال دو نژاد مرغوب "بم" و
"تامسون" ،كه براساس نمونهگيري تصادفي ساده از جامعه آماري مورد بررسي
جمعآوري شدهاند ،فرمانهاي ،SPSSبراي بخش زيادي از تحليلهاي آماري
مورد استفاده در رشته اقتصادكشاورزي ،ارائه ميگردد.
)1نژاد :بم تامسون (با كدهاي 0و )1
)2نوع سم مصرفي(D,C,B,A :با كدهاي 3 ،2 ،1و )4
)3ارتفاع نهال :برحسب سانتيمتر
)4رشد فعلي :ميزان رشد هفتگي نهالها بعد از مصرف كود حيواني
)5رشد قبلي :ميزان رشد هفتگي نهالها قبل از مصرف كود حيواني
)6وزن محصول برداشت شده :برحسب كيلوگرم
)7مقدار سم مصرفي :برحسب ليتر
دادههاي مربوط به تأثير استفاده از كود حيواني و سم در نهالهاي پرتقال:
نژاد
نوع سم
ارتفاع
نهال
رشد فعلي
رشد قبلي
وزن
محصول
مقدار سم
1
0
1
0
1
0
1
1
1
0
0
1
1
0
1
1
1
2
2
1
3
1
4
4
3
2
1
1
170
160
164
177
172
15 6
170
180
170
180
188
170
177
171
67
56
60
76
45
55
66
70
65
80
87
79
78
70
60
55
57
73
44
50
66
69
64
76
80
77
79
70
50
20
25
30
17
29
38
77
80
44
55
64
29
64
12
11
10
13
10
12
11
16
16
14
13
14
9
16
1
2
185
88
85
55
17
1
0
1
0
1
4
3
2
1
1
166
160
171
160
180
67
55
70
55
89
60
50
66
54
80
77
28
29
19
80
18
11
12
12
17
آمار توصيفي
در بخش آمار توصيفي نرمافزار آماري ،SPSSآمارههاي توصيفي مربوط به
متغيرها شامل:
-1معيارهاي گرايش به مركز (كميتهاي مركزي) :ميانگين ،ميانه ،مُد ،مجموع،
ماكزيمم ،مينيمم ،دامنه ،چاركها ،صدكها و ميانگين خطاي انحرافات.
-2معيارهاي پراكندگي (كميتهاي پراكندگي) :واريانس ،انحراف معيار ،چولگي
و كشيدگي.
به همراه نمودارهاي مختلف (ميلهاي ،دايرهاي و بافتنگار) بطور تكي يا گروهي
محاسبه ،ترسيم يا جدولبندي ميشود.
براي اجراي آمار توصيفي در نرمافزار آماري ،SPSS13.0كافي است از منوي
Analyzeبر روي گزينه Descriptive Statisticsكليك نمائيم .اين
زيرشاخه ،خود شامل فرمانهاي مختلفي است كه مهمترين آنها عبارتند از:
…"Frequencies
فراوانيها
مان
مك فر
به "ك
جداول
…،Frequencies
فراوا ني ،نمودار هاي مي لهاي و
بافتنگاروآماره هاي تكمتغ يره،
به نمايش در ميآيند.
بعنوان مثال ،براي محاسبه ميانگين ،ميانه ،مُد ،چاركها ،صدكهاي 15ام و 77
ام ،انحراف معيار و چولگي مربوط به متغير مقدار سم مصرفي ،جهت انجام
تحليلهاي آماري كافي است با وارد نمودن متغير PoisonAmountدر
بخش )Variable(sاز پنجره … ،Frequenciesسپس كليك بر روي
دكمه …Statisticsو ورود به پنجره ،Frequencies: Statisticsبا
انتخاب گزينه هاي مورد نظر و در پايان ،فشردن دكمه هاي Continueو
،OKاينكار را انجام دهيم
در صورتيكه بخواهيم عالوه بر مقادير آماره هاي توصيفي ،نمودار بافت نگار را
نيز براي اين متغير رسم نمايم ،كافي است از پنجره … ،Frequenciesوارد
قسمت … Chartsشده و با انتخاب گزينه ،Histogramsاين نمودار را نيز
رسم نمائيم.
خروجيهاي اين فرمان بصورت جداول و نمودار زير مي باشد.
توصيفات "…"Descriptives
برخالف فرمان … ،Frequenciesفرمان… Descriptivesتنها آمارههاي
توصيفي يك يا چند متغير را محاسبه و نمايش ميدهد و بيشتر جنبه مقايسهاي
ميان چندين متغير (از نظر مقدار كميتهاي مركزي و پراكندگي) را دارد.
بهعنوان مثال ،براي محاسبه و مقايسه كميتهاي ميانگين ،واريانس ،دامنه و
كشيدگي متغيرهاي " ميزان رشد هفتگي نهالها قبل از مصرف كود حيواني" و
" ميزان رشد هفتگي نهالها پس از مصرف كود حيواني" (داده هاي جدول -5
،)1بعد از وارد كردن متغيرهاي Pre-Growthو Now-Growthدر
بخش ) ،Variable(sبا كليك بر روي دكمه … Optionsو انتخاب
آمارههاي مورد نظر ،سپس فشردن كليدهاي Continueو ،OKمحاسبات را
انجام مي 1در پنجره ،Descriptives: Optionsنوع آمارههايي كه براي
متغيرهاي منتخب محاسبه ميشود و ترتيب قرار گرفتن آنها در خروجي ،تعيين
ميگردد.
تذكر :در پنجره ،Descriptivesگزينه Save standardized values
،as variablesامكان ساخت و ذخيرهسازي متغيرهاي استانداردشده از
متغيرهاي اصلي را فراهم ميكند.
خروجي اين فرمان به صورت جدول زيرخواهد بود.
جداول توافقي ""Crosstabs
اين فرمان ،وظيفه ساخت جداول توافقي دو يا چند بُعدي ،تحليل و آزمون استقالل
آنها و اندازهگيري معيارهاي پيوند دو يا چند متغير را بر عهده دارد .جدول
توافقي ،ماتريسي است با ابعاد ،r*cشامل rسطر و cستون كه چگونگي
توزيع مقادير يك متغير را در سطرها (ستونهاي) ماتريس براساس ردههاي
مختلف متغير ديگري كه در ستون (سطر) جدول جاي گرفته است ،نشان
ميدهد .هدف اصلي از رسم جداول توافقي ،آزمون استقالل يا وابستگي بين دو
يا چند پرسش از پرسشنامههاي آماري است .براي انجام اين آزمون ،از آماره
خي -دو پيرسون ( -پيرسون) كه از رابطه
(Orc Erc )2
χ
)~ χ 2df ( R 1) (C 1
Erc
ri 1 c 1
C
R
2
محاسبه ميشود استفاده مينمائيم .كه در آن ،مقدار مشاهده شده در سطر rام از
ستون cام جدول توافقي و ،مقدار مورد انتظار در سطر rام از ستون cام
جدول توافقي است كه بصورت
Or O c
Erc
r , c
n
محاسبه ميشود .بطوريكه در آن ،nتعداد نمونه گرفته شده از جامعه آماري مورد
مطالعه است.
براي رسم جداول توافقي بهصورت شكل زير عمل مينماييم.
بهعنوان مثال ،ميخواهيم جدول توافقي مربوط به متغيرهاي اسمي نژاد پرتقالها و
نوع سم مصرفي (دادههاي جدول )1-3را رسم نمائيم .براي اين منظور ،متغير
Ethnic Groupرا وارد بخش ) Row (sو متغير The Kind of
Poisonرا وارد قسمت )Column(sنموده و بر روي كليد
…Statisticsكليك ميكنيم.
از آنجائيكه متغيرهاي سطر و ستون اين جدول توافقي ،متغيرهاي اسمي ميباشند،
گزينههاي Chi-Squareو Etaرا انتخاب نموده و بر روي Continue
كليك مينمائيم.
در ادامه با كليك بر روي دكمه … Cellsو انتخاب گزينههاي Observedو
( Expectedبراي نمايش مقادير مشاهده شده و مورد انتظار در سلولها
(خانهها)ي جدول توافقي) و سپس فشردن كليد ،Continueبر روي دكمه
OKكليك مينمائيم.
خروجيهاي اين فرمان بصورت جداول زيرخواهد بود.
با توجه به مقادير مشاهده شده در جدول توافقي (جدول ،)5-5چون بيشتر اين
مقادير از 5كوچكتر ميباشند بايد برخي از ستونهاي اين جدول را در يكديگر
ادغام نمائيم (به كمك دستور Recodeاز منوي )Transformتا نتايج
محاسبهشده داراي ارزش بيشتري باشند .از طرف ديگر ،بدليل آنكه مقدار P-
)Sig( Valueمحاسبهشده براي آماره خي -دو پيرسون در جدول ،6-5برابر
604/0است ،بعبارت ديگر چون ،پس فرض استقالل متغيرهاي سطر و ستون
جدول توافقي (استقالل پرسشها) رد نميشود .از طرف ديگر ،با توجه به مقدار
آماره Etaدر جدول ،7-5چون بوده و نسبتاً كوچك است لذا ،تقريباً
نميتوان نوع سم مصرفي براي نهالهاي پرتقال را براساس نژادشان پيشبيني
كرد (تعيين نمود).
آزمون فرضهاي آماري
براي انجام چنين آزمون فرضهاي آماري ،كافي است از منوي Analyzeبر
روي گزينه Compare Meansكليك نمائيم.
فرمان … : One Sample T Test
آزمون مقايسه ميانگين جامعه با يك مقدار ثابت ( ) ،يكي از آزمونهايي است
كه در بررسي متغيرهاي كمي مورد استفاده قرار ميگيرد .در اين آزمون ،اگر
ميانگين جامعه را با نشان دهيم آنگاه فرضهاي آماري بصورت زير خواهند
H :
بود.
H :
0
0
0
1
بعنوان مثال ،فرض كنيد بخواهيم ميانگين ارتفاع جامعه نهالها (داده هاي جدول
)1-3را با مقدار ثابت آزمون كنيم
براي انجام اينكار در نرم افزار آماري ،SPSSاز منوي Analyzeبر روي
گزينه Compare Meansو سپس … One Sample T Testكليك
مي نمائيم .حال متغير Heightرا وارد قسمت )Test Variable(sكرده،
سپس مقدار 171را در قسمت Test Valueتايپ نموده و بر روي دكمه
OKكليك مينمائيم
خروجيهاي آن عبارت است از:
چون مقدار P-Valueدر جدول ،9-3برابر 713/0است .بهعبارت ديگر ،چون ،
پس فرض در سطح معنيداري رد نميشود .بعبارت ديگر ،ميانگين ارتفاع
جامعه نهالهاي پرتقال تقريباً برابر 171ميباشد.
فرمان … Independent Samples T Test
گاهي اوقات ،دو نمونه از دو جامعه مختلف داشته و ميخواهيم براساس نمونهها،
ميانگينهاي دو جامعه مستقل را با يكديگر مقايسه نمائيم .درچنين مواردي ،از
آزمون ميانگينهاي دو نمونه مستقل استفاده ميكنيم .كه در اينصورت،
فرضهاي آماري بصورت زير خواهند بود:
H 0 : 1 2
H 1 : 1 2
بعنوان مثال ،فرض كنيد بخواهيم ميانگين ارتفاع نهال هاي بم و تامسون را ( با
فرض نر مال بودن داده ها) با ي كديگر مقاي سه ك نيم .ب نابراين ،از م نوي
Compareو سپس
Means
Analyzeبر روي گزينه
… Independent Samples T Testكليك مينمائيم .حال متغير
Heightرا وارد قسمت ) Test Variable(sو متغير Genderرا وارد
بخش Grouping Variableنموده و با زدن دكمه ِ Define Groups
… و اختصاص اعداد " 0بم" و " 1تامسون" بترتيب براي " "Group 1و "2
"Groupو سپس كل يك بر روي دك مه هاي Continueو ،OKا ين
آزمون را انجام ميدهيم
كه نمونه خروجيهاي اين فرمان عبارتند از :
با توجه به اينكه در جدول ،11-3مقدار آماره Fبراي آزمون برابري واريانسهاي
دو جامعه در سطح معنيداري برابر با 508/6بوده و مقدار Sigمتناظر با آن
02/0است بعبارت ديگر ،لذا فرض صفر (فرض برابري واريانسهاي دو
جامعه) رد شده و ميبايست خط دوم نتيجه آزمون نابرابري واريانسهاي دو
جامعه را درنظر بگيريم.
حال با توجه به مقدار آماره آزمون و مقدار Sigمتناظر چون پس فرض برابري
ميانگينها نيز رد نميشود.
تذكر :در صورتيكه فرض برابري واريانسها رد نميشد ،ميبايست نتايج مربوط
به خط اول را درنظر ميگرفتيم.
فرمان … Paired Samples T Test
براي مقايسه ميانگينهاي مشاهدات زوج شده (مشاهداتي كه از نمونههاي مستقل
بدست نيامده اند) ،مانند نمرات يك آزمون درسي قبل و بعد از يك آموزش
خاص ،از اين فرمان استفاده مينمائيم .اينگونه مشاهدات به يكديگر وابسته بوده
و مالك مقايسه آنها تفاوتهاي بين زوج مقادير مشاهدات است.
بعنوان مثال ،فرض كنيد بخواهيم رشد هفتگي نهالهاي پرتقال (دادههاي جدول -3
)1را قبل و بعد از مصرف كود حيواني ،با يكديگر مقايسه و اثر كود حيواني
را بر روي آنها بررسي كنيم يعني فرض بيتأثير بودن كود ( ) را آزمون
نمائيم ،كافي است از منوي Analyzeبر روي گزينه Compare Means
و سپس … Paired Samples T Testكليك كنيم .حال در پنجره
… ،Paired Samples T Testمتغيرهاي Pre-Growthو Now-
Growthرا وارد قسمت Paired Variablesنموده و بر روي دكمه
OKكليك مينمائيم
خروجيهاي اين فرمان عبارتند از:
با توجه به مقدار Sigدر جدول ،14-3چون در سطح معني داري ،مقدار است
پس فرض صفر (بي تأثير بودن مصرف كود ،) :رد مي شود .بعبارت ديگر،
مصرف كود حيواني ،در افزايش رشد هفتگي جامعه نهال پرتقال تأثير داشته
است.
آناليز واريانس يكطرفه "”One Way ANOVA
اصول كلي آناليز واريانس ،بوسيله رونالد فيشر ،بنيانگذاري و سپس جزئيات آن
توسط ساير آماردانان تكميل گرديد .بطور كلي ،آناليز واريانس عبارتست از
انجام يك سري عمليات جبري كه بهوسيله آن ميتوان مقدار كل تغييرات يا
اختالفات موجود در يك آزمايش را به قسمتها يا اجزاي مختلف تقسيم كرد.
بعضي از اين اجزا ،بخاطر عواملي است كه محقق عمداً در آزمايش قرار داده
است تا اثر آنها را بر روي صفات مورد مطالعه تعيين كند و برخي ديگر ،زائيده
عوامل غيرقابل كنترل ميباشند.
براي مقايسه ميانگينهاي مربوط به دو يا چند جامعه مستقل يعني آزمون:
H 0 : 1 2 ... k
; i, j
H 1 : i j
از روش آناليز واريانس يكطرفه ،استفاده مينمائيم.
بعنوان مثال ،اگر بخواهيم ،فرضيه يكسان بودن وزن محصول برداشت شده پس از
سمپاشي با انواع سمهاي مورد استفاده را بررسي كنيم ،از منوي Analyzeبر
روي گزينه Compare Meansو سپس One Way ANOVAكليك
(Weightمتغير وابسته) را وارد قسمت
مينمائيم .حال متغير
Dependent Listو متغير (The Kind of Poisonمتغير مستقل) را
وارد بخش (Factorعامل) نموده و بر روي دكمه OKكليك ميكنيم
خروجي اين فرمان بصورت جدول زير خواهد بود.
با توجه به مقدار Sigدر جدول ،15-3چون در سطح معنيداري ،مقدار است
پس فرض صفر ،رد نميشود .بعبارت ديگر ،گروه خوني ،در قد افراد نمونه و
به تبع آن افراد جامعه مورد مطالعه تأثيري ندارد يعني ميانگينها در سطح
داراي اختالف معنيداري نميباشند.
در صورتيكه ميانگينها داراي اختالف معنيداري بودند يعني فرض ،رد ميشد،
از آزمونهاي ( LSDآزمون كمترين اختالف معنيدار) ،بونفروني ،شفه،
توكي ،دانكن و غيره (در سطح معنيداري ) ،براي فهميدن اين موضوع كه
كداميك از ميانگينها با يكديگر برابر نيستند ،استفاده ميكنيم .كه اينكار را
ميتوان با انتخاب گزينه مورد نظر در بخش ( Post Hocشكل )24-3و
فشردن كليد ،Continueانجام داد.
تذكر :از آنجاييكه خطاي نوع دوم در آزمون دانكن از بقيه آزمونها كمتر است
پس پرتوانترين آزمون در ميان ساير آزمونهاي موجود ميباشد .به همين
دليل ،در اكثر موارد آماردانان از آن استفاده مينمايند.
تحليل همبستگي ""Correlations
همبستگي بين دو متغير ،شدت و جهت رابطه خطي ميان آنها را نشان مي دهد.
مقدار اين كميت ،چگونگي برازش معادله اي خطي يا غيرخطي كه ارتباط بين
متغيرها را توجيه مي كند ،بيان مي نمايد (اگر معادله ثابتي بين متغيرها برقرار
باشد ،همبستگي كامل خواهد بود) .ضريب همبستگي ( )rهمواره بين " "-1و
" "1خواهد بود .بعبارت ديگر:
از آنجايي كه رسم نمودار پراكنش به تنهايي نمي تواند نوع رابطه بين دو متغير را
تعيين كند ،معياري عددي براي محاسبه قدرت و جهت رابطه خطي بين آنها،
مورد نياز است .معيار عددي اين پيوند ،زمانيكه رابطه بين دو متغير خطي فرض
شود ،ضريب همبستگي نمونهاي يا ضريب همبستگي پيرسون نام دارد كه از
رابطه 3-3محاسبه ميشود.
) X )(Yi Y
n
2
) (Y Y
i
i 1
n
i
(X
X) .
i 1
n
2
i
(X
) Cov ( X , Y
S X .SY
rXY
i 1
در صورتيكه رابطه متغيرها در نمودار پراكنش به شكل منحني ديده شود ،ضريب
همبستگي پيرسون معيار مناسبي نخواهد بود .از طرف ديگر ،ضريب همبستگي
پيرسون ،زماني معتبر است كه دادهها كمي باشد .ضريب همبستگي ديگري كه
ميتوان براي دادههاي كمي محاسبه نمود ،ضريب همبستگي تاو-كندال است.
اين ضريب همبستگي ،اندازه اي است ناپارامتري از شدت پيوند متغيرها و
به كمك رابطه
) sign(S S ) . sign( R R
n
j
i
j
)n(n 1
2
i
i j
rtau
محاسبه مي گردد كه در آن () signنماد تابع عالمت )Si-Sj( ،اختالف
رتبه iامين و jامين مقدار متغير Yو ( )Ri-Rjاختالف رتبه iامين و j
امين مقدار متغير Xميباشند.
حال اگر دادهها از نوع فاصلهاي باشند ،از ضريب همبستگي ديگري بنام
ضريب همبستگي اسپيرمن كه براساس رتبه دادهها و با همان نمادهاي
rtauتعريف شده است ،استفاده مينمائيم .اين ضريب همبستگي از رابطه
زير قابل محاسبه است .
n 1
n 1
)(Si
)
2
2
)n(n2 1
12
( Ri
n
i 1
rsp
براي محاسبه ضرايب همبستگي در نرمافزار آماري ، SPSS 13.0از منوي
Analyzeبر روي گزينه Correlateو سپس … Bivariateكليك
مينمائيم
بهعنوان مثال ،اگر بخواهيم ضريب همبستگي پيرسون ميان متغيرهاي مقدار سم
مصرفي و وزن محصول برداشت شده (دادههاي جدول )1-3را محاسبه نمائيم
(با توجه به پراكندگي نقاط بصورت خط راست در نمودار پراكنش (نمودار -3
،))2با وارد نمودن متغيرهاي ( Weightمتغير وابسته) و Amount of
( Poisonمتغير مستقل) در جعبه Variablesاز پنجره Bivariate
Correlationsو سپس انتخاب گزينه Pearsonاز قسمت
،Correlation Coefficientsبر روي دكمه OKكليك مينمائيم .
تحليل رگرسيوني ": ”Regression
تحليل رگرسيوني ،يكي از پرمصرفترين روشهاي آماري است كه براي تجزيه
و تحليل دادهها مورد استفاده قرار ميگيرد ،زيرا روابط ميان متغيرهاي پيوسته را
بطور ساده و بامفهوم ،بيان مينمايد.
1اگر برخي از متغيرهاي مستقل از نوع كيفي باشند ،نياز به تحليل آناليز
كوواريانس دارد و با اين مباحث نميتوان آنها را تحليل كرد.
بطور كلي؛ رگرسيون ،مجموعهاي از روشها و تكنيكهاست كه براي كمك به
درك رابطه بين گروهي از متغيرها ،مورد استفاده قرار ميگيرد .در بسياري از
موارد ،يك معادله خط راست ميتواند براي نشان دادن وابستگي يك متغير به
ديگري مورد استفاده قرار گيرد.
در حالت كلي ،معادله يك مدل رگرسيوني خطي عبارت است از
Y 0 1 X 1 ... k X k
كه در آن ،مقدار ثابت رگرسيوني؛ ،متغير مستقل iام و ،ضريب رگرسيوني
براي متغير مستقل iام ميباشند.
در اين بخش نشان ميدهيم كه چگونه ميتوان معادله چنين خطي را با استفاده از
نرمافزار آماري SPSSبدست آورد.
ميتوانيم يك مدل رگرسيوني كه
نشان دهنده رابطهاي خطي ميان
آنها ميباشد ،برازش دهيم كه به
كمك نرم افزار آماري SPSS
،اين كار را ميتوان براحتي انجام
داد .پس از منوي Analyze
گزينه
روي
بر
Regressionو سپس
… Linearكليك مينمائيم:
با ا جراي ا ين فر مان جع به گفت گوي ز ير باز مي شود .حال متغ ير واب سته را وارد
خش
ستقل را وارد ب
هاي م
سمت Dependentو متغير
ق
)Independent(sمينمائيم.
در اين پنجره و در بخش Methodروشهاي مختلفي براي ورود و يا خروج
متغيرها از مدل رگرسيوني وجود دارد كه بترتيب عبارتند از:
.1
.2
.3
.4
.5
روش ( Enterورود)
روش ( Stepwiseگام به گام)
روش ( Removeخروج)
روش ( Backwardپسرو)
روش ( Forwardپيشرو)
پایان