تحلیل داده ها در نرم افزار آماری

Transcript تحلیل داده ها در نرم افزار آماری

‫کاربرد کامپیوتر در اقتصاد کشاورزی‬
‫بر اساس کتاب‬
‫کاربرد نرم افزارهای تخصصی در اقتصاد کشاورزی‬
‫تالیف ‪ :‬دکتر یاوری – قوامی – امیر سرداری‬
‫انتشارات دانشگاه پیام نور‬
‫‪‬فصل سوم ‪ :‬تحلیل داده ها در نرم افزار آماری ‪SPSS‬‬
‫فصل سوم‬
‫تحليل دادهها‬
‫در نرمافزار آماري ‪SPSS‬‬
‫در اين فصل‪ ،‬با نگاهي موشكافانه و با ذكر پرسشنامهاي آماري در مورد تأثير‬
‫استفاده از كود حيواني در ميزان رشد هفتگي و همچنين اثر نوع سم مصرفي در‬
‫مقدار محصول برداشت شده از نهالهاي پرتقال دو نژاد مرغوب "بم" و‬
‫"تامسون"‪ ،‬كه براساس نمونهگيري تصادفي ساده از جامعه آماري مورد بررسي‬
‫جمعآوري شدهاند‪ ،‬فرمانهاي ‪ ،SPSS‬براي بخش زيادي از تحليلهاي آماري‬
‫مورد استفاده در رشته اقتصادكشاورزي‪ ،‬ارائه ميگردد‪.‬‬
‫‪ )1‬نژاد‪ :‬بم تامسون (با كدهاي ‪ 0‬و ‪)1‬‬
‫‪ )2‬نوع سم مصرفي‪(D,C,B,A :‬با كدهاي ‪ 3 ،2 ،1‬و ‪)4‬‬
‫‪ )3‬ارتفاع نهال‪ :‬برحسب سانتيمتر‬
‫‪ )4‬رشد فعلي‪ :‬ميزان رشد هفتگي نهالها بعد از مصرف كود حيواني‬
‫‪ )5‬رشد قبلي‪ :‬ميزان رشد هفتگي نهالها قبل از مصرف كود حيواني‬
‫‪ )6‬وزن محصول برداشت شده‪ :‬برحسب كيلوگرم‬
‫‪ )7‬مقدار سم مصرفي‪ :‬برحسب ليتر‬
‫دادههاي مربوط به تأثير استفاده از كود حيواني و سم در نهالهاي پرتقال‪:‬‬
‫نژاد‬
‫نوع سم‬
‫ارتفاع‬
‫نهال‬
‫رشد فعلي‬
‫رشد قبلي‬
‫وزن‬
‫محصول‬
‫مقدار سم‬
‫‪1‬‬
‫‪0‬‬
‫‪1‬‬
‫‪0‬‬
‫‪1‬‬
‫‪0‬‬
‫‪1‬‬
‫‪1‬‬
‫‪1‬‬
‫‪0‬‬
‫‪0‬‬
‫‪1‬‬
‫‪1‬‬
‫‪0‬‬
‫‪1‬‬
‫‪1‬‬
‫‪1‬‬
‫‪2‬‬
‫‪2‬‬
‫‪1‬‬
‫‪3‬‬
‫‪1‬‬
‫‪4‬‬
‫‪4‬‬
‫‪3‬‬
‫‪2‬‬
‫‪1‬‬
‫‪1‬‬
‫‪170‬‬
‫‪160‬‬
‫‪164‬‬
‫‪177‬‬
‫‪172‬‬
‫‪15 6‬‬
‫‪170‬‬
‫‪180‬‬
‫‪170‬‬
‫‪180‬‬
‫‪188‬‬
‫‪170‬‬
‫‪177‬‬
‫‪171‬‬
‫‪67‬‬
‫‪56‬‬
‫‪60‬‬
‫‪76‬‬
‫‪45‬‬
‫‪55‬‬
‫‪66‬‬
‫‪70‬‬
‫‪65‬‬
‫‪80‬‬
‫‪87‬‬
‫‪79‬‬
‫‪78‬‬
‫‪70‬‬
‫‪60‬‬
‫‪55‬‬
‫‪57‬‬
‫‪73‬‬
‫‪44‬‬
‫‪50‬‬
‫‪66‬‬
‫‪69‬‬
‫‪64‬‬
‫‪76‬‬
‫‪80‬‬
‫‪77‬‬
‫‪79‬‬
‫‪70‬‬
‫‪50‬‬
‫‪20‬‬
‫‪25‬‬
‫‪30‬‬
‫‪17‬‬
‫‪29‬‬
‫‪38‬‬
‫‪77‬‬
‫‪80‬‬
‫‪44‬‬
‫‪55‬‬
‫‪64‬‬
‫‪29‬‬
‫‪64‬‬
‫‪12‬‬
‫‪11‬‬
‫‪10‬‬
‫‪13‬‬
‫‪10‬‬
‫‪12‬‬
‫‪11‬‬
‫‪16‬‬
‫‪16‬‬
‫‪14‬‬
‫‪13‬‬
‫‪14‬‬
‫‪9‬‬
‫‪16‬‬
‫‪1‬‬
‫‪2‬‬
‫‪185‬‬
‫‪88‬‬
‫‪85‬‬
‫‪55‬‬
‫‪17‬‬
‫‪1‬‬
‫‪0‬‬
‫‪1‬‬
‫‪0‬‬
‫‪1‬‬
‫‪4‬‬
‫‪3‬‬
‫‪2‬‬
‫‪1‬‬
‫‪1‬‬
‫‪166‬‬
‫‪160‬‬
‫‪171‬‬
‫‪160‬‬
‫‪180‬‬
‫‪67‬‬
‫‪55‬‬
‫‪70‬‬
‫‪55‬‬
‫‪89‬‬
‫‪60‬‬
‫‪50‬‬
‫‪66‬‬
‫‪54‬‬
‫‪80‬‬
‫‪77‬‬
‫‪28‬‬
‫‪29‬‬
‫‪19‬‬
‫‪80‬‬
‫‪18‬‬
‫‪11‬‬
‫‪12‬‬
‫‪12‬‬
‫‪17‬‬
‫آمار توصيفي‬
‫در بخش آمار توصيفي نرمافزار آماري ‪ ،SPSS‬آمارههاي توصيفي مربوط به‬
‫متغيرها شامل‪:‬‬
‫‪ -1‬معيارهاي گرايش به مركز (كميتهاي مركزي)‪ :‬ميانگين‪ ،‬ميانه‪ ،‬مُد‪ ،‬مجموع‪،‬‬
‫ماكزيمم‪ ،‬مينيمم‪ ،‬دامنه‪ ،‬چاركها‪ ،‬صدكها و ميانگين خطاي انحرافات‪.‬‬
‫‪ -2‬معيارهاي پراكندگي (كميتهاي پراكندگي)‪ :‬واريانس‪ ،‬انحراف معيار‪ ،‬چولگي‬
‫و كشيدگي‪.‬‬
‫به همراه نمودارهاي مختلف (ميلهاي‪ ،‬دايرهاي و بافتنگار) بطور تكي يا گروهي‬
‫محاسبه‪ ،‬ترسيم يا جدولبندي ميشود‪.‬‬
‫براي اجراي آمار توصيفي در نرمافزار آماري ‪ ،SPSS13.0‬كافي است از منوي‬
‫‪Analyze‬بر روي گزينه ‪Descriptive Statistics‬كليك نمائيم‪ .‬اين‬
‫زيرشاخه‪ ،‬خود شامل فرمانهاي مختلفي است كه مهمترين آنها عبارتند از‪:‬‬
‫…‪"Frequencies‬‬
‫فراوانيها‬
‫مان‬
‫مك فر‬
‫به "ك‬
‫جداول‬
‫…‪،Frequencies‬‬
‫فراوا ني‪ ،‬نمودار هاي مي لهاي و‬
‫بافتنگاروآماره هاي تكمتغ يره‪،‬‬
‫به نمايش در ميآيند‪.‬‬
‫بعنوان مثال‪ ،‬براي محاسبه ميانگين‪ ،‬ميانه‪ ،‬مُد‪ ،‬چاركها‪ ،‬صدكهاي ‪ 15‬ام و ‪77‬‬
‫ام‪ ،‬انحراف معيار و چولگي مربوط به متغير مقدار سم مصرفي‪ ،‬جهت انجام‬
‫تحليلهاي آماري كافي است با وارد نمودن متغير ‪PoisonAmount‬در‬
‫بخش )‪Variable(s‬از پنجره …‪ ،Frequencies‬سپس كليك بر روي‬
‫دكمه …‪Statistics‬و ورود به پنجره ‪ ،Frequencies: Statistics‬با‬
‫انتخاب گزينه هاي مورد نظر و در پايان‪ ،‬فشردن دكمه هاي ‪ Continue‬و‬
‫‪ ،OK‬اينكار را انجام دهيم‬
‫در صورتيكه بخواهيم عالوه بر مقادير آماره هاي توصيفي‪ ،‬نمودار بافت نگار را‬
‫نيز براي اين متغير رسم نمايم‪ ،‬كافي است از پنجره …‪ ،Frequencies‬وارد‬
‫قسمت …‪ Charts‬شده و با انتخاب گزينه ‪ ،Histograms‬اين نمودار را نيز‬
‫رسم نمائيم‪.‬‬
‫خروجيهاي اين فرمان بصورت جداول و نمودار زير مي باشد‪.‬‬
‫توصيفات "…‪"Descriptives‬‬
‫برخالف فرمان …‪ ،Frequencies‬فرمان…‪ Descriptives‬تنها آمارههاي‬
‫توصيفي يك يا چند متغير را محاسبه و نمايش ميدهد و بيشتر جنبه مقايسهاي‬
‫ميان چندين متغير (از نظر مقدار كميتهاي مركزي و پراكندگي) را دارد‪.‬‬
‫بهعنوان مثال‪ ،‬براي محاسبه و مقايسه كميتهاي ميانگين‪ ،‬واريانس‪ ،‬دامنه و‬
‫كشيدگي متغيرهاي " ميزان رشد هفتگي نهالها قبل از مصرف كود حيواني" و‬
‫" ميزان رشد هفتگي نهالها پس از مصرف كود حيواني" (داده هاي جدول ‪-5‬‬
‫‪ ،)1‬بعد از وارد كردن متغيرهاي ‪ Pre-Growth‬و ‪ Now-Growth‬در‬
‫بخش )‪ ،Variable(s‬با كليك بر روي دكمه …‪ Options‬و انتخاب‬
‫آمارههاي مورد نظر‪ ،‬سپس فشردن كليدهاي ‪ Continue‬و ‪ ،OK‬محاسبات را‬
‫انجام مي ‪ 1‬در پنجره ‪ ،Descriptives: Options‬نوع آمارههايي كه براي‬
‫متغيرهاي منتخب محاسبه ميشود و ترتيب قرار گرفتن آنها در خروجي‪ ،‬تعيين‬
‫ميگردد‪.‬‬
‫تذكر‪ :‬در پنجره ‪ ،Descriptives‬گزينه ‪Save standardized values‬‬
‫‪ ،as variables‬امكان ساخت و ذخيرهسازي متغيرهاي استانداردشده از‬
‫متغيرهاي اصلي را فراهم ميكند‪.‬‬
‫خروجي اين فرمان به صورت جدول زيرخواهد بود‪.‬‬
‫جداول توافقي "‪"Crosstabs‬‬
‫اين فرمان‪ ،‬وظيفه ساخت جداول توافقي دو يا چند بُعدي‪ ،‬تحليل و آزمون استقالل‬
‫آنها و اندازهگيري معيارهاي پيوند دو يا چند متغير را بر عهده دارد‪ .‬جدول‬
‫توافقي‪ ،‬ماتريسي است با ابعاد ‪ ،r*c‬شامل ‪ r‬سطر و ‪ c‬ستون كه چگونگي‬
‫توزيع مقادير يك متغير را در سطرها (ستونهاي) ماتريس براساس ردههاي‬
‫مختلف متغير ديگري كه در ستون (سطر) جدول جاي گرفته است‪ ،‬نشان‬
‫ميدهد‪ .‬هدف اصلي از رسم جداول توافقي‪ ،‬آزمون استقالل يا وابستگي بين دو‬
‫يا چند پرسش از پرسشنامههاي آماري است‪ .‬براي انجام اين آزمون‪ ،‬از آماره‬
‫خي‪ -‬دو پيرسون ( ‪ -‬پيرسون) كه از رابطه‬
‫‪(Orc  Erc )2‬‬
‫‪χ  ‬‬
‫)‪~ χ 2df  ( R 1) (C 1‬‬
‫‪Erc‬‬
‫‪ri 1 c 1‬‬
‫‪C‬‬
‫‪R‬‬
‫‪2‬‬
‫محاسبه ميشود استفاده مينمائيم‪ .‬كه در آن ‪ ،‬مقدار مشاهده شده در سطر ‪ r‬ام از‬
‫ستون ‪ c‬ام جدول توافقي و ‪ ،‬مقدار مورد انتظار در سطر ‪ r‬ام از ستون ‪ c‬ام‬
‫جدول توافقي است كه بصورت‬
‫‪Or   O c‬‬
‫‪Erc ‬‬
‫‪r , c‬‬
‫‪n‬‬
‫محاسبه ميشود‪ .‬بطوريكه در آن ‪ ،n‬تعداد نمونه گرفته شده از جامعه آماري مورد‬
‫مطالعه است‪.‬‬
‫براي رسم جداول توافقي بهصورت شكل زير عمل مينماييم‪.‬‬
‫بهعنوان مثال‪ ،‬ميخواهيم جدول توافقي مربوط به متغيرهاي اسمي نژاد پرتقالها و‬
‫نوع سم مصرفي (دادههاي جدول ‪ )1-3‬را رسم نمائيم‪ .‬براي اين منظور‪ ،‬متغير‬
‫‪ Ethnic Group‬را وارد بخش )‪ Row (s‬و متغير ‪The Kind of‬‬
‫‪Poison‬را وارد قسمت )‪Column(s‬نموده و بر روي كليد‬
‫…‪Statistics‬كليك ميكنيم‪.‬‬
‫از آنجائيكه متغيرهاي سطر و ستون اين جدول توافقي‪ ،‬متغيرهاي اسمي ميباشند‪،‬‬
‫گزينههاي ‪ Chi-Square‬و ‪ Eta‬را انتخاب نموده و بر روي ‪Continue‬‬
‫كليك مينمائيم‪.‬‬
‫در ادامه با كليك بر روي دكمه …‪ Cells‬و انتخاب گزينههاي ‪ Observed‬و‬
‫‪( Expected‬براي نمايش مقادير مشاهده شده و مورد انتظار در سلولها‬
‫(خانهها)ي جدول توافقي) و سپس فشردن كليد ‪ ،Continue‬بر روي دكمه‬
‫‪ OK‬كليك مينمائيم‪.‬‬
‫خروجيهاي اين فرمان بصورت جداول زيرخواهد بود‪.‬‬
‫با توجه به مقادير مشاهده شده در جدول توافقي (جدول ‪ ،)5-5‬چون بيشتر اين‬
‫مقادير از ‪ 5‬كوچكتر ميباشند بايد برخي از ستونهاي اين جدول را در يكديگر‬
‫ادغام نمائيم (به كمك دستور ‪ Recode‬از منوي ‪ )Transform‬تا نتايج‬
‫محاسبهشده داراي ارزش بيشتري باشند‪ .‬از طرف ديگر‪ ،‬بدليل آنكه مقدار ‪P-‬‬
‫‪ )Sig( Value‬محاسبهشده براي آماره خي‪ -‬دو پيرسون در جدول ‪ ،6-5‬برابر‬
‫‪ 604/0‬است‪ ،‬بعبارت ديگر چون ‪ ،‬پس فرض استقالل متغيرهاي سطر و ستون‬
‫جدول توافقي (استقالل پرسشها) رد نميشود‪ .‬از طرف ديگر‪ ،‬با توجه به مقدار‬
‫آماره ‪ Eta‬در جدول ‪ ،7-5‬چون بوده و نسبتاً كوچك است لذا‪ ،‬تقريباً‬
‫نميتوان نوع سم مصرفي براي نهالهاي پرتقال را براساس نژادشان پيشبيني‬
‫كرد (تعيين نمود)‪.‬‬
‫آزمون فرضهاي آماري‬
‫براي انجام چنين آزمون فرضهاي آماري‪ ،‬كافي است از منوي ‪ Analyze‬بر‬
‫روي گزينه ‪ Compare Means‬كليك نمائيم‪.‬‬
‫فرمان … ‪: One Sample T Test‬‬
‫آزمون مقايسه ميانگين جامعه با يك مقدار ثابت ( )‪ ،‬يكي از آزمونهايي است‬
‫كه در بررسي متغيرهاي كمي مورد استفاده قرار ميگيرد‪ .‬در اين آزمون‪ ،‬اگر‬
‫ميانگين جامعه را با نشان دهيم آنگاه فرضهاي آماري بصورت زير خواهند‬
‫‪H :   ‬‬
‫‪‬‬
‫بود‪.‬‬
‫‪H :   ‬‬
‫‪0‬‬
‫‪0‬‬
‫‪0‬‬
‫‪1‬‬
‫بعنوان مثال‪ ،‬فرض كنيد بخواهيم ميانگين ارتفاع جامعه نهالها (داده هاي جدول‬
‫‪ )1-3‬را با مقدار ثابت آزمون كنيم‬
‫براي انجام اينكار در نرم افزار آماري ‪ ،SPSS‬از منوي ‪ Analyze‬بر روي‬
‫گزينه ‪ Compare Means‬و سپس …‪ One Sample T Test‬كليك‬
‫مي نمائيم‪ .‬حال متغير ‪Height‬را وارد قسمت )‪Test Variable(s‬كرده‪،‬‬
‫سپس مقدار ‪ 171‬را در قسمت ‪ Test Value‬تايپ نموده و بر روي دكمه‬
‫‪ OK‬كليك مينمائيم‬
‫خروجيهاي آن عبارت است از‪:‬‬
‫چون مقدار ‪ P-Value‬در جدول ‪ ،9-3‬برابر ‪ 713/0‬است‪ .‬بهعبارت ديگر‪ ،‬چون ‪،‬‬
‫پس فرض در سطح معنيداري رد نميشود‪ .‬بعبارت ديگر‪ ،‬ميانگين ارتفاع‬
‫جامعه نهالهاي پرتقال تقريباً برابر ‪ 171‬ميباشد‪.‬‬
‫فرمان … ‪Independent Samples T Test‬‬
‫گاهي اوقات‪ ،‬دو نمونه از دو جامعه مختلف داشته و ميخواهيم براساس نمونهها‪،‬‬
‫ميانگينهاي دو جامعه مستقل را با يكديگر مقايسه نمائيم‪ .‬درچنين مواردي‪ ،‬از‬
‫آزمون ميانگينهاي دو نمونه مستقل استفاده ميكنيم‪ .‬كه در اينصورت‪،‬‬
‫فرضهاي آماري بصورت زير خواهند بود‪:‬‬
‫‪ H 0 : 1   2‬‬
‫‪‬‬
‫‪ H 1 : 1   2‬‬
‫بعنوان مثال‪ ،‬فرض كنيد بخواهيم ميانگين ارتفاع نهال هاي بم و تامسون را ( با‬
‫فرض نر مال بودن داده ها) با ي كديگر مقاي سه ك نيم‪ .‬ب نابراين‪ ،‬از م نوي‬
‫‪ Compare‬و سپس‬
‫‪Means‬‬
‫‪ Analyze‬بر روي گزينه‬
‫…‪ Independent Samples T Test‬كليك مينمائيم‪ .‬حال متغير‬
‫‪ Height‬را وارد قسمت )‪ Test Variable(s‬و متغير ‪ Gender‬را وارد‬
‫بخش ‪ Grouping Variable‬نموده و با زدن دكمه ِ ‪Define Groups‬‬
‫… و اختصاص اعداد ‪ " 0‬بم" و ‪" 1‬تامسون" بترتيب براي "‪ "Group 1‬و "‪2‬‬
‫‪ "Group‬و سپس كل يك بر روي دك مه هاي ‪ Continue‬و ‪ ،OK‬ا ين‬
‫آزمون را انجام ميدهيم‬
‫كه نمونه خروجيهاي اين فرمان عبارتند از ‪:‬‬
‫با توجه به اينكه در جدول ‪ ،11-3‬مقدار آماره ‪ F‬براي آزمون برابري واريانسهاي‬
‫دو جامعه در سطح معنيداري برابر با ‪ 508/6‬بوده و مقدار ‪ Sig‬متناظر با آن‬
‫‪ 02/0‬است بعبارت ديگر ‪ ،‬لذا فرض صفر (فرض برابري واريانسهاي دو‬
‫جامعه) رد شده و ميبايست خط دوم نتيجه آزمون نابرابري واريانسهاي دو‬
‫جامعه را درنظر بگيريم‪.‬‬
‫حال با توجه به مقدار آماره آزمون و مقدار ‪ Sig‬متناظر چون پس فرض برابري‬
‫ميانگينها نيز رد نميشود‪.‬‬
‫تذكر‪ :‬در صورتيكه فرض برابري واريانسها رد نميشد‪ ،‬ميبايست نتايج مربوط‬
‫به خط اول را درنظر ميگرفتيم‪.‬‬
‫فرمان … ‪Paired Samples T Test‬‬
‫براي مقايسه ميانگينهاي مشاهدات زوج شده (مشاهداتي كه از نمونههاي مستقل‬
‫بدست نيامده اند)‪ ،‬مانند نمرات يك آزمون درسي قبل و بعد از يك آموزش‬
‫خاص‪ ،‬از اين فرمان استفاده مينمائيم‪ .‬اينگونه مشاهدات به يكديگر وابسته بوده‬
‫و مالك مقايسه آنها تفاوتهاي بين زوج مقادير مشاهدات است‪.‬‬
‫بعنوان مثال‪ ،‬فرض كنيد بخواهيم رشد هفتگي نهالهاي پرتقال (دادههاي جدول ‪-3‬‬
‫‪ )1‬را قبل و بعد از مصرف كود حيواني ‪ ،‬با يكديگر مقايسه و اثر كود حيواني‬
‫را بر روي آنها بررسي كنيم يعني فرض بيتأثير بودن كود ( ) را آزمون‬
‫نمائيم‪ ،‬كافي است از منوي ‪Analyze‬بر روي گزينه ‪Compare Means‬‬
‫و سپس …‪ Paired Samples T Test‬كليك كنيم‪ .‬حال در پنجره‬
‫…‪ ،Paired Samples T Test‬متغيرهاي ‪ Pre-Growth‬و ‪Now-‬‬
‫‪ Growth‬را وارد قسمت ‪ Paired Variables‬نموده و بر روي دكمه‬
‫‪ OK‬كليك مينمائيم‬
‫خروجيهاي اين فرمان عبارتند از‪:‬‬
‫با توجه به مقدار ‪ Sig‬در جدول ‪ ،14-3‬چون در سطح معني داري ‪ ،‬مقدار است‬
‫پس فرض صفر (بي تأثير بودن مصرف كود ‪ ،) :‬رد مي شود‪ .‬بعبارت ديگر‪،‬‬
‫مصرف كود حيواني‪ ،‬در افزايش رشد هفتگي جامعه نهال پرتقال تأثير داشته‬
‫است‪.‬‬
‫آناليز واريانس يكطرفه "‪”One Way ANOVA‬‬
‫اصول كلي آناليز واريانس‪ ،‬بوسيله رونالد فيشر‪ ،‬بنيانگذاري و سپس جزئيات آن‬
‫توسط ساير آماردانان تكميل گرديد‪ .‬بطور كلي‪ ،‬آناليز واريانس عبارتست از‬
‫انجام يك سري عمليات جبري كه بهوسيله آن ميتوان مقدار كل تغييرات يا‬
‫اختالفات موجود در يك آزمايش را به قسمتها يا اجزاي مختلف تقسيم كرد‪.‬‬
‫بعضي از اين اجزا‪ ،‬بخاطر عواملي است كه محقق عمداً در آزمايش قرار داده‬
‫است تا اثر آنها را بر روي صفات مورد مطالعه تعيين كند و برخي ديگر‪ ،‬زائيده‬
‫عوامل غيرقابل كنترل ميباشند‪.‬‬
‫براي مقايسه ميانگينهاي مربوط به دو يا چند جامعه مستقل يعني آزمون‪:‬‬
‫‪ H 0 : 1   2  ...   k‬‬
‫‪‬‬
‫‪; i, j‬‬
‫‪H 1 :  i   j‬‬
‫از روش آناليز واريانس يكطرفه‪ ،‬استفاده مينمائيم‪.‬‬
‫بعنوان مثال‪ ،‬اگر بخواهيم‪ ،‬فرضيه يكسان بودن وزن محصول برداشت شده پس از‬
‫سمپاشي با انواع سمهاي مورد استفاده را بررسي كنيم‪ ،‬از منوي ‪ Analyze‬بر‬
‫روي گزينه ‪ Compare Means‬و سپس ‪ One Way ANOVA‬كليك‬
‫‪(Weight‬متغير وابسته) را وارد قسمت‬
‫مينمائيم‪ .‬حال متغير‬
‫‪ Dependent List‬و متغير ‪(The Kind of Poison‬متغير مستقل) را‬
‫وارد بخش ‪(Factor‬عامل) نموده و بر روي دكمه ‪ OK‬كليك ميكنيم‬
‫خروجي اين فرمان بصورت جدول زير خواهد بود‪.‬‬
‫با توجه به مقدار ‪ Sig‬در جدول ‪ ،15-3‬چون در سطح معنيداري ‪ ،‬مقدار است‬
‫پس فرض صفر ‪ ،‬رد نميشود‪ .‬بعبارت ديگر‪ ،‬گروه خوني‪ ،‬در قد افراد نمونه و‬
‫به تبع آن افراد جامعه مورد مطالعه تأثيري ندارد يعني ميانگينها در سطح‬
‫داراي اختالف معنيداري نميباشند‪.‬‬
‫در صورتيكه ميانگينها داراي اختالف معنيداري بودند يعني فرض ‪ ،‬رد ميشد‪،‬‬
‫از آزمونهاي ‪( LSD‬آزمون كمترين اختالف معنيدار)‪ ،‬بونفروني‪ ،‬شفه‪،‬‬
‫توكي‪ ،‬دانكن و غيره (در سطح معنيداري )‪ ،‬براي فهميدن اين موضوع كه‬
‫كداميك از ميانگينها با يكديگر برابر نيستند‪ ،‬استفاده ميكنيم‪ .‬كه اينكار را‬
‫ميتوان با انتخاب گزينه مورد نظر در بخش ‪( Post Hoc‬شكل ‪ )24-3‬و‬
‫فشردن كليد ‪ ،Continue‬انجام داد‪.‬‬
‫تذكر‪ :‬از آنجاييكه خطاي نوع دوم در آزمون دانكن از بقيه آزمونها كمتر است‬
‫پس پرتوانترين آزمون در ميان ساير آزمونهاي موجود ميباشد‪ .‬به همين‬
‫دليل‪ ،‬در اكثر موارد آماردانان از آن استفاده مينمايند‪.‬‬
‫تحليل همبستگي "‪"Correlations‬‬
‫همبستگي بين دو متغير‪ ،‬شدت و جهت رابطه خطي ميان آنها را نشان مي دهد‪.‬‬
‫مقدار اين كميت‪ ،‬چگونگي برازش معادله اي خطي يا غيرخطي كه ارتباط بين‬
‫متغيرها را توجيه مي كند‪ ،‬بيان مي نمايد (اگر معادله ثابتي بين متغيرها برقرار‬
‫باشد‪ ،‬همبستگي كامل خواهد بود)‪ .‬ضريب همبستگي (‪ )r‬همواره بين "‪ "-1‬و‬
‫"‪ "1‬خواهد بود‪ .‬بعبارت ديگر‪:‬‬
‫از آنجايي كه رسم نمودار پراكنش به تنهايي نمي تواند نوع رابطه بين دو متغير را‬
‫تعيين كند‪ ،‬معياري عددي براي محاسبه قدرت و جهت رابطه خطي بين آنها‪،‬‬
‫مورد نياز است‪ .‬معيار عددي اين پيوند‪ ،‬زمانيكه رابطه بين دو متغير خطي فرض‬
‫شود‪ ،‬ضريب همبستگي نمونهاي يا ضريب همبستگي پيرسون نام دارد كه از‬
‫رابطه ‪ 3-3‬محاسبه ميشود‪.‬‬
‫) ‪ X )(Yi  Y‬‬
‫‪n‬‬
‫‪2‬‬
‫) ‪ (Y  Y‬‬
‫‪i‬‬
‫‪i 1‬‬
‫‪n‬‬
‫‪i‬‬
‫‪(X‬‬
‫‪ X) .‬‬
‫‪i 1‬‬
‫‪n‬‬
‫‪2‬‬
‫‪i‬‬
‫‪(X‬‬
‫) ‪Cov ( X , Y‬‬
‫‪‬‬
‫‪‬‬
‫‪S X .SY‬‬
‫‪rXY‬‬
‫‪i 1‬‬
‫در صورتيكه رابطه متغيرها در نمودار پراكنش به شكل منحني ديده شود‪ ،‬ضريب‬
‫همبستگي پيرسون معيار مناسبي نخواهد بود‪ .‬از طرف ديگر‪ ،‬ضريب همبستگي‬
‫پيرسون‪ ،‬زماني معتبر است كه دادهها كمي باشد‪ .‬ضريب همبستگي ديگري كه‬
‫ميتوان براي دادههاي كمي محاسبه نمود‪ ،‬ضريب همبستگي تاو‪-‬كندال است‪.‬‬
‫اين ضريب همبستگي‪ ،‬اندازه اي است ناپارامتري از شدت پيوند متغيرها و‬
‫به كمك رابطه‬
‫) ‪ sign(S  S ) . sign( R  R‬‬
‫‪n‬‬
‫‪j‬‬
‫‪i‬‬
‫‪j‬‬
‫)‪n(n  1‬‬
‫‪2‬‬
‫‪i‬‬
‫‪i j‬‬
‫‪rtau ‬‬
‫محاسبه مي گردد كه در آن ()‪ sign‬نماد تابع عالمت‪ )Si-Sj( ،‬اختالف‬
‫رتبه ‪ i‬امين و ‪ j‬امين مقدار متغير ‪ Y‬و (‪ )Ri-Rj‬اختالف رتبه ‪ i‬امين و ‪j‬‬
‫امين مقدار متغير ‪ X‬ميباشند‪.‬‬
‫حال اگر دادهها از نوع فاصلهاي باشند‪ ،‬از ضريب همبستگي ديگري بنام‬
‫ضريب همبستگي اسپيرمن كه براساس رتبه دادهها و با همان نمادهاي‬
‫‪ rtau‬تعريف شده است‪ ،‬استفاده مينمائيم‪ .‬اين ضريب همبستگي از رابطه‬
‫زير قابل محاسبه است ‪.‬‬
‫‪n 1‬‬
‫‪n 1‬‬
‫‪)(Si ‬‬
‫)‬
‫‪2‬‬
‫‪2‬‬
‫)‪n(n2  1‬‬
‫‪12‬‬
‫‪( Ri ‬‬
‫‪n‬‬
‫‪‬‬
‫‪i 1‬‬
‫‪rsp ‬‬
‫براي محاسبه ضرايب همبستگي در نرمافزار آماري ‪ ، SPSS 13.0‬از منوي‬
‫‪ Analyze‬بر روي گزينه ‪ Correlate‬و سپس …‪ Bivariate‬كليك‬
‫مينمائيم‬
‫بهعنوان مثال‪ ،‬اگر بخواهيم ضريب همبستگي پيرسون ميان متغيرهاي مقدار سم‬
‫مصرفي و وزن محصول برداشت شده (دادههاي جدول ‪ )1-3‬را محاسبه نمائيم‬
‫(با توجه به پراكندگي نقاط بصورت خط راست در نمودار پراكنش (نمودار ‪-3‬‬
‫‪ ،))2‬با وارد نمودن متغيرهاي ‪( Weight‬متغير وابسته) و ‪Amount of‬‬
‫‪( Poison‬متغير مستقل) در جعبه ‪ Variables‬از پنجره ‪Bivariate‬‬
‫‪ Correlations‬و سپس انتخاب گزينه ‪ Pearson‬از قسمت‬
‫‪ ،Correlation Coefficients‬بر روي دكمه ‪ OK‬كليك مينمائيم ‪.‬‬
‫تحليل رگرسيوني "‪: ”Regression‬‬
‫تحليل رگرسيوني‪ ،‬يكي از پرمصرفترين روشهاي آماري است كه براي تجزيه‬
‫و تحليل دادهها مورد استفاده قرار ميگيرد‪ ،‬زيرا روابط ميان متغيرهاي پيوسته را‬
‫بطور ساده و بامفهوم‪ ،‬بيان مينمايد‪.‬‬
‫‪ 1‬اگر برخي از متغيرهاي مستقل از نوع كيفي باشند‪ ،‬نياز به تحليل آناليز‬
‫كوواريانس دارد و با اين مباحث نميتوان آنها را تحليل كرد‪.‬‬
‫بطور كلي؛ رگرسيون‪ ،‬مجموعهاي از روشها و تكنيكهاست كه براي كمك به‬
‫درك رابطه بين گروهي از متغيرها‪ ،‬مورد استفاده قرار ميگيرد‪ .‬در بسياري از‬
‫موارد‪ ،‬يك معادله خط راست ميتواند براي نشان دادن وابستگي يك متغير به‬
‫ديگري مورد استفاده قرار گيرد‪.‬‬
‫در حالت كلي‪ ،‬معادله يك مدل رگرسيوني خطي عبارت است از‬
‫‪Y  0  1 X 1  ...   k X k‬‬
‫كه در آن ‪ ،‬مقدار ثابت رگرسيوني؛ ‪ ،‬متغير مستقل ‪ i‬ام و ‪ ،‬ضريب رگرسيوني‬
‫براي متغير مستقل ‪ i‬ام ميباشند‪.‬‬
‫در اين بخش نشان ميدهيم كه چگونه ميتوان معادله چنين خطي را با استفاده از‬
‫نرمافزار آماري ‪SPSS‬بدست آورد‪.‬‬
‫ميتوانيم يك مدل رگرسيوني كه‬
‫نشان دهنده رابطهاي خطي ميان‬
‫آنها ميباشد‪ ،‬برازش دهيم كه به‬
‫كمك نرم افزار آماري ‪SPSS‬‬
‫‪ ،‬اين كار را ميتوان براحتي انجام‬
‫داد‪ .‬پس از منوي ‪Analyze‬‬
‫گزينه‬
‫روي‬
‫بر‬
‫‪Regression‬و سپس‬
‫…‪ Linear‬كليك مينمائيم‪:‬‬
‫با ا جراي ا ين فر مان جع به گفت گوي ز ير باز مي شود‪ .‬حال متغ ير واب سته را وارد‬
‫خش‬
‫ستقل را وارد ب‬
‫هاي م‬
‫سمت ‪ Dependent‬و متغير‬
‫ق‬
‫)‪Independent(s‬مينمائيم‪.‬‬
‫در اين پنجره و در بخش ‪Method‬روشهاي مختلفي براي ورود و يا خروج‬
‫متغيرها از مدل رگرسيوني وجود دارد كه بترتيب عبارتند از‪:‬‬
‫‪.1‬‬
‫‪.2‬‬
‫‪.3‬‬
‫‪.4‬‬
‫‪.5‬‬
‫روش ‪( Enter‬ورود)‬
‫روش ‪( Stepwise‬گام به گام)‬
‫روش ‪( Remove‬خروج)‬
‫روش ‪( Backward‬پسرو)‬
‫روش ‪( Forward‬پيشرو)‬
‫پایان‬

تحلیل داده ها در نرم افزار آماری

Transcript تحلیل داده ها در نرم افزار آماری

Directory