Transcript statistic
آمار و آزمون های آماری
احتمال
آزمون فرض
آزمون های پارمتری
آزمون های ناپارامتری
احتمال
بین صفر و 1میباشد که نشاندهندة احتمال وقوع یک حادثه است.
یک حادثه با احتمال صفر ،یک حادثة بیاثر است.
یک حادثه با احتمال یک یک حادثة قطعی است.
نزدیکتر به یک ،احتمال وقوع حادثه بیشتر است.
احتمال حادثة Aرا با ) P(Aنشان میدهند.
یک مرد باردار شود
زن از سرطان پروستات بمیرد.
خورشید امشب غروب خواهد کرد.
نیمسال به پایان خواهد رسید.
یک نفر خواهد مرد.
روش فراوانی
روش کالسیک
روش عقیدة شخص ی
ت وزی عنرما ل
هیست وگرام درصد
IQ
(Intervals of size 20)
40
Percent
30
20
10
0
55
75
95
IQ
115
135
ه یستو گرام
م سا حت مستط ی ل =احتما ل
IQ
(Intervals of size 20)
Density
0.02
0.01
0.00
55
75
95
IQ
115
135
... ا صل ه
ةف
ه شانداز
کا
IQ
(Intervals of size 10)
Density
0.02
0.01
0.00
55
65
75
85
95
IQ
105
115
125
135
... ها
ا صل ه
ةف
شترانداز
ه شبی
کا
IQ
(Intervals of size 5)
0.03
Density
0.02
0.01
0.00
50
60
70
80
90
100
IQ
110
120
130
140
منحنی توصیفکنندة احتمال هر محدودهای از مقادیر را کسب میکند.
مثل:
)P(X > 120), P(X<100), P(110 < X < 120
مساحت زیر منحنی = احتمال
کل مساحت زیر منحنی = 1
ا
احتمال بدستآوردن یک عدد خاص 0است .مثال
P(X=120) = 0
چگال یا حتما ل
ع
ب
ا
ت
از
ای
ه
ویژ
ع
و
ن
Bell-shaped curve
p.d.fپی و سته
0.08
Mean = 70 SD = 5
0.07
Density
0.06
0.05
0.04
Mean = 70 SD = 10
0.03
0.02
0.01
0.00
40
50
60
70
Grades
80
90
100
متقارن – منحنی زنگولهای
شکل منحنی بستگی به میانگین جمعیت و انحراف معیار دارد.
مرکز توزیع است.
وسعت منحنی بستگی به دارد.
بیشتر مقادیر اطراف میانگین هستند اما بعض ی از مقادیر کوچکتر و بعض ی
بزرگتر میباشند.
چقدرا س ت75 ا حتما لباالی
؟
Probability student scores higher than 75?
0.08
0.07
Density
0.06
0.05
P(X > 75)
0.04
0.03
0.02
0.01
0.00
55
60
65
70
Grades
75
80
85
محاسبة جبری؟
شخص ی این کار سخت را برای ما انجام داده است.
ما تنها به یک جدول احتماالت برای هر توزیع نرمالی نیاز داریم.
اما تعداد بینهایت توزیع نرمال وجود دارد (برای هر میانگین و انحراف
معیاری یک توزیع)
جواب استانداردکردن standardizeمیباشد.
مقدار xرا از میانگین کم نموده و به انحراف معیار تقسیم کنید .نتیجه
مقدار zمیباشد .یعنی:
Z = (X- )/
Z را نرمال استاندارد مینامند .میانگین آن 0 و انحراف معیاری برابر با
1دارد.
سپس از جدول احتمال برای zاستفاده میشود.
ا ستفاد هاز جدو ل
Standard Normal Curve
z
0.4
Density
0.3
0.2
Tail probability
P(Z > z)
0.1
0.0
-4
-3
-2
-1
0
Z
1
2
3
4
70 و65 ا حتما لبی ن
چ یست؟
0.08
0.07
Density
0.06
0.05
P(65 < X < 70)
0.04
0.03
0.02
0.01
0.00
55
60
65
70
Grades
75
80
85
65 ا حتما لز یر
چ یست؟
0.08
0.07
Density
0.06
0.05
0.04
0.03
0.02
P(X < 65)
0.01
0.00
55
65
75
Grades
85
احتماالت محاسبهشده دقیق هستند تنها اگر فروض ایجادشده به طور
واقعی درست باشند.
وقتی محاسبات فوق را انجام میدهید ،فرض شما این است که دادهها به
طور نرمال توزیع شده باشند.
ا
همیشه این فرض را چک کنید! (بعدا یاد خواهیم گرفت)
ة
ع یتبزر گتر،از ی کنمون
برای دانست نخصو صیات ی ک جم
ا ی ید.
تصادفیا ستفاد هنم
دورا هبراییادگیری در
م ورد ی ک جمعیت
فواصل اطمینان
آزمون فرضیه
اجازه دهید که با استفاده از دادههای نمونه ،مقادیر جمعیت مانند
میانگین یا نسبتهای واقعی را برآورد نماییم.
مثال :متوسط واقعی زمانی که دانشجویان در آخر هفته مطالعه میکنند،
چقدر است؟
به ما اجازه دهید که با استفاده از دادههای نمونه ،یک ادعا در مورد یک
ا
جمعیت را آزمون نماییم .مثال اینکه نسبتی از جمعیت یا میانگین جمعیت
برابر با یک عدد است.
مثال :آیا مقدار واقعی متوسط مطالعة دانشجویان در آخر هفته 20
دقیقه است؟
اید هعم و م ی آز م و ن
فرضیه
یک فرض ابتدایی بسازید.
شواهد را جمعآوری کنید (دادهها)
بر اساس شواهد موجود ،تصمیم بگیرید که آیا فرض اولیه قابل قبول
است یا خیر.
آیا متوسط نمره 7/2
است؟
چقدر احتمال دارد که 100
دانشجو دارای متوسط نمرهای
به اندازة 9/2باشند اگر متوسط
جمعیت 7/2باشد؟
جمعیت 5میلیون دانشجوی
کالج
نمونة 100دانشجو
مثا ل5
تصمیمگ ی
ری
آن محتمل یا غیرمحتمل است که ما شواهدی داشته باشیم که فرض
اولیة ما را تأیید یا رد کند.
(توجه :محتمل یا غیرمحتمل با محاسبة احتمال مشخص میشود)
اگر محتمل باشد ،آنگاه ما فرض اولیة خود را رد نمیکنیم .یعنی شواهد
کافی برای چیز دیگر نداریم.
اگر غیرمحتمل باشد ،آنگاه:
◦ یا فرض اولیة ما درست است و ما یک حادثة غیرمعمول را تجربه میکنیم.
◦ یا فرض اولیة ما نادرست است.
در آمار ،اگر غیرمحتمل باشد ،ما تصمیم به رد فرض اولیه میگیریم.
ة آز م و ن
اید
فرضیه
اول دو فرضیه ارائه میکنیم ،فرضیة صفر
the null hypothesis (“H0”)
و فرضیة جایگزین
and the alternative hypothesis (“HA”)
◦
◦
H0:خوانده گناهکار نیست
HA:خوانده گناهکار است
ا یی
اس
شن
ها
فر ضیه
فرضیه صفر همیشه نشاندهندة وضعیت موجود میباشد یعنی فرضیهای
که نیازمند هیچ تغییری در رفتار جاری ندارد.
فرضیه جایگزین ،نتیجهای است که محقق سعی دارد آن را بدست آورد.
در آمار ،دادهها همان شواهد هستند.
سپس فرض اولیه ساخته میشود
◦ خوانده ،بیگناه است تا وقتی که ثابت شود ،گناهکار است.
درآمار ،ما همیشه فرض میکنیم فرضیة صفر درست است.
سپس یک تصمیم بر اساس شواهد موجود بگیرید.
◦ اگر شواهد کافی وجود داشت (ماورای شک منطقی) ،فرضیة صفر رد میشود.
(خوانده گناهکار است).
◦ اگر شواهد کافی وجود نداشته باشد ،فرضیة صفر رد نمیشود (خوانده گناهکار
نیست)
هیچ تصمیمی مستلزم اثبات فرضیة صفر یا فرضیة جایگزین نمیباشد.
ما فقط اظهار میداریم که شواهد کافی برای حرکت در یک راه یا راه دیگر
نداریم.
این موضوع همیشه در آمار درست است ،موضوع این نیست که ما چه
تصمیمی میگیریم ،همیشه شانس این وجود دارد که ما تصمیم اشتباه
بگیریم.
ها در
خ طا
آز م و نفر ضیه
واق عی ت
فرضیة ج ایگزی ن
فرضیة صفر
تصمی م
TYPE II
ERROR
OK
ع دم رد فرضیة صفر
OK
TYPE I
ERROR
رد فرضیة صفر
ار ی ف5ان وا ع
تع
خ طا
خطای نوع اول :فرضیة صفر رد شود درحالیکه درست است.
خطای نوع دوم :فرضیة صفر رد نشود ،وقتی اشتباه است.
همیشه شانس ایجاد یکی از این خطاها وجود دارد اما هدف ما باید
حداقل کردن شانس وقوع این خطاها باشد.
p-valueبرایتصمیمگیری
ةکرانی را
ا چن ی ن نمون
الیا ستکه م
ه ندة ا حتم
اند
p-value نش
اشد.
ة صفردر ستب
ه یمکردا گرفر ض ی
هد ه خ وا
مشا
اشد.
ابرا ی نبی ن صفر و ی ک م یب
p-value ا حتما لا ست،بن
نزد ی کبه صفربهمعنای غ یر م حتم لا ست.
اشد ( به ط ور م ثا لکمتر از
ا ی نا گر p-valueک وچک ب
ابر
بن
ة صفر رد م یش ود.
، 05/0آن گا هفر ض ی
آز م و نفرضیهبرای
میانگی ن جمعیت
آیا متوسط نمره
7/2است؟
چقدر احتمال دارد که 100
دانشجو دارای متوسط
نمرهای به اندازة 9/2باشند
اگر متوسط جمعیت 7/2
باشد؟
جمعیت 5میلیون دانشجوی
کالج
نمونة 100دانشجو
مقاد یر p
چقدر محتمل است که 100دانشجو دارای میانگین نمرهای به اندازة 9/2
باشند اگر متوسط جمعیت 7/2باشد؟
تعیی ن مقادیر
= 2.7 Pمتوسط نمرات جمعیت = H0: μ
> 2.7متوسط نمرات جمعیت = μ
HA :
اگر 100دانشجو دارای متوسط نمرهای برابر 9/2با انحراف معیار 6/0
باشد ،مقدار Pبرابر است با:
]) P ( X 2 . 9 ) P [ Z ( 2 . 9 2 . 7 ) /( 0 . 6 / 100
P [ Z 3 . 33 ] 0 . 0004
تصم یمگی
ری
مقدار Pکوچک است .غیرمحتمل است که ما نمونهای به اندازة
9/2داشته باشیم اگر متوسط نمرات جمعیت 7/2باشد.
فرضیة صفر رد میشود .شواهد کافی وجود دارد که متوسط نمرات
بزرگتر از 7/2باشد.
اص طال حا
ت
2.7 در برابر HA: μ > 2.7
یک آزمون فرضیة دنبالة راست یا یک طرفه نامیده میشود چون مقدار P
مربوط به دنبالة سمت راست است.
Z = 3.33
را آمارة آزمون مینامند.
اگر ما فکر کنیم که مقدار Pما کوچک است یعنی کوچکتر از 05/0باشد،
آنگاه احتمال اینکه ما یک خطای نوع اول بسازیم برابر 05/0است .این
مقدار را سطح معنیداری آزمون مینامند .ما میگوییم α=0.05جاییکه α
سطح معنیداری است.
آز م ونهایپارامتری
آزمونهای tو Fعمدهترین آزمونهای آماری برای مقایسۀ میانگین گروهها
میباشند .از آنجا که گروههای مورد بررس ی ممکن است مستقل با همبسته
باشند بنابراین هر یک از آزمونهای فوق به دو بخش مستقل و همبسته
تقسیم میشوند .تصمیمگیری در مورد اینکه در چه مواقعی باید از آزمونهای
tیا Fمستقل یا همبسته استفاده کرد مهمترین مسأله در تحلیل داده های
کمی است.
آیا گروههای مورد بررسی مستقل هستند یا همبسته؟
مستقلاند
سه گروه یا بیشتر
آزمون Fمستقل
همبستهاند
دو گروه
آزمون tمستقل
سه گروه یا بیشتر
آزمون Fهمبسته
دو گروه
آزمون tهمبسته
پیشفرضهای آزمونهای
پارامتری
آزمونهای پارامتری Tو Fرا با پیش فرضهای زیر میتوان مورد استفاده قرار
داد:
مشاهدات از یک جامعه نرمال انتخاب شده باشند.
اطالعاتی که با هم مقایسه میشوند باید تقریبا واریانس یکسانی داشته
باشند (در نمونههای بزرگ اگر واریانس یک گروه دو برابر دیگری باشد باز هم
میتوان از آزمونهای پارامتری استفاده نمود)
دادههای گردآوری شده دارای مقیاس فاصلهای یا نسبتی باشند.
اگر اطالعات جمعآوریشده این سه شرط را نداشت میتوان دادههای فوق
را به غیر پارامتری تبدیل کرد و از روشهای آماری غیرپارامتری استفاده نمود.
روش عمده تبدیل دادههای پارامتری به غیرپارامتری ،رتبهبندی کردن آنها
میباشد.
الف -آزمون :tاگر متغیرمستقل یا متغیرگروهبندی تنها دو گروه داشته باشد.
(اگر بخواهیم درآمد زنان و مردان را با هم مقایسه کنیم)
ب -آزمون ( Fتحلیل واریانس )ANOVA
اگر تعداد گروهها بیش از دو باشد.
(اگر بخواهیم میزان درآمد گروههای شغلی کارگر ،کارمند و کشاورز را با هم
مقایسه کنیم)
نکته :آزمون Fتنها معنیداری تفاوت بین میانگین گروهها را مورد بررس ی قرار
میدهد اما مشخص نمیکند که این تفاوتها در بین کدامیک از گروههای
مورد بررس ی وجود دارد .به همین دلیل برای ایک که بدانیم تفاوتهای
بدستآمده در بین کدامیک از طبقات وجود دارد و از این طریق مقایسهای
بین گروهها انجام گیرد ،باید از آزمون شفه ( )Scheffe testیا LSDو یا
از آمارههایی نظیر توکی Tukeyیا دانکن Duncanاستفاده کرد .این
آزمونها میانگین زوجها را با همدیگر به صورت دوبدو مقایسه کرده و وجود
اختالف معنیدار بین آنها را نشان میدهد.
ها
ای نرو شک ل واریان س م وج ود در ی ک مجم وعهاز داد ه
کند
رابه دوبخ شتقسیم م ی
بخش ی از این واریانس ممکن است بخاطر شانس و تصادف حادث شده باشد و
بخش دیگر ممکن است ناش ی از دالیل یا عوامل خاص ی باشد ،از طرف دیگر
واریانس موجود ممکن است ناش ی از تفاوت بین گروههای مورد مطالعه و یا
بخاطر تفاوت موجود در درون نمونهها حادث شده باشد.
مهمترین اصل در تحلیل واریانس ( )ANOVAآزمایش تفاوتهای موجود در
بین میانگینهای جوامع یا گروههای مورد مطالعه از طریق بررس ی میزان
واریانس بین گروهها نسبت به واریانس درون گروههاست.
در واریانس درون جامعه فرض بر این است که تفاوت بین مقدار نسبت به
میانگین جامعه بخاطر شانس است در حالیکه در بررس ی تفاوتهای بین جوامع و
گروهها ،فرض بر این است که تفاوت بین میانگین جامعه یا نمونۀ jام با
میانگین کل به دلیل عوامل خاص میباشد .بنابراین زمانی که از تحلیل واریانس
استفاده میشود فرض میگردد که هر یک از نمونهها از یک جامعه نرمال
انتخاب شدهاند و هر یک از این جوامع نیز واریانس برابری دارند همچنین فرض
میشود کلیه عوامل بجز عواملی که مورد مطالعه میباشند تحت کنترل هستند.
نکته5
در تحلیل واریانس ،اگر در بین میانگین گروههای مختلف تفاوت معنیداری وجود
داشته باشد تنها از طریق ANOVAنمیتوان محل این تفاوتها را بدست آورد.
اگر به مقایسۀ سه گروه C ،B ،Aبپردازیم و تفاوت معنیداری در بین آنها وجود
داشته باشد نمیتوانیم قضاوت کنیم که آیا این تفاوتها بین Aو Bاست یا بین
Bو Cیا بین Aو .C
در چنین مواقعی نباید از طریق آزمون tبه مقایسه دوبدو گروهها پرداخت ،زیرا هر
قدر تعداد دفعاتی که آزمون tانجام میگیرد بیشتر باشد سطح اطمینان نتایج پائین
میآید.
(در این موارد باید از آزمونهائی مانند آزمون شفه ،آزمون چنددامنه دانکن ،آزمون
توکی و آزمون استیودنت نیومن ،کیول برحسب ضرورت استفاده کرد.
تحلیل واریانس یکطرفه:
One-way Analysis of Variance
اگر محقق تنها یک متغیر (درآمد) را انتخاب کند و بخواهد تفاوت بین
طبقات یا گروههای مختلف را بررس ی کند در این صورت از تحلیل
واریانس یکطرفه استفاده میکند.
ت حلی ل واریان س دوطرفه5
Two way Analysis of Variance
هد اثر دو عا م ل را بر روی ی ک متغیر وابسته
اگر م حق ق بخ وا
برر س یکندبایدازت حلی ل واریان س دوطرفها ستفاد هکند.
ارامتری
آز م و ن غ یرپ
ا
ی
همانطوری که قبال نیز بحث گردید آزمونهای پارامتر عالوه بر این که نیاز
به دادههائی از نوع فاصلهای دارند باید از برخی از پیش فرضهای اولیه نیز
برخوردار باشند (نرمال بودن توزیع در جامعه و داشتن واریانس یکسان در
مواردی که دو یا چند جامعه با هم مورد مقایسه قرار میگیرند و )...
اما در آزمونهای غیرپارامتری چنین پیشفرضهائی مطرح نبوده و زمانی که
دادهها در سطح اسمی و یا ترتیبی باشد و یا در صورتیکه گروههای مورد
مطالعه از واریانس نابرابر و یا از چولگی برخوردار باشند باید از آزمونهای
غیرپارامتری استفاده کرد .این آزمونها از ویژگیهائی برخوردار هستند که
آنها را از آزمونهای پارامتری متمایز کرده است:
.1این آزمونها هیچکدام از پیشفرضهای مطرح شده در آزمونهای پارامتری،
نظیر نرمال بودن جامعه و یا برابر بودن واریانس گروهها را مبنا قرار
نمیدهد و حتی در صورت صادق نبودن مفروضات فوق در خصوص
دادههای فاصلهای به منظور استفاده از آزمونهای پارامتری امکان تبدیل
داده های فوق به دادههای غیرپارامتری و رتبهای و محاسبه آزمونهای
ناپارامتری وجود دارد.
.2از آنجا که در این آزمونها از مقادیر رتبهای و حتی دادههای اسمی استفاده
میگردد ،بنابراین محاسبۀ آنها کار سادهای است.
.3این آزمونها در مقایسه با آزمونهای پارامتری از دقت باالئی برخوردار
نمیباشند .دلیل آن این است که با تبدیل دادههای فاصلهای به مقادیر
رتبهای ،فواصل واقعی موجود در بین دادهها به فواصل یکسان بین
رتبهها تبدیل شده و در این فرآیند بخش ی از اطالعات ناپدید میگردند به
عبارت دیگر با تبدیل مقادیر اصلی و واقعی به مقادیر رتبهای ،بدلی از
واقعیت ساخته میشود و این بدل بدستآمده به جای واقعیت مورد
زمانی که دادهها به صورت همبسته باشند مورد استفاده قرار میگیرد.
.2آز م و ن م ک
نمار5
ار برده میش ودکه داد هها به صورتا سمی
اغل ب در م واردیبک
اهم بسته
و مر ب وط به دو نمونه مرت بط بهم ( )Two relatedی
اشند
ب
ا یسه
قبلی وبعدیافراد را م ورد مق
ه یمن ظرات
انیکهبخ وا
(ز م
ه یم)
قرار د
مثااال .1ابتاادا در مااورد یااک موضااوع نظاار اف اراد را بااه صااورت موافااق یااا مخااالف
جوی ااا میش ااویم ااس از آن نس اابت ب ااه برگ ازاری ک ااالس آموز ا ی اق اادام م اایکنیم
(یاجلس ا ااۀ ت ا ااوجی ی) و س ا اارس دوب ا اااره نظ ا اار اف ا اراد را نس ا اابت ب ا ااه موض ا ااوع جوی ا ااا
میشویم .در اینجا فرض صفر ( )Hoاین است که تفاوتی باین نظارات افاراد در
قبل و س از اجرای برنامه (دورۀ آموز ی) وجود ندارد.
مث ااال .2نظا ارات 1000نف اار درب اااره خری ااد و ع اادم خری ااد ی ااک ک ااا قب اال و بع ااد از
برگزاری برنامه تبلیغاتی و معرفی کا پرسیده شده است با ایان آزماون میتاوان
مشخص نمود که آیا برنامه تبلیغاتی در تغییر نگرش مشاتریان ما ر باوده اسات
یا خیر.
کس و ن
.3آز م و ن ویلکا
Wilcoxon Test
در بسیاری از پژوهشهائی که نمونهها به صورت جفت شده و همبسته
هستند ممکن است محقق بخواهد هم جهت تغییر و هم میزان تغییر را
مورد بررس ی قرار دهد ،برای این منظور آزمون ویلکاکسون تست مناسبی
است.
داده های مورد استفاده در این آزمون حداقل باید در سطح ترتیبی باشند.
مثال :نظر تعدادی از مشتریان در رابطه با دو نوع کاالی مشابه اما با
مارکهای متفاوت از نظر کیفیت محصول سؤال شده است.
.4آز م و نفرید م ن
Fridman Test
آزمون فریدمن یکی از آزمونهای غیرپارامتری است این آزمون در واقع معادل
آزمون Fدر روشهای پارامتری میباشد اما در اینجا برخالف آزمون ،F
فرض توزیع نرمال و برابر بودن واریانس ضرورتی ندارد.
این روش برای مقایسه سه گروه یا بیشتر از سه گروه همبسته بکار میرود.
مثال :نظرات 30نفر از فراگیران را درخصوص سه روش مختلف تدریس
جویا شدهایم و پاسخها نیز از ( 1بسیار نامناسب) تا ( 5بسیار مناسب)
امتیازبندی شدهاند.
.5آز م و ن
کرا ن
کو
یکی از روشهای ناپارامتری و درواقع تعمیمیافته آزمون مک نمار است با این
تفاوت که این روش برای مواردی که تعداد گروهها یا تکرار سه یا بیشتر از
سه باشد بکار میرود :دادههای این آزمون به صورت اسمی میباشد و وجود
تفاوت بین نظرات افراد را مورد بررس ی قرار میدهد.
مثال :نظرات افراد نسبت به یک موضوع در زمانهای مختلف پرسیده میشود
(موافقت – مخالفت)
قبل از برگزاری یک دورۀ آموز ی(موافقت – مخالفت)
بعد از برگزاری دوره(موافقت – مخالفت)
-بعد از اجرای عملی محتویات دوره
.6آز م و ن م ن -ویتن ی
Mann – Whitney Test
برای مقایسه میانگینهای دو جامعه مستقل زمانی که دادهها به صورت
رتبهای یا ترتیبی باشند مورد استفاده قرار میگیرد.
مثال :فرض کنید دو گروه 30نفره از فراگیران با دو روش متفاوت آموزش
دیده و نتیجه ارزیابی آنها از دورههای فوق در قالب امتیازات 1تا 5گردآوری
شده است.
.7آز م و نک ولم وگرو ف -ا سمیرن ف
– Kolmogrov
Smirnov Test
چنانچه در بحث کایاسکوئر گفته شد اگر فراوانیهای مورد انتظار بیش از
20درصد خانههای جدول ،کمتر از 5باشد ،در این صورت نمیتوان از
فرمول کایاسکوئر استفاده کرد ،این مشکل معمو زمانی پیش میآید که
حجم نمونه کمتر از 50باشد و یا تعداد خانههای جدول بیشتر باشد .در
چنین حالتی میتوان از تست کوملوگرف -اسمیرنف استفاده کرد .اساس این
آزمون مقایسه فراوانی تجمعی نسبی مشاهده شده با فراوانی تجمعی نسبی
مورد انتظار میباشد.
.8آز م و نکرو سکا ل -والی س Kruskal – Wallis
Test
این آزمون در واقع معادل تحلیل واریانس یکطرفه میباشد ،اما برخالف آن
نیازی به مفروضات آن نظیر اینکه نمونهها از یک جامعۀ نرمال بدستآمده
باشند و یا اینکه انحراف معیار یکسانی داشته باشند وجود ندارد .آزمون
کروسکال والیس زمانی استفاده میشود که تعداد نمونهها بیش از دو گروه
باشد.
مثال :از 90نفر دانشجو در سه رشته مختلف درخواست شد تا کیفیت
برنامههای آموزش ی دانشکده را ارزیابی کنند .امتیازات ارائه شده توسط
افراد فوق از ( 1بسیار ضعیف) تا ( 5بسیار قوی) در نوسان بوده است.
:Hoبین نظرات دانشجویان رشتههای مختلف تفاوت معنیداری وجود
ندارد.
این آزمون اگرچه وجود تفاوت بین نظرات گروههای مختلف را نشان
میدهد اما مشخص نمیکند که این تفاوت در بین کدام یک از گروهها
.9آز م و ن میانهMedian 5
test
یکی دیگر از روشهای غیرپارامتری است که برای مقایسه سه یا بیشتر از سه
گروه مورد استفاده قرار میگیرد .اطالعات مورد نیاز در این روش باید در
سطح رتبهای بوده و حتیا مکان دادهها همرتبه نباشند ،زیرا اگر میانه
مشترک بین گروهها جزو نمرات تکراری باشد در این صورت تشخیص تفاوت
گروهها با مشکل مواجه میگردد.
مثال :میخواهیم بدانیم آیا سرعت عمل کارگران سه شیفت مختلف یک
کارگاه خیاطی با هم متفاوت است یا خیر؟
برای این کار تعداد شلوار دوخته شده توسط 40کارگر (از سه شیفت
مختلف) در یک هفته گردآوری شده است.