Transcript statistic

‫آمار و آزمون های آماری‬
‫‪ ‬احتمال‬
‫‪ ‬آزمون فرض‬
‫‪ ‬آزمون های پارمتری‬
‫‪ ‬آزمون های ناپارامتری‬
‫احتمال‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫بین صفر و ‪ 1‬میباشد که نشاندهندة احتمال وقوع یک حادثه است‪.‬‬
‫یک حادثه با احتمال صفر‪ ،‬یک حادثة بیاثر است‪.‬‬
‫یک حادثه با احتمال یک یک حادثة قطعی است‪.‬‬
‫نزدیکتر به یک‪ ،‬احتمال وقوع حادثه بیشتر است‪.‬‬
‫احتمال حادثة ‪ A‬را با )‪ P(A‬نشان میدهند‪.‬‬
‫‪ ‬یک مرد باردار شود‬
‫‪ ‬زن از سرطان پروستات بمیرد‪.‬‬
‫‪ ‬خورشید امشب غروب خواهد کرد‪.‬‬
‫‪ ‬نیمسال به پایان خواهد رسید‪.‬‬
‫‪ ‬یک نفر خواهد مرد‪.‬‬
‫‪ ‬روش فراوانی‬
‫‪ ‬روش کالسیک‬
‫‪ ‬روش عقیدة شخص ی‬
‫ت وزی عنرما ل‬
‫هیست وگرام درصد‬
IQ
(Intervals of size 20)
40
Percent
30
20
10
0
55
75
95
IQ
115
135
‫ه یستو گرام‬
‫م سا حت مستط ی ل =احتما ل‬
IQ
(Intervals of size 20)
Density
0.02
0.01
0.00
55
75
95
IQ
115
135
... ‫ا صل ه‬
‫ةف‬
‫ه شانداز‬
‫کا‬
IQ
(Intervals of size 10)
Density
0.02
0.01
0.00
55
65
75
85
95
IQ
105
115
125
135
... ‫ها‬
‫ا صل ه‬
‫ةف‬
‫شترانداز‬
‫ه شبی‬
‫کا‬
IQ
(Intervals of size 5)
0.03
Density
0.02
0.01
0.00
50
60
70
80
90
100
IQ
110
120
130
140
‫‪ ‬منحنی توصیفکنندة احتمال هر محدودهای از مقادیر را کسب میکند‪.‬‬
‫مثل‪:‬‬
‫)‪P(X > 120), P(X<100), P(110 < X < 120‬‬
‫‪ ‬مساحت زیر منحنی = احتمال‬
‫‪ ‬کل مساحت زیر منحنی = ‪1‬‬
‫ا‬
‫‪ ‬احتمال بدستآوردن یک عدد خاص ‪ 0‬است‪ .‬مثال‬
‫‪P(X=120) = 0‬‬
‫چگال یا حتما ل‬
‫ع‬
‫ب‬
‫ا‬
‫ت‬
‫از‬
‫ای‬
‫ه‬
‫ویژ‬
‫ع‬
‫و‬
‫ن‬
Bell-shaped curve
p.d.f‫پی و سته‬
0.08
Mean = 70 SD = 5
0.07
Density
0.06
0.05
0.04
Mean = 70 SD = 10
0.03
0.02
0.01
0.00
40
50
60
70
Grades
80
90
100
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫متقارن – منحنی زنگولهای‬
‫شکل منحنی بستگی به میانگین جمعیت ‪ ‬و انحراف معیار ‪ ‬دارد‪.‬‬
‫مرکز توزیع ‪ ‬است‪.‬‬
‫وسعت منحنی بستگی به ‪ ‬دارد‪.‬‬
‫بیشتر مقادیر اطراف میانگین هستند اما بعض ی از مقادیر کوچکتر و بعض ی‬
‫بزرگتر میباشند‪.‬‬
‫ چقدرا س ت‬75 ‫ا حتما لباالی‬
‫؟‬
Probability student scores higher than 75?
0.08
0.07
Density
0.06
0.05
P(X > 75)
0.04
0.03
0.02
0.01
0.00
55
60
65
70
Grades
75
80
85
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫محاسبة جبری؟‬
‫شخص ی این کار سخت را برای ما انجام داده است‪.‬‬
‫ما تنها به یک جدول احتماالت برای هر توزیع نرمالی نیاز داریم‪.‬‬
‫اما تعداد بینهایت توزیع نرمال وجود دارد (برای هر میانگین و انحراف‬
‫معیاری یک توزیع)‬
‫جواب استانداردکردن ‪ standardize‬میباشد‪.‬‬
‫‪ ‬مقدار ‪ x‬را از میانگین ‪ ‬کم نموده و به انحراف معیار تقسیم کنید‪ .‬نتیجه‬
‫مقدار ‪ z‬میباشد‪ .‬یعنی‪:‬‬
‫‪Z = (X- )/‬‬
‫‪ Z ‬را نرمال استاندارد مینامند‪ .‬میانگین آن ‪ 0 ‬و انحراف معیاری برابر با‬
‫‪ 1‬دارد‪.‬‬
‫‪ ‬سپس از جدول احتمال برای ‪ z‬استفاده میشود‪.‬‬
‫ا ستفاد هاز جدو ل‬
Standard Normal Curve
z
0.4
Density
0.3
0.2
Tail probability
P(Z > z)
0.1
0.0
-4
-3
-2
-1
0
Z
1
2
3
4
70 ‫ و‬65 ‫ا حتما لبی ن‬
‫چ یست؟‬
0.08
0.07
Density
0.06
0.05
P(65 < X < 70)
0.04
0.03
0.02
0.01
0.00
55
60
65
70
Grades
75
80
85
65 ‫ا حتما لز یر‬
‫چ یست؟‬
0.08
0.07
Density
0.06
0.05
0.04
0.03
0.02
P(X < 65)
0.01
0.00
55
65
75
Grades
85
‫‪ ‬احتماالت محاسبهشده دقیق هستند تنها اگر فروض ایجادشده به طور‬
‫واقعی درست باشند‪.‬‬
‫‪ ‬وقتی محاسبات فوق را انجام میدهید‪ ،‬فرض شما این است که دادهها به‬
‫طور نرمال توزیع شده باشند‪.‬‬
‫ا‬
‫‪ ‬همیشه این فرض را چک کنید! (بعدا یاد خواهیم گرفت)‬
‫ة‬
‫ع یتبزر گتر‪،‬از ی کنمون‬
‫‪ ‬برای دانست نخصو صیات ی ک جم‬
‫ا ی ید‪.‬‬
‫تصادفیا ستفاد هنم‬
‫دورا هبراییادگیری در‬
‫م ورد ی ک جمعیت‬
‫‪ ‬فواصل اطمینان‬
‫‪ ‬آزمون فرضیه‬
‫‪ ‬اجازه دهید که با استفاده از دادههای نمونه‪ ،‬مقادیر جمعیت مانند‬
‫میانگین یا نسبتهای واقعی را برآورد نماییم‪.‬‬
‫‪ ‬مثال‪ :‬متوسط واقعی زمانی که دانشجویان در آخر هفته مطالعه میکنند‪،‬‬
‫چقدر است؟‬
‫‪ ‬به ما اجازه دهید که با استفاده از دادههای نمونه‪ ،‬یک ادعا در مورد یک‬
‫ا‬
‫جمعیت را آزمون نماییم‪ .‬مثال اینکه نسبتی از جمعیت یا میانگین جمعیت‬
‫برابر با یک عدد است‪.‬‬
‫‪ ‬مثال‪ :‬آیا مقدار واقعی متوسط مطالعة دانشجویان در آخر هفته ‪20‬‬
‫دقیقه است؟‬
‫اید هعم و م ی آز م و ن‬
‫فرضیه‬
‫‪ ‬یک فرض ابتدایی بسازید‪.‬‬
‫‪ ‬شواهد را جمعآوری کنید (دادهها)‬
‫‪ ‬بر اساس شواهد موجود‪ ،‬تصمیم بگیرید که آیا فرض اولیه قابل قبول‬
‫است یا خیر‪.‬‬
‫‪ ‬آیا متوسط نمره ‪7/2‬‬
‫است؟‬
‫چقدر احتمال دارد که ‪100‬‬
‫دانشجو دارای متوسط نمرهای‬
‫به اندازة ‪ 9/2‬باشند اگر متوسط‬
‫جمعیت ‪ 7/2‬باشد؟‬
‫جمعیت ‪ 5‬میلیون دانشجوی‬
‫کالج‬
‫نمونة ‪ 100‬دانشجو‬
‫مثا ل‪5‬‬
‫تصمیمگ ی‬
‫ری‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫آن محتمل یا غیرمحتمل است که ما شواهدی داشته باشیم که فرض‬
‫اولیة ما را تأیید یا رد کند‪.‬‬
‫(توجه‪ :‬محتمل یا غیرمحتمل با محاسبة احتمال مشخص میشود)‬
‫اگر محتمل باشد‪ ،‬آنگاه ما فرض اولیة خود را رد نمیکنیم‪ .‬یعنی شواهد‬
‫کافی برای چیز دیگر نداریم‪.‬‬
‫اگر غیرمحتمل باشد‪ ،‬آنگاه‪:‬‬
‫◦ یا فرض اولیة ما درست است و ما یک حادثة غیرمعمول را تجربه میکنیم‪.‬‬
‫◦ یا فرض اولیة ما نادرست است‪.‬‬
‫‪ ‬در آمار‪ ،‬اگر غیرمحتمل باشد‪ ،‬ما تصمیم به رد فرض اولیه میگیریم‪.‬‬
‫ة آز م و ن‬
‫اید‬
‫فرضیه‬
‫‪ ‬اول دو فرضیه ارائه میکنیم‪ ،‬فرضیة صفر‬
‫‪the null hypothesis (“H0”) ‬‬
‫‪ ‬و فرضیة جایگزین‬
‫‪and the alternative hypothesis (“HA”) ‬‬
‫◦‬
‫◦‬
‫‪H0:‬خوانده گناهکار نیست‬
‫‪HA:‬خوانده گناهکار است‬
‫ا یی‬
‫اس‬
‫شن‬
‫ها‬
‫فر ضیه‬
‫‪ ‬فرضیه صفر همیشه نشاندهندة وضعیت موجود میباشد یعنی فرضیهای‬
‫که نیازمند هیچ تغییری در رفتار جاری ندارد‪.‬‬
‫‪ ‬فرضیه جایگزین‪ ،‬نتیجهای است که محقق سعی دارد آن را بدست آورد‪.‬‬
‫‪ ‬در آمار‪ ،‬دادهها همان شواهد هستند‪.‬‬
‫‪ ‬سپس فرض اولیه ساخته میشود‬
‫◦ خوانده‪ ،‬بیگناه است تا وقتی که ثابت شود‪ ،‬گناهکار است‪.‬‬
‫‪ ‬درآمار‪ ،‬ما همیشه فرض میکنیم فرضیة صفر درست است‪.‬‬
‫‪ ‬سپس یک تصمیم بر اساس شواهد موجود بگیرید‪.‬‬
‫◦ اگر شواهد کافی وجود داشت (ماورای شک منطقی)‪ ،‬فرضیة صفر رد میشود‪.‬‬
‫(خوانده گناهکار است)‪.‬‬
‫◦ اگر شواهد کافی وجود نداشته باشد‪ ،‬فرضیة صفر رد نمیشود (خوانده گناهکار‬
‫نیست)‬
‫‪ ‬هیچ تصمیمی مستلزم اثبات فرضیة صفر یا فرضیة جایگزین نمیباشد‪.‬‬
‫‪ ‬ما فقط اظهار میداریم که شواهد کافی برای حرکت در یک راه یا راه دیگر‬
‫نداریم‪.‬‬
‫‪ ‬این موضوع همیشه در آمار درست است‪ ،‬موضوع این نیست که ما چه‬
‫تصمیمی میگیریم‪ ،‬همیشه شانس این وجود دارد که ما تصمیم اشتباه‬
‫بگیریم‪.‬‬
‫ها در‬
‫خ طا‬
‫آز م و نفر ضیه‬
‫واق عی ت‬
‫فرضیة ج ایگزی ن‬
‫فرضیة صفر‬
‫تصمی م‬
‫‪TYPE II‬‬
‫‪ERROR‬‬
‫‪OK‬‬
‫ع دم رد فرضیة صفر‬
‫‪OK‬‬
‫‪TYPE I‬‬
‫‪ERROR‬‬
‫رد فرضیة صفر‬
‫ار ی ف‪5‬ان وا ع‬
‫تع‬
‫خ طا‬
‫‪ ‬خطای نوع اول‪ :‬فرضیة صفر رد شود درحالیکه درست است‪.‬‬
‫‪ ‬خطای نوع دوم‪ :‬فرضیة صفر رد نشود‪ ،‬وقتی اشتباه است‪.‬‬
‫‪ ‬همیشه شانس ایجاد یکی از این خطاها وجود دارد اما هدف ما باید‬
‫حداقل کردن شانس وقوع این خطاها باشد‪.‬‬
‫‪p-value‬برایتصمیمگیری‬
‫ةکرانی را‬
‫ا چن ی ن نمون‬
‫الیا ستکه م‬
‫ه ندة ا حتم‬
‫اند‬
‫‪p-value ‬نش‬
‫اشد‪.‬‬
‫ة صفردر ستب‬
‫ه یمکردا گرفر ض ی‬
‫هد ه خ وا‬
‫مشا‬
‫اشد‪.‬‬
‫ابرا ی نبی ن صفر و ی ک م یب‬
‫‪p-value ‬ا حتما لا ست‪،‬بن‬
‫‪ ‬نزد ی کبه صفربهمعنای غ یر م حتم لا ست‪.‬‬
‫اشد ( به ط ور م ثا لکمتر از‬
‫ا ی نا گر ‪p-value‬ک وچک ب‬
‫ابر‬
‫‪ ‬بن‬
‫ة صفر رد م یش ود‪.‬‬
‫‪ ، 05/0‬آن گا هفر ض ی‬
‫آز م و نفرضیهبرای‬
‫میانگی ن جمعیت‬
‫آیا متوسط نمره‬
‫‪ 7/2‬است؟‬
‫چقدر احتمال دارد که ‪100‬‬
‫دانشجو دارای متوسط‬
‫نمرهای به اندازة ‪ 9/2‬باشند‬
‫اگر متوسط جمعیت ‪7/2‬‬
‫باشد؟‬
‫‪‬‬
‫جمعیت ‪ 5‬میلیون دانشجوی‬
‫‪ ‬کالج‬
‫نمونة ‪ 100‬دانشجو‬
‫مقاد یر ‪p‬‬
‫چقدر محتمل است که ‪ 100‬دانشجو دارای میانگین نمرهای به اندازة ‪9/2‬‬
‫باشند اگر متوسط جمعیت ‪ 7/2‬باشد؟‬
‫تعیی ن مقادیر‬
‫‪ = 2.7 P‬متوسط نمرات جمعیت = ‪ H0: μ‬‬
‫‪ > 2.7‬متوسط نمرات جمعیت = ‪μ‬‬
‫‪ HA :‬‬
‫اگر ‪ 100‬دانشجو دارای متوسط نمرهای برابر ‪ 9/2‬با انحراف معیار ‪6/0‬‬
‫باشد‪ ،‬مقدار ‪ P‬برابر است با‪:‬‬
‫]) ‪P ( X  2 . 9 )  P [ Z  ( 2 . 9  2 . 7 ) /( 0 . 6 / 100‬‬
‫‪ P [ Z  3 . 33 ]  0 . 0004‬‬
‫تصم یمگی‬
‫ری‬
‫‪ ‬مقدار ‪ P‬کوچک است‪ .‬غیرمحتمل است که ما نمونهای به اندازة‬
‫‪ 9/2‬داشته باشیم اگر متوسط نمرات جمعیت ‪ 7/2‬باشد‪.‬‬
‫‪ ‬فرضیة صفر رد میشود‪ .‬شواهد کافی وجود دارد که متوسط نمرات‬
‫بزرگتر از ‪ 7/2‬باشد‪.‬‬
‫اص طال حا‬
‫ت‬
‫‪2.7 ‬در برابر ‪HA: μ > 2.7‬‬
‫یک آزمون فرضیة دنبالة راست یا یک طرفه نامیده میشود چون مقدار ‪P‬‬
‫مربوط به دنبالة سمت راست است‪.‬‬
‫‪Z = 3.33 ‬‬
‫را آمارة آزمون مینامند‪.‬‬
‫‪ ‬اگر ما فکر کنیم که مقدار ‪ P‬ما کوچک است یعنی کوچکتر از ‪ 05/0‬باشد‪،‬‬
‫آنگاه احتمال اینکه ما یک خطای نوع اول بسازیم برابر ‪ 05/0‬است‪ .‬این‬
‫مقدار را سطح معنیداری آزمون مینامند‪ .‬ما میگوییم ‪ α=0.05‬جاییکه ‪α‬‬
‫سطح معنیداری است‪.‬‬
‫آز م ونهایپارامتری‬
‫‪ ‬آزمونهای ‪ t‬و ‪ F‬عمدهترین آزمونهای آماری برای مقایسۀ میانگین گروهها‬
‫میباشند‪ .‬از آنجا که گروههای مورد بررس ی ممکن است مستقل با همبسته‬
‫باشند بنابراین هر یک از آزمونهای فوق به دو بخش مستقل و همبسته‬
‫تقسیم میشوند‪ .‬تصمیمگیری در مورد اینکه در چه مواقعی باید از آزمونهای‬
‫‪ t‬یا ‪ F‬مستقل یا همبسته استفاده کرد مهمترین مسأله در تحلیل داده های‬
‫کمی است‪.‬‬
‫آیا گروههای مورد بررسی مستقل هستند یا همبسته؟‬
‫مستقلاند‬
‫سه گروه یا بیشتر‬
‫آزمون ‪ F‬مستقل‬
‫همبستهاند‬
‫دو گروه‬
‫آزمون ‪ t‬مستقل‬
‫سه گروه یا بیشتر‬
‫آزمون ‪ F‬همبسته‬
‫دو گروه‬
‫آزمون ‪ t‬همبسته‬
‫پیشفرضهای آزمونهای‬
‫پارامتری‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫آزمونهای پارامتری ‪ T‬و ‪ F‬را با پیش فرضهای زیر میتوان مورد استفاده قرار‬
‫داد‪:‬‬
‫مشاهدات از یک جامعه نرمال انتخاب شده باشند‪.‬‬
‫اطالعاتی که با هم مقایسه میشوند باید تقریبا واریانس یکسانی داشته‬
‫باشند (در نمونههای بزرگ اگر واریانس یک گروه دو برابر دیگری باشد باز هم‬
‫میتوان از آزمونهای پارامتری استفاده نمود)‬
‫دادههای گردآوری شده دارای مقیاس فاصلهای یا نسبتی باشند‪.‬‬
‫اگر اطالعات جمعآوریشده این سه شرط را نداشت میتوان دادههای فوق‬
‫را به غیر پارامتری تبدیل کرد و از روشهای آماری غیرپارامتری استفاده نمود‪.‬‬
‫روش عمده تبدیل دادههای پارامتری به غیرپارامتری‪ ،‬رتبهبندی کردن آنها‬
‫میباشد‪.‬‬
‫الف‪ -‬آزمون‪ :t‬اگر متغیرمستقل یا متغیرگروهبندی تنها دو گروه داشته باشد‪.‬‬
‫(اگر بخواهیم درآمد زنان و مردان را با هم مقایسه کنیم)‬
‫ب‪ -‬آزمون ‪( F‬تحلیل واریانس ‪)ANOVA‬‬
‫‪ ‬اگر تعداد گروهها بیش از دو باشد‪.‬‬
‫(اگر بخواهیم میزان درآمد گروههای شغلی کارگر‪ ،‬کارمند و کشاورز را با هم‬
‫مقایسه کنیم)‬
‫‪ ‬نکته‪ :‬آزمون ‪ F‬تنها معنیداری تفاوت بین میانگین گروهها را مورد بررس ی قرار‬
‫میدهد اما مشخص نمیکند که این تفاوتها در بین کدامیک از گروههای‬
‫مورد بررس ی وجود دارد‪ .‬به همین دلیل برای ایک که بدانیم تفاوتهای‬
‫بدستآمده در بین کدامیک از طبقات وجود دارد و از این طریق مقایسهای‬
‫بین گروهها انجام گیرد‪ ،‬باید از آزمون شفه (‪ )Scheffe test‬یا ‪ LSD‬و یا‬
‫از آمارههایی نظیر توکی ‪Tukey‬یا دانکن ‪ Duncan‬استفاده کرد‪ .‬این‬
‫آزمونها میانگین زوجها را با همدیگر به صورت دوبدو مقایسه کرده و وجود‬
‫اختالف معنیدار بین آنها را نشان میدهد‪.‬‬
‫ها‬
‫ای نرو شک ل واریان س م وج ود در ی ک مجم وعهاز داد ه‬
‫کند‬
‫رابه دوبخ شتقسیم م ی‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫بخش ی از این واریانس ممکن است بخاطر شانس و تصادف حادث شده باشد و‬
‫بخش دیگر ممکن است ناش ی از دالیل یا عوامل خاص ی باشد‪ ،‬از طرف دیگر‬
‫واریانس موجود ممکن است ناش ی از تفاوت بین گروههای مورد مطالعه و یا‬
‫بخاطر تفاوت موجود در درون نمونهها حادث شده باشد‪.‬‬
‫مهمترین اصل در تحلیل واریانس (‪ )ANOVA‬آزمایش تفاوتهای موجود در‬
‫بین میانگینهای جوامع یا گروههای مورد مطالعه از طریق بررس ی میزان‬
‫واریانس بین گروهها نسبت به واریانس درون گروههاست‪.‬‬
‫در واریانس درون جامعه فرض بر این است که تفاوت بین مقدار نسبت به‬
‫میانگین جامعه بخاطر شانس است در حالیکه در بررس ی تفاوتهای بین جوامع و‬
‫گروهها‪ ،‬فرض بر این است که تفاوت بین میانگین جامعه یا نمونۀ ‪j‬ام با‬
‫میانگین کل به دلیل عوامل خاص میباشد‪ .‬بنابراین زمانی که از تحلیل واریانس‬
‫استفاده میشود فرض میگردد که هر یک از نمونهها از یک جامعه نرمال‬
‫انتخاب شدهاند و هر یک از این جوامع نیز واریانس برابری دارند همچنین فرض‬
‫میشود کلیه عوامل بجز عواملی که مورد مطالعه میباشند تحت کنترل هستند‪.‬‬
‫نکته‪5‬‬
‫‪‬‬
‫در تحلیل واریانس‪ ،‬اگر در بین میانگین گروههای مختلف تفاوت معنیداری وجود‬
‫داشته باشد تنها از طریق ‪ ANOVA‬نمیتوان محل این تفاوتها را بدست آورد‪.‬‬
‫‪‬‬
‫اگر به مقایسۀ سه گروه ‪ C ،B ،A‬بپردازیم و تفاوت معنیداری در بین آنها وجود‬
‫داشته باشد نمیتوانیم قضاوت کنیم که آیا این تفاوتها بین ‪ A‬و ‪ B‬است یا بین‬
‫‪ B‬و ‪ C‬یا بین ‪ A‬و ‪.C‬‬
‫‪‬‬
‫در چنین مواقعی نباید از طریق آزمون ‪ t‬به مقایسه دوبدو گروهها پرداخت‪ ،‬زیرا هر‬
‫قدر تعداد دفعاتی که آزمون ‪ t‬انجام میگیرد بیشتر باشد سطح اطمینان نتایج پائین‬
‫میآید‪.‬‬
‫(در این موارد باید از آزمونهائی مانند آزمون شفه‪ ،‬آزمون چنددامنه دانکن‪ ،‬آزمون‬
‫توکی و آزمون استیودنت نیومن‪ ،‬کیول برحسب ضرورت استفاده کرد‪.‬‬
‫‪‬‬
‫تحلیل واریانس یکطرفه‪:‬‬
‫‪One-way Analysis of Variance‬‬
‫اگر محقق تنها یک متغیر (درآمد) را انتخاب کند و بخواهد تفاوت بین‬
‫طبقات یا گروههای مختلف را بررس ی کند در این صورت از تحلیل‬
‫واریانس یکطرفه استفاده میکند‪.‬‬
‫ت حلی ل واریان س دوطرفه‪5‬‬
‫‪Two way Analysis of Variance‬‬
‫هد اثر دو عا م ل را بر روی ی ک متغیر وابسته‬
‫اگر م حق ق بخ وا‬
‫برر س یکندبایدازت حلی ل واریان س دوطرفها ستفاد هکند‪.‬‬
‫ارامتری‬
‫آز م و ن غ یرپ‬
‫ا‬
‫ی‬
‫‪ ‬همانطوری که قبال نیز بحث گردید آزمونهای پارامتر عالوه بر این که نیاز‬
‫به دادههائی از نوع فاصلهای دارند باید از برخی از پیش فرضهای اولیه نیز‬
‫برخوردار باشند (نرمال بودن توزیع در جامعه و داشتن واریانس یکسان در‬
‫مواردی که دو یا چند جامعه با هم مورد مقایسه قرار میگیرند و ‪)...‬‬
‫‪ ‬اما در آزمونهای غیرپارامتری چنین پیشفرضهائی مطرح نبوده و زمانی که‬
‫دادهها در سطح اسمی و یا ترتیبی باشد و یا در صورتیکه گروههای مورد‬
‫مطالعه از واریانس نابرابر و یا از چولگی برخوردار باشند باید از آزمونهای‬
‫غیرپارامتری استفاده کرد‪ .‬این آزمونها از ویژگیهائی برخوردار هستند که‬
‫آنها را از آزمونهای پارامتری متمایز کرده است‪:‬‬
‫‪ .1‬این آزمونها هیچکدام از پیشفرضهای مطرح شده در آزمونهای پارامتری‪،‬‬
‫نظیر نرمال بودن جامعه و یا برابر بودن واریانس گروهها را مبنا قرار‬
‫نمیدهد و حتی در صورت صادق نبودن مفروضات فوق در خصوص‬
‫دادههای فاصلهای به منظور استفاده از آزمونهای پارامتری امکان تبدیل‬
‫داده های فوق به دادههای غیرپارامتری و رتبهای و محاسبه آزمونهای‬
‫ناپارامتری وجود دارد‪.‬‬
‫‪ .2‬از آنجا که در این آزمونها از مقادیر رتبهای و حتی دادههای اسمی استفاده‬
‫میگردد‪ ،‬بنابراین محاسبۀ آنها کار سادهای است‪.‬‬
‫‪ .3‬این آزمونها در مقایسه با آزمونهای پارامتری از دقت باالئی برخوردار‬
‫نمیباشند‪ .‬دلیل آن این است که با تبدیل دادههای فاصلهای به مقادیر‬
‫رتبهای‪ ،‬فواصل واقعی موجود در بین دادهها به فواصل یکسان بین‬
‫رتبهها تبدیل شده و در این فرآیند بخش ی از اطالعات ناپدید میگردند به‬
‫عبارت دیگر با تبدیل مقادیر اصلی و واقعی به مقادیر رتبهای‪ ،‬بدلی از‬
‫واقعیت ساخته میشود و این بدل بدستآمده به جای واقعیت مورد‬
‫زمانی که دادهها به صورت همبسته باشند مورد استفاده قرار میگیرد‪.‬‬
‫‪ .2‬آز م و ن م ک‬
‫نمار‪5‬‬
‫ار برده میش ودکه داد هها به صورتا سمی‬
‫‪‬اغل ب در م واردیبک‬
‫اهم بسته‬
‫و مر ب وط به دو نمونه مرت بط بهم (‪ )Two related‬ی‬
‫اشند‬
‫ب‬
‫ا یسه‬
‫قبلی وبعدیافراد را م ورد مق‬
‫ه یمن ظرات‬
‫انیکهبخ وا‬
‫(ز م‬
‫ه یم)‬
‫قرار د‬
‫‪ ‬مثااال‪ .1‬ابتاادا در مااورد یااک موضااوع نظاار اف اراد را بااه صااورت موافااق یااا مخااالف‬
‫جوی ااا میش ااویم ااس از آن نس اابت ب ااه برگ ازاری ک ااالس آموز ا ی اق اادام م اایکنیم‬
‫(یاجلس ا ااۀ ت ا ااوجی ی) و س ا اارس دوب ا اااره نظ ا اار اف ا اراد را نس ا اابت ب ا ااه موض ا ااوع جوی ا ااا‬
‫میشویم‪ .‬در اینجا فرض صفر (‪ )Ho‬این است که تفاوتی باین نظارات افاراد در‬
‫قبل و س از اجرای برنامه (دورۀ آموز ی) وجود ندارد‪.‬‬
‫‪ ‬مث ااال‪ .2‬نظا ارات ‪ 1000‬نف اار درب اااره خری ااد و ع اادم خری ااد ی ااک ک ااا قب اال و بع ااد از‬
‫برگزاری برنامه تبلیغاتی و معرفی کا پرسیده شده است با ایان آزماون میتاوان‬
‫مشخص نمود که آیا برنامه تبلیغاتی در تغییر نگرش مشاتریان ما ر باوده اسات‬
‫یا خیر‪.‬‬
‫کس و ن‬
‫‪ .3‬آز م و ن ویلکا‬
‫‪Wilcoxon Test‬‬
‫‪ ‬در بسیاری از پژوهشهائی که نمونهها به صورت جفت شده و همبسته‬
‫هستند ممکن است محقق بخواهد هم جهت تغییر و هم میزان تغییر را‬
‫مورد بررس ی قرار دهد‪ ،‬برای این منظور آزمون ویلکاکسون تست مناسبی‬
‫است‪.‬‬
‫‪ ‬داده های مورد استفاده در این آزمون حداقل باید در سطح ترتیبی باشند‪.‬‬
‫‪ ‬مثال‪ :‬نظر تعدادی از مشتریان در رابطه با دو نوع کاالی مشابه اما با‬
‫مارکهای متفاوت از نظر کیفیت محصول سؤال شده است‪.‬‬
‫‪ .4‬آز م و نفرید م ن‬
‫‪Fridman Test‬‬
‫‪ ‬آزمون فریدمن یکی از آزمونهای غیرپارامتری است این آزمون در واقع معادل‬
‫آزمون ‪ F‬در روشهای پارامتری میباشد اما در اینجا برخالف آزمون ‪،F‬‬
‫فرض توزیع نرمال و برابر بودن واریانس ضرورتی ندارد‪.‬‬
‫‪ ‬این روش برای مقایسه سه گروه یا بیشتر از سه گروه همبسته بکار میرود‪.‬‬
‫‪ ‬مثال‪ :‬نظرات ‪ 30‬نفر از فراگیران را درخصوص سه روش مختلف تدریس‬
‫جویا شدهایم و پاسخها نیز از ‪( 1‬بسیار نامناسب) تا ‪( 5‬بسیار مناسب)‬
‫امتیازبندی شدهاند‪.‬‬
‫‪ .5‬آز م و ن‬
‫کرا ن‬
‫کو‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫یکی از روشهای ناپارامتری و درواقع تعمیمیافته آزمون مک نمار است با این‬
‫تفاوت که این روش برای مواردی که تعداد گروهها یا تکرار سه یا بیشتر از‬
‫سه باشد بکار میرود‪ :‬دادههای این آزمون به صورت اسمی میباشد و وجود‬
‫تفاوت بین نظرات افراد را مورد بررس ی قرار میدهد‪.‬‬
‫مثال‪ :‬نظرات افراد نسبت به یک موضوع در زمانهای مختلف پرسیده میشود‬
‫(موافقت – مخالفت)‬
‫ قبل از برگزاری یک دورۀ آموز ی‬‫(موافقت – مخالفت)‬
‫ بعد از برگزاری دوره‬‫(موافقت – مخالفت)‬
‫‪ -‬بعد از اجرای عملی محتویات دوره‬
‫‪ .6‬آز م و ن م ن ‪ -‬ویتن ی‬
‫‪Mann – Whitney Test‬‬
‫‪ ‬برای مقایسه میانگینهای دو جامعه مستقل زمانی که دادهها به صورت‬
‫رتبهای یا ترتیبی باشند مورد استفاده قرار میگیرد‪.‬‬
‫‪ ‬مثال‪ :‬فرض کنید دو گروه ‪ 30‬نفره از فراگیران با دو روش متفاوت آموزش‬
‫دیده و نتیجه ارزیابی آنها از دورههای فوق در قالب امتیازات ‪ 1‬تا ‪ 5‬گردآوری‬
‫شده است‪.‬‬
‫‪ .7‬آز م و نک ولم وگرو ف ‪-‬ا سمیرن ف‬
‫– ‪Kolmogrov‬‬
‫‪Smirnov Test‬‬
‫‪ ‬چنانچه در بحث کایاسکوئر گفته شد اگر فراوانیهای مورد انتظار بیش از‬
‫‪ 20‬درصد خانههای جدول‪ ،‬کمتر از ‪ 5‬باشد‪ ،‬در این صورت نمیتوان از‬
‫فرمول کایاسکوئر استفاده کرد‪ ،‬این مشکل معمو زمانی پیش میآید که‬
‫حجم نمونه کمتر از ‪ 50‬باشد و یا تعداد خانههای جدول بیشتر باشد‪ .‬در‬
‫چنین حالتی میتوان از تست کوملوگرف ‪ -‬اسمیرنف استفاده کرد‪ .‬اساس این‬
‫آزمون مقایسه فراوانی تجمعی نسبی مشاهده شده با فراوانی تجمعی نسبی‬
‫مورد انتظار میباشد‪.‬‬
‫‪ .8‬آز م و نکرو سکا ل ‪ -‬والی س ‪Kruskal – Wallis‬‬
‫‪Test‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫این آزمون در واقع معادل تحلیل واریانس یکطرفه میباشد‪ ،‬اما برخالف آن‬
‫نیازی به مفروضات آن نظیر اینکه نمونهها از یک جامعۀ نرمال بدستآمده‬
‫باشند و یا اینکه انحراف معیار یکسانی داشته باشند وجود ندارد‪ .‬آزمون‬
‫کروسکال والیس زمانی استفاده میشود که تعداد نمونهها بیش از دو گروه‬
‫باشد‪.‬‬
‫مثال‪ :‬از ‪ 90‬نفر دانشجو در سه رشته مختلف درخواست شد تا کیفیت‬
‫برنامههای آموزش ی دانشکده را ارزیابی کنند‪ .‬امتیازات ارائه شده توسط‬
‫افراد فوق از ‪( 1‬بسیار ضعیف) تا ‪( 5‬بسیار قوی) در نوسان بوده است‪.‬‬
‫‪ :Ho‬بین نظرات دانشجویان رشتههای مختلف تفاوت معنیداری وجود‬
‫ندارد‪.‬‬
‫این آزمون اگرچه وجود تفاوت بین نظرات گروههای مختلف را نشان‬
‫میدهد اما مشخص نمیکند که این تفاوت در بین کدام یک از گروهها‬
‫‪ .9‬آز م و ن میانه‪Median 5‬‬
‫‪test‬‬
‫‪ ‬یکی دیگر از روشهای غیرپارامتری است که برای مقایسه سه یا بیشتر از سه‬
‫گروه مورد استفاده قرار میگیرد‪ .‬اطالعات مورد نیاز در این روش باید در‬
‫سطح رتبهای بوده و حتیا مکان دادهها همرتبه نباشند‪ ،‬زیرا اگر میانه‬
‫مشترک بین گروهها جزو نمرات تکراری باشد در این صورت تشخیص تفاوت‬
‫گروهها با مشکل مواجه میگردد‪.‬‬
‫‪ ‬مثال‪ :‬میخواهیم بدانیم آیا سرعت عمل کارگران سه شیفت مختلف یک‬
‫کارگاه خیاطی با هم متفاوت است یا خیر؟‬
‫‪ ‬برای این کار تعداد شلوار دوخته شده توسط ‪ 40‬کارگر (از سه شیفت‬
‫مختلف) در یک هفته گردآوری شده است‪.‬‬