Hypothesis Test

Download Report

Transcript Hypothesis Test

‫آزمون فرضیه‬
‫و‬
‫مفهوم ‪P - Value‬‬
‫مثال‬
‫‪‬‬
‫‪‬‬
‫‪ :1‬مقایسه وزن آقایان و خانم ها‬
‫درنظر بگیرید‪ ،‬قصد داشته باشیم وزن آقایان را با وزن خانم ها در‬
‫جامعه مقایسه نماییم‬
‫مسلما ً اندازه گیری وزن تمام آقایان و تمام خانم ها در جامعه مقدور‬
‫نیست اما می توانیم براحتی میانگین وزن آقایان و خانم ها را در‬
‫نمونه ای از جامعه (بعنوان مثال در ‪ 100‬آقا و ‪ 100‬خانم) بدست‬
‫بیاوریم ‪:‬‬
‫• متوسط وزن در ‪100‬خانم ‪ 59 :‬کیلوگرم‬
‫• متوسط وزن در ‪ 100‬آقا ‪ 64 :‬کیلوگرم‬
‫‪‬‬
‫‪‬‬
‫براین اساس مشاهده می کنیم در نمونه مورد بررسی‪ ،‬متوسط وزن‬
‫آقایان بیشتر از خانم ها می باشد‪.‬‬
‫سئوال‪ :‬آیا این تفاوت صرفا ً بدلیل شانس می باشد یا اینکه آقایان‬
‫واقعا ً از خانم ها سنگین تر می باشند؟‬
‫مثال‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ :2‬فشارخون در دانشجویان‬
‫فشارخون سیستولیک طی سال اول و دوم دوره دانشکده افزایش می یابد‪.‬‬
‫برای اثبات این موضوع باید فشار خون تمامی دانشجویان سال اول و دوم‬
‫را اندازه گیری نموده و سپس با هم مقایسه نماییم‪.‬‬
‫منتهی قادر به اندازه گیری فشارخون سیستولیک تمام دانشجویان سال اول‬
‫و دوم نیستیم‪.‬‬
‫لذا بطور تصادفی ‪ 5‬دانشجو را از هر سال انتخاب کرده وفشار خون آنها‬
‫را اندازه گیری می نماییم‪.‬‬
‫(‪)Mean=99‬‬
‫دانشجویان سال اول‪95 ،110 ،90 ،80 ،120 :‬‬
‫دانشجویان سال دوم‪)Mean=124( 115 ،125 ،145 ،130 ،105 :‬‬
‫سئوال‪ :‬آیا براساس این مشاهدات می توان نتیجه گرفت که واقعا ً ‪ SBP‬در‬
‫دانشجویان سال دوم باالتر از دانشجویان سال اول می باشد؟‬
‫فرضیه‬
‫‪ ‬سئوال ‪ :1‬آیا این تفاوت صرفا ً بدلیل شانس می باشد یا اینکه‬
‫آقایان واقعا ً از خانم ها سنگین تر می باشند؟‬
‫‪ ‬سئوال ‪ :2‬آیا واقعا ً فشارخون سیستولیک در دانشجویان سال دوم‬
‫باالتر از دانشجویان سال اول می باشد؟‬
‫‪ ‬با مطرح نمودن فرضیه و انجام آزمون ‪ ،‬به سئواالت فوق پاسخ‬
‫داده می شود‪.‬‬
‫فرضیه‬
‫‪ ‬پیش گویي رابطه یك یا چند عامل با مسئله مورد مطالعه‬
‫مي باشد كه از طریق آزمایش علمي صحت یا سقم آن‬
‫تعیین مي گردد‪.‬‬
‫‪ ‬حدس عالمانه اي كه بر اساس تجربه یا بررسي پیشینة‬
‫موضوع مورد بررسي توسط محقق بیان مي شود‪.‬‬
‫انواع فرضیه‬
‫‪ ‬با دو نوع فرضیه این موضوع پیگیری می شود‪ :‬فرضیه صفر(‪)H0‬‬
‫و فرضیه آلترناتیو (‪)H1‬‬
‫‪ ‬هریک از این فرضیه ها نشاندهنده دو سر طیف استدالل می باشند‪.‬‬
‫‪ :Null hypothesis ‬تفاوت مشاهده شده بعلت شانس می باشد ؛‬
‫بعبارت دیگر تفاوت واقعی وجود ندارد‪:‬‬
‫بین دو جمعیت تفاوتی وجود ندارد‬
‫ارتباطی بین مواجهه با عامل خطر و بیماری وجود ندارد‬
‫درمان تاثیری ندارد‬
‫فرضيه صفر یا فرضيه آماري (‪: )H0‬‬
‫در این نوع فرضيه هرگونه تفاوت یا ارتباط بين متغيرها رد مي شود‪.‬‬
‫انواع فرضیه‬
‫‪‬‬
‫‪ :Alternative hypothesis‬تفاوت واقعی وجود دارد‪.‬‬
‫‪‬‬
‫بعبارت دیگر‪ :‬دو جمعیت با یکدیگر تفاوت دارند‪.‬‬
‫بین مواجهه با عامل خطر و بیماری ارتباط وجود دارد‬
‫درمان موثر است‬
‫فرضيه آلترناتيو یا فرضيه تحقيق (‪: )H1‬‬
‫پيش بيني و جهت گيري محقق را نشان مي دهد‪،‬‬
‫و چيزی است که محقق می خواهد آن را ثابت نماید‪.‬‬
‫فرضیه ‪ -‬مثال‬
‫‪ ‬در رابطه با مقایسه وزن آقایان با خانم ها‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪ – H0‬وزن خانم ها و آقایان یکسان است‪.‬‬
‫‪ – H1‬آقایان سنگین تر از خانم ها می باشند‪.‬‬
‫‪ ‬در رابطه با مقایسه ‪ SBP‬دانشجویان سال اول و دوم‪:‬‬
‫‪H0 -Mean SBP in Year1– Mean SBP in Year 2 = 0‬‬
‫‪ H1 -Mean SBP in Year1– Mean SBP in Year 2 ≠ 0‬‬
‫‪‬‬
‫فرضیه ‪ -‬مثال‬
‫‪ ‬در رابطه با مقایسه وزن آقایان با خانم ها‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪ – H0‬وزن خانم ها و آقایان یکسان است‪.‬‬
‫‪ – H1‬وزن خانم ها و آقایان متفاوت است‪.‬‬
‫‪ ‬در رابطه با مقایسه ‪ SBP‬دانشجویان سال اول و دوم‪:‬‬
‫‪H0 -Mean SBP in Year1= Mean SBP in Year 2‬‬
‫‪ H1 -Mean SBP in Year1≠ Mean SBP in Year 2‬‬
‫‪‬‬
‫پارامتر و آماره‬
‫‪ ‬پارامتر عبارت است یک مقدار واقعی در جمعیت مورد‬
‫نظر‬
‫‪ ‬آماره مقداری است که از طریق محاسبه از داده های‬
‫مربوط به نمونه و به منظور تخمین زدن پارامتر بدست‬
‫می آید‪.‬‬
‫‪ ‬مثال ‪:1‬‬
‫‪ ‬پارامتر– میانگین وزن تمام آقایان و تمام خانم ها‬
‫‪ ‬آماره – متوسط وزن ‪ 100‬آقا و ‪ 100‬خانم‬
‫پارامتر و آماره‬
‫‪ ‬مثال ‪:2‬‬
‫‪ ‬پارامتر–متوسط فشارخون سیستولیک تمام دانشجویان سال‬
‫اول و تمام داشجویان سال دوم‬
‫‪ ‬آماره –متوسط فشارخون ‪ 5‬دانشجوی سال اول و ‪5‬‬
‫دانشجوی سال دوم که بطور تصادفی انتخاب شده اند‪.‬‬
‫آزمون فرضیه‬
‫‪ ‬همواره این سئوال مطرح است چگونه می توان مشخص نمود که‬
‫مقادیربدست آمده از نمونه ( آماره) با واقعیت (پارامتر) متفاوت است‬
‫یا خیر؟‬
‫مثال‪:‬‬
‫‪ ‬چگونه می توان تفاوت بین میانگین فشارخون دانشجویان سال اول و‬
‫سال دوم را توضیح داد؟‬
‫‪ (1‬تفاوت واقعی ‪ :‬میانگین فشارخون در دو جمعیت متفاوت است‪.‬‬
‫‪ (2‬تغییرات تصادفی‪ :‬دو جمعیت میانگین های یکسانی دارند و تفاوت‬
‫مشاهده شده بعلت نمونه برداری تصادفی است (بعلت شانس)‬
‫‪ (3‬خطای نمونه برداری (سوگیری)‪ :‬نمونه های انتخاب شده ناکافی‬
‫(نماینده جمعیت نمی باشند‪).‬‬
‫آزمون فرضیه‬
‫‪‬‬
‫اگر نمونه ها با روشهای احتمالی انتخاب شده باشند‪ ،‬آزمون‬
‫فرض و آماره به ما کمک می کنند ‪ ،‬نتیجه بگیریم که آیا‬
‫تفاوت مشاهده شده بعلت تغییرات تصادفی (شانس) بوده یا‬
‫ناشی از تفاوت واقعی بین گروه ها است‪.‬‬
‫‪‬‬
‫آزمون فرضیه و آماره‪ ،‬نمی توانند به ما بگویند که نتایج‬
‫بدست آمده بعلت خطای نمونه برداری (سوگیری) است‪.‬‬
‫آزمون فرضیه‬
‫‪‬‬
‫تعریف فرضیه های صفر و آلترناتیو‬
‫انتخاب آزمون آماری مناسب به منظور ارزیابی فرضیه ها‬
‫آزمون آماری تفاوت بین آنچه ما در داده هایمان مشاهده‬
‫نمودیم و آنچه در صورت حقیقت داشتن فرضیه صفر مورد‬
‫انتظار است را اندازه گیری می نماید‪.‬‬
‫‪‬‬
‫اساس روش آزمون فرضیه این است که ابتدا فرضیه صفر‬
‫را صحیح درنظر گرفته و سپس این احتمال محاسبه می شود‬
‫که نتایج مشاهده شده چقدر با فرضیه صفر همگونی و‬
‫همخوانی دارد‪.‬‬
‫) ‪( p-value‬‬
‫‪‬‬
‫‪‬‬
‫‪P-value‬‬
‫‪‬‬
‫‪ p-value‬نشان می دهد با فرض صحیح بودن فرضیه صفر‬
‫چقدر احتمال دارد نتایج مشاهده شده و بدست آمده با این‬
‫فرض همگونی داشته باشند‪.‬‬
‫‪‬‬
‫براساس ‪ ، p-value‬تصمیم گرفته می شود که فرضیه‬
‫صفر رد شود یا خیر‪.‬‬
‫‪‬‬
‫‪‬‬
‫اگر مقدار این احتمال بزرگ باشد‪ ،‬تفاوت مشاهده شده ناشی از‬
‫شانس بوده و جعلی می باشند‪ ،‬بنابراین نتایج با فرضیه صفر‬
‫همخوانی داشته و فرضیه صفر قبول می شود‪.‬‬
‫اگر این احتمال کوچک باشد فرضیه صفر رد شده و فرضیه‬
‫جایگزین پذیرفته می شود‪.‬‬
Interpretation of P-value





P-value: the probability of observing the test statistic
value (or one more extreme) if the null hypothesis were
true
A large p-value implies that the value of the test statistic
is likely supporting the idea that the observed difference
is due to chance variation.
A small p-value implies the observed value of the test
statistic is unlikely, supporting the idea that this
difference is not just due to chance variation.
Typical (and arbitrary) rule of thumb: If the p-value is
less than 0.05, we reject the null hypothesis and
conclude there is a real difference.
Another way to say this is: the difference is
statistically significant.
‫نکاتی در مورد ‪P-value‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫یک نتیجه معنی دار آماری ‪ ،‬الزاما ً به این مفهوم نیست که‬
‫نتایج از نظر بالینی نیز معنا دارند‪.‬‬
‫بعبارت دیگرباید بین معناداری آماری ومعناداری بیولوژیک‬
‫یا بالینی تفاوت قائل شد‪.‬‬
‫حتی یک تفاوت خیلی کوچک که از نظر بالینی معنادار‬
‫نیست‪ ،‬در صورتی که حجم نمونه به اندازه کافی زیاد باشد‬
‫از نظر آماری معنا دار می شود‪.‬‬
‫مثال ‪:‬‬
‫‪‬‬
‫‪‬‬
‫درنظر بگیرید که قصد داریم یک داروی پایین آورنده کلسترول خون‬
‫را ارزیابی کنیم‪:‬‬
‫در این پژوهش متوجه شده ایم افرادی که دارو را دریافت کرده اند‪،‬‬
‫سطح کلسترول خون شان تا ‪ 5‬درجه بیشتر از آنهایی که دارو نگرفته‬
‫اند کاهش یافته است‪ .‬این یافته با ‪ p-value‬کمتر از ‪ 0.05‬همراه‬
‫است‪ .‬متخصصین آمار معتقدند این تفاوت از نظر آماری معنی دار‬
‫است‪.‬‬
‫در حالیکه متخصصین بالینی چندان به این موضوع امیدوار نیستند‪.‬‬
‫آنها اعتقاد دارند که این میزان کاهش کلسترول در جهت جلوگیری از‬
‫پیامدهای قلبی تاثیر گذار نمی باشد‪ .‬از اینرو از نظر بالینی تفاوت‬
‫معنی داری وجود ندارد‪.‬‬
‫‪Type I and Type II Errors‬‬
‫‪‬‬
‫هنگامی که تصمیم داریم فرضیه صفر را رد یا قبول نماییم‪،‬‬
‫همیشه این شانس وجود دارد که مرتکب خطا شویم‪.‬‬
‫‪‬‬
‫خطای نوع اول‪ :‬رد نمودن فرضیه صفر هنگامی که صحیح‬
‫است‪( .‬بیان تفاوت هنگامی که تفاوتی وجود ندارد)‬
‫‪‬‬
‫خطای نوع دوم‪ :‬عدم رد فرضیه صفر هنگامی که غلط است‪.‬‬
‫(ناتوانی در نشان دادن تفاوت هنگامی که تفاوت وجود دارد)‬
‫‪Type I and Type II Errors‬‬
‫‪‬‬
‫چهار حالت ممکن است در آزمون فرضیه رخ دهد‪:‬‬
‫حقیقت‬
‫‪ H0‬غلط است‬
‫‪Correct‬‬
‫‪decision‬‬
‫‪Type II error‬‬
‫(‪(β‬‬
‫‪ H0‬صحیح است‬
‫‪Type I error‬‬
‫(‪(α‬‬
‫‪Correct‬‬
‫‪decision‬‬
‫‪ H0‬رد می شود‬
‫تصمیم براساس‬
‫نمونه‬
‫‪ H0‬رد نمی گردد‬
‫تمرین‬
‫‪‬‬
‫مثال ‪:1‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ :1‬مقایسه وزن آقایان و خانم ها‬
‫‪ – H0‬وزن خانم ها و آقایان یکسان است‪.‬‬
‫‪ – H1‬اقایان سنگین تر از خانم ها می باشند‪.‬‬
‫در آزمون آماری ‪ p-value = 0.07‬بدست آمده است‪ .‬تفسیر‬
‫شما چیست؟‬
‫ فشارخون در دانشجویان‬:2
‫تمرین‬
:2 ‫ مثال‬
H0 -Mean SBP in Year1– Mean SBP in Year 2 = 0
 H1 -Mean SBP in Year1– Mean SBP in Year 2 ≠ 0

‫ تفسیر‬.‫ بدست آمده است‬p-value = 0.03 ‫در آزمون آماری‬
‫شما چیست؟‬

‫تمرین ‪:3‬‬
‫خطای نوع اول و خطای نوع دوم‬
‫‪ ‬در قضاوت یک قاضی خطای نوع اول و‬
‫خطای نوع دوم چگونه مطرح می شود؟‬