Hypothesis Test
Download
Report
Transcript Hypothesis Test
آزمون فرضیه
و
مفهوم P - Value
مثال
:1مقایسه وزن آقایان و خانم ها
درنظر بگیرید ،قصد داشته باشیم وزن آقایان را با وزن خانم ها در
جامعه مقایسه نماییم
مسلما ً اندازه گیری وزن تمام آقایان و تمام خانم ها در جامعه مقدور
نیست اما می توانیم براحتی میانگین وزن آقایان و خانم ها را در
نمونه ای از جامعه (بعنوان مثال در 100آقا و 100خانم) بدست
بیاوریم :
• متوسط وزن در 100خانم 59 :کیلوگرم
• متوسط وزن در 100آقا 64 :کیلوگرم
براین اساس مشاهده می کنیم در نمونه مورد بررسی ،متوسط وزن
آقایان بیشتر از خانم ها می باشد.
سئوال :آیا این تفاوت صرفا ً بدلیل شانس می باشد یا اینکه آقایان
واقعا ً از خانم ها سنگین تر می باشند؟
مثال
:2فشارخون در دانشجویان
فشارخون سیستولیک طی سال اول و دوم دوره دانشکده افزایش می یابد.
برای اثبات این موضوع باید فشار خون تمامی دانشجویان سال اول و دوم
را اندازه گیری نموده و سپس با هم مقایسه نماییم.
منتهی قادر به اندازه گیری فشارخون سیستولیک تمام دانشجویان سال اول
و دوم نیستیم.
لذا بطور تصادفی 5دانشجو را از هر سال انتخاب کرده وفشار خون آنها
را اندازه گیری می نماییم.
()Mean=99
دانشجویان سال اول95 ،110 ،90 ،80 ،120 :
دانشجویان سال دوم)Mean=124( 115 ،125 ،145 ،130 ،105 :
سئوال :آیا براساس این مشاهدات می توان نتیجه گرفت که واقعا ً SBPدر
دانشجویان سال دوم باالتر از دانشجویان سال اول می باشد؟
فرضیه
سئوال :1آیا این تفاوت صرفا ً بدلیل شانس می باشد یا اینکه
آقایان واقعا ً از خانم ها سنگین تر می باشند؟
سئوال :2آیا واقعا ً فشارخون سیستولیک در دانشجویان سال دوم
باالتر از دانشجویان سال اول می باشد؟
با مطرح نمودن فرضیه و انجام آزمون ،به سئواالت فوق پاسخ
داده می شود.
فرضیه
پیش گویي رابطه یك یا چند عامل با مسئله مورد مطالعه
مي باشد كه از طریق آزمایش علمي صحت یا سقم آن
تعیین مي گردد.
حدس عالمانه اي كه بر اساس تجربه یا بررسي پیشینة
موضوع مورد بررسي توسط محقق بیان مي شود.
انواع فرضیه
با دو نوع فرضیه این موضوع پیگیری می شود :فرضیه صفر()H0
و فرضیه آلترناتیو ()H1
هریک از این فرضیه ها نشاندهنده دو سر طیف استدالل می باشند.
:Null hypothesis تفاوت مشاهده شده بعلت شانس می باشد ؛
بعبارت دیگر تفاوت واقعی وجود ندارد:
بین دو جمعیت تفاوتی وجود ندارد
ارتباطی بین مواجهه با عامل خطر و بیماری وجود ندارد
درمان تاثیری ندارد
فرضيه صفر یا فرضيه آماري (: )H0
در این نوع فرضيه هرگونه تفاوت یا ارتباط بين متغيرها رد مي شود.
انواع فرضیه
:Alternative hypothesisتفاوت واقعی وجود دارد.
بعبارت دیگر :دو جمعیت با یکدیگر تفاوت دارند.
بین مواجهه با عامل خطر و بیماری ارتباط وجود دارد
درمان موثر است
فرضيه آلترناتيو یا فرضيه تحقيق (: )H1
پيش بيني و جهت گيري محقق را نشان مي دهد،
و چيزی است که محقق می خواهد آن را ثابت نماید.
فرضیه -مثال
در رابطه با مقایسه وزن آقایان با خانم ها:
– H0وزن خانم ها و آقایان یکسان است.
– H1آقایان سنگین تر از خانم ها می باشند.
در رابطه با مقایسه SBPدانشجویان سال اول و دوم:
H0 -Mean SBP in Year1– Mean SBP in Year 2 = 0
H1 -Mean SBP in Year1– Mean SBP in Year 2 ≠ 0
فرضیه -مثال
در رابطه با مقایسه وزن آقایان با خانم ها:
– H0وزن خانم ها و آقایان یکسان است.
– H1وزن خانم ها و آقایان متفاوت است.
در رابطه با مقایسه SBPدانشجویان سال اول و دوم:
H0 -Mean SBP in Year1= Mean SBP in Year 2
H1 -Mean SBP in Year1≠ Mean SBP in Year 2
پارامتر و آماره
پارامتر عبارت است یک مقدار واقعی در جمعیت مورد
نظر
آماره مقداری است که از طریق محاسبه از داده های
مربوط به نمونه و به منظور تخمین زدن پارامتر بدست
می آید.
مثال :1
پارامتر– میانگین وزن تمام آقایان و تمام خانم ها
آماره – متوسط وزن 100آقا و 100خانم
پارامتر و آماره
مثال :2
پارامتر–متوسط فشارخون سیستولیک تمام دانشجویان سال
اول و تمام داشجویان سال دوم
آماره –متوسط فشارخون 5دانشجوی سال اول و 5
دانشجوی سال دوم که بطور تصادفی انتخاب شده اند.
آزمون فرضیه
همواره این سئوال مطرح است چگونه می توان مشخص نمود که
مقادیربدست آمده از نمونه ( آماره) با واقعیت (پارامتر) متفاوت است
یا خیر؟
مثال:
چگونه می توان تفاوت بین میانگین فشارخون دانشجویان سال اول و
سال دوم را توضیح داد؟
(1تفاوت واقعی :میانگین فشارخون در دو جمعیت متفاوت است.
(2تغییرات تصادفی :دو جمعیت میانگین های یکسانی دارند و تفاوت
مشاهده شده بعلت نمونه برداری تصادفی است (بعلت شانس)
(3خطای نمونه برداری (سوگیری) :نمونه های انتخاب شده ناکافی
(نماینده جمعیت نمی باشند).
آزمون فرضیه
اگر نمونه ها با روشهای احتمالی انتخاب شده باشند ،آزمون
فرض و آماره به ما کمک می کنند ،نتیجه بگیریم که آیا
تفاوت مشاهده شده بعلت تغییرات تصادفی (شانس) بوده یا
ناشی از تفاوت واقعی بین گروه ها است.
آزمون فرضیه و آماره ،نمی توانند به ما بگویند که نتایج
بدست آمده بعلت خطای نمونه برداری (سوگیری) است.
آزمون فرضیه
تعریف فرضیه های صفر و آلترناتیو
انتخاب آزمون آماری مناسب به منظور ارزیابی فرضیه ها
آزمون آماری تفاوت بین آنچه ما در داده هایمان مشاهده
نمودیم و آنچه در صورت حقیقت داشتن فرضیه صفر مورد
انتظار است را اندازه گیری می نماید.
اساس روش آزمون فرضیه این است که ابتدا فرضیه صفر
را صحیح درنظر گرفته و سپس این احتمال محاسبه می شود
که نتایج مشاهده شده چقدر با فرضیه صفر همگونی و
همخوانی دارد.
) ( p-value
P-value
p-valueنشان می دهد با فرض صحیح بودن فرضیه صفر
چقدر احتمال دارد نتایج مشاهده شده و بدست آمده با این
فرض همگونی داشته باشند.
براساس ، p-valueتصمیم گرفته می شود که فرضیه
صفر رد شود یا خیر.
اگر مقدار این احتمال بزرگ باشد ،تفاوت مشاهده شده ناشی از
شانس بوده و جعلی می باشند ،بنابراین نتایج با فرضیه صفر
همخوانی داشته و فرضیه صفر قبول می شود.
اگر این احتمال کوچک باشد فرضیه صفر رد شده و فرضیه
جایگزین پذیرفته می شود.
Interpretation of P-value
P-value: the probability of observing the test statistic
value (or one more extreme) if the null hypothesis were
true
A large p-value implies that the value of the test statistic
is likely supporting the idea that the observed difference
is due to chance variation.
A small p-value implies the observed value of the test
statistic is unlikely, supporting the idea that this
difference is not just due to chance variation.
Typical (and arbitrary) rule of thumb: If the p-value is
less than 0.05, we reject the null hypothesis and
conclude there is a real difference.
Another way to say this is: the difference is
statistically significant.
نکاتی در مورد P-value
یک نتیجه معنی دار آماری ،الزاما ً به این مفهوم نیست که
نتایج از نظر بالینی نیز معنا دارند.
بعبارت دیگرباید بین معناداری آماری ومعناداری بیولوژیک
یا بالینی تفاوت قائل شد.
حتی یک تفاوت خیلی کوچک که از نظر بالینی معنادار
نیست ،در صورتی که حجم نمونه به اندازه کافی زیاد باشد
از نظر آماری معنا دار می شود.
مثال :
درنظر بگیرید که قصد داریم یک داروی پایین آورنده کلسترول خون
را ارزیابی کنیم:
در این پژوهش متوجه شده ایم افرادی که دارو را دریافت کرده اند،
سطح کلسترول خون شان تا 5درجه بیشتر از آنهایی که دارو نگرفته
اند کاهش یافته است .این یافته با p-valueکمتر از 0.05همراه
است .متخصصین آمار معتقدند این تفاوت از نظر آماری معنی دار
است.
در حالیکه متخصصین بالینی چندان به این موضوع امیدوار نیستند.
آنها اعتقاد دارند که این میزان کاهش کلسترول در جهت جلوگیری از
پیامدهای قلبی تاثیر گذار نمی باشد .از اینرو از نظر بالینی تفاوت
معنی داری وجود ندارد.
Type I and Type II Errors
هنگامی که تصمیم داریم فرضیه صفر را رد یا قبول نماییم،
همیشه این شانس وجود دارد که مرتکب خطا شویم.
خطای نوع اول :رد نمودن فرضیه صفر هنگامی که صحیح
است( .بیان تفاوت هنگامی که تفاوتی وجود ندارد)
خطای نوع دوم :عدم رد فرضیه صفر هنگامی که غلط است.
(ناتوانی در نشان دادن تفاوت هنگامی که تفاوت وجود دارد)
Type I and Type II Errors
چهار حالت ممکن است در آزمون فرضیه رخ دهد:
حقیقت
H0غلط است
Correct
decision
Type II error
((β
H0صحیح است
Type I error
((α
Correct
decision
H0رد می شود
تصمیم براساس
نمونه
H0رد نمی گردد
تمرین
مثال :1
:1مقایسه وزن آقایان و خانم ها
– H0وزن خانم ها و آقایان یکسان است.
– H1اقایان سنگین تر از خانم ها می باشند.
در آزمون آماری p-value = 0.07بدست آمده است .تفسیر
شما چیست؟
فشارخون در دانشجویان:2
تمرین
:2 مثال
H0 -Mean SBP in Year1– Mean SBP in Year 2 = 0
H1 -Mean SBP in Year1– Mean SBP in Year 2 ≠ 0
تفسیر. بدست آمده استp-value = 0.03 در آزمون آماری
شما چیست؟
تمرین :3
خطای نوع اول و خطای نوع دوم
در قضاوت یک قاضی خطای نوع اول و
خطای نوع دوم چگونه مطرح می شود؟