اسلایدهای آمار تغذیه

Transcript اسلایدهای آمار تغذیه

1
‫فهرست مطالب‬
‫‪‬تعریف فرضیه‬
‫‪‬تعریف آزمون فرض آماری‬
‫‪ ‬تعریف فرض صفرو فرض یک‬
‫‪‬خطاهای آزمون‬
‫‪‬آزمون فرض یک دنباله و دو دنباله‬
‫‪‬مراحل آزمون یک فرض آماری‬
‫‪‬آزمون های فرض‪:‬‬
‫‪ ‬آزمون میانگین دریک جامعه‬
‫‪‬آزمون نسبت موفقیت دریک جامعه‬
‫‪‬آزمون اختالف میانگین های دو جامعه‬
‫‪‬آزمون اختالف نسبت های دو جامعه‬
‫‪‬آزمون برابری واریانس های دو جامعه‬
‫‪ 2‬آزمون خی دو(کای دو)‬
‫فرضیه چیست؟‬
‫فرضیه معموال بصورت تفکری ناش ی ازمشاهده ی پدیده ها درطبیعت است‪ .‬به عبارتی‬
‫دیگرحدس یا اظهارنظری درمورد پارامترهای جامعه است‪.‬‬
‫مثال‪:‬‬
‫• سیگارموجب سرطان ریه می شود‪.‬‬
‫•‬
‫قد مردان اززنان بلند تراست‪.‬‬
‫• ورزش روزانه به طور متوسط ‪ 30‬دقیقه ‪ ،‬موجب کاهش استرس می شود‪.‬‬
‫‪3‬‬
‫آزمون فرضیه‬
‫فنون آماری مناسب برای بررس ی صحت فرضیه ها را آزمون فرضیه گویند‪.‬‬
‫در آزمون فرضیه بر مبنای داده های نمونه درباره صحت فرضیه ها با اطمینان معینی‬
‫قضاوت می کنیم‪.‬‬
‫‪4‬‬
‫تعریف فرض صفر و فرض یک‬
‫حدس یا ادعای ممکن است صحیح یا غلط باشد که دو فرض مکمل درذهن به وجود می آید‪:‬‬
‫‪ :H0‬ادعا غلط است‪.‬‬
‫‪ :HA‬ادعا صحیح است‪.‬‬
‫معموال سوال پژوهش یا ادعای محقق درقالب فرض ‪ HA‬بیان می شود‪ ،‬بنابراین هدف‬
‫پژوهشگررد ‪ H0‬و اثبات ‪ HA‬است‪.‬ولی همیشه فرض صفردربرگیرنده تساوی است!‬
‫‪5‬‬
‫فرضیه صفر)‪:(Null Hypothesis) (H0‬‬
‫فرضیه ای که باید مورد آزمون قرار گیردو عدم تفاوت و یا یکسان بودن را در جامعه نشان‬
‫می دهد ‪.‬‬
‫فرضیه جانشین ‪(H1) (Alternative Hypothesis) :‬‬
‫این فرضیه برخالف فرضیه ‪ H0‬بیان می شود وادعای محقق را نشان می دهد ‪.‬‬
‫‪6‬‬
‫مثال ‪:‬‬
‫میزان عوارض داروی ‪ A‬و داروی ‪ B‬یکسان نیست‪.‬‬
‫‪H 0 : PA  PB‬‬
‫‪H1 : PA  PB‬‬
‫‪7‬‬
‫مثال‪:‬‬
‫میانگین وزن نوزادان درطبقات مرفه جامعه‪ ،‬حداقل ‪ 3000gr‬است ‪.‬‬
‫‪H 0 :   3000‬‬
‫‪H1 :   3000‬‬
‫‪8‬‬
‫آزمون فرض یک دامنه(دنباله) و دو دامنه‬
‫با توجه به فرض یک (‪ ،)HA‬یک دامنه یا دو دامنه بودن آزمون فرض مشخص می شود‪.‬‬
‫‪9‬‬
‫فرضیه یک طرفه ‪(one-tailed Hypothesis) :‬‬
‫در فرض یک‪ ،‬پارامتر جامعه‪ ،‬کوچکتر یا بزرگتر از مقداری را نشان می دهد ‪.‬‬
‫) ‪(    0 ), (    0‬‬
‫فرضیه دو طرفه ‪(Two-tailed Hypothesis) :‬‬
‫در فرض یک ‪ ،‬پارامتر جامعه مخالف مقداری از پیش تعیین شده را بیان می کند‪.‬‬
‫‪10‬‬
‫‪  0‬‬
‫خطاهای آزمون‬
‫چون آزمون فرضیه برمبنای داده های نمونه می باشد بنابراین ممکن است در‬
‫تصمیم گیری دچارخطا شویم ‪.‬‬
‫‪11‬‬
‫دو نوع خطا درآزمون فرضیه داریم‪:‬‬
‫‪ -1‬خطای نوع اول‪ :‬رد فرضیه ‪ H0‬وقتی آن درست می باشد ‪.‬‬
‫‪ -2‬خطای نوع دوم‪ :‬قبول فرضیه ‪ H0‬وقتی آن غلط می باشد ‪.‬‬
‫‪‬احتمال ارتکاب خطای نوع اول را با نشان‪‬می دهیم و سطح معنی داری نیزگفته می شود ‪.‬‬
‫‪‬احتمال ارتکاب خطای نوع دوم را با نشان می دهیم ‪.‬‬
‫‪‬‬
‫‪12‬‬
H0
H0
H0
H0
13
‫مراحل آزمون یک فرض آماری‬
‫‪ .1‬تعیین فرض صفرو یک آزمون‬
‫‪ .2‬تعیین آماره آزمون(مالک آزمون)‬
‫‪ .3‬تعیین ناحیه بحرانی‬
‫‪ .4‬مقایسه آماره آزمون با ناحیه بحرانی‬
‫‪14‬‬
‫‪0‬‬
‫آزمون فرضیه مقایسه میانگین جامعه باعدد ثابت‬
‫‪2‬‬
‫‪‬‬
‫(واریانس جامعه)‬
‫معلوم‬
‫مجهول‬
‫در این حالت فرضیه های صفرو یک‪ ،‬یکی از حالتهای زیر می توان باشد‪:‬‬
‫‪16‬‬
‫‪3) H 0 :   0‬‬
‫‪H 0 :   0‬‬
‫‪H1 :    0‬‬
‫‪H1 :   0‬‬
‫‪H 0 :   0‬‬
‫)‪2‬‬
‫‪H1 :   0‬‬
‫)‪1‬‬
‫انتخاب آماره آزمون‬
‫الف‪-‬وقتی واریانس جامعه معلوم و داده ها توزیع نرمال دارند ‪:‬‬
‫آماره آزمون‬
‫‪X  0‬‬
‫‪Z‬‬
‫‪‬‬
‫‪n‬‬
‫ب‪-‬وقتی واریانس جامعه مجهول و داده ها توزیع نرمال دارند ‪:‬‬
‫آماره آزمون‬
‫‪17‬‬
‫‪X  0‬‬
‫‪T‬‬
‫‪S‬‬
‫‪n‬‬
‫آماره آزمون به صورت زیرمحاسبه می شود ‪:‬‬
‫(مقدارپارامتربا قبول ‪ – H0‬آماره درنمونه)‬
‫(خطای معیارآماره نمونه )‬
‫‪18‬‬
‫قاعده تصمیم گیری برای ‪:1‬‬
‫‪Z  Z1‬‬
‫‪Re ject H 0 if‬‬
‫قاعده تصمیم گیری برای ‪:2‬‬
‫‪Z  Z1‬‬
‫‪if‬‬
‫‪H0‬‬
‫‪Re ject‬‬
‫قاعده تصمیم گیری برای ‪:3‬‬
‫‪19‬‬
‫‪z Z‬‬
‫‪2‬‬
‫‪1‬‬
‫‪Re ject H 0 if‬‬
‫مثال‬
‫در یک نمونه ‪ 10‬نفری میانگین سطح آنزیم ‪ 22‬به دست آمده است‪.‬‬
‫در مورد میانگین سطح یک آنزیم در جمعیت معینی با توزیع نرمال‪ ،‬این سوال مطرح است که‬
‫آیا می توان گفت میانگین سطح آنزیم مورد نظر مقدار ‪ 25‬است یا خیر؟‬
‫( در سطح خطای ‪ 0.05‬محاسبه کنید‪(.‬‬
‫مفروضات‪ :‬واریانس جامعه برابر ‪ 45‬فرض می شود‪.‬‬
‫‪20‬‬
‫فرضیه ها‪:‬‬
‫‪ H0 : µ=25‬دربرابر ‪HA : µ≠25‬‬
‫‪X  0‬‬
‫‪22  25‬‬
‫‪z‬‬
‫‪z‬‬
‫‪ 1.41‬‬
‫‪/ n‬‬
‫‪45 / 10‬‬
‫‪z  Z1 / 2   H A‬‬
‫‪1.41  1.96‬‬
‫‪‬‬
‫بنابراین فرضیه ‪ H0 : µ=25‬رابا اطمینان ‪ 95%‬نمی توان رد کرد‪.‬‬
‫‪21‬‬
:
24
.
22
(ck  g  Eq / m 2 )
25
8
10
16
23
H 0 :   25
H 1 :   25
)‫(معلوم‬, σ = 10
x  0 16  25
Z

 2.25

10
n
8
  0.05  Z1  1.65,
‫عددبحرانی‬
‫ زیرا‬Z  2.25  Z1  1.65  RH 0
24
‫مثال‪:‬‬
‫یک روش درمانی جدید برای جلوگیری از نوزادان کم وزن ابداع شده است‪.‬‬
‫دریک مطالعه اولیه بر روی ‪ 20‬خانم باردار که از این دارو استفاده کرده‬
‫بودند‪ ،‬میانگین وزن نوزادان متولد شده ‪ 3500‬گرم با انحراف معیار ‪500‬‬
‫گرم بود‪ .‬اگرمیانگین وزن نوزادان کم وزن درکل جامعه برابر ‪ 2800‬گرم‬
‫باشدآیامی توان ادعا نمودکه این داروباعث افزایش وزن نوزادان شده‬
‫است؟‬
‫‪25‬‬
H 0 :   2800
H 1 :   2800
x  0 3500  2800
T

 6.2
s
500
n
20
  0.05,
T1  T0.95,df 19  1.729
T  6.2  1.729  RH 0
26
‫مقایسه نسبت جامعه با یک عدد ثابت‬
‫استنباط در مورد پارامتری است که برای صفات کیفی به کار می رود‪.‬‬
‫فرضیات صفرو مقابل عبارتند از‪:‬‬
‫‪27‬‬
‫‪H 0 : P  P0‬‬
‫‪H 0 : P  P0‬‬
‫‪H 1 : P  P0‬‬
‫‪H 1 : P  P0‬‬
‫‪H 0 : P  P0‬‬
‫‪H1 : P  P0‬‬
‫درحالتی که حجم نمونه به اندازه کافی بزرگ باشد ‪ np>5‬و ‪n(1-P)> 5‬‬
‫آماره آزمون عبارت است از‪:‬‬
‫‪P  P0‬‬
‫) ‪P0 (1  P0‬‬
‫‪n‬‬
‫‪28‬‬
‫‪Z‬‬
: ‫ناحیه رد برای آزمون یک طرفه‬
H1 : P  P0 Re ject H 0 If
H1 : P  P0 Re ject H 0 If
Z  Z1
Z  Z1
: ‫ناحیه رد برای آزمون دو طرفه‬
H1 : P  P0 Re ject H 0 If
Z Z

(1 )
2
29
‫مثال ‪:‬‬
‫پيش از آن كه برنامه مصون سازي سرخچه در بخش مديترانه اي صورت گیرد‪ ،‬مطالعه اي‬
‫نشان مي دهد كه ‪ 150‬نفر از ميان ‪ 500‬كودك دبستاني در بخش مزبورعليه اين بيماري‬
‫مصون سازي شده اند‪ .‬آيا داده ها با اين اعتقاد كه حدود ‪ 50‬درصد از كودكان دبستاني در‬
‫فرض شود‪.‬‬
‫بخش مديترانه اي عليه سرخچه مصون شده اند سازگار است؟ مقدار‬
‫‪  0.05‬‬
‫‪30‬‬
H 0 : P  0.5
H1 : P  0.5
150
P
 0.3
500
0.3  0.5
Z
 5.90
0.5  0.5
500
Z 0.975  1.96
Z  5.90  1.96  RH 0
31
‫مثال‪:‬‬
‫نسبت چندقلوزایی بطور تقریب ‪ 1‬درصد می باشد تصور می شود که چند قلوزایی‬
‫تحت تاثیر عواملی مانند سن‪ ،‬نژاد‪ ،‬رتبه تولد می باشد‪ .‬برای آزمون تاثیر سن بر‬
‫چندقلوزایی تعداد ‪ 2000‬نفر از زنان باردار که سن آنها زیر ‪ 20‬سال بوده است را‬
‫مورد بررس ی قرار دادیم و ده مورد چند قلوزایی مشاهده گردید‪ .‬در مورد تاثیر سن بر‬
‫چند قلوزایی چه می توان گفت؟‬
‫‪32‬‬
H 0 : P  0.01
H 1 : P  0.01
10
P
 0.005
2000
0.005  0.01
Z
 1.16
0.01 0.99
2000
Z 0.975  1.96
Z  1.16  1.96  AH0
33
‫آزمون فرضیه مقایسه میانگین دو جامعه (تفاوت میانگین دوجامعه)‬
‫ آزمونهای قبلی براساس یک نمونه از جامعه بوده اند‪.‬‬‫‪ -‬در آزمونهای دو جامعه (دو نمونه ای ) پارامترهای موردنظر دردو جامعه‬
‫متفاوت مقایسه می شوند ‪.‬‬
‫‪34‬‬
‫مثال‪:‬‬
‫‪‬میانگین سطح کلسترول در بچه هایی که والدین آنها بیماری قلبی دارند‬
‫بیشتر از افراد سالم است‪.‬‬
‫‪ ‬کودکانی که در مناطق نزدیک کارخانه سرب زندگی می کنند ‪،‬سطح سرب خون آنها‬
‫باالتر از سایر کودکان است‪.‬‬
‫‪35‬‬
‫در این حالت فرضیات مورد بررس ی به صورت زیر فرمول بندی می شوند ‪:‬‬
‫‪36‬‬
‫‪H1 : 1   2‬‬
‫‪VS.‬‬
‫‪H 0 : 1   2‬‬
‫‪H1 : 1   2‬‬
‫‪VS.‬‬
‫‪H 0 : 1   2‬‬
‫‪H1 : 1   2‬‬
‫‪VS.‬‬
‫‪H 0 : 1   2‬‬
‫دوحالت برای آزمون مقایسه میانگین دوجامعه وجود دارد ‪:‬‬
‫‪ -1‬دو نمونه منتخب از دو جامعه وابسته اند‪.‬‬
‫یعنی هرعضو نمونه اول باعضوی منحصر به فرد از نمونه دوم جور شده باشد‪.‬‬
‫مانند‪:‬‬
‫‪ -‬اندازه پاسخ قبل و بعد از دارو‬
‫ اندازه پاسخ در چشم راست و چپ‬‫‪37‬‬
‫‪ -‬آگاهی قبل و بعد از آموزش‬
‫‪ -2‬دو نمونه منتخب از دو جامعه مستقل می باشند ‪:‬‬
‫یعنی نمونه ها از دو جامعه متفاوت اند و ارتباطی بهم ندارند‬
‫مانند ‪:‬‬
‫ پاسخ به درمان در افراد بیمار و سالم‬‫ فشار خون در مردان و زنان‬‫‪38‬‬
39
‫مقایسه میانگین دو نمونه ازدوجامعه وابسته‬
‫ً‬
‫در این حالت داده ها به صورت وابسته مثال قبل و بعد ارائه می شود‬
‫برای انجام آزمون‪:‬‬
‫‪ -1‬اختالف مشاهدات قبل و بعد را محاسبه می کنیم‪.‬‬
‫‪ -2‬میانگین و انحراف معیار تفاوتها را بدست می آوریم ‪.‬‬
‫‪40‬‬
‫با استفاده ازآزمون ‪ t‬مقدارآماره ازمون رامحاسبه می کنیم‪:‬‬
‫‪d‬‬
‫‪T‬‬
‫‪, df  n  1‬‬
‫‪sd‬‬
‫‪n‬‬
‫بقیه مراحل مشابه حالتهای قبل می باشد‪.‬‬
‫‪41‬‬
‫مثال‪:‬‬
‫جدول زیر اندازه های فشارخون قبل و بعد از شش ماه مصرف قرصهای‬
‫‪ OC‬را در زنان ‪ 15-45‬سال نشان می دهد‪ .‬آیا می توان ادعا نمود‬
‫مصرف قرصهای ‪ OC‬باعث افزایش فشارخون می شود ‪.‬‬
‫‪42‬‬
X1
X2
Bp
1
2
3
4
5
6
7
8
9
10
OC
115
112
107
119
115
138
126
105
104
115
di=X2-X1
Bp
OC
128
115
106
128
122
145
132
109
102
117
13
3
-1
9
7
7
6
4
-2
2
43
H 0 :  2  1  0
H1 :  2  1  0
4.8
d  4.8, sd  4.57, T 
4.57
 3.32
10
t0.95,9   1.833
T  3.32  1.833  RH 0
44
‫مقایسه میانگین دو جامعه مستقل ‪:‬‬
‫‪ -1‬دو نمونه تصادفی انتخاب شده از دو جامعه مستقل می باشند ‪.‬‬
‫‪ -2‬جامعه ها دارای توزیع نرمال می باشند‪.‬‬
‫واریانسهای دو جامعه‬
‫ معلوم‬‫الف‪-‬مساوی هستند‬
‫ مجهول‬‫‪45‬‬
‫ب‪-‬مساوی نیستند‬
‫الف‪ :‬آماره آزمون در صورت معلوم بودن واریانس ها‪:‬‬
‫‪ X 2   1   2 ‬‬
‫‪2‬‬
‫‪2‬‬
‫‪‬‬
‫‪n2‬‬
‫‪46‬‬
‫‪‬‬
‫‪2‬‬
‫‪1‬‬
‫‪‬‬
‫‪n1‬‬
‫‪1‬‬
‫‪‬‬
‫‪X‬‬
‫‪‬‬
‫‪z‬‬
:‫ناحیه بحرانی‬
Re ject H 0 if
z Z
1
2
47
‫مثال‬
‫در بررس ی سطوح میانگین اسید اوریک سرم بین افراد سالم و افراد مبتال به مونگلیسم‪ ،‬اطالعات‬
‫زیر به دست آمده است‪:‬‬
‫میانگین اسید اوریک سرم در ‪ 12‬فرد بیمار و ‪ 15‬فرد سالم به ترتیب برابر ‪ 4/5‬و ‪ 3/4‬میلی گرم در‬
‫صد میلی لیتر بوده است‪.‬‬
‫با فرض آن که انحراف معیار سطوح اسید اوریک سرم هر دو جامعه ‪ 1‬میلی گرم در صد میلی لیتر‬
‫باشد‪.‬‬
‫آیا می توان با اطمینان ‪ %95‬نتیجه گرفت که میانگین اسید اوریک سرم بین افراد سالم و افراد‬
‫مبتال به مونگلیسم متفاوت است؟‬
‫‪48‬‬
‫حل‬
‫‪ H0: µ1 = µ2‬در مقابل ‡ ‪HA: µ1‬‬
‫‪µ2‬‬
‫‪4.5  3.4  0  2.82‬‬
‫‪1 1‬‬
‫‪‬‬
‫‪12 15‬‬
‫‪‬‬
‫‪ X 2   1   2 ‬‬
‫‪ 22‬‬
‫‪n2‬‬
‫‪‬‬
‫‪ 12‬‬
‫‪1‬‬
‫‪X‬‬
‫‪z ‬‬
‫‪n1‬‬
‫‪2.82  1.96  RH 0‬‬
‫نتیجه گیری‪ :‬میانگین سطح اسید اوریک سرم در افراد مبتال به مونگلیسم به طور معنا داری‬
‫متفاوت از افراد سالم است‪.‬‬
‫‪49‬‬
‫فاصله اطمینان‬
x1  x2  Z1 / 2

2
n1


2
n2
50
‫آزمون فرضیه مساوی بودن واریانس دو جامعه‬
‫‪2‬‬
‫‪2‬‬
‫‪‬‬
‫‪H‬‬
‫‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪ 0‬‬
‫‪1‬‬
‫‪2‬‬
‫‪‬‬
‫‪2‬‬
‫‪2‬‬
‫‪‬‬
‫‪H‬‬
‫‪:‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪1‬‬
‫‪2‬‬
‫‪ 1‬‬
‫= حجم نمونه از جامعه اول‬
‫‪n1 ‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪ = S1 ‬واریانس نمونه از جامعه اول‬
‫‪n2 ‬‬
‫‪‬‬
‫‪‬‬
‫‪2‬‬
‫‪S2 ‬‬
‫= حجم نمونه از جامعه دوم‬
‫= واریانس نمونه از جامعه دوم‬
: ‫آماره آزمون و ناحیه بحرانی‬
2
1
2
2
S
F
S
F  F1 / 2 [n1  1, n2  1]
OR
F  F / 2 [n1  1, n2  1]
R H0
‫مثال ‪:‬‬
‫مطالعه اي به منظور مشاهده اثر مواجهه مداوم با سرب بر ‪ IQ‬طراحی گردید‪ .‬بدین منظور يك‬
‫گروه از کودکان یک منطقه كه در معرض سرب بودند و يك گروه كنترل از كودكان همان منطقه‬
‫مشخص گرديدند ‪ .‬آزمايش ‪ IQ‬بر روي ‪ 34‬كودك ‪ 5‬ساله و باالتر در در معرض سرب و ‪36‬‬
‫كودك همسن آنها درگروه كنترل انجام شد كه اطالعات آن درجدول زير داده شده است ‪.‬‬
‫گروه‬
‫اندازه نمونه‬
‫انحراف معیار‬
‫میانگین‪IQ‬‬
‫در معرض سرب‬
‫‪34‬‬
‫‪13/74‬‬
‫‪96/4‬‬
‫کنترل‬
‫‪36‬‬
‫‪17/87‬‬
‫‪103/29‬‬
‫آیا با اطمینان ‪ ، %95‬میانگین نمره هوش دردو گروه متفاوت است ؟‬
2
2
S1 17.87
F 2 
 1.7
2
S2 13.74
n1 - 1= 36-1=35
n2 - 1= 34-1=33
F )0./975‫و‬35‫و‬33( ≈1.88
1.7  1.88  AH 0
‫مقایسه میانگین دو جامعه‬
‫(در صورتی که فرض مساوی بودن واریانسها پذیرفته شود)‬
‫‪n1 ‬‬
‫‪‬‬
‫‪x1 ‬‬
‫‪2‬‬
‫‪S1 ‬‬
‫= حجم نمونه از جامعه اول‬
‫= میانگین نمونه از جامعه اول‬
‫= واریانس نمونه از جامعه اول‬
‫‪n2 ‬‬
‫‪‬‬
‫‪ = x 2 ‬میانگین نمونه از جامعه دوم‬
‫‪2‬‬
‫‪ = S 2 ‬واریانس نمونه از جامعه دوم‬
‫= حجم نمونه از جامعه دوم‬
‫) ‪( x1  x2 )  ( 1   2‬‬
‫‪T‬‬
‫‪1‬‬
‫‪2 1‬‬
‫) ‪SP ( ‬‬
‫‪n1 n2‬‬
‫‪(n1  1) S12  (n2  1 ) S 22‬‬
‫‪n1  n2  2‬‬
‫‪‬‬
‫‪2‬‬
‫‪SP‬‬
: ‫ناحیه بحرانی‬
| t | t1 / 2 (n1  n2  2)
df  n1  n2  2
56
‫جذب کننده سرب‬
‫اندازه‬
‫نمونه‬
‫‪34‬‬
‫انحراف‬
‫معیار‬
‫‪13/74‬‬
‫میانگین‬
‫‪IQ‬‬
‫‪96/4‬‬
‫کنترل‬
‫‪36‬‬
‫‪17/87‬‬
‫‪103/29‬‬
‫گروه‬
‫‪H 0 : 1  2‬‬
‫‪H1 : 1   2‬‬
(n1  1) S12  (n2  1) S 22 33 13.74 2  35 17.84 2
S 

 255.98
n1  n2  2
34  36  2
2
P
( x1  x2 )  ( 1   2 )
96.4  103.29
 6.85
T


 1.79
2
3.83
1 1
1 1
S P(  )
255.98(  )
n1 n2
34 36
df  34  36  2, T(0.975,68)  2
 1.79  2  AH 0
‫فاصله اطمینان‬
1 1
x1  x2  t1 / 2 (n1  n2  2) Sp (  )
n1 n2
59
‫آزمون اختالف نسبتها یا تساوی دو نسبت‬
‫چنانچه ‪P‬و‬
‫‪1‬‬
‫‪ P‬ترتيب معرف نسبت صفت مورد مطالعه در جامعه اول و جامعه دوم باشند‪،‬‬
‫به‬
‫‪2‬‬
‫آزموني كه به منظور مقايسه اين دو نسبت صورت مي گیرد يك آزمون دو دامنه بوده و فرضيه آزمون‬
‫به صورت زيرخواهد بود‪:‬‬
‫‪H 0 : P1  P2  P‬‬
‫‪H1 : P1  P2‬‬
‫‪60‬‬
: ‫آماره آزمون و ناحیه بحرانی‬
z
x1
x2

n1 n2
1
1
ˆ (1  p
ˆ )(
p

)
n1 n2
x1  x2
ˆ 
p
n1  n2
Z  Z1 / 2  RH 0
61
‫مثال‬
‫در يك كارآزمايي باليني‪ 20 ،‬نفر از ‪ 240‬نفري كه واكسن آنفالنزا دريافت كرده اند و ‪ 80‬نفر از ‪ 220‬نفري كه شبه‬
‫واكسن دريافت كرده اند‪ ،‬مبتال شدهاند‪ .‬آيا ميتوان با اطمینان ‪ %95‬گفت نسبت ابتال در دوگروه با هم‬
‫يكسان است؟‬
‫‪62‬‬
‫‪ H 0 : P1  P2‬‬
‫‪‬‬
‫‪H 1 : P1  P2‬‬
‫‪20‬‬
‫‪80‬‬
‫‪‬‬
‫‪0.083  0.36‬‬
‫‪240‬‬
‫‪220‬‬
‫‪z‬‬
‫‪‬‬
‫‪ 7.28‬‬
‫‪0.038‬‬
‫‪1‬‬
‫‪1‬‬
‫()‪0.22(1  0.22‬‬
‫‪‬‬
‫)‬
‫‪240 220‬‬
‫‪20  80‬‬
‫‪ˆ ‬‬
‫‪p‬‬
‫‪ 0.22‬‬
‫‪240  220‬‬
‫‪ 7.28  1.96  RH 0‬‬
‫‪63‬‬
‫فرض صفررد ميشود‪ .‬يعني واكسن‪ ،‬میزان شيوع آنفالنزا را به طور قابل مالحظهاي كاهش ميدهد‪.‬‬
‫فاصله اطمینان‬
ˆ1  p
ˆ 2  Z1 / 2
p
ˆ 1 (1  p
ˆ1 )
ˆ 2 (1  p
ˆ2)
p
p

)
n1
n2
64
65
‫آزمون تطابق توزیع نمونه با توزیع نظری ‪ :‬با استفاده از مالک‬
‫(کای دو)‬
‫‪2‬‬
‫تا چه اندازه توزيع فراواني مشاهده شده برتوزيع فراواني نظري‬
‫منطبق مي شود يا برازنده است؟‬
‫‪66‬‬
‫فراواني مشاهده شده‪:‬‬
‫منظور تعداد افرادي از نمونه كه در يك گروه خاص قرار گرفته اند‪.‬‬
‫فراواني مورد انتظار‪:‬‬
‫فراواني براساس قبول فرضيه صفر (تطابق نمونه با توزيع نظري) را‬
‫فراواني مورد انتظار گويند كه براي محاسبه فراواني منتظره اين گروه‬
‫بايد احتمال مربوط به آن گروه را كه از توزيع نظري براساس فرضيه‬
‫صفر محاسبه مي شود در تعداد مشاهدات )‪ (n‬ضرب كنيم‪.‬‬
‫گروه‬
‫فشارخون‬
‫سیستولیک‬
‫فراوانی مشاهده شده (‪)ni‬‬
‫فراوانی مورد انتظار‬
‫(‪)ei‬‬
‫‪1‬‬
‫کمتراز‪90‬‬
‫‪0‬‬
‫‪2/12‬‬
‫‪2‬‬
‫‪90-120‬‬
‫‪15‬‬
‫‪24/64‬‬
‫‪3‬‬
‫‪120-150‬‬
‫‪57‬‬
‫‪51/47‬‬
‫‪4‬‬
‫باالتراز‪150‬‬
‫‪28‬‬
‫‪21/77‬‬
‫‪68‬‬
‫فرض آزمون‪:‬‬
‫ً‬
‫‪ : H 0‬توزيع نمونه با توزيع موردنظر تطابق دارد (مثال نرمال است)‬
‫‪ : H 1‬توزيع نمونه با توزيع موردنظر تطابق ندارد‪.‬‬
‫آماره آزمون عبارتست از‪:‬‬
‫‪2‬‬
‫(‬
‫‪n‬‬
‫‪‬‬
‫‪e‬‬
‫)‬
‫‪2   i i‬‬
‫‪ei‬‬
‫‪i 1‬‬
‫‪ :ni‬فراواني مشاهده شده‬
‫‪ :ei‬فراواني مورد انتظار‬
‫‪ :k‬تعداد گروههاي مختلف متغیر مورد بررس ی‬
‫‪k‬‬
‫آماره آزمون‪:‬‬
‫‪2‬‬
‫) ‪( n i  ei‬‬
‫‪ ‬‬
‫‪ei‬‬
‫‪i 1‬‬
‫‪k‬‬
‫‪2‬‬
‫‪ :ni‬فراواني مشاهده شده‬
‫‪ :ei‬فراواني مورد انتظار‬
‫‪ :k‬تعداد طبقات مختلف متغیر(صفت) مورد بررس ی‬
‫ناحيه بحراني براي اين آزمون عبارتست از‪:‬‬
‫فرضيه ‪ H0‬رد مي شود‬
‫‪‬‬
‫‪(   2‬محاسبه شده)‪ 2‬‬
‫) ‪1 ,( k 1m‬‬
‫درجه آزادي موردنظربراي اين آزمون به صورت ‪ df = k-1-m‬محاسبه مي شود‪.‬‬
‫(‪ m‬تعداد پارامترهاي برآورد شده جامعه است؛ به عبارتی تعداد پارامترهایی که مجهول اند‪).‬‬
‫مثال‬
‫اطالعات جدول زیر که مربوط به فشارخون سیستولیک نمونه ای ازمردان ‪ 35‬سال به باالی‬
‫روستایی است رادرنظربگیرید‪.‬‬
‫اگرمیانگین وانحراف معیار نمونه به ترتیب برابر ‪133/25‬و‪ 21/27‬متر جیوه است ‪.‬در سطح‬
‫خطای ‪ 0.01‬تطابق توزیع صفت فشارخون رادراین جامعه باتوزیع نظری نرمال آزمون کنید ‪.‬‬
‫توزیع فشار خون سیستولیک در جامعه مورد مطالعه نرمال است ‪H0 :‬‬
‫توزیع فشار خون سیستولیک در جامعه مورد مطالعه نرمال نیست ‪H1 :‬‬
‫گروه‬
‫فشارخون‬
‫سیستولیک‬
‫فراوانی مشاهده شده (‪ )ni‬احتمال مربوط‬
‫به هرگروه‬
‫فراوانی مورد انتظار‬
‫(‪)ei‬‬
‫‪1‬‬
‫کمتراز‪90‬‬
‫‪0‬‬
‫‪0/0212‬‬
‫‪2/12‬‬
‫‪2‬‬
‫‪90-120‬‬
‫‪15‬‬
‫‪0/ 2464‬‬
‫‪24/64‬‬
‫‪3‬‬
‫‪120-150‬‬
‫‪57‬‬
‫‪0/5147‬‬
‫‪51/47‬‬
‫‪4‬‬
‫باالتراز‪150‬‬
‫‪28‬‬
‫‪0/2177‬‬
‫‪21/77‬‬
‫جمع‬
‫‪100‬‬
‫‪100‬‬
‫‪90  133.25‬‬
‫‪p( X  90)  p( Z ‬‬
‫‪)‬‬
‫‪21.27‬‬
‫‪p( Z  2.03)  0.5  0.4788  0.0212‬‬
‫‪150  133.25‬‬
‫‪‬‬
‫‪21.27‬‬
‫‪p ( X  150)  p ( Z ‬‬
‫احتمال مربوط به گروه ‪1‬‬
‫‪.‬‬
‫‪.‬‬
‫‪.‬‬
‫احتمال مربوط به گروه ‪4‬‬
‫‪1  pZ  0.787   1  (0.5  0.2823)  0.2177‬‬
‫‪e1 np1  100  0.2464  24 / 64‬‬
‫فراوانی مورد انتظارگروه ‪1‬‬
‫‪e4  np4  100  0.2177  21/ 77‬‬
‫فراوانی مورد انتظارگروه‪4‬‬
‫‪..‬‬
‫‪.‬‬
‫‪2‬‬
‫(‬
‫‪n‬‬
‫‪‬‬
‫‪e‬‬
‫)‬
‫‪ 2   i i  2.12  3.77  0.594  1.78  8.264‬‬
‫‪ei‬‬
‫‪i 1‬‬
‫‪4‬‬
‫‪df  k  1  m  4  1  2  1‬‬
‫‪ :K‬تعدادگروهها‬
‫‪ :m‬تعداد پارامترهای مستقلی است که توسط نمونه برای توزیع نظری برآورد‬
‫شده است ‪.‬‬
‫‪H0‬‬
‫‪ reject‬‬
‫)‪ 0.99 (1)  6.63 , 8.264   02.99 (1‬‬
‫نتیجه‪ :‬توزیع فشارخون درجامعه مورد مطالعه دارای توزیع نرمال نیست‪.‬‬
‫نکته‪:‬‬
‫فواصل گروه ها چنان انتخاب شود که هیچ یک از فراوانی های نظری کمتراز‪1‬‬
‫نباشند و حداقل ‪ %80‬فراوانی های نظری بزرگتراز‪ 5‬باشند!‬
‫‪76‬‬
‫مثال ‪:‬‬
‫اطالعات جدول زیر متضمن مطالعه ای از‪147‬حادثه صنعتی است که مراقبتهای پزشکی الزم دارند‪.‬این ادعا را در‬
‫سطح خطای ‪ 0.05‬آزمون کنید که حوادث درروزهای هفته به صورت زیرتوزیع شده اند ‪.‬‬
‫‪ %30‬درروز شنبه ‪ %15 ،‬درروزیکشنبه ‪%15 ،‬درروزدوشنبه ‪ %20 ،‬درروزسه شنبه و ‪ %20‬درروزچهارشنبه ‪.‬‬
‫روزها‬
‫حوادث‬
‫مشاهده شده‬
‫شنبه‬
‫یکشنبه‬
‫دوشنبه‬
‫سه شنبه‬
‫چهارشنبه‬
‫‪31‬‬
‫‪42‬‬
‫‪18‬‬
‫‪25‬‬
‫‪31‬‬
‫فرض صفراین ادعاست که درصدهای بیان شده درست هستند‪،‬‬
‫پس فرض صفروفرض مقابل به صورت زیراست‪.:‬‬
‫‪p5  0.2‬‬
‫‪H 0 : p1  0.03 , p 2  0.15 , p3  0.15 , p 4  0.2 ,‬‬
‫حداقل یکی ازنسبتهای قبلی مساوی مقدار ادعا شده نیست ‪.‬‬
‫‪H1 :‬‬
‫محاسبه فراوانیهای مورد انتظار‪:‬‬
‫‪e1  np  147  0.03  44.1‬‬
‫‪e5  np  147  0.2  29.4‬‬
‫فراوانی مورد انتظار روز شنبه‬
‫‪..‬‬
‫‪.‬‬
‫فراوانی مورد انتظار روز چهارشنبه‬
‫روزها‬
‫شنبه‬
‫یکشنبه‬
‫دوشنبه‬
‫سه شنبه‬
‫چهارشنبه‬
‫تعدادحوادث‬
‫مشاهده شده‬
‫‪31‬‬
‫‪42‬‬
‫‪18‬‬
‫‪25‬‬
‫‪31‬‬
‫تعدادحوادث‬
‫موردانتظار‬
‫‪44.1‬‬
‫‪22.05‬‬
‫‪22.05‬‬
‫‪29.4‬‬
‫‪29.4‬‬
‫‪2‬‬
‫(‬
‫‪n‬‬
‫‪‬‬
‫‪e‬‬
‫)‬
‫‪2   i i ‬‬
‫‪ei‬‬
‫‪i 1‬‬
‫‪4‬‬
‫‪(31  44.1) 2 (42  22.05) 2‬‬
‫‪(31  29.4) 2‬‬
‫‪‬‬
‫‪ ... ‬‬
‫‪ 23.431‬‬
‫‪44.1‬‬
‫‪22.05‬‬
‫‪29.4‬‬
‫‪df  k  1  5  1  4‬‬
‫‪H0‬‬
‫‪reject‬‬
‫‪‬‬
‫)‪23.431   02.05 (4‬‬
‫‪,‬‬
‫‪  0.05‬‬
‫‪ 0.05 2 (4)  9.488‬‬
‫شواهدکافی برای رد این ادعاکه حوادث مطابق درصدهای داده شده توزیع شده اندوجوددارد‪.‬‬
80