اسلایدهای آمار تغذیه
Download
Report
Transcript اسلایدهای آمار تغذیه
1
فهرست مطالب
تعریف فرضیه
تعریف آزمون فرض آماری
تعریف فرض صفرو فرض یک
خطاهای آزمون
آزمون فرض یک دنباله و دو دنباله
مراحل آزمون یک فرض آماری
آزمون های فرض:
آزمون میانگین دریک جامعه
آزمون نسبت موفقیت دریک جامعه
آزمون اختالف میانگین های دو جامعه
آزمون اختالف نسبت های دو جامعه
آزمون برابری واریانس های دو جامعه
2آزمون خی دو(کای دو)
فرضیه چیست؟
فرضیه معموال بصورت تفکری ناش ی ازمشاهده ی پدیده ها درطبیعت است .به عبارتی
دیگرحدس یا اظهارنظری درمورد پارامترهای جامعه است.
مثال:
• سیگارموجب سرطان ریه می شود.
•
قد مردان اززنان بلند تراست.
• ورزش روزانه به طور متوسط 30دقیقه ،موجب کاهش استرس می شود.
3
آزمون فرضیه
فنون آماری مناسب برای بررس ی صحت فرضیه ها را آزمون فرضیه گویند.
در آزمون فرضیه بر مبنای داده های نمونه درباره صحت فرضیه ها با اطمینان معینی
قضاوت می کنیم.
4
تعریف فرض صفر و فرض یک
حدس یا ادعای ممکن است صحیح یا غلط باشد که دو فرض مکمل درذهن به وجود می آید:
:H0ادعا غلط است.
:HAادعا صحیح است.
معموال سوال پژوهش یا ادعای محقق درقالب فرض HAبیان می شود ،بنابراین هدف
پژوهشگررد H0و اثبات HAاست.ولی همیشه فرض صفردربرگیرنده تساوی است!
5
فرضیه صفر):(Null Hypothesis) (H0
فرضیه ای که باید مورد آزمون قرار گیردو عدم تفاوت و یا یکسان بودن را در جامعه نشان
می دهد .
فرضیه جانشین (H1) (Alternative Hypothesis) :
این فرضیه برخالف فرضیه H0بیان می شود وادعای محقق را نشان می دهد .
6
مثال :
میزان عوارض داروی Aو داروی Bیکسان نیست.
H 0 : PA PB
H1 : PA PB
7
مثال:
میانگین وزن نوزادان درطبقات مرفه جامعه ،حداقل 3000grاست .
H 0 : 3000
H1 : 3000
8
آزمون فرض یک دامنه(دنباله) و دو دامنه
با توجه به فرض یک ( ،)HAیک دامنه یا دو دامنه بودن آزمون فرض مشخص می شود.
9
فرضیه یک طرفه (one-tailed Hypothesis) :
در فرض یک ،پارامتر جامعه ،کوچکتر یا بزرگتر از مقداری را نشان می دهد .
) ( 0 ), ( 0
فرضیه دو طرفه (Two-tailed Hypothesis) :
در فرض یک ،پارامتر جامعه مخالف مقداری از پیش تعیین شده را بیان می کند.
10
0
خطاهای آزمون
چون آزمون فرضیه برمبنای داده های نمونه می باشد بنابراین ممکن است در
تصمیم گیری دچارخطا شویم .
11
دو نوع خطا درآزمون فرضیه داریم:
-1خطای نوع اول :رد فرضیه H0وقتی آن درست می باشد .
-2خطای نوع دوم :قبول فرضیه H0وقتی آن غلط می باشد .
احتمال ارتکاب خطای نوع اول را با نشانمی دهیم و سطح معنی داری نیزگفته می شود .
احتمال ارتکاب خطای نوع دوم را با نشان می دهیم .
12
H0
H0
H0
H0
13
مراحل آزمون یک فرض آماری
.1تعیین فرض صفرو یک آزمون
.2تعیین آماره آزمون(مالک آزمون)
.3تعیین ناحیه بحرانی
.4مقایسه آماره آزمون با ناحیه بحرانی
14
0
آزمون فرضیه مقایسه میانگین جامعه باعدد ثابت
2
(واریانس جامعه)
معلوم
مجهول
در این حالت فرضیه های صفرو یک ،یکی از حالتهای زیر می توان باشد:
16
3) H 0 : 0
H 0 : 0
H1 : 0
H1 : 0
H 0 : 0
)2
H1 : 0
)1
انتخاب آماره آزمون
الف-وقتی واریانس جامعه معلوم و داده ها توزیع نرمال دارند :
آماره آزمون
X 0
Z
n
ب-وقتی واریانس جامعه مجهول و داده ها توزیع نرمال دارند :
آماره آزمون
17
X 0
T
S
n
آماره آزمون به صورت زیرمحاسبه می شود :
(مقدارپارامتربا قبول – H0آماره درنمونه)
(خطای معیارآماره نمونه )
18
قاعده تصمیم گیری برای :1
Z Z1
Re ject H 0 if
قاعده تصمیم گیری برای :2
Z Z1
if
H0
Re ject
قاعده تصمیم گیری برای :3
19
z Z
2
1
Re ject H 0 if
مثال
در یک نمونه 10نفری میانگین سطح آنزیم 22به دست آمده است.
در مورد میانگین سطح یک آنزیم در جمعیت معینی با توزیع نرمال ،این سوال مطرح است که
آیا می توان گفت میانگین سطح آنزیم مورد نظر مقدار 25است یا خیر؟
( در سطح خطای 0.05محاسبه کنید(.
مفروضات :واریانس جامعه برابر 45فرض می شود.
20
فرضیه ها:
H0 : µ=25دربرابر HA : µ≠25
X 0
22 25
z
z
1.41
/ n
45 / 10
z Z1 / 2 H A
1.41 1.96
بنابراین فرضیه H0 : µ=25رابا اطمینان 95%نمی توان رد کرد.
21
:
24
.
22
(ck g Eq / m 2 )
25
8
10
16
23
H 0 : 25
H 1 : 25
)(معلوم, σ = 10
x 0 16 25
Z
2.25
10
n
8
0.05 Z1 1.65,
عددبحرانی
زیراZ 2.25 Z1 1.65 RH 0
24
مثال:
یک روش درمانی جدید برای جلوگیری از نوزادان کم وزن ابداع شده است.
دریک مطالعه اولیه بر روی 20خانم باردار که از این دارو استفاده کرده
بودند ،میانگین وزن نوزادان متولد شده 3500گرم با انحراف معیار 500
گرم بود .اگرمیانگین وزن نوزادان کم وزن درکل جامعه برابر 2800گرم
باشدآیامی توان ادعا نمودکه این داروباعث افزایش وزن نوزادان شده
است؟
25
H 0 : 2800
H 1 : 2800
x 0 3500 2800
T
6.2
s
500
n
20
0.05,
T1 T0.95,df 19 1.729
T 6.2 1.729 RH 0
26
مقایسه نسبت جامعه با یک عدد ثابت
استنباط در مورد پارامتری است که برای صفات کیفی به کار می رود.
فرضیات صفرو مقابل عبارتند از:
27
H 0 : P P0
H 0 : P P0
H 1 : P P0
H 1 : P P0
H 0 : P P0
H1 : P P0
درحالتی که حجم نمونه به اندازه کافی بزرگ باشد np>5و n(1-P)> 5
آماره آزمون عبارت است از:
P P0
) P0 (1 P0
n
28
Z
: ناحیه رد برای آزمون یک طرفه
H1 : P P0 Re ject H 0 If
H1 : P P0 Re ject H 0 If
Z Z1
Z Z1
: ناحیه رد برای آزمون دو طرفه
H1 : P P0 Re ject H 0 If
Z Z
(1 )
2
29
مثال :
پيش از آن كه برنامه مصون سازي سرخچه در بخش مديترانه اي صورت گیرد ،مطالعه اي
نشان مي دهد كه 150نفر از ميان 500كودك دبستاني در بخش مزبورعليه اين بيماري
مصون سازي شده اند .آيا داده ها با اين اعتقاد كه حدود 50درصد از كودكان دبستاني در
فرض شود.
بخش مديترانه اي عليه سرخچه مصون شده اند سازگار است؟ مقدار
0.05
30
H 0 : P 0.5
H1 : P 0.5
150
P
0.3
500
0.3 0.5
Z
5.90
0.5 0.5
500
Z 0.975 1.96
Z 5.90 1.96 RH 0
31
مثال:
نسبت چندقلوزایی بطور تقریب 1درصد می باشد تصور می شود که چند قلوزایی
تحت تاثیر عواملی مانند سن ،نژاد ،رتبه تولد می باشد .برای آزمون تاثیر سن بر
چندقلوزایی تعداد 2000نفر از زنان باردار که سن آنها زیر 20سال بوده است را
مورد بررس ی قرار دادیم و ده مورد چند قلوزایی مشاهده گردید .در مورد تاثیر سن بر
چند قلوزایی چه می توان گفت؟
32
H 0 : P 0.01
H 1 : P 0.01
10
P
0.005
2000
0.005 0.01
Z
1.16
0.01 0.99
2000
Z 0.975 1.96
Z 1.16 1.96 AH0
33
آزمون فرضیه مقایسه میانگین دو جامعه (تفاوت میانگین دوجامعه)
آزمونهای قبلی براساس یک نمونه از جامعه بوده اند. -در آزمونهای دو جامعه (دو نمونه ای ) پارامترهای موردنظر دردو جامعه
متفاوت مقایسه می شوند .
34
مثال:
میانگین سطح کلسترول در بچه هایی که والدین آنها بیماری قلبی دارند
بیشتر از افراد سالم است.
کودکانی که در مناطق نزدیک کارخانه سرب زندگی می کنند ،سطح سرب خون آنها
باالتر از سایر کودکان است.
35
در این حالت فرضیات مورد بررس ی به صورت زیر فرمول بندی می شوند :
36
H1 : 1 2
VS.
H 0 : 1 2
H1 : 1 2
VS.
H 0 : 1 2
H1 : 1 2
VS.
H 0 : 1 2
دوحالت برای آزمون مقایسه میانگین دوجامعه وجود دارد :
-1دو نمونه منتخب از دو جامعه وابسته اند.
یعنی هرعضو نمونه اول باعضوی منحصر به فرد از نمونه دوم جور شده باشد.
مانند:
-اندازه پاسخ قبل و بعد از دارو
اندازه پاسخ در چشم راست و چپ37
-آگاهی قبل و بعد از آموزش
-2دو نمونه منتخب از دو جامعه مستقل می باشند :
یعنی نمونه ها از دو جامعه متفاوت اند و ارتباطی بهم ندارند
مانند :
پاسخ به درمان در افراد بیمار و سالم فشار خون در مردان و زنان38
39
مقایسه میانگین دو نمونه ازدوجامعه وابسته
ً
در این حالت داده ها به صورت وابسته مثال قبل و بعد ارائه می شود
برای انجام آزمون:
-1اختالف مشاهدات قبل و بعد را محاسبه می کنیم.
-2میانگین و انحراف معیار تفاوتها را بدست می آوریم .
40
با استفاده ازآزمون tمقدارآماره ازمون رامحاسبه می کنیم:
d
T
, df n 1
sd
n
بقیه مراحل مشابه حالتهای قبل می باشد.
41
مثال:
جدول زیر اندازه های فشارخون قبل و بعد از شش ماه مصرف قرصهای
OCرا در زنان 15-45سال نشان می دهد .آیا می توان ادعا نمود
مصرف قرصهای OCباعث افزایش فشارخون می شود .
42
X1
X2
Bp
1
2
3
4
5
6
7
8
9
10
OC
115
112
107
119
115
138
126
105
104
115
di=X2-X1
Bp
OC
128
115
106
128
122
145
132
109
102
117
13
3
-1
9
7
7
6
4
-2
2
43
H 0 : 2 1 0
H1 : 2 1 0
4.8
d 4.8, sd 4.57, T
4.57
3.32
10
t0.95,9 1.833
T 3.32 1.833 RH 0
44
مقایسه میانگین دو جامعه مستقل :
-1دو نمونه تصادفی انتخاب شده از دو جامعه مستقل می باشند .
-2جامعه ها دارای توزیع نرمال می باشند.
واریانسهای دو جامعه
معلومالف-مساوی هستند
مجهول45
ب-مساوی نیستند
الف :آماره آزمون در صورت معلوم بودن واریانس ها:
X 2 1 2
2
2
n2
46
2
1
n1
1
X
z
:ناحیه بحرانی
Re ject H 0 if
z Z
1
2
47
مثال
در بررس ی سطوح میانگین اسید اوریک سرم بین افراد سالم و افراد مبتال به مونگلیسم ،اطالعات
زیر به دست آمده است:
میانگین اسید اوریک سرم در 12فرد بیمار و 15فرد سالم به ترتیب برابر 4/5و 3/4میلی گرم در
صد میلی لیتر بوده است.
با فرض آن که انحراف معیار سطوح اسید اوریک سرم هر دو جامعه 1میلی گرم در صد میلی لیتر
باشد.
آیا می توان با اطمینان %95نتیجه گرفت که میانگین اسید اوریک سرم بین افراد سالم و افراد
مبتال به مونگلیسم متفاوت است؟
48
حل
H0: µ1 = µ2در مقابل ‡ HA: µ1
µ2
4.5 3.4 0 2.82
1 1
12 15
X 2 1 2
22
n2
12
1
X
z
n1
2.82 1.96 RH 0
نتیجه گیری :میانگین سطح اسید اوریک سرم در افراد مبتال به مونگلیسم به طور معنا داری
متفاوت از افراد سالم است.
49
فاصله اطمینان
x1 x2 Z1 / 2
2
n1
2
n2
50
آزمون فرضیه مساوی بودن واریانس دو جامعه
2
2
H
:
0
1
2
2
2
H
:
1
2
1
= حجم نمونه از جامعه اول
n1
2
= S1 واریانس نمونه از جامعه اول
n2
2
S2
= حجم نمونه از جامعه دوم
= واریانس نمونه از جامعه دوم
: آماره آزمون و ناحیه بحرانی
2
1
2
2
S
F
S
F F1 / 2 [n1 1, n2 1]
OR
F F / 2 [n1 1, n2 1]
R H0
مثال :
مطالعه اي به منظور مشاهده اثر مواجهه مداوم با سرب بر IQطراحی گردید .بدین منظور يك
گروه از کودکان یک منطقه كه در معرض سرب بودند و يك گروه كنترل از كودكان همان منطقه
مشخص گرديدند .آزمايش IQبر روي 34كودك 5ساله و باالتر در در معرض سرب و 36
كودك همسن آنها درگروه كنترل انجام شد كه اطالعات آن درجدول زير داده شده است .
گروه
اندازه نمونه
انحراف معیار
میانگینIQ
در معرض سرب
34
13/74
96/4
کنترل
36
17/87
103/29
آیا با اطمینان ، %95میانگین نمره هوش دردو گروه متفاوت است ؟
2
2
S1 17.87
F 2
1.7
2
S2 13.74
n1 - 1= 36-1=35
n2 - 1= 34-1=33
F )0./975و35و33( ≈1.88
1.7 1.88 AH 0
مقایسه میانگین دو جامعه
(در صورتی که فرض مساوی بودن واریانسها پذیرفته شود)
n1
x1
2
S1
= حجم نمونه از جامعه اول
= میانگین نمونه از جامعه اول
= واریانس نمونه از جامعه اول
n2
= x 2 میانگین نمونه از جامعه دوم
2
= S 2 واریانس نمونه از جامعه دوم
= حجم نمونه از جامعه دوم
) ( x1 x2 ) ( 1 2
T
1
2 1
) SP (
n1 n2
(n1 1) S12 (n2 1 ) S 22
n1 n2 2
2
SP
: ناحیه بحرانی
| t | t1 / 2 (n1 n2 2)
df n1 n2 2
56
جذب کننده سرب
اندازه
نمونه
34
انحراف
معیار
13/74
میانگین
IQ
96/4
کنترل
36
17/87
103/29
گروه
H 0 : 1 2
H1 : 1 2
(n1 1) S12 (n2 1) S 22 33 13.74 2 35 17.84 2
S
255.98
n1 n2 2
34 36 2
2
P
( x1 x2 ) ( 1 2 )
96.4 103.29
6.85
T
1.79
2
3.83
1 1
1 1
S P( )
255.98( )
n1 n2
34 36
df 34 36 2, T(0.975,68) 2
1.79 2 AH 0
فاصله اطمینان
1 1
x1 x2 t1 / 2 (n1 n2 2) Sp ( )
n1 n2
59
آزمون اختالف نسبتها یا تساوی دو نسبت
چنانچه Pو
1
Pترتيب معرف نسبت صفت مورد مطالعه در جامعه اول و جامعه دوم باشند،
به
2
آزموني كه به منظور مقايسه اين دو نسبت صورت مي گیرد يك آزمون دو دامنه بوده و فرضيه آزمون
به صورت زيرخواهد بود:
H 0 : P1 P2 P
H1 : P1 P2
60
: آماره آزمون و ناحیه بحرانی
z
x1
x2
n1 n2
1
1
ˆ (1 p
ˆ )(
p
)
n1 n2
x1 x2
ˆ
p
n1 n2
Z Z1 / 2 RH 0
61
مثال
در يك كارآزمايي باليني 20 ،نفر از 240نفري كه واكسن آنفالنزا دريافت كرده اند و 80نفر از 220نفري كه شبه
واكسن دريافت كرده اند ،مبتال شدهاند .آيا ميتوان با اطمینان %95گفت نسبت ابتال در دوگروه با هم
يكسان است؟
62
H 0 : P1 P2
H 1 : P1 P2
20
80
0.083 0.36
240
220
z
7.28
0.038
1
1
()0.22(1 0.22
)
240 220
20 80
ˆ
p
0.22
240 220
7.28 1.96 RH 0
63
فرض صفررد ميشود .يعني واكسن ،میزان شيوع آنفالنزا را به طور قابل مالحظهاي كاهش ميدهد.
فاصله اطمینان
ˆ1 p
ˆ 2 Z1 / 2
p
ˆ 1 (1 p
ˆ1 )
ˆ 2 (1 p
ˆ2)
p
p
)
n1
n2
64
65
آزمون تطابق توزیع نمونه با توزیع نظری :با استفاده از مالک
(کای دو)
2
تا چه اندازه توزيع فراواني مشاهده شده برتوزيع فراواني نظري
منطبق مي شود يا برازنده است؟
66
فراواني مشاهده شده:
منظور تعداد افرادي از نمونه كه در يك گروه خاص قرار گرفته اند.
فراواني مورد انتظار:
فراواني براساس قبول فرضيه صفر (تطابق نمونه با توزيع نظري) را
فراواني مورد انتظار گويند كه براي محاسبه فراواني منتظره اين گروه
بايد احتمال مربوط به آن گروه را كه از توزيع نظري براساس فرضيه
صفر محاسبه مي شود در تعداد مشاهدات ) (nضرب كنيم.
گروه
فشارخون
سیستولیک
فراوانی مشاهده شده ()ni
فراوانی مورد انتظار
()ei
1
کمتراز90
0
2/12
2
90-120
15
24/64
3
120-150
57
51/47
4
باالتراز150
28
21/77
68
فرض آزمون:
ً
: H 0توزيع نمونه با توزيع موردنظر تطابق دارد (مثال نرمال است)
: H 1توزيع نمونه با توزيع موردنظر تطابق ندارد.
آماره آزمون عبارتست از:
2
(
n
e
)
2 i i
ei
i 1
:niفراواني مشاهده شده
:eiفراواني مورد انتظار
:kتعداد گروههاي مختلف متغیر مورد بررس ی
k
آماره آزمون:
2
) ( n i ei
ei
i 1
k
2
:niفراواني مشاهده شده
:eiفراواني مورد انتظار
:kتعداد طبقات مختلف متغیر(صفت) مورد بررس ی
ناحيه بحراني براي اين آزمون عبارتست از:
فرضيه H0رد مي شود
( 2محاسبه شده) 2
) 1 ,( k 1m
درجه آزادي موردنظربراي اين آزمون به صورت df = k-1-mمحاسبه مي شود.
( mتعداد پارامترهاي برآورد شده جامعه است؛ به عبارتی تعداد پارامترهایی که مجهول اند).
مثال
اطالعات جدول زیر که مربوط به فشارخون سیستولیک نمونه ای ازمردان 35سال به باالی
روستایی است رادرنظربگیرید.
اگرمیانگین وانحراف معیار نمونه به ترتیب برابر 133/25و 21/27متر جیوه است .در سطح
خطای 0.01تطابق توزیع صفت فشارخون رادراین جامعه باتوزیع نظری نرمال آزمون کنید .
توزیع فشار خون سیستولیک در جامعه مورد مطالعه نرمال است H0 :
توزیع فشار خون سیستولیک در جامعه مورد مطالعه نرمال نیست H1 :
گروه
فشارخون
سیستولیک
فراوانی مشاهده شده ( )niاحتمال مربوط
به هرگروه
فراوانی مورد انتظار
()ei
1
کمتراز90
0
0/0212
2/12
2
90-120
15
0/ 2464
24/64
3
120-150
57
0/5147
51/47
4
باالتراز150
28
0/2177
21/77
جمع
100
100
90 133.25
p( X 90) p( Z
)
21.27
p( Z 2.03) 0.5 0.4788 0.0212
150 133.25
21.27
p ( X 150) p ( Z
احتمال مربوط به گروه 1
.
.
.
احتمال مربوط به گروه 4
1 pZ 0.787 1 (0.5 0.2823) 0.2177
e1 np1 100 0.2464 24 / 64
فراوانی مورد انتظارگروه 1
e4 np4 100 0.2177 21/ 77
فراوانی مورد انتظارگروه4
..
.
2
(
n
e
)
2 i i 2.12 3.77 0.594 1.78 8.264
ei
i 1
4
df k 1 m 4 1 2 1
:Kتعدادگروهها
:mتعداد پارامترهای مستقلی است که توسط نمونه برای توزیع نظری برآورد
شده است .
H0
reject
) 0.99 (1) 6.63 , 8.264 02.99 (1
نتیجه :توزیع فشارخون درجامعه مورد مطالعه دارای توزیع نرمال نیست.
نکته:
فواصل گروه ها چنان انتخاب شود که هیچ یک از فراوانی های نظری کمتراز1
نباشند و حداقل %80فراوانی های نظری بزرگتراز 5باشند!
76
مثال :
اطالعات جدول زیر متضمن مطالعه ای از147حادثه صنعتی است که مراقبتهای پزشکی الزم دارند.این ادعا را در
سطح خطای 0.05آزمون کنید که حوادث درروزهای هفته به صورت زیرتوزیع شده اند .
%30درروز شنبه %15 ،درروزیکشنبه %15 ،درروزدوشنبه %20 ،درروزسه شنبه و %20درروزچهارشنبه .
روزها
حوادث
مشاهده شده
شنبه
یکشنبه
دوشنبه
سه شنبه
چهارشنبه
31
42
18
25
31
فرض صفراین ادعاست که درصدهای بیان شده درست هستند،
پس فرض صفروفرض مقابل به صورت زیراست.:
p5 0.2
H 0 : p1 0.03 , p 2 0.15 , p3 0.15 , p 4 0.2 ,
حداقل یکی ازنسبتهای قبلی مساوی مقدار ادعا شده نیست .
H1 :
محاسبه فراوانیهای مورد انتظار:
e1 np 147 0.03 44.1
e5 np 147 0.2 29.4
فراوانی مورد انتظار روز شنبه
..
.
فراوانی مورد انتظار روز چهارشنبه
روزها
شنبه
یکشنبه
دوشنبه
سه شنبه
چهارشنبه
تعدادحوادث
مشاهده شده
31
42
18
25
31
تعدادحوادث
موردانتظار
44.1
22.05
22.05
29.4
29.4
2
(
n
e
)
2 i i
ei
i 1
4
(31 44.1) 2 (42 22.05) 2
(31 29.4) 2
...
23.431
44.1
22.05
29.4
df k 1 5 1 4
H0
reject
)23.431 02.05 (4
,
0.05
0.05 2 (4) 9.488
شواهدکافی برای رد این ادعاکه حوادث مطابق درصدهای داده شده توزیع شده اندوجوددارد.
80