Transcript Document
نمونهگیری و برآوردها
موسوی ندوشنی
بهار 1384
1
دانشگاه صنعت آب و برق
نمونهگیری
برای برآورد پارامترهای جامعه ،از نمونه جامعه استفاده
میکنیم (چون جامعه نامتناهی است) نمونه باید معرف
جامعه باشد.
تعریف :هر تابعی از عنصرهای نمونه تصادفی که شامل
پارامترهای مجهول نباشد را یک آماره گویند.
• مثال :اگر X1,X2,...,Xnیک نمونه تصادفی از متغیر
باشند ،توابع
تصادفی X
n
2
) (X i - X
آماره هستند.
2
å
i= 1
n
1
n
i
X
å
i= 1
دانشگاه صنعت آب و برق
1
1
n
2
X
X
- 1
2
+ 3X
1
X
بررسی چند آماره مفید
تعریف :اگر X1,X2,...,Xnیک نمونه تصادفی از متغیر
Xباشد r ،امین گشتاور نمونه حول مبدا به صورت زیر
تعریف میشود.
1
n
r
i
r = 1, 2, 3, L
å
X
i= 1
= M r¢
n
n
å
1
•
همچنین rامین گشتاور نمونه حول میانگین بوسیله Mr
1
= M
) (X - X
نشان داده میشود.
å
n
• اگر r=2باشد .واریانس نمونه بدست میآید.
اگر r=1باشد ،میانگین نمونه بدست میآید.
i
X
i= 1
= X
n
n
r
r
i
i= 1
n
2
) - X
i
(X
å
i= 1
3
دانشگاه صنعت آب و برق
1
n
=
2
M
امید ریاضی و واریانس میانگین نمونه
امید ریاضی
))
n
1
(E (X 1 ) + L + E (X
= )
n
+ L + X
n
+ X
2
1
X
( E (X ) = E
n
( n m ) = mX
1
n
واریانس
) ) ( v ar( X 1 ) + L + v ar( X n
1
2
= )
n
+ L + X
n
+ X
2
s
n
4
(v ar( X ) = v ar
n
2
X
دانشگاه صنعت آب و برق
1
X
=
2
X
n ´ s
2
n
=
یک برآوردگر خوب
برای خوب بودن یک برآوردگر شرایط زیر باید در نظر گرفته
شود.
• نااریب باشد.
• کاراترین باشد
• توزیع آن شناخته شده باشد
برآوردگر نااریب unbiased estimator
^
گوییم ،اگر داشته باشیم که:
برای) ˆE (q
• برآوردگر را برآوردگر نااریبی= q
•
مثال :در مورد واریانس شرط نااریبی وقتی برقرار است که مخرج آن
E (X ) = m
n-1باشد.
2
5
2
E (S ) = s
دانشگاه صنعت آب و برق
کاراترین برآوردگر
باید توجه داشت که برآوردگر نااریب منحصر بفرد
نیست .مانند:
X , X ,L
یا اینکه در توزیع نرمال میانگین ،میانه و نما برآوردگر
نااریب برای میباشند.
تعریف :بین برآوردگرهای نااریب یک پارامتر مانند ،
برآوردگری که کمترین واریانس را داشته باشد ،کاراترین
برآوردگر است.
3
6
دانشگاه صنعت آب و برق
2
تابع چگالی احتمال میانگین نمونهها
چون نمونهها خود متغیر تصادفی هستند ،لذا میانگین آنها
نیز یک متغیر تصادفی است.
برای این متغیر تصادفی باید یک تابع چگالی احتمال
جستحو نمود .برای این کار به قضیه زیر توجه کنید.
• قضیه حد مرکزی :اگر تمام نمونههای تصادفی با حجم nاز
یک جامعه متناهی با میانگین و ( 2با جایگذاری) انتخاب
شوند ،توزیع میانگین تقریبا دارای توزیع نرمال با میانگین
و واریانس 2/nمیباشد .به عبارت دیگر
)N ( 0, 1
X - m
= Z
:
s
n
7
دانشگاه صنعت آب و برق
Distribution of 200 digits from
Social Security Numbers
Frequency
(Last 4 digits from 50 students)
20
10
0
0
1
2
3
4
5
6
7
8
9
Distribution of 200 digits
Figure 5-19
دانشگاه صنعت آب و برق
8
Table 5-2
x
9
SSN digits
4.75
4.25
8.25
3.25
5.00
3.50
5.25
4.75
5.00
4
6
8
5
5
2
6
4
9
4.00
5.25
4.25
4.50
4.75
3.75
5.25
3.75
4.50
6.00
2
6
1
9
5
7
8
6
4
0
7
6
3
8
2
3
6
1
5
3
4
6
7
3
7
3
3
8
3
7
6
دانشگاه صنعت آب و برق
8
3
8
1
3
2
7
1
3
3
7
7
3
4
4
4
5
1
3
6
1
5
9
5
9
4
7
9
5
7
2
6
2
2
5
0
2
7
8
5
Frequency
Distribution of 50 Sample Means for 50 Students
15
10
5
0
0
1
2
3
4
5
6
7
8
9
Figure 5-20
دانشگاه صنعت آب و برق
10
مثال قضیه حد مرکزی
یک نمونه 30تایی از تابع چگالی احتمال زیر انتخاب شده
است .مطلوبست )P(45<Xi<49.5
ìï x
3
ï
ï
f X (x ) = í 4
ï
ï0
ïî
0< x < 2
ot h e rw ise
3
d x = 1.6
x
4
3
8
3
= dx
4
8
75
11
دانشگاه صنعت آب و برق
x
2
òx
= mX
0
2
2
x
ò
2
= ) E (X
0
2
= = ( 83 ) - 1.6
2
X
s
دنباله مثال قضیه حد مرکزی
طرفین بر عدد 30تقسیم میشود و مطابق قضیه حد
مرکزی متغیر مورد نظر نرمال است.
n
)
49.5
30
45
< 49.5) = P ( 30
< < X
i
X
å
< P ( 45
i= 1
æ
ö
çç
÷
÷
çç 1.5 - 1.6
÷ 1.65 - 1.6
÷
P ç
< < Z
)= P ( - 1.68 < Z < 0.84
÷
çç
÷
8
8
÷
75
75
çç
÷
÷
çè
÷
ø
30
30
= 0.753
12
دانشگاه صنعت آب و برق
تابع چگالی احتمال واریانس نمونهها
اگر نمونهای با حجم ( )n<30از یک جامعه نرمال با
میانگین و واریانس 2انتخاب و مقادیر S2را محاسبه
کنید .این مقادیر ،مقادیری از آماره S2هستند ،توزیع
آماره S2مشخص نیست اما توزیع آماره (n-1)S2/ 2
مشخص است و این آماره دارای توزیع توان دوم کای با
v=n-1درجه آزادی است.
قضیه :اگر S2واریانس یک نمونه تصادفی با حجم nاز
یک جامعه نرمال با واریانس 2باشد ،آنگاه توزیع آماره
2
2
n- 1
13
c
:
( n - 1)S
دانشگاه صنعت آب و برق
2
s
اثبات
2
ابتدا میتوان نوشت
- X ) + ( X - m) ù
û
é( X
ë
i
n
n
å
2
= )- m
i= 1
n
) - X
n
å
( X - m ) + 2( X - m ) å ( X
2
i
i= 1
- X ) +
i
(X
i= 1
å
=
i= 1
n
2
2
)- X ) + n (X - m
i
(X
å
=
i= 1
طرفین را بر 2تقسیم میکنیم و جایگذاری را انجام
.
دهیم
می
æX - m ö
( n - 1)S
)( X - m
2
2
2
2
s
+
2
s
n
14
دانشگاه صنعت آب و برق
÷
=
÷
ø
n
i
s
çç
è
å
i= 1
n
2
i
(X
å
i= 1
برآورد
بطور کلی برآوردها به دو دسته تقسیم میشوند.
• برآورد نقطهای
• برآورد فاصلهای
برآورد نقطهای همانطور که از اسمش پیداست ،نشان از
X ; m
یک نقطه دارد .مانند:
S ; s
•
•
15
در این نوع برآورد ،اثر تغییر نمونهها در میزان برآورد
مشهود نیست.
این نوع برآورد دارای احتمال متناظر نیست.
دانشگاه صنعت آب و برق
برآورد فاصلهای
برای این برآورد یک نوع فاصله در نظر گرفته میشود.
Lower # < population parameter < Upper #
As an example
P(Lower # < < Upper #)=1-
احتمال متناظر این فاصله برابر با 1-است.
usually 90%, 95%, or 99%
)( = 10%), ( = 5%), ( = 1%
16
دانشگاه صنعت آب و برق
Confidence Intervals from 20 Different Samples
دانشگاه صنعت آب و برق
17
مقادیر بحرانی ()1
2
2
2
z
z=0
2
-z
مثال اگر مقدار 1-=0.95باشد ،مقدار =0.05است و
مقدار با استفاده از جدول نرمال برابر Z/2=1.96است.
18
دانشگاه صنعت آب و برق
مقادیر بحرانی ()2
95%
= 5%
2 = 2.5% = .025
.95
.025
z2=1.96
19
دانشگاه صنعت آب و برق
.025
-z2=-1.96
حاشیه خطا
نمونه X
میزان خطا میانگین
میتوان با Eنشان داد.
از میانگین جامعه را
µ
x +E
x -E
X - E < m< X + E
حد پایین
حد باال
s
a
n
20
E = Z
2
دانشگاه صنعت آب و برق
اگر مقدار معلوم باشد
اما اگر n<30باشد ،برای اینکه شرط نرمال بودن حفظ
شود ،باید مقدار معلوم باشد.
در این حالت اگر ( n30تعداد نمونه) باشد بجای
میتوان از برآورد آن یعنی Sاستفاده نمود.
21
دانشگاه صنعت آب و برق
مثال
متوسط دمای بدن 106انسان سالم برابر 98.2درجه فارنهایت
است و انحراف معیار آنها 0.62میباشد .یک فاصله اطمینان
برای میانگین جامعه حساب کنید.
= 0.12
0.62
= 1.96
106
s
a
n
E = Z
2
x -E << x +E
98.20o + 0.12
98.32o
22
<<
<<
98.20o - 0.12
98.08o
دانشگاه صنعت آب و برق
n = 106
x = 98.20o
s = 0.62o
= 0.05
/2 = 0.025
z / 2 = 1.96
فاصله اطمینان با نامعلوم
اگر تعداد نمونهها کوچک و نامعلوم باشد ،آنگاه از
شودX - .
توزیع tاستودنت استفاده می m
S
= t
n
فاصله اطمینان بصورت قبل میباشد ولی از t/2استفاده
میشود و حاشیه خطا برابر است با:
S
n
23
,n- 1
E = ta
2
دانشگاه صنعت آب و برق
فاصله اطمینان برای واریانس و انحراف معیار
همانطور که قبال مالحظه شد ،آماره زیر از توزیع مربع
کای پیروی میکند.
( n - 1)S
: c
s
برآورد فاصلهای یا فاصله اطمینان برای واریانس به
شرح زیر است.
2
2
n- 1
2
( n - 1)S
2
L ,n - 1
24
2
2
<
2
< s
c
دانشگاه صنعت آب و برق
( n - 1)S
2
R ,n - 1
c
شکل توزیع مربع کای از حیث توزیع مساحتها
25
دانشگاه صنعت آب و برق
برآوردگر برای 1- 2
کهB .E . m1 - m 2 :
نشان داده میشود
یک برآوردگر خوب میباشد.
2
- X
1
X
- X 2 ) = E ( X 1 ) - E ( X 2 ) = m1 - m 2
2
2
s
+
) - X 2 ) - ( m1 - m 2
2
2
s
+
2
1
2
1
(X
= Z
s
< Z < za) = 1- a
2
26
X 1- X
s
n1
n2
دانشگاه صنعت آب و برق
2
=
n1
n2
): N ( 0, 1
2
1
s
1
E (X
a
2
P (- z
)1( 1- 2 برآورد فاصلهای برای
: عبارت است از1- 2 برای%(1-) بازه اطمینان
(X
(X
1
1
- X 2) - z
- X 2) + z
s
a
2
+
n1
s
a
2
2
1
2
1
n1
s
2
2
n2
+
s
< m1 - m 2 <
2
2
n2
. مورد فوق با توجه به شرایط زیر برقرار است
2
2
2
kn ow n
2
2
2
u n kn ow n
n 1, n 2 ³
30 an y p op u lat ion s 1 , s
n 1, n 2 ³
30 an y p op u lat ion s 1 , s
2
n 1 , n 2 < 30 n orm al d ist rib u t ion s 1 , s
دانشگاه صنعت آب و برق
2
2
kn ow n
27
برآورد فاصلهای برای )2( 1- 2
اگر حجم نمونهها کوچکتر از 30و دو جامعه نرمال و
واریانسها با هم برابر باشند ،خواهیم داشت.
) - X 2 ) - ( m1 - m 2
1
+
n2
1
1
(X
=
) - X 2 ) - ( m1 - m 2
2
2
s
n1
+
n2
2
( n 2 - 1)S 2
2
2
s
n1
=
2
( n 1 - 1)S 1
V
2
=
s
1
V
2
+
s
( n 1 - 1)S 1
2
=
s
2
2
+ V
1
V = V
2
( n 1 - 1)S 1 + ( n 2 - 1)S 2
2
28
= Z
2
s
( n 2 - 1)S 2
2
s
2
1
1
(X
دانشگاه صنعت آب و برق
s
=
)3( 1- 2 برآورد فاصلهای برای
(X
- X 2 ) - ( m1 - m 2 )
1
1
s
Z
T =
n1
=
2
2
( n 1 - 1)S 1 + ( n 2 - 1)S 2
u
s ( n 1 + n 2 - 2)
1
2
- X 2 ) - ( m1 - m 2 )
Sp
1
+
1
n2
n1
2
2
n2
V
(X
=
+
1
Sp =
2
( n 1 - 1)S 1 + ( n 2 - 1)S 2
n1 + n2 - 2
دانشگاه صنعت آب و برق
29
برآورد فاصلهای برای )4( 1- 2
< < m1 - m 2
1
n2
n1
1
1
n2
30
+
1
+
n1
Sp
2, a / 2
Sp
دانشگاه صنعت آب و برق
2, a / 2
- X 2 ) - t n 1+ n 2- X 2 ) + t n 1+ n 2-
1
1
(X
(X
مثال
از دو جامعه نرمال با واریانسهای مساوی ،دو نمونه
تصادفی مستقل n1=9و n2=16انتخاب کردهایم و نتایج
x = 64
s = 36
x = 59
استs .
زیر بدست آمده= 25
95% فاصله اطمینان را برای 1- 2بهدست آورید.
حل :برای t0.975,16+9-2مقدار 2.07بهدست میآید.
2
2
2
2
1
(8 ´ 36 + 15 ´ 25) = 28.83 Þ s p = 5.37
بنابراین
< ´ 2.07 < m 1 - m 2
´ 2.07 Þ 0.37 < m 1 - m 2 < 9.63
31
دانشگاه صنعت آب و برق
1
16
1
16
+
+
1
9
1
9
1
1
23
2
= sp
( 64 - 59) - 5.37
( 64 - 59) + 5.37