آمار و روش تحقیق
Download
Report
Transcript آمار و روش تحقیق
آمار و روش تحقیق
رشته مددکاری آجتماعی
تهیه :عبداله مصطفوی امجد
کلیات
تعریف آمار:
آمار مجموعه ای از روش ها برای جمع آوری و
خالصه کردن داده ها ،طبقه بندی آنها ،روش های
تحلیلی برای پیش بینی ،برآورد و تصمیم گیری در
شرایط مختلف ارائه می دهد.
سیر تحول آمار:
آمار از نظر موضوعی به سه مرحله تقسیم می شود
)1 آمار توصیفی:
قسمتی از علم آمار است که در باره خالصه
کرده و توصیف خصوصیات مهم داده ها بحث
می کند بدون آنکه استنباط آماری انجام شود.
)2آمار استنباطی
در این نوع آمار ،محقق با استفاده از مقادیر
نمونه آماره ها را محاسبه می کند سپس به
کمک تخمین و آزمون فرض آماری ،نتایج به
دست آمده از آماره ها را به پارامتر های
جامعه تعمیم می دهد.
)3آمار ناپارامتر:
این نوع آمار در مقابل آمار پارامتریک بیان می شود.
فرض اساسی در آمار پارامتریک برخوردار بودن مشاهدات
از یک توزیع خاص مانند توزیع نرمال است.
در صورتی که در این نوع آمار این فرض ضرورتی ندارد.
( بیشتر در علوم رفتاری که متغیر ها ی آن با مقیاس های
کیفی سنجیده می شوند از فنون آمار ناپارامتریک استفاده
می شود)
جامعه آماری:
هر مجموعه ای از افراد ،اشیاء و یا ...را که حداقل
دارای یک خصوصیت مشترک باشند ،جامعه می گویند.
مانند:
اتومبیل های سواری شخصی با سن باالی 15سال
مدیران با مدرک تحصیلی دکتری
فاکتورهای فروش کاال در یک ماه معین
حجم جامعه آماری را با Nنشان می دهند.
جمع آوری اطالعات از همه اعضای جامعه
را سرشماری می گویند.
نمونه:
نمونه تعداد محدودی از آحاد جامعه آماری است که بیان
کننده ویژگی های اصلی جامعه باشند.
تعداد نمونه ها را با nنمایش می دهیم و تکنیک های
انتخاب نمونه را نمونه گیری می گویند.
پارآمتر:
برای بدست آوردن برخی از شاخص ها در
جامعه اگر این شاخص ها را با اندازه گیری
از تمامی عناصر بدست آوریم آنها را پارامتر
می نامند
آماره:
اگر شاخص های مورد نظر در جامعه با استفاده از
بخشی از جامعه( نمونه گیری) بدست آمده باشند آماره
نامیده می شوند.
جامعه
نمونه
آندآزه گیری:
عبارت است از نسبت دادن اعداد به خصوصیات
اشیاء و وقایع یا افراد بر طبق قواعد ی منطقی و
قابل قبول.
آنوآع مقیاس های آندآزه گیری:
)1 مقیاس اسمی
)2 مقیاس ترتیبی
)3 مقیاس فاصله ای
)4 مقیاس نسبی(نسبتی)
خصوصیات مقیاس های اندازه گیری
خصوصیات
ترتیب
ارزش
مبداء صفرقراردادی
مبداء صفر مطلق
انواع
اسمی
ندارد
ندارد
ندارد
ندارد
ترتیبی
دارد
ندارد
ندارد
ندارد
فاصله ای
دارد
دارد
دارد
ندارد
نسبی(نسبتی)
دارد
دارد
دارد
دارد
صفت آماری:
هر عضو جامعه ویژگی هایی دارد که اعضای جامعه
را با آن ویژگی توصیف می کنیم ،به هر ویژگی یک
صفت آماری می گویند.
مثال:
زمان تصادف ،مکان تصادف ،تعداد مصدومین و مانند
اینها صفت هایی برای یک مورد تصادف هستند.
آنوآع صفت ها:
)1 صفت مشخصه :صفت هایی که در همه اعضای
جامعه به طور یکسان وجود دارد.
جامعه آماری و محدوده ی مطالعه با این
صفت ها تعیین می شود.
)2صفت متغیر:
صفت هایی هستند که از هر عضو به عضو دیگر تغییر
می کنند ،از این جهت آنها را به اختصار متغیر می
گوییم این متغیر ها هستند که عمالً در حین تحقیق مورد
سئوال و اندازه گیری قرار می گیرند.
داده ها مقادیر اندازه گیری شده یک متغیر
هستند
دسته بندی متغیر ها:
دسته بندی متغیر ها به ما کمک می کند مسیر مناسبی
برای رسیدن به نتایج درست طی کنیم.
متغیرها
کیفی
اسمی
کمی
ترتیبی
گسسته
پیوسته
متغیر کیفی:
بعضی از متغیر هایی که غیر قابل شمارش و
اندازه گیری اند مثل رنگ چشم ،گروه خونی ،
درجه کیفیت کاالو مانند اینها را متغیر کیفی گویند؛
این گونه متغیر ها ماهیت اندازه پذیری ندارند و
تنها با حاالت یا وضعیت هایی که دارند ثبت می
شوند .متغیر های کیفی می توانند اسمی یا ترتیبی
باشند.
مثال:
اگر به هر یک از گروه های خونی چهار
گانه اعداد 1تا 4را اختصاص دهید ،با یک
متغیر کیفی اسمی روبرو هستید و اگر میزان
مهارت کارگران را با اعداد 1تا 3رتبه بندی
کنید یک متغیر کیفی ترتیبی خواهید داشت.
متغیر کمی:
از آنجایی که ریاضیات و آمار علم کمیت هاست ،به
همین دلیل دامنه ی وسیعی از تحلیل های آماری به
متغیر های کمی اختصاص دارند ،متغیر های کمی
متغیر هایی هستند که قابل شمارش و اندازه گیری اند
و همیشه نتیجه اندازه گیری آنها یک عدد است.
مثال:
تعداد فرزندان یک خانواده/طول یک قطعه/دمای هوا
متغیر های کمی گسسته و پیوسته
گسسته:
متغیر هایی که فقط قابل شمارش
هستند گسسته می باشند
تعداد فرزندان/تعداد دندان
های پوسیده/تعداد تماس
های ناموفق همراه اول
پیوسته:
متغیر هایی که قابل اندازه گیری است
و مقادیر آن در فاصله ای از اعداد
حقیقی قرار دارد متغیر پیوسته می
باشد
دمای هوا/مدت زمان تولید
یک قطعه/وزن یک کاال
آنوآع برآورد:
الف) برآورد نقطه ای(تمام شاخصهای آماره های که
مربوط به پارامتر های خاص هستند برآورد نقطه ای )است
برآورد P
ب) برآورد فاصله ای)یک فاصله ای که با اطمینان معین
پارامتر جامعه ای را درون خود دارد یا براورد ،فاصله ای
است که با درجه اطمینان معین پارامتر جامعه درون آن
قرار می گیرد).
برآورد نقطه ای هیچ اطالعات دیگری به محقق نمی دهد
فقط یک عدد است ،مثال میزان دقت.
آمار استنباطی دو قسمت دارد:
-1آزمون فرضیه
-2بر آورد ها:می خواهیم خصوصیات جامعه را
برآورد کنیم برآورد پارامتر ازروی آماره.
شرآیط آستفاده آز بر آوردها:
-1نمونه تصادفی باشد ،اعضا در
انتخاب شدن مستقل باشد.
-2توزیع اندازه ها طبیعی باشد.
تمام کارهای استنباطی را دو نوع خطا می
تواند بی اعتبار کند
-Iخطا ی اندازه گیری
-IIخطای نمونه گیری
ویژگی برآورد ارزشمند:
:unbiased-1بدون اریب:میانگین میانگین های محاسبه شده
برابر میانگین جامعه است (درآماری گرآیش منظمی جهت بزر گ تر یا
کوچک تر شدن آز پارآمتر وجود ندآشته باشدبرآورد بدون آریب نامیده می شود)
:consistency-2ثبات:با افزایش نمونه مقدار شاخص آماری
برآورد شده به پارامترنزدیکترشود
:efficiency-3کارایی:بدون اتالف اطالعات ،بهترین نتیجه
را بدست دهد(محاسبه نسبت خطای آستاندآردمیانگین به میانه)
sufficiency:-4کفایت:برآورد زمانی مکفی است که
واریانس نمونه گیری) (s2کوچکتر از روش دیگرباشد
*هرچه کارآی ی زیادترباشد ک فایت زیادتر خوآهد بود.
تعریف فرضیه:
فرضیه عبارت است از یک راه حل پیشنهاد ی برای مسئله که شامل
یک حدس آگاهانه ،هوشیارانه و روشن بینانه است و قابل آزمایش .
-Iآگاهانه :یعنی از روی تخصص.
-IIروشن بینانه :یعنی اطالعاتش بروز باشد.
-IIIهوشیارانه :یعنی آدم باهوش وخالقی باشد
-IIIIقابل آزمایش :اگر فرضیه قابل آزمایش نباشد فرضیه
نیست.
آنوآع فرض:
فرض پوچ ،صفر ،آماری ،منفی ( : )H0این فرضیه همیشه به نبود تفاوت،
رابطه از نوع همبستگی وعلّی بین متغییرها نظر دارد.
فرض خالف ،فرض تحقیق ،عکس ،جانشین ،مثبت : )H1 ) ،این فرضیه
همیشه به بود تفاوت ،رابطه از نوع همبستگی و علَی عنوان می گردد.
درجه آزادی :
درجات آزادی به تعداد ارزشیابی اطالق می شود که
پس از قرار دادن برخی محدودیتها در داده ها ،می
توانند آزادانه تغییر کنند.
مثال)Iجمع سه عدد28دو عدد مشخص
باشد عدد سوم اجباری است .
df = n-1
df = 3-1 = 2
مثال )IIده عدد بنویسیم که مجموع سه عدد
اول 25و مجموع کل ده عدد 50باشد.
nده عدد دو محدودیت
=)df
( 10-2= 8 n -2
آزمون فرضیه
آزمون فرضیه مشخص می کند که فرضیه علمی صحیح
است یا صحیح نیست.
#تا فرضیه ای نباشد تحقیق علمی نیست و آمار در
فرضیه ها حرف اول و آخر را می زند.
مراحل آزمون فرضیه:
مرحله اول :
تبدیل فرضیه های علمی به فرضیه های آماری
H0 = 1≤µ2
µ
1>µ2
µH1=
مرحله دوم:
پیدا کردن ابزاری برای آزمون فرضیه.
(آزمونهای آماری مناسب)
مرحله سوم
تعیین قوآعد و مقررآت برآی رد فرضیه صفر :
-1جهت H0وH1
-2توزیع نمونه آی چیستz :یا tیا f
-3مقدآرآلفا α
a
جهت H1
>
<
T
T>Tα
T<-Tα
Z
Z>Zα
Z<-Zα
توزیع نظری
≠
𝛼
2
T>T
𝛼
2
T<-T
Z>Zα/2
Z<-Zα/2
مرحله چهارم
نمونه گیری،جمع آوری داده ها ومحاسبه شاخصهای الزم برای
بدست آوردن مقدار آزمون.
محاسبه با ضابطه ای که در مرحله 3بدست آوردیم ونهایتا ً نتیجه
گیری .
خطای اندازه گیری و خطای نمونه گیری :
#اگر اندازه های دقیق نداشته باشیم خطای موجود در اندازه ها هر
نتیجه گیری را بی اعتبار می کند .
#اگر یک نمونه دقیقا مثل یا شبه جامعه باشد می توان تمام خصوصیات
جامعه را از این نمونه بدست آورد ولی خطای نمونه گیری مانع از بدست
آمدن این نمونه ها می شود.
در جه اطمینان وابسته به اطمینان محقق از نمونه ای است که انتخاب
کرده و اندازه گیری نموده است.
خطای نمونه گیری sampling error :
چنانچه از جامعه ای نمونه های متفاوتی را بصورت تصادفی انتخاب
کنیم مالحظه خواهیم کرد که همه آنها دارای ویژگیهای یکسانی نیستند
وحتی گاهی اوقات ویژگیها ی آنها مشابه جامعه هم نیستند ،علت این امر
وجود نوعی خطا به نام خطای نمونه گیری است.
علل خطای نمونه گیری:
-Iضرورتا نتیجه اشتباه نمونه گیری نیست.
– IIعلت ،اختالفات فاحش در بین آزمودنی ها باشد.
گروه های مستقل و وابسته
گروههای مستقل :یعنی آن گروه هایی که هیچیک ازاعضای آن
گروه نمی تواند عضو گروه دیگری باشد به عبارت دیگرگروهها با
هم همبستگی درونی ندارد .
مثال ) اگر یک گروه از جامعه افراد عصبی وگروه دیگری از جامعه افراد
عادی گزیده شده باشد ،دراین حالت گزارشنمونه یا گروههای مورد تحقیق به
جهت کنترل عوامل یا متغیر های نا خواسته مثال جنسیت ،سن ،وضعیت اجتماعی
،اقتصادی و...یا باید به شیوه تصادفی از دو جامعه یاد شده صورت گیرد ویا به
لحاظ عوامل نا خواسته که اشاره شد جور شوند.ولی باید دانست که این دو گروه
گزینش شده بطور تصادفی یا جور شده عمداتا به لحاظ متغیرمستقل مورد نظر در
این مثال یعنی (وضعیت روانی) کامال مستقل از یکدیگر هستند .ودر این
خصوص با هم تفاوت دارند و هیچیک از افراد عصبی عضو گروه افراد عادی و
بر عکس نیستند .
گروههای وابسته :یعنی آن گروههایی که اعضای هر گروه به سادگی وبدون
هیچ گونه ابهامی می تواند عضو گروه دیگر باشد ،به عبارت دیگر محقق
چنین جابجایی هایی را بدون دغدغه از وجود تفاوت فی مابین اعضا انجام می
دهد.
مثال)ممکن است محقق یک گروه را دو بار مورد آزمایش های ویژه ای قرار
دهد (آزمون اول و دوم) یا دو گروه که هر دو از یک مجموعه هستند (مثال هر
دو از جامعه افراد عصبی یا عادی ) و کامال از هر حیث ولحاظ هرپارامتر با
هم جور می باشند و به عبارتی از هر نظر مشابه هستند مورد یک بار آزمایش
قرار می دهد.
خطای نوع اول و دوم
جدول حاالت ممکن رد یا پذیرشH0
H0نادرست است
H0درست است
توان آزمون1- β
خطای نوع اول ()α
رد H0
خطای نوع دوم( )β
خطایی رخ نداده () 1- α
تایید H0
توضیح:
باید توجه داشت که احتمال رخ داد خطای نوع اول برابرآلفا که همان میزان سطح احتمال
است ،می باشد ،بنابر این محقق می تواند میزان را کنترل کند ،بدین معنی که احتمال رد
نادرست فرض پوچ را با انتخاب اندازه های بزرگی ازآلفا چون 0/25درصد یا 0/30
درصد و مانند آن ،زیاد کند و یا با انتخاب اندازه های کوچکی از آلفا چون 0/01و
0/001این احتمال را بسیار کوچک و ناچیز نماید.
معموال در تحقیقات میزان آلفا بیشتر اندازه های 0/05و 0/01بکار میرود.
(اگر nکم باشد α = 0/15یا α = 0/1نیز با توجه به هدف تحقیق قابل قبول است )
در مورد میزان احتمال رخ داد خطای نوع دوم یعنی بتا ناتوانی رد فرض پوچ هنگامی
که این فرض غلط است ،باید گفت که میزان این خطای احتمال بطور غیر مستقیم به میزان
آلفا و تعداد آزمودنی ها بستگی دارد.به عبارت دیگر میزان اشتباه نوع دوم تا حدودی در
کنترل محقق است ،حال اگر میزان احتمال رد درست فرض پوچ را هنگامی که واقعا غلط
است با 1 -βمشخص کنیم ،در نتیجه میزان احتمال رخ داد اشتباه نوع دوم به میزان
βخواهد بود.
خطای نوع دوم با نوع اول رابطه عکس دارد با افزایش آلفا میزان بتا کاهش می یابد.
عوامل موثر بر ارتکاب خطای نوع دوم
-1سطح معنادار بودن :با کاهش آلفا αاز 0/05به 0/01ارزش
بحرانی آزمون آماری یا ناحیه رد فرض صفر افزایش می یابد.
-2اندازه تاثیرمتغیر مستقل :با افزایش تاثیر متغیر مستقل ،خطای
نوع دوم کاهش می یابد (منجر به افزایش توان آزمون می شود)
-3تعداد پراکندگی موجود در متغیر وابسته :هر چه پراکندگی کم
باشد خطا کم می شود.
راه کاهش پراکندگی :
الف) کنترل متغیر های مشتبه کننده
ب) کاهش خطای اندازه گیری
-4اندازه یا حجم نمونه :با افزایش حجم نمونه خطای βکاهش
می یابد.
ارتباط بین خطای نوع اول و دوم ( αو ) β
بین خطای نوع اول ودوم رابطه معکوس وجود دارد.
اندازه خطای نوع اول با تنظیم آلفا یا مقادیر بحرانی
کاهش پیدا می کند.
افزایش حجم نمونه ،مقادیرآلفا و بتا را همزمان کاهش
می دهد.
توان آزمون:
توان یک آزمون آماری برابر است با احتمال رد H0
هنگامی که این فرض واقعا ً غلط است.به عبارت دیگر:
توان آزمون مساوی است با احتمال قبول H1وقتی که
این فرض واقعا درست است .با ( ) 1 -βنشان می
دهند.
با توجه به 1-βو رابطه توان آزمون با βدر صورت
کاهش βبر توان آزمون افزوده می شود.
سطح اطمینان( سطح معنا دار بودن)
level of significance
احتمال ارتکاب خطای نوع اول را سطح ریسک خطایا
سطح معنا دار بودن آزمون می نامند.
انتخاب این سطح اختیاری است و لی غالبا 0/05و
0/01به عنوان سطح قابل قبول انتخاب می شود.
آزمونهای یک دامنه و دو دامنه
one tailed and two tailed tests
در آزمون دو دامنه :جهت تاثیر متغیر مستقل بر
متغیروابسته معلوم نیست.
آلفا αباید بر دو تقسیم شود α/2راحساب می کنیم
.مثال α =0/05در دو دامنه 0/025یا ± 1/96
انحراف از میانگین
H0:µ =µ0
H1: µ≠µ0
وقتي جهت تأثیر متغیرمستقل بر متغیروابسته معلوم نباشد،
آزمون دو دامنه است.
Ho : 1 2 0
HA : 1 2 0
HA : 1 2
فرض صفر
فرض خالف
رد شود یعني اختالف بین میانگینها
معنيدار است.
اگرH o
آزمونهاي دو دامنه two tailed test
مثال :بين ميانگينهاي قد دختران و قد پسران
دبيرستاني اختالف معنيداري وجود دارد.
ناحیه رد فرض صفر در دودامنه
در آزمونهاي دو دامنه دو ناحيه برراي رد فررض صرفر
( ) H0وجود دارد
كه هر ناحيه برابر با α/2مي باشد .
0/95
مثال :اگر
α=0/05
𝜶
=0/025
𝟐
آزمون یک دامنه
در آزمون یک دامنه :جهت تاثیر متغییر مستقل به
وابسته معلوم است.
در یک دامنه تنها یک ناحیه یا دامنه جهت رد فرض
ناحیه رد
صفر وجود دارد .مثال Z = 0/05
1/64
H0:µ=µ0
H0:µ=µ0
H1:µ>µ0
H1:µ<µ0
تفسیر تایید یا رد فرض صفر
تایید فرض صفر :معنای آن این است که مدارک کافی
برای رد آن وجود ندارد .تایید فرض صفر به این معنی
نیست که این فرض واقعا درست است .
رد فرض صفر :معنای آن این است که بین شاخصهای
آماری مورد مقایسه ،از نظر آماری اختالف معناداری
وجود دارد .
مقصود از معنادار بودن این است که تفاوتهای اندازه گیری
شده تابع شانس نیست .
در صورتی که واقعا H0درست باشد احتمال اینکه اختالف
بین شاخصهای مورد مقایسه از روی شانس باشد برابر α
(خطای نوع اول) است
روش های جمع آوری اطالعات
منظور از جمع آوری اطالعات ،اطالعاتی است که بر
اساس موضوع تحقیق و تعیین متغیر های مطالعه از
جامعه آماری برداشت می شود .در آمار دو روش کلی
برای جمع آوری اطالعات مطرح است:
سرشماری:
یعنی جمع آوری اطالعات از تمامی
اعضای یک جامعه آماری که عمالً
کار بسیار پر هزینه ،وقت گیر و در
بعضی مواقع غیر ممکن است.
نمونه گیری:
مقصود از نمونه گیری انتخاب بخشی از
جامعه است که نماینده همه جامعه باشد،
یعنی انتخاب به گونه ای صورت گیرد که
در حد امکان همه خصوصیات و جزئیات
جامعه در نمونه ای که برمی داریم ،
مشاهده شود.
نمونه گیری و برآورد حجم نمونه
روش های نمونه گیری بسیار متنوع است؛ و بر اساس
توزیع جمعیت و نوع مطالعه و بسیاری مالحظات دیگر
روش های متفاوتی در جمع آوری اطالعات به طریق
نمونه گیری وجود دارد ،به این نکته نیز توجه داشته
باشید که جمع آوری اطالعات ممکن است از نظر نوع
ابزار جمع آوری به یکی از صورت های پرسشنامه،
مصاحبه ،مشاهده ،جامعه سنجی ،کتابخانه ای و ...انجام
شود.
روش های نمونه گیری
روش های نمونه گیری
تصادفی
ساده
سیستماتیک
طبقه ای
خوشه ای
نمونهگیري تصادفي ساده
هریك از اعضاء شانس مساوي براي انتخاب شدن
دارند.
مشكل آن ،تهیه و تدوین لیست افراد جامعه است.
به دو شیوه زیر اعمال می گردد:
الف) قرعه کشی
ب) جدول اعداد تصادفی
نمونهگیري منظم (سیستماتیك)
كلیه اعضاي جامعه تعریف شده ،قبالً بصورت
تصادفي لیستبندي می شود.
سادهتراز روش نمونهگیري تصادفي ساده است.
برخالف روش قبل در اینجا ،انتخاب هر عضو
مستقل از انتخاب سایراعضاي جامعه نیست.
شرایط استفاده از نمونه گیری تصادفی
ساده یا سیستماتیک
الف) در دسترس بودن چارچوب نمونه برداری
ب) شدید نبودن تغییرات صفت متغیر در جامعه
نمونهگیري طبقهاي
در این روش واحد های جامعه مورد مطالعه در طبقه
هایی که از نظر صفت متغیر همگن هستند ،گروه
بندی می شوند.
همان نسبتي كه در جامعه است در نمونه هم برقرار
باشد.
جامعه به گروههاي متجانس تقسیم ميشود.
مثال :دو گروه زنان و مردان
شیوه های نمونه گیری طبقه ای
𝑘nh=𝑛/
-1 مساوی
-2 متناسب )𝑁nh=n(𝑁ℎ/
)nh= n(𝑁ℎ𝑠ℎ/∑𝑁ℎ𝑠ℎ
-3 بهینه
جامعه=N
تعداد افراد هر طبقه=Nh
تعداد طبقات=k
واریانس هر طبقه=sh
نمونهگیري خوشهاي
جامعه مورد مطالعه خیلي وسیع و گسترده است.فهرست
کامل افراد جامعه در دسترس نیست.
واحد نمونهگیري فرد یا عضو نیست بلكه گروهي از
افراد است.
یك مرحلهاي :فقط یكبار نمونهگیري
خوشه اي
چند مرحله اي :چند مرحله تكرار نمونه گيري
تعیین حجم نمونه
بر اساس حالت های زیر نسبت به تعیین حجم نمونه
اقدام می گردد:
-1برآورد میانگین صفت متغیر () µ
-2برآورد نسبت صفت متغیر () P
-1برآور د حجم نمونه براساس میانگین
جهت تعیین حجم نمونه در راستای برآورد پارامتر باید به سه موءلفه
زیر توجه داشت:
– Aمقدار اشتباه مجاز که با ( ) dنشان می دهند که برابر است با
تفاوت میانگین واقعی( ) µبا برآورد آن( 𝑦 ).
| 𝑦d=|µ-
-Bمقدار فاصله اطمینان که به Zنشان داده می شودو عبارت است
از () 1-α
-Cواریانس متغیر مورد مطالعه که با ( )σ2نشان داده می شود.
فرمول محاسبه:
𝑧2 𝜎2
𝑑2
=n
-2برآورد حجم نمونه بر اساس نسبت
در صورتی که بخواهیم نسبت به افراد جامعه که دارای
یک ویژگی خاصی هستندرا براورد کنیم از رابطه
زیر استفاده می شود.
𝑞𝑝 𝑧2
𝑑2
=n
Pبرآورد صفت متغیر و qعبارت است از q=(1-P) :
عوامل موثر در تعیین حجم نمونه
-1واریانس
-2سطح اطمینان
-3حجم جامعه
-4توزیع نظری
)1واریانس
اگر واریانس صفتی که می خواهیم آن را به
وسیله نمونه گیری برآورد کنید زیاد باشد ،
طبیعی است که به حجم نمونه بیشتری نیاز
خواهید داشت.
)2سطح اطمینان
انتظاری که از نمونه می روداین است که
بتواند پارامتر را با دقت کافی برآورد کند و
این انتظار باالیی را می طلبد و افزایش سطح
اطمینان افزایش حجم نمونه را در پی خواهد
داشت.
)3حجم جامعه
از آنجایی که باید صفت مورد بررسی به
جامعه تعمیم داده شود ،در یک جمعیت با
حجم زیاد باید تعداد نمونه به قدری بزرگ
باشد که ویژگی های جمعیت در آنها
مشاهده شود.
)4توزیع نظری
یکی دیگر از عوامل موثر بر تعداد و حجم
نمونه توزیع احتمال صفتی است که در
جامعه وجود دارد.
بیشتر بدانیم:
سطح اطمینان ودقت توسط محقق تعیین می شود؛ اما به
طور معمول واریانس داده ها از قبل مشخص نیست.
روش های تعیین واریانس:
(1استفاده از اطالعات به دست آمده از مطالعات قبلی
)2بر اساس یک نمونه گیری اولیه(پیش آزمون)می توان واریانس را برآورد
کرد.
)3گاهی در پرسشنامه ها که پاسخ ک ّمی دارند و از کمترین و بیشترین مقادیر
آنها اطالع داریم ،می توان واریانس را از رابطه زیر محاسبه
کرد.
σ2= max(𝑥𝑖) – min(𝑥𝑖) / 6
فرمول محاسبه حجم نمونه (متغیر کمی و N
زیاد باشد)
2 𝜎2
𝛼𝑍1−
2
𝑑2
𝛼 = 0/05
𝛼
Z (1 − 2 ) =1/96
=n
فرمول محاسبه حجم نمونه (متغیر کمی و N
محدود)
2 𝜎2
𝛼 2 𝜎2
1−
2
𝑧 𝑁
𝛼
1−
2
𝑧 𝑁−1 𝑑2 +
= Nحجم جامعه است
=n
متغیر رتبه ای و دو ارزشی و Nزیاد
𝑞𝑝 2
𝛼
1−
2
𝑑2
𝑧
=n
متغیر رتبه ای و دو ارزشی و Nکم
𝑞𝑝 2
2
𝑞𝑝 𝛼
1−
2
𝑧 𝑁
𝛼
1−
2
𝑧 𝑁−1 𝑑2 +
=n
آزمون های ناپارامتریک
آزمون هم توزیعی کی دو 𝑒𝑟𝑎𝑢𝑞𝑠 𝑥 2 𝑐ℎ𝑖 −
در بسیاری از تحقیقات محقق عالقمند به شمارش افراد ،اشیاء
و یا پاسخ هایی است که در طبقه هایی خاص قرار می
گیرند.مثالً تعداد ی از بیماران را می توان بر حسب گروه
خونی به 4دسته AB،B،O،Aطبقه بندی کرد یا مثالً ممکن
است افراد مختلف را بر حسب این که آیا «موافق» « ،بی
تفاوت» ،و «مخالف» کار بیرون از منزل زنان هستند ،دسته
بندی کرد.
در این حال محقق می تواند پاسخ های ذکر شده ،از نظر
فراوانی با یکدیگر تفاوت معنی داری خواهند داشت را آزمون
کند.این آزمون از نوع آزمون تطابق توزیع است.
فرضیه ،آماره آزمون و درجه آزادی
فرضیه ها :در این آزمون فرضیه ها به صورت زیر
مطرح هستند.
تفاوت بین فراوانی طبقه ها وجود ندارد 𝐻0 :
حد اقل دو طبقه از نظر فراوانی متفاوت اند𝐻1 :
آماره آزمون:
𝑛
𝑓𝑜−𝑓𝑒 2
𝑒𝑓
2
= 𝑥
𝑖=1
فراوانی های مشاهده شده= fo
فراوانی های مورد انتظار= fe
df= k-1
توزیع آماره آزمون
آماره این آزمون دارای توزیع کی دو با k-1درجه آزادی
است .که مقادیر آن در سطح معنی داری 𝛼 در جدولی به
نام جدول توزیع کی دو آمده است k(.تعداد طبقات است).
قائده رد فرض صفر :𝐻0
مقدار آماره آزمون را محاسبه کرده ،در صورتی که مقدار
آن از مقدار جدول کی دو بیشتر باشد فرض صفر را رد
می کنیم و در غیر این صورت فرض صفر را نمی توان
𝑘−1و𝛼 𝑥 2 > 𝑥 2
رد کرد
مثال )1آزمون هم توزیعی(
100نفر را به صورت تصادفی انتخاب کرده ایم و یکسان
بودن گروه خونی مختلف مورد بررسی است.
سئوال این است که آیا تعداد گروه خونی در این جمعیت
(نمونه) مساوی است.توزیع گروه های خونی مطابق جدول
زیر است.
گروه خونی
A
O
B
AB
تعداد
23
38
21
18
فرضیه های تحقیق مثال 1
تفاوت بین فراوانی گروه های خونی وجود ندارد𝐻0 :
حداقل دو گروه خونی از نظر فراوانی متفاوت است𝐻1 :
جدول تکمیلی و محاسبه کی دو
A
O
B
AB
جمع
Fo
23
38
21
18
100
Fe
25
25
25
25
100
محاسبه شده 𝑥 2 = 9/5
fe= ∑ 𝑘𝑓𝑜=100
= 25
4
Df=k-1
Df=4-1=3
جدول 3 = 7/82و𝑥 2 0/05
با توجه به اینکه کی دو محاسبه شده از کی دو جدول در سطح 0/05و درجه
آزادی 3بیشتر است بنا بر این فرض صفر رد می شود .یعنی توزیع گروه های خونی در این
جمعیت یکسان نمی باشد
نحوه محاسبه کی دو
Fo-fe
Fe
Fo
گروه خونی
0/08
4
-2
25
23
A
6/76
169
13
25
38
O
0/64
16
-4
25
21
B
1/96
49
-7
25
18
AB
𝟐 𝒆𝒇𝒇𝒐−
𝒆𝒇
9/5
𝟐
𝒆𝒇 𝒇𝒐 −
جمع
آزمون استقالل کی دو( برای دو متغیر)
جدولی که در آن داده های آماری در rسطرو cستون
قرار دارد یک جدول توافقی است .در چنین جداولی می
توان تاثیر یک متغیر کیفی (اسمی یا ترتیبی) را بر روی
یک متغیر کیفی دیگر بررسی کرد.
صفت B
𝒄𝑩
….
𝟑𝑩
𝟐𝑩
𝟏𝑩
𝐴1
𝐴2
…
𝑟𝐴
صفت A
شرایط آزمون استقالل کی دو در جداول توافقی
-1فراوانی مورد انتظار در هیچ طبقه ای نباید صفر باشد.
-2جمع فراوانی طبقاتی که فراوانی آنها کمتر از 5است
نباید بیشتر از %20فراوانی کل باشد.
-3عضویت افراد در گروه با هم همپوشانی نداشته باشد،
یعنی هیچ فرد یا موردی نتواند در بیشتر از یک ترکیب یا
طبقه قرار گیرد.
فرمول محاسبه ،درجه آزادی
𝑟
𝑐
𝑓0−𝑓𝑒 2
𝑒𝑓
2
= 𝑥
𝑗−1 𝑖=1
)Df=(r-1)(c-1
𝑐∑ 𝑟∑
𝑁
=Fe
جمع
سطر
ستون جمع×
=Fe
کل جمع
فرضیه های تحقیق و قائده رد فرض صفر
رابطه ای بین دو متغیر وجود ندارد𝐻𝑜 :
بین دو متغیر رابطه وجود دارد𝐻1 :
قائده رد فرض صفر:
)𝛼 1−و𝑓𝑑( 𝑥 2 > 𝑥 2
مثال برای استقالل
محققی می خواهد نتیجه آزمایش انرژی زایی نوعی
ویتامین را به افراد بررسی کند .او به 100نفر ویتامین
مورد نظر و به 100نفر دیگر (گروه شاهد) شبه دارو
تجویز می کند ،نتیجه در جدول زیر آمده است .فرضیه
مورد بحث را در سطح معنی داری 5درصد آزمون
کنید.
گروه ها
نتیجه آزمایش انرژی زایی
افزایشی
کاهشی
بدون تغییر
36
8
56
آزمایش
20
10
70
شاهد
2
محاسبه feو 𝑥
جمع
100
100
200
شاخص
نتیجه آزمایش انرژی زایی
افزایشی
کاهشی
بدون تغییر
36
8
56
fo
28
9
63
fe
20
10
70
fo
28
9
63
fe
56
18
126
Fe=100×126
=63
200
گروه ها
آزمایش
شاهد
جمع
تشگیل جدول وآزمون فرض
𝟐 𝒆𝒇𝒇𝒐−
𝒆𝒇
𝟐
Fo-fe
𝒆𝒇 𝒇𝒐 −
Fo
Fe
0/78
49
-7
63
56
0/11
1
-1
9
8
2/29
64
8
28
36
0/78
49
7
63
70
0/11
1
1
9
10
2/29
64
-8
28
20
6/36
𝐻0رد می شود
𝑥 2جدول > 𝑥 2محاسبه شده
𝑥 2 = 6/36
Df= (2-1)(3-1)= 2
0/95 = 5/99و 𝑥 2 2
آزمون : T
حالت اول :برای آزمون فرض پوچ یا نبود تفاوت بین میانگین
نمونه ای خاص(یک نمونه) با میانگین 𝑋 و انحراف استاندارد S
و میانگین جامعه با میانگین μو انحراف استاندارد نامعلوم.
𝜇𝑋−
∑ 𝑥2
)𝑁(𝑁−1
= T
Df = N-1
آزمون tبراي تفاوت بین میانگینهاي نمونه
مراحل كار :همان مراحل كار(*) در آزمون یك
گروهي ميباشد.
فقط محاسبه tو dfآن فرق دارد.
محاسبه : tفرمولهاي ()1و()2
محاسبه : dfدرجات آزادی برای هردو فرمول
()1و( )2برابراست با:
df=n1+n2-2
فرمول Tبرای گروه های مستقل
مقایسه میانگینهاي دو گروه مستقل
گروهها (یا نمونههایي)
هستند كه انتخاب آزمودنيها در یك
نمونه تأثیري در انتخاب آزمودنیها
دیگري ندارد.
مستقل
در پژوهش دو نوع نمونه مستقل به كار برده مي
شود
نمونه هاي مستقلي كه بصورت تصادفي
روش تجزیه و تحلیل در هر شرایط یكسان است
آزمون tبراي گروههاي همبسته
وقتي نمونه ها مستقل نباشند ،همبسته یا وابسته هستند.
نمونه ها ي همبسته در چنین
طرح هاي پژوهشي بكار
مي روند
اندازه گیري هاي
مكرر
طرح جفت هاي
همتراز شده
آزمون tبراي گروههاي همبسته
اندازهگیريهاي مكرر :
در این نوع طرح هر آزمود ني در نمونه مورد مطالعه
دو بار اندازه گیري مي شود :قبل و بعد از اجراي
متغیر مستقل (آزمایشي )
سپس با یك آزمون آماري ،اختالف بین دو بار اندازه
گیري ،معین مي شود .
آزمون tبراي گروههاي همبسته
طرح جفت هاي همتراز شده :
در این نوع طرح آزمود نیهاي هر دو نمونه (گروه
هاي آزمایش و كنترل ) بر اساس یك یا چند متغیر
كه با متغیر وابسته (متغیر مالك ) رابطه دارند ،
همتراز مي شوند .
آزمون tبراي گروههاي همبسته
هدف آزمون tبراي گروههاي همبسته همانند نمونههاي
مستقل عبارتست از پاسخگویي به این سوال كه:
آیا تفاوت بین میانگینها ناشي از عوامل شانس است یا
حاصل تفاوت واقعي بین میانگینهاي جامعهاي كه
نمونههاازآن بصورت تصادفي انتخاب شدهاند؟
آزمون tبراي گروههاي همبسته
مراحل كار :
همان مراحل كار توضیح داده شده در (*) آزمون یك
گروهي ميباشد.
فقط محاسبه tو dfفرق دارد.
محاسبه tوdf
D X1 X 2
مثال
براي نمونه اي كه از 25جفت آزمودني تشكيل شده است
∑ 𝐷 = 50 و ∑ 𝐷 2 = 400نسبت tرا محاسبه
کنید.
D X1 X 2