ขนาดตัวอย่างในการท าวิจัย

Download Report

Transcript ขนาดตัวอย่างในการท าวิจัย

ขนาดตัวอย่ างในการทาวิจัย
การคานวณกลุ่มตัวอย่างเพื่อการทาวิจยั ทางการพยาบาล
วันที่ 25 มีนาคม 2553
ณ ห้องประชุม 402 อาคารราชนคริ นทร์
คณะแพทยศาสตร์ มหาวิทยาลัยเชียงใหม่
กิตติกา กาญจนรัตนากร
งานวิจยั และวิเทศสัมพัน์์
What is “Routine to Research”?
Prof. Vicharn Panich
ผลลัพธ์ ของการวิจัยต้ องวัดทีผ่ ลต่ อตัว
ผู้ป่วย หรื อบริการทีม่ ผี ลต่ อผู้ป่วย
โดยตรง ไม่ ใช่ วดั ทีต่ วั ชี้วดั ทุตยิ ภูมิ
เท่ านั้น เช่ น ระดับสารต่ าง ๆ ใน
ร่ างกาย หรื อผลการตรวจพิเศษต่ าง ๆ
การนาผลการวิจัยไปใช้ ประโยชน์ ผลการวิจัย
ต้ องวนกลับไปมีผลเปลีย่ นแปลงการ
ให้ บริการผู้ป่วยโดยตรงหรื อต่ อการจัดบริการ
ผู้ป่วย จึงจะถือว่ าเป็ น R2R
คาถาม 108 ทีอ่ าจเป็ นอุปสรรค
นักวิชาการมักตั้งคาถามเหล่ านี้
1.การคานวณขนาดตัวอย่ าง ???
2.ความน่ าเชื่ อถือของ intervention??
?????????????
คาถามเหล่ านี้
อาจบั่นทอนกาลังใจ
ของนักปฏิบัติการ
ทีก่ าลังริเริ่มทาวิจยั ใหม่ ๆ
ทาให้ เบื่อหน่ าย
และไม่ อยากทาวิจยั
แง........แกล้งหนู
ไม่ทำก็ได้
โน่นก็ผด
ิ นีก
่ ็ผด
ิ
ทางออกที่ดี
- พบกันคนละครึ่งทาง
- พยายามผลักดันให้ นักปฏิบัตมิ องงาน ทีท่ าอยู่ประจาวันเป็ นงานวิจยั
- งานพัฒนาคุณภาพทีท่ าอยู่ เก็บข้ อมูลดีๆ รายงานผลให้ เป็ น และใช้ สถิติ
เปรียบเทียบให้ ถูกต้ อง ก็สามารถ report ได้ ในลักษณะของงานวิจยั
• ความสาคัญของขนาดตัวอย่ าง
- ขนาดเหมาะสม  คาตอบทีถ่ ูกต้ อง
- ขนาดเล็กไป  ไม่ น่าเชื่ อถือ เสี ยเวลา
- ขนาดมากไป  สิ้นเปลืองงบประมาณ เวลา ฯลฯ
• ปั จจัยที่เกี่ยวข้องในการคานวณขนาดตัวอย่าง
1. วัตถุประสงค์ของการวิจยั (objective of the study)
2. ประเภทของตัวแปรหลัก (type of variable)
3. รู ปแบบงานวิจยั (study design)
• Study Objective:
- Hypothesis generating (Pilot study)
 No sample size estimation
- Hypothesis confirmation
* Estimation
* Test of hypothesis
 Sample size estimation
Descriptive study  estimation
• ศึกษาค่าเฉลี่ยจากกลุ่มตัวอย่างเพื่ออ์ิบายค่าเฉลี่ยของกลุ่มประชากร
• ศึกษาอุบตั ิการณ์จากกลุ่มตัวอย่างเพื่ออ์ิบายอุบตั ิการณ์ที่เกิดในกลุ่ม
ประชากร
x อ์ิบายค่า 
p อ์ิ บายค่า 
ศึกษาอุบตั ิการณ์การติดเชื้อในโรงพยาบาลที่ตาแหน่งผ่าตัด
Test of hypothesis : การทดสอบสมมติฐาน
อาศัยทฤษฎีความน่าจะเป็ นศึกษาจากกลุ่มตัวอย่างเพื่อ
ทดสอบความแตกต่าง หรื อความสัมพัน์์ของค่าที่สนใจ โดยใช้
เทคนิคทางสถิติที่เหมาะสม
• ประเภทของตัวแปรหลัก
1. Nominal ตาย, ติดเชื้อ
ข้ อมูลเชิงคุณภาพ
2. Ordinal ปวดมาก, ปวดปานกลาง
3. Interval อุณหภูมิ ,IQ
ข้ อมูลเชิงปริมาณ
4. Ratio น้ าหนัก, ส่ วนสู ง
ขนาดตัวอย่างจะแปรตามพารามิเตอร์
1. ความน่าจะเป็ นของความผิดพลาดในการศึกษา
แสดงเป็ นค่า  เช่น .05, .10
2. ความแปรปรวนของตัวแปรหลัก    SD2
3. Precision of the estimate หรื อ effect size ที่ใช้ในการ
ทดสอบสมมติฐาน
2
Estimation
ขนาดตัวอย่างสาหรับการศึกษาในกลุ่มตัวอย่างเดียว
1. ขนาดตัวอย่างเพื่อใช้ในการประมาณค่าเฉลี่ย
Z 
n
e2
2
2
เมื่อ
คือ ค่าคะแนนมาตรฐานเมื่อกาหนดให้ระดับนัยสาคัญเท่ากับ 
 คือ ค่าความแปรปรวนของค่าที่เราต้องการศึกษา ปกติในทาง
ปฏิบตั ิจะไม่ทราบค่าที่แท้จริ ง จะอาศัยค่าจากการศึกษา
ก่อนหน้านี้ หรื อจาก pilot study หรื อนามาจากประสบการณ์
ของผูเ้ ชี่ยวชาญที่ได้รับการยอมรับในวงการนั้นๆ
1   คือ ระดับความเชื่ อมัน
่ ที่กาหนดให้ เช่น 95%, 99%
e คือ ค่าความคลาดเคลื่อนระหว่างค่าเฉลี่ยของประชากรกับค่าเฉลี่ย
จากกลุ่มตัวอย่างที่มากที่สุดที่ยอมให้เกิดขึ้นได้ในการศึกษานี้
Z
2
ตัวอย่ าง
นักวิจยั ต้องการค่าเฉลี่ยของปริ มาณเกลือฟอสเฟตที่ปรากฏอยู่ใน
อาหารชุดของผูป้ ่ วย โดยเคยมีผรู ้ ายงานว่า SD ของเกลือที่ปรากฎอยูว่ ่า
เท่ากับ 4 ppm. ภายใต้ระดับความเชื่อมัน่ ที่ 95% หากกาหนดว่าค่าเฉลี่ยที่
ศึกษานี้ มีความคลาดเคลื่อนจากค่าจริ งไม่เกิน 0.8 ppm. นักวิจยั จะต้อง
สุ่ มตรวจตัวอย่างในการศึกษานี้ เป็ นจานวนเท่าใด
จากข้อมูลที่ได้ทราบถึง ค่า  คือ 4
ค่า Z ที่ระดับความเชื่อมัน่ 95% คือ 1.96
ค่า e คือ ขนาดความคลาดเคลื่อนที่ยอมให้
เกิดขึ้นคือ 0.8
การคานวณขนาดตัวอย่าง
(1.96) 2 (4) 2
n
(0.8) 2
= 96.04
ดังนั้น ต้องใช้ตวั อย่าง อย่างน้อย 97 ตัวอย่าง
2. ขนาดตัวอย่างเพื่อใช้ในการประมาณค่าสัดส่ วน
Z 2 P(1  P)
n
e2
เมื่อ   คือ ค่าคะแนนมาตรฐานเมื่อกาหนดให้ระดับนัยสาคัญเท่ากับ 
P คือ ค่าสัดส่ วนที่เราสนใจจะประเมินโดยปกติคือค่า
จานวนการเกิดขึ้นของเหตุการณ์ที่เราสนใจ
จานวนตัวอย่างที่ใช้ในการศึกษานั้น
คือ ระดับความเชื่อมัน่ ที่กาหนดให้ เช่น 95%, 99%
e คือ ค่าความคลาดเคลื่อนระหว่างสัดส่ วนของประชากรกับค่าของ
กลุ่มตัวอย่างที่นกั วิจยั ยอมให้เกิดขึ้นในการศึกษา
1
ตัวอย่ าง
หากทางโรงพยาบาลตั้งเป้ าหมายว่าสถิ ติการฉี ดยาผิดพลาดของ
พยาบาลใน 1 ปี ไม่ควรเกิน 5% ทางโรงพยาบาลจึงทาการสุ่ มตรวจ ภายใต้
ระดับ ความเชื่ อ มั่น ที่ 95% และการประมาณอุ บ ัติ ก ารณ์ น้ ี จะมี ค วาม
คลาดเคลื่อนไม่เกินบวกลบ 1% จะต้องใช้การสุ่ มตัวอย่างขนาดเท่าใด
ค่าอุบตั ิการณ์เท่ากับ 5% 
5
 0.05
10
จากข้อมูลที่มีทาให้ทราบ
ค่า Z ที่ระดับความเชื่อมัน่ 95% = 1.96
ค่า e คือขนาดความคลาดเคลื่อนไม่เกินบวกลบ 1% = 0.01
ดังนั้นต้องใช้การสุ่ มตัวอย่างขนาด
(1.96) 2 (0.05)(0.95)

(0.01) 2
= 1824
ดังนั้นต้องสุ่ มตัวอย่างขนาดอย่างน้อย 1,824 ตัวอย่าง
การคานวณขนาดตัวอย่ างเมื่อต้ องการเปรียบเทียบค่าทีไ่ ด้
จากการศึกษากับค่ าทีเ่ ป็ นทฤษฎี หรื อทีม่ กี ารรายงานมาก่ อน
1. ขนาดตัวอย่ างเพื่อเปรียบเทียบค่ าเฉลีย่ ของกลุ่มตัวอย่ าง 1
กลุ่มกับค่ าเฉลีย่ ทีเ่ ป็ นทฤษฎีมาตรฐานมาก่ อน
หากกาหนดให้ค่าเฉลี่ยที่เป็ นมาตรฐาน (Standard Value) เป็ น  0
และค่าเฉลี่ยของกลุ่มตัวอย่างที่ศึกษาเป็ น1
เราจะทดสอบสมมุติฐานที่วา่
 0 : 1   2  0
นัน่ คือ
1   2  0
 1 : 1   2  d
เมื่อกาหนดค่า  และ  แล้ว
เราจะได้ค่าคะแนนมาตรฐาน   และ   ได้
ขนาดตัวอย่างเมื่อต้องการเปรี ยบเทียบค่าเฉลี่ยของกลุ่มตัวอย่างกับค่าเฉลี่ย
เป็ นมาตรฐาน คือ
 (      ) 
n




1
0


2
เมื่อ  คือ ค่าส่ วนเบี่ยงเบนมาตรฐานของข้อมูลของประชากร ซึ่งจะได้
จากการศึกษาในอดีต หรื อที่มีการอ้างอิงมาก่อน
Zα คือ ค่า Z เมื่อกาหนดขนาดของ type I error
Z คือ ค่า Z เมื่อกาหนดขนาดของ type II error
โอกาสผิดพลาดของผลการทดลองที่เรายอมรั บให้
เกิดขึน้ ได้ (the risk of error one is willing to
tolerate)
หรื อ α error
Type II error หรื อ  error
 Type I error

ตารางแสดงค่ า z ณ ระดับ error ต่ างๆ ที่กาหนด
Error level
0.500
0.400
0.300
0.200
0.100
0.050
0.025
0.010
0.005
One - tailed
0.000
0.253
0.524
0.842
1.282
1.645
1.960
2.326
2.576
Two – tailed
0.674
0.842
1.036
1.282
1.645
1.960
2.248
2.576
2.813
ตัวอย่ าง
ผูว้ ิจยั ต้องการศึกษาว่าค่าคะแนนความเครี ยดของพยาบาลใน ward ICU
จะต่างกับพยาบาลโดยทัว่ ไปหรื อไม่ หากอดีตพบว่าค่าคะแนนความเครี ยดใน
พยาบาลทัว่ ไปจะมีค่าเท่ากับ 98 คะแนน ส่ วนเบี่ยงเบนมาตรฐานเท่ากับ 20 และ
เมื่อต้องการหาค่าเฉลี่ยคะแนนความเครี ยดของกลุ่ม พยาบาลใน ward ICU โดย
เก็บข้อมูลนาร่ องพบว่าค่าเฉลี่ยคะแนนความเครี ยดของพยาบาลใน ward ICU
เท่ากับ 110 คะแนน เมื่อ  0.05 และ  0.10 จะต้องใช้ขนาดตัวอย่างจานวน
เท่าไหร่
   1.96
จากข้อมูลที่มี จะได้
   1.28
 1  110
 0  98
  20
ดังนั้น
 (1.96  1.28)20 
n
 110  98 
 64.8 


 12 
2
= 29.16  30 คน
ต้องใช้ตวั อย่างกลุ่มละ 30 คน
2
2. ขนาดตัวอย่ างเพื่อเปรียบเทียบค่ าสั ดส่ วนที่ได้ จาก 1
กลุ่มตัวอย่ าง เทียบกับค่ าทฤษฎีหรื อค่ ามาตรฐาน
อาศัยหลักการเดียวกันจะได้
  0 (1  0 )    1 (1  1 ) 
n

1  0


2
เมื่อ
0
1
 ,  
เป็ นค่าสัดส่ วนของกลุ่มมาตรฐานคือ 0
เป็ นค่าสัดส่ วนของกลุ่มที่ศึกษาคือ 1
มีความหมายเช่นที่ผา่ นมา
เดิมมีผมู ้ าใช้บริ การตรวจสุ ขภาพเพียง 40% คาถามว่าถ้า
โรงพยาบาลส่ งไปรษณี ยบัตรเตื อน  ลูกค้ามาใช้บริ การเพิ่มเป็ น 50%
หากต้องการทาวิจยั สารวจความเห็นโดยกาหนด = 2% และ  = 10%
แล้ว ผูว้ ิจยั ควรจะเก็บข้อมูลจานวนเท่าใดจึงจะเพียงพอ 
เราต้องการทดสอบสมมุติฐาน
 0 : 0  0.40
1 : 0  1  d
กาหนด   2%
  10%
แทนค่า
ดังนั้น
ดังนั้น
  2.32
   1.28
 2.326 (0.40)(0.60)  1.28 (0.50)(0.50) 
n

0.40  0.50


= 317 คนเป็ นอย่างน้อย
2
3. ขนาดตัวอย่ างสาหรับการศึกษาความสั มพันธ์ ระหว่ าง
ตัวแปร 2 ตัว
เมื่อเราต้องการศึกษาค่าความสัมพัน์์ระหว่างตัวแปร x และ y ว่ามี
ค่าเท่าใด มีนยั สาคัญทางสถิติหรื อไม่ สู ตรการคานวณขนาดตัวอย่าง
คือ
    1 r


n

r

2
2

 2


เมื่อ
r


คือ ค่า estimate ของสัมประสิ ท์ิ์สมั พัน์์ของค่าตัวแปรทั้ง
สอง ซึ่งอาจได้จาก pilot study, การศึกษาในอดีต,
การศึกษาของที่มีการอ้างอิงมาแล้ว
คือ ค่า  ที่ได้จากตารางแจกแจงปกติมาตรฐานเมื่อ
กาหนดค่า  ให้
คือ ค่า  ที่ได้จากตารางแจกแจงปกติมาตรฐานเมื่อ
กาหนดค่า  ให้
ตัวอย่ าง
ต้องการศึกษาความสัมพัน์์ของความสัมพัน์์ระหว่างความหวัง
กับความพึงพอใจในการดาเนินชีวิตในสตรี ที่มีบุตรยาก โดยนักวิจยั เชื่อว่าผู ้
ที่มีค่าความหวัง สู งจะมีค่าความพึงพอใจต่า จากการศึกษาของต่างประเทศ
พบว่าค่าสัมประสิ ท์ิ์ สัมพัน์์ระหว่างค่าความหวังกับความพึงพอใจในการ
ดาเนิ นชี วิตในสตรี ที่มีบุตรยาก เท่ากับ -0.2 หากนักวิจยั ต้องการศึกษาใน
คลินิกผูม้ ีบุตรยาก ในไทย นักวิจยั ควรใช้ขนาดตัวอย่างเท่าไหร่
กาหนด   0.05,   0.10
ดังนั้น
   1.960
   1.282
r  0.20
แทนค่าในสู ตรได้ n  261 คน นัน่ คือจะต้องใช้ตวั อย่าง 261 คน
กรณีกลุ่มตัวอย่ างถอนตัวออกจากการวิจยั
หากมีประสบการณ์วา่ ตัวอย่างที่ถูกเลือกเป็ นกรณี ศึกษาของ
โครงการวิจยั ไม่สามารถอยูร่ ่ วมการวิจยั ได้ตลอดช่วงที่กาหนด ซึ่งอาจจะ
ถอนตัวไปด้วยสาเหตุต่างๆ นักวิจยั อาจต้องคานวณขนาดตัวอย่างเผือ่ ไว้โดย
w 

1W
เมื่อ Wเป็ นอัตราการถอนตัวหรื อไม่อยูร่ ่ วมการวิจยั อย่างต่อเนื่อง หากไม่มี
สถิติเดิมเก็บไว้ ก็อาจจะเผือ่ ไว้ได้ถึง 10 – 20%
• Krejcie & Morgan Formular for
Determining needed sample sizes
s  X 2 NP(1  P)  d 2 ( N  1)  X 2 P(1  P)
s = required sample size.
X2 = the table value of chi-square for 1 degree of freedom at the desired
confidence level (3.841).
N = the population size.
P = the population proportion (assumed to be .50 since this would provide
the maximum sample size).
d = the degree of accuracy expressed as a proportion (.05).
No one is in charge of your happiness
except you.
Other Sample Size Determination
1. Regression Analysis
n = 5 or 10 x number of independent variables.
2. Factor Analysis
Should not be done with n < 100.
3. Sampling non respondents
Should take sample of 10-20% of non respondents to use in
non-respondent follow up analysis.
4. Budget, time and other constraints.
- report both appropriate sample size & sample sizes actually
used in the study.
- The reasons for using inadequate sample size.
- Should exercise caution when making programmatic
recommendations based on research conducted with inadequate
sample sizes.
Reference :
1.
Woodward M. Epidemiology Study Design And Data Analysis. 2nd ed. Florida:
Chapman & Hall, 2004.
2.
Donglas GA. Practical statistics for medical research. London: Chapman &
Hall, 1991.
3.
Norman RG, Streiner LD. Biostatistics the bare essentials. Missouri: Mosby –
Year Book, 1994.
4.
Norman RG, Streiner LD. PDQ statistics. Ontario : B.C. Decker, 1986.
5.
Saunders DB, Trapp GR. Basic and clinical biostatistics. New Jersey: Applenton
& Lange, 1990.
6.
Knapp GR, Miller MC. Clinical epidemiology and biostatistics. Maryland:
Williams & Wilkins, 1992: 187-231.