บทที่ 10 t.. - มหาวิทยาลัยแม่โจ้

Download Report

Transcript บทที่ 10 t.. - มหาวิทยาลัยแม่โจ้

สาขาเทคโนโลยีการผลิตสัตว์
มหาวิทยาลัยแม่โจ้-แพร่ เฉลิมพระเกียรติ
การแปลงข้อมูล (Transformation)
•
การทดลองโดยทั่วไปมุ่งศึกษาเปรียบเทียบความแตกต่างระหว่าง
Treatment ที่ให้กับหน่วยทดลอง ว่ามีอิทธิพลแตกต่างกันหรือไม่
•
ในการศึกษาเพื่อทดสอบค่าเฉลี่ยประชากรของแต่ละทรีทเมนต์มีค่า
เท่ากันหรือไม่หรือทดสอบอิทธิพลของทรีทเมนต์มีนัยสาคัญหรือไม่
นั้น
1
สาขาเทคโนโลยีการผลิตสัตว์
มหาวิทยาลัยแม่โจ้-แพร่ เฉลิมพระเกียรติ
การแปลงข้อมูล (Transformation)
•
มีข้อตกลงเบื้องต้น (Assumption) คือ ความคลาดเคลื่อนสุ่มมา
จากประชากรเดียวกันที่มีการแจกแจงแบบปกติ โดยมีค่าเฉลี่ยศูนย์
และความแปรปรวนเท่ากันในทุกทรีทเมนต์และแต่ละตัวก็เป็นอิสระ
ซึ่งกันและกัน
•
หากพบว่าข้อมูลไม่เป็นไปตามข้อตกลงเบื้องต้นและทดสอบด้วย
วิธีการทางสถิติ จะทาให้ประสิทธิภาพของการทดสอบลดลง นาไปสู่
การสรุปผลการวิเคราะห์ที่ผิดพลาดและขาดความน่าเชื่อถือ
2
สาขาเทคโนโลยีการผลิตสัตว์
มหาวิทยาลัยแม่โจ้-แพร่ เฉลิมพระเกียรติ
การแปลงข้อมูล (Transformation)
•
วิ ธี ก ารแก้ ปั ญ หาในกรณี ที่ ข้ อ มู ล มี ก าร แจกแจงแบบไม่ ป กติ แ ละความ
แปรปรวนมีค่าไม่เท่ากัน คือ การแปลงข้อมูล (Data Transformation) โดยใช้
วิธีการทางสถิต(ิ Statistical Methods)
•
การแปลงข้อมูล หมายถึง การเปลี่ยนสภาพของข้อมูลที่ศึกษาให้มีการแจก
แจงแบบปกติ ห รื อ ท าให้ ค วามแปรปรวนมี ค่ า เท่ า กั น เนื่ อ งจากข้ อ ตกลง
เบื้องต้นของการทดสอบสถิติบางตัวได้กาหนดไว้ เช่น การทดสอบค่าเฉลี่ย
การทดสอบความแปรปรวน (Analysis of Variance) การวิเคราะห์การ
ถดถอย(Regression Analysis) เป็นต้น
3
สาขาเทคโนโลยีการผลิตสัตว์
มหาวิทยาลัยแม่โจ้-แพร่ เฉลิมพระเกียรติ
การแปลงข้อมูล (Transformation)
•
ใช้เพื่อแปลงข้อมูลให้เป็นไปตามข้อตกลงเบื้องต้น
•
ข้อมูลที่ต้องแปลงค่าก่อนการวิเคราะห์ เช่น ตายกับไม่ตาย ข้อมูลที่เป็น
สัดส่วน หรือ เปอร์เซ็นต์ ข้อมูลเกี่ยวกับการให้คะแนน ข้อมูลที่มคี ่าน้อย
มากๆ ซึ่งข้อมูลเหล่านี้มักมีการกระจายตัวไม่ปกติ
การแปลงข้อมูลมีวัตถุประสงค์
1) ให้ข้อมูลที่แปลงแล้วมีการกระจายแบบปกติ
2) ค่าเฉลี่ยและความแปรปรวนที่แปลงแล้ว เป็นอิสระต่อกัน
4
สาขาเทคโนโลยีการผลิตสัตว์
มหาวิทยาลัยแม่โจ้-แพร่ เฉลิมพระเกียรติ
การแปลงโดยใช้ Square root
•
จะใช้กับข้อมูลที่มีค่าสังเกตมีค่าต่ามาก เช่น จานวนโคโลนีของแบคทีเรีย
•
ข้อมูลมักมีการกระจายตัวแบบ พัวซอง (Poisson distribution) ซึ่งมีค่าความ
แปรปรวนเท่ากับค่าเฉลี่ย
•
แก้ไขให้กระจายตัวปกติ และ ให้ความแปรปรวนเป็นอิสระกับค่าเฉลี่ย ได้
•
ข้อมูลที่มคี ่าต่า ควรใช้ 𝒙
•
ข้อมูลที่มีค่าต่ามาก ควรใช้ 𝒙 + 𝟏 หรือ 𝒙 + 𝒙 + 𝟏
5
สาขาเทคโนโลยีการผลิตสัตว์
มหาวิทยาลัยแม่โจ้-แพร่ เฉลิมพระเกียรติ
การแปลงเป็นค่า Logarithmic
•
เป็นวิธีการแปลงข้อมูลที่มปี ระสิทธิภาพมากที่สุด
•
ใช้ในกรณีที่ ความแปรปรวนมีค่าเป็นสัดส่วนกับค่าเฉลี่ยของทรีทเมนต์
•
ผลจากการแปลง ทาให้ทุกทรีทเมนต์มีความแปรปรวนเท่ากัน
•
ข้อมูลที่มีค่า ลบ ไม่สามารถที่จะแปลงข้อมูลโดยวิธีนี้ได้
•
กรณีที่ข้อมูลที่มีค่า 0 ให้ใช้ log (x+1)
•
Log ฐาน 10 จะง่ายที่สุดสาหรับการแปลงข้อมูล
6
สาขาเทคโนโลยีการผลิตสัตว์
มหาวิทยาลัยแม่โจ้-แพร่ เฉลิมพระเกียรติ
การแปลงโดยใช้ Arcsine
•
จะใช้กับข้อมูลที่มีการนับเป็นเปอร์เซ็นต์ หรือสัดส่วนของตัวอย่างทั้งหมด
•
ข้อมูลที่มกี ารกระจายตัวแบบ binomial distribution มากกว่าแบบปกติ
•
เป็นการวัดหามุมองศา ซึ่งมีค่า sine เป็นรากที่สองของสัดส่วน
=arcsine 𝒙 หรือ sine-1 𝒙
•
มีตารางแสดงค่ามุมวัดเป็นองศาที่แปลงมาจากข้อมูลเดิมทีเ่ ป็นเปอร์เซ็นต์
7