การทดลอง - คณะเกษตรศาสตร์ มหาวิทยาลัยขอนแก่น

Download Report

Transcript การทดลอง - คณะเกษตรศาสตร์ มหาวิทยาลัยขอนแก่น

เอกสารประกอบการสอนรายวิชา 100302
่ ศรี
อ.ดร. พ ัชริน สง
ภาควิชาพืชศาสตร์และทร ัพยากรการเกษตร
คณะเกษตรศาสตร์ มหาวิทยาล ัยขอนแก่น
บทที่ 4
้ งต้น
การวางแผนการทดลองเบือ
-
การแสวงหาคาตอบตามทีไ
่ ด้
วางแผนไว ้
 เพือ
่ ค ้นหาความจริงใหม่ๆ
 ห รื อ ท ด ส อ บ ผ ล ที่ ไ ด ท
้ า
มาแล ้วว่าเป็ นจริงหรือไม่

•
ความหมายคล ้ายกัน
•
แต่การทดลองเป็ นระเบียบวิธวี จิ ัยประเภท
หนึง่ ในหลายประเภท
– การวิจัยเชงิ ประวัตศ
ิ าสตร์
– การวิจัยเชงิ พรรณนา
– การวิจ ัยเชงิ ทดลอง
สถิตก
ิ ับการวิจ ัย
วิธก
ี ารทางวิทยาศาสตร์
การแสวงหาความรูใ้ หม่
ั
จากปัญหาทีช
่ ดเจน
มีระบบและมีจด
ุ มุง
่ หมายทีแ
่ น่นอน
การวิจ ัย
การเก็บข้อมูล 1
สถิต ิ
การวิเคราะข้อมูล 2
การแปลผลการทดลอง 3
•
•
วิจัยเป็ นการแสวงหาความรู ้ใหม่โดยวิธก
ี ารทาง
วิทยาศาสตร์
สถิตเิ ป็ นกระบวนการแสวงหาความรู ้ใหม่ ที่
เกีย
่ วกับ
–
–
–
–
–
การวางแผนการทดลอง
การเก็บข ้อมูล
การวิเคราะห์ข ้อมูล
การแปรผลข ้อมูล
ซงึ่ จะทาให ้ผลการทดลอง หรือ
ื่ ถือ
ผลการวิจัยมีความน่าเชอ

ื่ ถือ ถ ้าหาก
ผลการทดลองไม่น่าเชอ
› การทดลองขาดการวางแผนการทดลองทีด
่ ี
› และขาดการเก็บข ้อมูลทีด
่ ี
 ขาดความสมบูรณ์ในการวิเคราะห์ข ้อมูลทางสถิต ิ
นักวิจัยทางานทดลอง
 เพือ
่ ให ้ได ้ความรู ้ใหม่ๆ
้ ้เป็ นประโยชน์
 และนาความรู ้นั น
้ ไปใชให
่ การพัฒนาพันธุพ
ั ว์ การ
เชน
์ ช
ื และ สต
จัดการดินและน้ าเพือ
่ เพิม
่ ผลผลิต

หล ักการวางแผนการทดลอง
่ นประกอบในงานทดลอง
สว
ทรีตเมนต์ (treatment) คือ สงิ่ หรือวิธก
ี ารที่
นามาทดลองเปรียบเทียบกัน
หน่วยทดลอง (experimental unit) คือ
กลุ่ ม หรื อ วั ต ถุ ท ดลองที่ ไ ด ร้ ั บ ทรี ต เมนต์ใ ดทรี ต
เมนต์หนึง่
1.
ทรีตเมนต์ (treatment) คือ
สงิ่ ทดลอง
วิธก
ี าร
หรือ
่
ทีน
่ ามาทดลองเปรียบเทียบก ัน เชน
• วิธก
ี ารกาจ ัดแมลง
• พ ันธุพ
์ ช
ื ทีน
่ ามาทดลองเปรียบเทียบ

้ ๋ ยในอ
การใชป
ุ
ัตราต่างๆ
2. หน่วยทดลอง (experiment unit) คือ
กลุม
่ ของว ัตถุทดลองทีไ่ ด้ร ับทรีตเมนต์
ใดทรีตเมนต์หนึง่
่
เชน
 การทดสอบการเปรียบเทียบปุ๋ยสูตร
ต่างๆ กับต ้นหน ้าวัวในกระถาง
 การทดสอบการเปรียบเทียบปุ๋ยสูตรต่างๆ
กับต ้นหน ้าวัวในกระถาง
› ปุ๋ยสูตรต่างๆ เป็ น tmt
› กระถาง ต ้นหน ้าวัวเป็ นหน่วยทดลอง
การทดลองเปรียบเทียบสูตรอาหารหมู
การทดลองเปรียบเทียบสูตรอาหารหมู
› อาหารสูตรต่างๆ เป็ น tmt
› หมูในคอกคือ หน่วยการทดลอง
หล ักการวางแผนการทดลอง
ความคลาดเคลือ
่ นของการทดลอง
(Experimental error)
ความแตกต่ า งระหว่ า งหน่ ว ยทดลองที่
ได ้รับอิทธิพลของทรีตเมนต์เดียวกัน
1.
ความแตกต่างทีม
่ อ
ี ยูใ่ นว ัตถุทดลองก่อนการ
ทดลอง (inherent variability)
1. ความแตกต่างทีม
่ อ
ี ยูใ่ นว ัตถุทดลองก่อนการ
ทดลอง (inherent variability)
่ การทดลองสูตรอาหารต่างๆ ก ับการเลีย
้ งสุกร
เชน
ปัญหา พ ันธุกรรมสุกร
2. ความแตกต่างเนือ
่ งมาจากสงิ่ ภายนอก
(extraneous variability)
2. ความแตกต่างเนือ
่ งมาจากสงิ่ ภายนอก
(extraneous variability)
่ อิทธิพลของสภาพแวดล้อม การทดลองในสภาพ
เชน
แปลง
ิ ธิภาพดี
การทดลองทีม
่ ป
ี ระสท
› ต้องมีความคลาดเคลือ
่ นของการทดลองน้อย
ทีส
่ ด
ุ เท่าทีจ
่ ะทาได้
• การลดความคลาดเคลื่อ นของ
การทดลองอ น
ั เนือ
่ งมาจากความ
แตกต่างของว ัตถุทดลอง
• ท าได้โ ดยการเลือ กว ต
ั ถุ ท ดลอง
ให้ม ค
ี วามสม่า เสมอ หรือ เลือ กใช ้
แผนการทดลองทีเ่ หมาะสม
โดยทดลองอย่างละม ัดระว ัง
 พิถพ
ี ถ
ิ ันในการดูแลงานทดลอง
 มีความแม่นยาในการใชเ้ ทคนิคในการเก็ บข้อมูล
 มีความรอบคอบในการบ ันทึกข้อมูล

การทาซา้ (replication)
คือ การทีใ่ ห้ทรีตเมนต์หนึง่ ๆ ก ับหน่วยทดลอง
อย่างน้อย 2 หน่วยทดลอง
่
• เชน
การทดสอบเปรียบเทียบปุ๋ยสองระด ับ ได้แก่
25 กก./ไร่ ก ับ 50 กก./ไร่
•ปลูกทดสอบทงหมด
ั้
8 แปลง
•ทรีตเมนต์ละ 4 แปลง (4 ซา้ )
้ นนเป
การทาซา
ั้ ็ นสงิ่ ทีจ
่ าเป็นมากใน
การทางานทดลอง
เพราะซ ้า น น
ั้ มีบ ทบาทส าค ญ
ั ใน
การทดลองหลายประการ คือ
1.ทาให้ประมาณค่าความคลาดเคลือ
่ น
ของการทดลองได้

ความคลาดเคลือ
่ นของการทดลอง คือความแตกต่างก ัน
ของหน่วยทดลองทีไ่ ด้ร ับอิทธิพลของ tmt เดียวก ัน

ด ังนนอย่
ั้
างน้อยต้องมี 2 หน่วยทดลองทีไ่ ด้ร ับอิทธิพลของ
tmt เดียวก ัน จึงจะประมาณหาค่าความคลาดเคลือ
่ นของ
การทดลองได้
้
2. ทาให้การทดลองมีความเทีย
่ งตรงมากขึน
โดยทาให้ standard error ของ
treatment mean ลดลง ซงึ่ แสดงให้เห็น
ได้จากสูตร
สู ตร
SE =
2
S /r
เมื่อ SE = standard error ของ treatment mean
S2 = experimental error
และ r = จำนวนซ้ำของกำรทดลอง
3. เป็นการควบคุมความคลาดเคลือ
่ น
ของการทดลองได้
การทดลองหนึง่ ๆ จะมีจานวนซา้
้ อยูก
เท่าใด ขึน
่ ับปัจจ ัยหลายประการ
ได้แก่
ึ ษา
1. ความแปรปรวนของล ักษณะทีศ
่ ก
- ถ ้าความแปรปรวนมาก ควรมีซ้ามาก
- แปรปรวนน ้อย ซ้าน ้อย
2. จานวนทรีตเมนต์
- Tmt น ้อย ซ้ามาก เนือ
่ งจากต ้องให ้มี df ของ
error ไม่ควรน ้อยกว่า 9 และในชว่ งทีเ่ หมาะสม
ควรจะเป็ น 10-12
3.
•
•
ขนาดของความแตกต่า ง หมายถึงความ
แตกต่างระหว่างค่าเฉลีย
่ ของทรีตเมนต์
ถ ้าขนาดความแตกต่างของ tmt
มีมาก ไม่ต ้อง
ทาซ้ามาก
เช่ น การทดสอบวิธ ี ก าจั ด วั ช พื ช กั บ ผลผลิต ของ
ข ้าวโพดสองการทดลอง
• 1 เปรียบเทียบวิธก
ี ารกาจัดด ้วยมือ กับไม่ดายหญ ้า
• 2 เปรียบเทียบวิธก
ี ารกาจัดวัชพืชด ้วยมือกับสารเคมี 5
สาร
•
การทดลองทีห
่ นึง่ ควรมีซ้าน ้อยกว่า
่ (randomization)
การสุม
หมายถึง การจัดให ้ทรีตเมนต์มโี อกาสทีจ
่ ะถูกกาหนด
ให ้กับหน่วยทดลองใดเท่าๆ กัน
 เพื่อทีจ่ ะทาให ้ทรีตเมนต์อยู่ในหน่ วยทดลองใด โดย
ไม่ลาเอียง (bias)
่ จะทาให ้ประมาณค่าความคลาดเคลือ
 การสุม
่ นของการ
ทดลองได ้อย่างถูกต ้อง
 ท าให ้การหาค่า เฉลี่ย อิท ธิพ ลของทรีต เมนต์ม ีค วาม
ถูกต ้อง
 ท าให ้การเปรีย บเทีย บทรีต เมนต์อ ยู่ บ นพื้น ฐานของ
ความยุตธิ รรม
ขนตอนและส
ั้
งิ่ ทีค
่ วรพิจารณาใน
การวางแผนทาการทดลอง
ึ ษาปัญหาและวิเคราะห์ปญ
1. ขนศ
ั้ ก
ั หา
2. ขนต
ั้ งว
ั้ ัตถุประสงค์ของการทดลอง
3. ขนการเลื
ั้
อกทรีตเมนต์
4. ขนการเลื
ั้
อกว ัตถุทดลอง
5. ขนการเลื
ั้
อกขนาดการทดลอง
6. ข น
ั้ ก า ร เลือ ก เท ค นิค ห รื อ วิธ ี ก า ร
ทดลองทีเ่ หมาะสม
7. ขนการเลื
ั้
อกแผนการทดลอง
ึ ษา และ
8. ข น
ั้ การเลือ กล ก
ั ษณะทีศ
่ ก
ล ักษณะประกอบอืน
่ ๆ
่ การปลูกข ้าวโพดมีปัญหาเรือ
เชน
่ งโรคทาให ้
โตไม่ด ี
 การปลูกข ้าวมีปัญหาเรือ
่ งดิน
้
 การป้ องกันการชะชางของดิ
น

การจะตอบค าถามเหล่า นี้ ไ ด ้จะต ้องมีก าร
ทดลองเพือ
่ แก ้ปั ญหา
ั
ชดเจนและเจาะจงว่
าจะตอบคาถามอะไร หรือทดสอบ
สมมุตฐ
ิ านอะไร
้ ับประชากรกลุม
 ทีส
่ าค ัญต้องระบุวา
่ จะใชก
่ ป้าหมาย
ประชากรใด
่ งานทดลองหนึง่ มีว ัตถุประสงค์เพือ
 เชน
่ หาอ ัตราปุ๋ยที่
เหมาะสมต่อการปลูกข้าวนาปร ังในเขตชลประทานภาค
กลาง
 ด ังนนงานทดลองนี
ั้
ใ้ ชไ้ ด้ก ับเฉพาะทีท
่ ดลองเท่านน
ั้

ต ้องพิจ ารณาว่า tmt
ที่เ ลือ กนั ้น สามารถท าให ้บรรลุ
วัตถุประสงค์ของการทดลองหรือสามารถตอบคาถามทีต
่ ั ง้
่
เอาไว ้ได ้ เชน
ปั ญหา ข ้าวผลผลิตต่า นั กวิจัยจึงตัง้ สมมุตฐ
ิ านสองอัน
ดังนี้
วัชพืช?
หากเป็ นวัชพืชหามีวธิ ก
ี ารกาจัดอย่างไร
1. tmt ควรเป็ น กาจัดวัชพืช กับ ไม่กาจัด
่ ใชแรงงานคนกั
้
2. tmt ควรมีหลายวิธ ี เชน
บสารเคมี
•ว ัตถุทดลองควรมีความสมา
่ เสมอหรือมีความ
แปรปรวนน้อย เพราะจะทาให้ความคลาดเคลือ
่ นของ
การทดลองน้อยด้วย
เล็กใหญ่ ขึน
้ กับ tmt ซา้ และขนาดของหน่วย
ทดลอง
 จานวน tmt ขึน
้ กับ วัตถุประสงค์ของการทดลอง
ด ้วย
 จานวนซ้า ขึน
้ กับ

ึ ษา
› ความแปรปรวนของลักษณะทีศ
่ ก
› จานวน tmt
› ขนาดของความแตกต่างของ tmt

ควรควบคุมอิทธิพลจากภายนอกเพียงพอให ้ tmt
แสดงอิทธิพลได ้ในสภาพทีเ่ หมือนกัน
7. ขัน
้ เลือกแผนการทดลอง
ึ ษา
8. เลือกลักษณะทีศ
่ ก
้ นกรณีทห
 ใชใ
ี่ น่วยทดลองมีความ
สมา
่ เสมอเหมือนก ัน
 สามารถทีจ
่ ะควบคุมสภาพแวดล้อมให้
หน่วยทดลองมีความเหมือนก ันได้
งานทดลองในห้องปฏิบ ัติการ
่ (randomization)
การสุม
่ ทรีตเมนต์สาหร ับหน่วยทดลอง
 คือการสุม
่ แบบสมบูรณ์
 เป็นล ักษณะของการสุม
 ทุ ก ๆ หน่ ว ยทดลองมีโ อกาสที่จ ะได้ร บ
ั ทรีต
เมนต์ใดทรีตเมนต์หนึง่ อย่างยุตธ
ิ รรม
•สมมติวา
่ งานทดลองหนึง่
• ต้องการเปรีย บเทีย บทรีตเมนต์ 4
ทรีทเมนต์ คือ A B C และ D
• แต่ละทรีตเมนต์ม ี 5 ซา้
้ งหมด
ขนที
ั้ ่ 1 กาหนดหน่วยทดลองทีต
่ อ
้ งใชท
ั้
ซงึ่ จะเท่าก ับ
้ (5)
 จานวนทรีตเมนต์ (4) คูณด้วยจานวนซา

ขนที
ั้ ่ 2 การให้เบอร์ของหน่วยทดลอง เพือ
่ การ
สะดวก ในการ
่ จะให้เบอร์ของหน่วยทดลองตงแต่
 สุม
ั้
1 ถึง n
คือจานวนหน่วยทดลองทงหมด
ั้
จากต ัวอย่าง
จะได้ เบอร์หน่วยทดลองตงแต่
ั้
1 ถึง 20 ด ังนี้

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
่ จ ัดหน่วยทดลองให้ได้ร ับทรีต
ขนที
ั้ ่ 3 สุม
เมนต์ตา่ ง ๆ โดยวิธ ี
จ ับฉลาก หรือใชต้ ารางเลขสุม่
•
•
•
•
•
่ โดยการจ ับฉลาก
1. การสุม
ทาฉลากทีเ่ หมือน ๆ ก ันจานวน 20 ใบ เขียน ทรีต
เมนต์ลงบนฉลาก ทรีตเมนต์ละ 5 ใบตามจานวน
ซา้
เขียน A B C และ D ลงบนฉลากอย่างละ 5 แผ่น
ม้วนฉลากให้เหมือนก ัน โดยไม่ให้เห็นต ัวอ ักษรท
รีตเมนต์ทเี่ ขียนอยูภ
่ ายใน
่ ลากลงในกล่องเขย่าให้ปนก ันดีแล้วค่อย ๆ
ใสฉ
่ ลากกล ับคืน
้ มาทีละแผ่น โดยไม่ใสฉ
จ ับฉลากขึน
แผ่นแรกได้
อก
ั ษ รใ ด ก็ จะ เ ป็ น ท รีต เ ม น ต์
ส าหร ับหน่ว ยทดลองที่ 1 แผ่น ที่ 2
ได้อ ักษรใดก็ เป็นทรีตเมนต์สาหร ับ
้ นครบ
หน่วยทดลองที่ 2 ทาเช่น นีจ
20 แผ่นด ังตาราง
แผนผ ังการทดลอง (lay out)
• คือ แผนผ งั ทีแ
่ สดงต าแหน่ง ของหน่ว ย
ทดลองในการทดลอง
• แต่ละหน่วยทดลองมีการระบุทรีตเมนต์
ั
่ ไว้อย่างชดเจน
ทีไ่ ด้ร ับจากการสุม
• อานวยความสะดวกให้ก ับผูท
้ ดลอง ใน
การให้ท รีตเมนต์ก ับหน่ว ยทดลองต่าง ๆ
ได้อย่างถูกต้อง
1 C
2 B
3 C
4 A
5 C
6 B
7 B
8 D
9 A
10 C
11 D
12 A
13 C
14 B
15 A
16 D
17 B
18 D
19 A
20 D
ต ัวอย่าง
• น ักวิชาการเกษตรทาการทดลองหาสูตรดินผสมที่
เหมาะสมสาหร ับการปลูกกุหลาบ
• คด
ั เลือ กกิง
่ ตอนกุ ห ลาบที่ม อ
ี ายุ แ ละขนาดกิ่ง ที่
เท่าก ัน
•นามาปลูกในกระถางทีบ
่ รรจุสต
ู รดิน A B C และ D
(ทา 4 ซา้ )
• หล ังจากปลูกได้ 60 ว ัน ว ัดความสูงของต้นกุหลาบ
หน่วยทดลองได้ด ังนี้
1 A 58
2 B 31
3 C 31
4 A 82
5 C 65
6 D 108
7 B 53
8 D 99
9 A 89
10 C 33
11 D 126
12 B 44
13 C 43
14 B 22
15 A 72
16 D 147
ตารางแจกแจงข้อมูล
หล ง
ั จากที่ว ด
ั ข้อ มู ล จากหน่ ว ย
ทดลองแต่ ล ะหน่ ว ยแล้ว เพื่อ ความ
สะดวกในการวิเ คราะห์ข อ
้ มูล ควรน า
ต ัวเลขข้อมูลจ ัดเรียงในตาราง
ความสูง (เซ็นติเมตร)
A
B
C
D
58
31
65
108
89
22
43
126
72
53
33
99
82
44
31
147
ผลรวม Yi. = 301
150
172
480
ค่าเฉลีย
่ = 75.25
37.50
43
120
• จากตารางจะเห็ นได้วา
่ การเรียงต ัวเลขจะเอา
้ ก่อนหล ังก็ได้
เลขไหนขึน
• แต่ต อ
้ งเป็ นต วั เลขทีไ่ ด้จ ากหน่ว ยทดลองที่
ได้ร ับอิทธิพลทรีตเมนต์เดียวก ันไว้ดว้ ยก ัน
• ห รื อ จ ด
ั แ บ่ ง ข้อ มู ล ต า ม ท รีต เ ม นต์น ่น
ั เอง
ล ักษณะการจ ัดข้อมูลตามทรีตเมนต์อย่างเดียว
้ ่า มี
เรีย กข้อ มูล นีว
คือแจกแจงตา
มทรีตเมนต์เพียงอย่างเดียว
ั
้ ทนข้อมูล
สญล
ักษณ์ทใี่ ชแ
•ถ้าให้ Yij คือข้อมูลทีไ่ ด้จากหน่วยทดลอง
ที่ j ในทรีตเมนต์ท ี่ i เมือ
่ i = 1, 2,…….t
และ j = 1, 2,…..r
โดย t คือจานวนทรีตเมนต์
r
คือจานวนซา้ ด ังนนข้
ั้ อมูลในตาราง
ั
สามารถเขียนเป็นสญล
ักษณ์ได้ด ังนี้
A
B
C
D
Y11
Y21
Y31
Y41
Y12
Y22
Y32
Y42
Y13
Y23
Y33
Y43
Y14
Y24
Y34
Y44
ผลรวม Yi.
Y1.
Y2.
Y3.
Y4.
Y.. = Grand total
ค่ ำเฉลีย่ Yi
Y1.
Y2.
Y3.
Y4.
Y.. = Grand mean
สูตรดิน
ผสม
การวิเคราะห์ขอ
้ มูล
• ก า ร วิ เ ค ร า ะ ห์ ข ้ อ มู ล ที่ ไ ด้ จ า ก
้ ผนการทดลอง
ึ ษา โดยใชแ
การศก
แบบ CRD
• มี รู ป แ บ บ ต า ร า ง ก า ร วิ เ ค ร า ะ ห์
ข้อมูล ในรูปของการวิเคราะห์ความ
แปรปรวน (Analysis of Variance
: ANOVA)
สูตรทีใ่ ชใ้ นการคานวณด ังนี้
Source of
variation
(SOV)
Treatment
Degree of
freedom
Sum of Square
(S.S.)
Mean Squares
(M.S.)
(t-1)
iY2i. – (Y..)2
Treatment S.S.
Error
t(r-1)
Total S.S. –
treatment S.S
Error S.S.
Total
N-1
ijY2ij–(Y..) 2
r
tr
t-1
t (r- 1)
tr
t = จานวนทรีตเมนต์, r = จานวนซา้
N = จานวนหน่วยทดลองทงหมด
ั้
= tr
ขนตอนวิ
ั้
ธก
ี ารคานวณและทดสอบทางสถิต ิ
1.
การคานวณค่า degree of freedom (df)
2.
คานวณค่า Correction factor (C.F.)
3.
คานวณค่า Sum of Squares (S.S.)
4.
คานวณค่า Mean Squares (M.S.)
5.
คานวณค่า F- Value
6.
นาค่าทีค
่ านวณได้ไปใสใ่ นตารางวิเคราะห์ความ
แปรปรวน (ANOVA)
7.
คานวณค่า Coefficient of variation (C.V.)
8.
การทดสอบทางสถิต ิ
1
ขนตอนวิ
ั้
ธก
ี ารคานวณและทดสอบทางสถิต ิ
1.
การคานวณค่า degree of freedom (df)
• ค่า df ของ Total คานวณจาก tr-1 = (4 x 4)-1 = 15
• ค่า df ของ Treatment คานวณจาก t-1 = 4-1 = 3
• ค่า df ของ Error คานวณจาก t(r-1) = 4(4-1) = 12
2
2. คานวณค่า Correction factor (C.F.)
C.F. = (Y..)2
tr
= (1103)2
(4)(4)
= 76038.06
3
3. คานวณค่า Sum of Squares (S.S.)
Total S.S. = ijY2ij – C.F.
= (582 + 312 + 652 +……..+ 1472) –76,038.06
= 96,457 –76,038.06
= 20,418.94
นา้ หน ัก (กร ัม)
A
B
C
D
58
31
65
108
89
22
43
126
72
53
33
99
82
44
31
147
ผลรวม Yi. = 301
150
172
480
ค่าเฉลีย
่ = 75.25
37.50
43
120
Treatment S.S. = iY2i. – C.F.
r
= (3012 + 1502 + 1722 + 4802) –76,038.06
4
= 93,271.25 –76,038.06
= 17,233.19
นา้ หน ัก (กร ัม)
A
B
C
D
58
31
65
108
89
22
43
126
72
53
33
99
82
44
31
147
ผลรวม Yi. = 301
150
172
480
ค่าเฉลีย
่ = 75.25
37.50
43
120
Error S.S. = Total S.S. – Treatment S.S.
= 20,418.94 – 17,233.19
= 3,185.75
4
4. คานวณค่า Mean Squares (M.S.)
Treatment M.S. = Treatment S.S.
t-1
= 17,233.19
3
= 5,744 . 39
Error M.S. = Error S.S.
t(r-1)
= 3,185.75
12
= 265 . 48
5
5. คานวณค่า F- Value
F = Treatment M.S.
Error M.S.
= 5,744.39
265.48
= 21.64
6
6. นาค่าทีค
่ านวณได้ไปใสใ่ นตาราง
วิเคราะห์ความแปรปรวน (ANOVA)
ตารางวิเคราะห์ความแปรปรวน (ANOVA)
SOV
df
S.S.
M.S.
F
Treatment
3
17,233.19
5,744.39
21.64
Error
12
3,185.75
265.48
Total
15
20,418.94
7
7. คานวณค่า Coefficient of variation (C.V.)
C.V. = Error M.S. x 100
Y..
= 265.48 x 100
68.94
= 23 . 64 %
• ค่า C.V.
เป็ นต ัวเลขด ัชนีบ อกความ
เทีย
่ งตรงของงานทดลอง
• ถ้าหากงานทดลองใดมี C.V. สูง แสดงว่า
งานทดลองนน
ั้ มีค วามคลาดเคลือ
่ น หรือ มี
ความแปรปรวนสูง
• ด ังนนงานทดลองที
ั้
ด
่ ี C.V.
น้อย
ควรจะมีคา
่
8
8. การทดสอบทางสถิต ิ
• การทดสอบทางสถิตเิ พือ
่ ทดสอบว่าอิทธิพล TMT ที่
ึ ษาแตกต่างก ันหรือไม่
ศก
• โดยการเปิ ดตาราง F ที่ df ของ Treatment และ
ื่ มน
df ของ Error และจะต้องกาหนดระด ับความเชอ
่ั
้ ดสอบ
ทีใ่ ชท
ถ้าค่า F ทีไ่ ด้จากการคานวณสูงกว่าค่า F ทีไ่ ด้
จากการเปิ ดตารางที่ P = 0.05 แสดงว่า TMT
ทีน
่ ามาเปรียบเทียบมีความแตกต่างก ันอย่างมี
ื่ มน
น ัยสาค ัญทางสถิตท
ิ รี่ ะด ับความเชอ
่ ั 95 %
ึ่ จะใสเ่ ครือ
 ซง
่ งหมาย * ไว้ เหนือค่า F ในตาราง
ANOVA

ถ้าค่า F ทีไ่ ด้จากการคานวณสูงกว่าค่า F ทีไ่ ด้
จากการเปิ ดตารางที่ P = 0.01
 แสดงว่า TMT
ทีน
่ ามาเปรียบเทียบมีความ
แตกต่างก ันอย่างมีนย
ั สาค ัญทางสถิตท
ิ รี่ ะด ับ
ื่ มน
ความเชอ
่ ั 99 %
ึ่ จะใสเ่ ครือ
 ซง
่ งหมาย ** ไว้ เหนือค่า F ใน
ตาราง ANOVA

df ของ Treatment
 df ของ Error
 F ทีค
่ าณวณได้

ตำรำงวิเครำะห์ ควำมแปรปรวน (ANOVA)
SOV
df
S.S.
M.S.
F
Treatment
3
17,233.19
5,744.39
21.64**
Error
12
3,185.75
265.48
Total
15
20,418.94
CV (%) = 23 . 64 %
ึ ษา
การทดสอบความแตกต่างระหว่าง TMT ทีศ
่ ก
้ า
 โดยใชค
่ F นนเป
ั้ ็ นการทดสอบความแตกต่าง
ึ ษาว่ามีความแตกต่างก ัน
ของ TMT ทงกลุ
ั้
ม
่ ทีศ
่ ก
หรือไม่
 แต่ไ ม่ส ามารถบอกได้ว ่า ค่า เฉลีย
่ ของทรีต เมนต์
ใดแตกต่างจากทรีตเมนต์ใดบ้าง
 ในทางปฏิบ ต
ั ม
ิ ก
ั จะต้อ งเปรีย บเทีย บค่ า เฉลี่ ย
ระหว่าง TMT

้ ากทีส
นิยมใชม
่ ด
ุ ในการทดลองทางการเกษตร คือ
1.
Least significant difference (LSD)
2.
Duncan’s multiple range test (DMRT)
การเปรียบเทียบค่าเฉลีย
่ ด้วยวิธ ี LSD
1. คำนวนค่ ำ LSD
LSD = t 2Error M.S. r

เมื่อ t คือ ค่ ำ t จำกตำรำง t (two-tailed) ที่ df ของ
Error และ P = 
จำกตำรำงจะเปรียบเทียบค่ ำเฉลีย่ ของทรีตเมนต์ ที่
ระดับควำมเชื่อมั่น 99 % (P = 0.01)
LSD0.01 = 3.052 x 265.48 4
= 35. 19
•
2. ค านวนแตกต่า งระหว่ า งค่า เฉลีย
่
ของคูท
่ รีตเมนต์ทต
ี่ อ
้ งการเปรียบเทียบ
ค่าความแตกต่างระหว่าง A ก ับ B = 75.25 – 37.50
= 37.75
ค่าความแตกต่างระหว่าง A ก ับ C = 75.25 – 43.00
= 32.25
ค่าความแตกต่างระหว่าง A ก ับ D = 75.25 – 120.0
= -44.75
ค่าความแตกต่างระหว่าง B ก ับ C = 37.50 – 43.00
= -5.5
ค่าความแตกต่างระหว่าง B ก ับ D = 37.50 – 120.00
= -82. 5
ค่าความแตกต่างระหว่าง C ก ับ D = 43.00 – 120.00
= -77
•เมือ
่ A, B, C, และ D คือทรีตเมนต์ สูตรดิน 4 สูตร
• จานวนคูท
่ เี่ ปรียบเทียบก ันได้สง
ู สุด = t(t-1) /2 คู่
ึ ษา
•เมือ
่ t คือจานวนทรีตเมนต์ทศ
ี่ ก
3.
นาค่าความแตกต่างระหว่างคูข
่ อง
TMT ทีต
่ อ
้ งการเปรียบเทียบมาเทียบค่า
LSD ทีค
่ านวณได้
• หากค่าความแตกต่างระหว่างคูข
่ องทรีตเมนต์
ทีต
่ อ
้ งการเปรียบเทียบน้อยกว่าค่า LSD ก็ แสดง
ว่าทรีตเมนต์คน
ู่ นไม่
ั้
มค
ี วามแตกต่างทางสถิต ิ
• แต่ถา้ ความแตกต่า งระหว่างค่า เฉลีย
่ ของคู่ท
รีตเมนต์ทต
ี่ อ
้ งการเปรียบเทียบมีคา
่ มากกว่าค่า
LSD
ก็ แสดงว่าอิทธิพลของทรีตเมนต์คูน
่ น
ั้
มีความแตกต่างก ันทางสถิต ิ
TMT
เปรียบเทียบ
A ก ับ B
A ก ับ C
A ก ับ D
B ก ับ C
B ก ับ D
C ก ับ D
ค่าต่าง
ระหว่างคู่
ค่า LSD
37.75
32.25
44.75
5.5
82.5
77.0
35.19
35.19
35.19
35.19
35.19
35.19
ข้อสรุป
TMT
เปรียบเทียบ
A ก ับ B
A ก ับ C
A ก ับ D
B ก ับ C
B ก ับ D
C ก ับ D
ค่าต่าง
ระหว่างคู่
ค่า LSD
ข้อสรุป
37.75
32.25
44.75
5.5
82.5
77.0
35.19
35.19
35.19
35.19
35.19
35.19
แตกต่าง
TMT
เปรียบเทียบ
A ก ับ B
A ก ับ C
A ก ับ D
B ก ับ C
B ก ับ D
C ก ับ D
ค่าต่าง
ระหว่างคู่
ค่า LSD
ข้อสรุป
37.75
32.25
44.75
5.5
82.5
77.0
35.19
35.19
35.19
35.19
35.19
35.19
แตกต่าง
ไม่แตกต่าง
TMT
เปรียบเทียบ
A ก ับ B
A ก ับ C
A ก ับ D
B ก ับ C
B ก ับ D
C ก ับ D
ค่าต่าง
ระหว่างคู่
ค่า LSD
ข้อสรุป
37.75
32.25
44.75
5.50
82.50
77.0
35.19
35.19
35.19
35.19
35.19
35.19
แตกต่าง
ไม่แตกต่าง
แตกต่าง
ไม่แตกต่าง
แตกต่าง
แตกต่าง
4. แสดงผลการทดสอบทางสถิต ิ
TMTเปรียบเทียบ
ค่าต่างระหว่างคู่
ค่า LSD
ข้อสรุป
A ก ับ B
37.75
35.19
แตกต่าง
A ก ับ C
32.25
35.19 ไม่แตกต่าง
A ก ับ D
44.75
35.19
B ก ับ C
5.50
B ก ับ D
82.50
35.19
แตกต่าง
C ก ับ D
77.0
35.19
แตกต่าง
แตกต่าง
35.19 ไม่แตกต่าง
TMTเปรียบเทียบ
ค่าต่างระหว่างคู่
ค่า LSD
ข้อสรุป
A ก ับ B
37.75
35.19
แตกต่าง
A ก ับ C
32.25
35.19
ไม่แตกต่าง
A ก ับ D
44.75
35.19
แตกต่าง
B ก ับ C
5.50
35.19
ไม่แตกต่าง
B ก ับ D
82.50
35.19
แตกต่าง
C ก ับ D
77.0
35.19
แตกต่าง
นา้ หน ักเฉลีย
่ (กร ัม)
นา้ หน ักเฉลีย
่ (กร ัม)
D
120.0
A
75.25
C
43.00
B
37.50
นา้ หน ักเฉลีย
่ (กร ัม)
นา้ หน ักเฉลีย
่ (กร ัม)
D
120.0a
A
75.25b
C
43.00bc
B
37.50c
ต ัวอ ักษรเหมือนก ันเพียงต ัวเดียวถือว่าไม่ตา่ งก ัน
ตารางสรุป
สูตรดิน
ความสูงเฉลีย
่ (กร ัม)
A
75.25b
B
37.50c
C
43.00bc
D
120.0a
ต ัวอ ักษรเหมือนก ันเพียงต ัวเดียวถือว่าไม่ตา่ งก ัน
• การเปรีย บเทีย บค่า เฉลีย
่ โดยวิธ ี LSD
นนเป
ั้ ็ นวิธท
ี งี่ า่ ย และสะดวกในการใช ้
้ อ
้ ับการ
• ข้อจาก ัดในการใชค
ื เหมาะทีใ่ ชก
ึ ษาทีม
เปรียบเทียบในการศก
่ ี TMT
ไม่
มากน ัก
การเปรียบเทียบค่าเฉลีย
่ ด้วยวิธ ี DMRT
การเปรียบเทียบค่าเฉลีย
่ ด้วยวิธ ี DMRT
ั อ
้ นมากกว่า LSD
• ซบซ
• แต่การใช ้ DMRT จะใชไ้ ด้ดแ
ี ม้ม ี TMT ที่
ึ ษาเป็นจานวนมาก (ข้อจาก ัดของวิธ ี LSD)
ศก
• การใช ้ DMRT
ในการเปรียบเทียบนนมี
ั้ คา
่
วิก ฤติใ นการเปรีย บเทีย บมากกว่า 1 ค่า (วิธ ี
LSD ทีม
่ ค
ี า่ วิกฤติเพียงค่าเดียว)
ขนตอนการค
ั้
านวณ
1. เรียงลาด ับค่าเฉลีย
่ ของ TMT จาก
น้อยไปหามาก หรือจากมากไปหาน้อย
TMT
D
A
C
B
นา้ หน ักเฉลีย
่ (g)
120.0
75.25
43.00
37.50
ลาด ับที่
1
2
3
4
2. คานวณค่า standard error ของค่าเฉลีย
่ (Syi.)
Syi. = Error M.S. / r
= 265.48 / 4
= 8.15
3. คานวณค่า shortest significant
ranges สาหร ับใชเ้ ปรียบเทียบค่าเฉลีย
่ ทีไ่ ด้
ื่ มน
เรียงล าด ับไว้ ทีร่ ะด ับความเชอ
่ ั ทีต
่ อ
้ งการ
จากสูตร
Rp = rpSyi.
•
ค่า rp คือ significant studentized range ซงึ่
ื่ มน
ได้จากการเปิ ดตาราง ทีร่ ะด ับความเชอ
่ ั ทีต
่ อ
้ งการ
้ อ
•
ค่า df ทีใ่ ชค
ื df ของ error, p = 2, 3,4,……t
เมือ
่ t คือ จานวนทรีตเมนต์ได้คา
่ rp และคานวณค่า
Rp ได้ด ังตาราง
4.32
4.55
4.68
P
rp (0.01) จากตาราง
Rp (จากการคานวณ)
2
4.32
3
4.55
4
4.68
(8.15 x 4.23) =
34.47
(8.15 x 4.55) =
37.08
(8.15 x 4.68) =
38.14
4. ทดสอบความแตกต่า งระหว่า งค่า เฉลีย
่ ของ
TMT ทีไ่ ด้ร ับจากการลาด ับทีไ่ ว้ทล
ี ะคู่
ลาด ับที่
เปรียบเทียบ
TMT ที่
เปรียบเทียบ
ผลต่างของ
ค่าเฉลีย
่
ค่า P
ค่า Rp
1 ก ับ 2
D ก ับA
44.75
2
34.47
1 ก ับ 3
D ก ับ C
77.00
3
37.08
1 ก ับ 4
D ก ับ B
82.50
4
38.14
2 ก ับ 3
A ก ับ C
32.25
2
34.47
2 ก ับ 4
A ก ับ B
37.75
3
37.08
3 ก ับ 4
C ก ับB
5.50
2
34.47
ข้อสรุป
ลาด ับที่
เปรียบเทียบ
TMT ที่
เปรียบเทียบ
ผลต่างของ
ค่าเฉลีย
่
ค่า P
ค่า Rp
ข้อสรุป
1 ก ับ 2
D ก ับA
44.75
2
34.47
แตกต่าง
1 ก ับ 3
D ก ับ C
77.00
3
37.08
1 ก ับ 4
D ก ับ B
82.50
4
38.14
2 ก ับ 3
A ก ับ C
32.25
2
34.47
2 ก ับ 4
A ก ับ B
37.75
3
37.08
3 ก ับ 4
C ก ับB
5.50
2
34.47
ลาด ับที่
เปรียบเทียบ
TMT ที่
เปรียบเทียบ
ผลต่างของ
ค่าเฉลีย
่
ค่า P
ค่า Rp
ข้อสรุป
1 ก ับ 2
D ก ับA
44.75
2
34.47
แตกต่าง
1 ก ับ 3
D ก ับ C
77.00
3
37.08
แตกต่าง
1 ก ับ 4
D ก ับ B
82.50
4
38.14
2 ก ับ 3
A ก ับ C
32.25
2
34.47
2 ก ับ 4
A ก ับ B
37.75
3
37.08
3 ก ับ 4
C ก ับB
5.50
2
34.47
ลาด ับที่
เปรียบเทียบ
TMT ที่
เปรียบเทียบ
ผลต่างของ
ค่าเฉลีย
่
ค่า P
ค่า Rp
ข้อสรุป
1 ก ับ 2
D ก ับA
44.75
2
34.47
แตกต่าง
1 ก ับ 3
D ก ับ C
77.00
3
37.08
แตกต่าง
1 ก ับ 4
D ก ับ B
82.50
4
38.14
แตกต่าง
2 ก ับ 3
A ก ับ C
32.25
2
34.47
ไม่แตกต่าง
2 ก ับ 4
A ก ับ B
37.75
3
37.08
แตกต่าง
3 ก ับ 4
C ก ับB
5.50
2
34.47
ไม่แตกต่าง
5. แสดงผลการทดสอบทางสถิต ิ
นิย มเขีย นต วั อ ก
ั ษรก าก บ
ั ไว้เ หนื อ
ต ัวเลขค่าเฉลีย
่ ของแต่ละทรีตเมนต์
ค่าเฉลีย
่ ของทรีตเมนต์ทไี่ ม่แตกต่าง
ก ันจะถูกกาก ับด้วยต ัวอ ักษรทีเ่ หมือนก ัน
ลาด ับที่
เปรียบเทียบ
TMT ทีเ่ ปรียบเทียบ
ผลต่างของ
ค่าเฉลีย
่
ค่า P
ค่า Rp
ข้อสรุป
1 ก ับ 2
D ก ับA
44.75
2
34.47
แตกต่าง
1 ก ับ 3
D ก ับ C
77.00
3
37.08
แตกต่าง
1 ก ับ 4
D ก ับ B
82.50
4
38.14
แตกต่าง
2 ก ับ 3
A ก ับ C
32.25
2
34.47
ไม่แตกต่าง
2 ก ับ 4
A ก ับ B
37.75
3
37.08
แตกต่าง
3 ก ับ 4
C ก ับB
5.50
2
34.47
ไม่แตกต่าง
ทรีตเมนต์ลาด ับที่
นา้ หน ักเฉลีย
่
(กร ัม)
1
D
2
A
3
C
4
B
นา้ หน ักเฉลีย
่
(กร ัม)
120.00
75.25
43.00
37.50
ทรีตเมนต์
ลาด ับที่
นา้ หน ักเฉลีย
่
(กร ัม)
1
2
3
4
D
A
C
B
นา้ หน ักเฉลีย
่
(กร ัม)
120.00a
75.25b
43.00bc
37.50c
ั พันธ์
- การวิเคราะห์คา่ สหสม
- การสร ้างสมการทานายอย่างง่าย
Dr. Patcharin Songsri
Dept. Plant Sci. & Agric Resources,
Fact. Agriculture, Khon Kaen University
Chapter Goals
After completing this chapter, you
should be able to:
•
Calculate and interpret the simple correlation
between two variables
•
Determine whether the correlation is significant
•
Calculate and interpret the simple linear
regression equation for a set of data
•
Understand the assumptions behind regression
analysis
•
Determine whether a regression model is
significant

Pearson correlation coefficient (r)
measures the degree of linear
association between two intervally
scaled variables
Two pieces of information:
› The strength of the relationship
› The direction of the relationship

Positive correlation:
› high values of one variable associated
with high values of the other

Example:
› Higher STAT scores are associated with
better grades in the first year of college

Negative correlation:
› high values of one variable associated with
low values of the other

Example:
› reduced in fruit number is related with
Increased in fruit size

Correlation
› A measure of association between two
numerical variables.

Example (positive correlation)
› Typically, in the summer as the
temperature increases people are
thirstier.
Positive Correlation
Negative Correlation
Examples of Approximate r Values
y
y
y
x
r = -1
r = -0.6
y
x
x
r=0
y
r = +0.3
x
r = +1
x
r value
Interpretation
1
perfect positive linear relationship
0
no linear relationship
-1
perfect negative linear relationship
r value (+,-)
Interpretation
1.0 - 0.7
strong association
0.6 - 0.5
moderate association
> 0.4
weak association
Pearson’s Sample Correlation
Coefficient, r
measures the direction and the strength of the
linear association between two numerical
paired variables.
Calculating
the Correlation Coefficient (r)
 xy
r 
2
2
[  x ][  y ]
n
 ( X i  X )( Y i  Y )
i 1
r 
n
n
[  ( X i  X ) ][  (Y i  Y ) ]
i 1
2
i 1
2
Nitrogen Grain yield
rate (kg/ha) (kg/ha) (Y)
0
50
100
150
1000
2500
3500
4500
200
4000
Deviation from
means
X
Square of deviation
Y
(Xi - Ẍ)2
(Yi - Ῡ)2
Product of
deviates
((Xi - Ẍ))(Yi - Ῡ)
-100.00
-2100.00
10000.00
4410000.00
210000.00
-50.00
-600.00
2500.00
360000.00
30000.00
0.00
400.00
0.00
160000.00
0.00
50.00
1400.00
2500.00
1960000.00
70000.00
100.00
900
10000.00
810000.00
90000.00
Sum
500
15500
0
0
25000
Mean
100
3100
7700000
400000
Compute the Correlation Coefficient (r)
 xy
r 
2
2
[  x ][  y ]
n
 ( X i  X )( Y i  Y )
i 1
r 
n
n
[  ( X i  X ) ][  (Y i  Y ) ]
2
i 1
r 
2
i 1
400,000
( 25,000 )( 7,700,000
 0 . 9117
)
r =0.91*
Correlation does not imply a causal
relationship between variables
 Causal inferences are made based on
underlying knowledge and theories
 Correlations can be affected by outliers
(which is why scatter plots are useful)
 Underlying relationship is assumed to be
linear

The Correlation Coefficient
• The strength of a linear relationship is
measured by the correlation coefficient
• The sample correlation coefficient is given
the symbol “r”
Fundamental Rule of Correlation
• Correlation DOES NOT imply causation
– Just because two variables are highly
correlated does not mean that the explanatory
variable “causes” the Response
Cautions
• The correlation coefficient (r) only gives us an
indication about the strength of a linear
relationship.
• Two variables may have a strong curvilinear
relationship, but they could have a “weak” value
for ‘r’

Regression
› Specific statistical methods for finding the
“line of best fit” for one response
(dependent) numerical variable based on one
or more explanatory (independent) variables.

Regression
› Includes using statistical
methods to assess the
"goodness of fit" of the
model. (ex. Correlation
Coefficient)

To describe (or model)

To predict (or estimate)

To control (or administer)

Statistical method for finding
› the “line of best fit”
› for one response (dependent) numerical
variable
› based on one explanatory (independent)
variable.
Draw a scatter plot of the data.
 Visually, consider the strength of the
linear relationship.

Draw a scatter plot of the data.
 Visually, consider the strength of the
linear relationship.
 If the relationship appears relatively
strong, find the correlation coefficient as
a numerical verification.

Draw a scatter plot of the data.
 Visually, consider the strength of the
linear relationship.
 If the relationship appears relatively
strong, find the correlation coefficient as
a numerical verification.
 If the correlation is still relatively strong,
then find the simple linear regression
line.


The coefficient of determination is the
portion of the total variation in the
dependent variable that is explained by
variation in the independent variable

The coefficient of determination is also
called R-squared and is denoted as R2
R 
2
SSR
SST
where
0R 1
2
(continued)
Coefficient of determination
R 
2
SSR

SST
sum of squares explained
by regression
total sum of squares
Note: In the single independent variable case, the coefficient
of determination is
R r
2
2
where:
R2 = Coefficient of determination
r = Simple correlation coefficient
y
R2 = 1
R2 = 1
x
100% of the variation in y is
explained by variation in x
y
R2
= +1
Perfect linear relationship
between x and y:
x
y
0 < R2 < 1
x
Weaker linear relationship
between x and y:
Some but not all of the
variation in y is explained
by variation in x
y
x
R2 = 0
y
No linear relationship
between x and y:
R2 = 0
x
The value of Y does not
depend on x. (None of the
variation in y is explained
by variation in x)
Temperature (F)
Water
Consumption
(ounces)
75
83
85
85
92
97
99
16
20
25
27
32
48
48

Interpreting the result:
y = bx + c
› The value of b is the slope
› The value of c is the y-intercept
› r is the correlation coefficient
› r2 is the coefficient of determination
Write down the equation of the line in
slope intercept form.
 Press Y= and enter the equation under
Y1. (Clear all other equations.)
 Press GRAPH and the line will be graphed
through the data points.


Regression Equation:
y=1.5*x - 96.9
Water Consumption = 1.5*Temperature - 96.9

Slope = 1.5 (ounces)/(degrees F)
› for each 1 degree F increase in
temperature, you expect an increase of
1.5 ounces of water drank.
y-intercept = -96.9
› For this example,
when the temperature is 0 degrees F,
then a person would drink about -97
ounces of water.
› That does not make any sense!
› Our model is not applicable for x=0.
•
Predict the amount of
water a person would drink when the
temperature is 95 degrees F.
•
Solution: Substitute the value of x=95
(degrees F) into the regression
equation and solve for y (water
consumption).
If x=95, y=1.5*95 - 96.9 = 45.6 ounces.

Coefficient of Determination – r2

General Interpretation: The
coefficient of determination tells the
percent of the variation in the
response variable that is explained
(determined) by the model and the
explanatory variable.
Example: r2 =92.7%.
 Interpretation:

› Almost 93% of the variability in the amount of
water consumed is explained by outside
temperature using this model.
› Note: Therefore 7% of the variation in the
amount of water consumed is not explained
by this model using temperature.
Relationship between water use efficiency (WUE) (g/kg) and root dry weight (g/plant)
under 2/3 AW
Source: Songsri et al., 2009. Agricultural water management. 96; 790 –798.
The step–by–step procedure for simple
linear regression
Step 1
Compute the means X and Y, the corrected sum
of squares, and the corrected sum of cross products
X 
 y
2
n
  (X i  X )
2
i 1
 X
n
Y 
 x
2
n
  (Y i  Y )
2
i 1
 Y
n
 xy
n
  (X
i 1
i
 X )( Y i  Y )
Nitrogen Grain yield
rate (kg/ha) (kg/ha) (Y)
0
50
100
150
1000
2500
3500
4500
200
4000
Deviation from
means
X
Square of deviation
Y
(Xi - Ẍ)2
(Yi - Ῡ)2
Product of
deviates
((Xi - Ẍ))(Yi - Ῡ)
-100.00
-2100.00
10000.00
4410000.00
210000.00
-50.00
-600.00
2500.00
360000.00
30000.00
0.00
400.00
0.00
160000.00
0.00
50.00
1400.00
2500.00
1960000.00
70000.00
100.00
900
10000.00
810000.00
90000.00
Sum
500
15500
0
0
25000
Mean
100
3100
7700000
400000
Step 2 Compute the estimates of the regression
parameters a and b
a 
b 
Y  bX
 xy
 x
b 
2
400,000
 16
25,000
a  3,100 - (16)(100)
 1, 500
Step 3 Compute r and R2
 xy
r 
2
2
[  x ][  y ]
n
 ( X i  X )( Y i  Y )
i 1
r 
n
n
[  ( X i  X ) ][  (Y i  Y ) ]
2
i 1
r 
i 1
400,000
( 25,000 )( 7,700,000
R
2
2
 ( 0 . 9117 )  0 . 83
2
 0 . 9117
)