Transcript เอกสาร
การวิเคราะห์ข ้อมูล ดร. สงั วรณ์ งัดกระโทก 26 มีนาคม 2553 1 แนวทางการวิเคราะห ์ข้อมู ล ่ • การวิเคราะห ์ข้อมู ลเพือบรรยายสภาพ--สถิ ติ เชิงพรรณา ่ กษาความสัมพันธ ์ • การวิคราะห ์ข้อมู ลเพือศึ ของตัวแปร---correlation ่ • การวิเคราะห ์ข้อมู ลเพือเปรี ยบเทียบ ---t-test, z test, ANOVA, ANCOVA, MANOVA, MANCOVA • การวิเคราะห ์ข้อมู ลทานาย ---regression, forecasting ่ • การวิเคราะห ์ข้อมู ลเพือตรวจสอบโมเดล—SEM 2 MANOVA, MANCOVA ANOVA, ANCOVA T-test Z test Discriminant , Canonical Analysis , Multilevel Factor Analysis Multiple regression Regression SEM Correlation 3 ั พันธ์ของตัว การวิเคราะห์ความสม แปร • Pearson Correlation สาหรับตัวแปรต่อเนือ ่ ง • Spearman Rank Correlation ตัวแปรจัดอันดับ • Chi-square ตัวแปรนามบัญญัต ิ 4 5 ั ประสท ิ ธิส ั พันธ์ (Correlation สม ์ หสม Coefficient, Rxy) • ระดับของความผันแปรร่วมกันของตัวแปร X และ Y ่ ความสม ั พันธ์ของจานวนนักศก ึ ษากับจานวน เชน อาจารย์ ึ ษากับจานวนอาจารย์อาจมี • จานวนนักศก ั พันธ์กน ความสม ั แต่ไม่บอกว่าอะไรเป็ นเหตุ อะไร เป็ นผล ั พันธ์มค • ความสม ี า่ ตัง้ แต่ -1 ถึง +1 ั พันธ์น ้อยมาก <.20 ความสม ั พันธ์น ้อย .20-.40 ความสม ั พันธ์ปานกลาง .40-.70 ความสม ั พันธ์สงู .70-.90 ความสม ั พันธ์สงู มาก > .90 ความสม 6 ์ การคานวณสัมประสิทธิสหสั มพันธ ์ แบบเพียร ์สัน X=เงินเดือน Y= ประสบการณ์ การทางาน H 0 : XY 0 XY rXY 2 2 H : 0 1 XY X Y rXY .937, n 10 .937 10 2 t r n2 1 r df n 2 2 2.65 t 7.59 .122 1 .(937) 2 d . f . 10 2 8 t วิกฤติ 7 8 ั พันธ์จาก SPSS ผลการวิเคราะห์สหสม Correlations science science Pearson Correlation HEDRES 1 Sig. (2-tailed) HEDRES .448 ** .000 N 6192 6177 Pearson Correlation .448 ** 1 Sig. (2-tailed) .000 N 6177 6177 **. Correlation is significant at the 0.01 level (2-tailed). 9 Simple and Multiple Regression 10 College GPA RegressionLine 4.0 3.0 Scatterplot 2.0 1.0 1.0 2.0 3.0 4.0 HighSchool GPA 11 การวิเคราะห ์การถดถอยอย่างง่ าย (simple 1. การวิเคราะห์การถดถอยอย่างง่าย (s : มีตวั แปรตามและตัวแปรอิสระอย่างละ Y = a + bX + e 12 Yi = b0 + b1x1 + Ei (x x)(Y Y) 1 2 ) (X X 0 Y 1X 13 Ho : b=๐ H1: b=๐ =๐ b i t sbi 2 (Y Y) /(N2) Sb _2 (XX) 14 2 R /k F 2 (1R )(nk1) ช ้ทดสอบนัยสำคัญของ Ho : b=๐ 15 tiple regression analysis คือ เท ่ ถิตท ิ ใช้ ี วเิ คราะห ์ความสัมพันธ ์ระห ปรตาม 1 ตัวกับตัวแปรทานายหลา Y = a + b1X1 +b2X2 + … + 16 กลงของการวิเคราะห ์การถดถอยพหุค Linearity of the phenomenon measu Constant variance of the error terms Independence of the error terms Normality of the error term distribut 17 + + 0 0 - Y Y + + 0 0 - - Y - Y 18 ์ สัมประสิทธิของการท านาย (R2) 2 R คือ ปริมาณความแปรปรวนของตัว ่ บายได้ดว้ ยตัวแปรต้น ทีอธิ JOBQUA = 0.928 + 0.189(GROWTH) + 0.427(JOBSA (16.68) (8.130) (15.335) 2 R = 0.558 19 Scatterplot Dependent Variable: TIME6 3 2 1 0 -1 -2 -3 -4 -3 -2 -1 0 Regression Standardized Predicted Value 1 2 3 20 Normal P-P Plot of Regression Standardized Residual Dependent Variable: TIME6 1.00 .75 .50 .25 0.00 0.00 .25 .50 Observed Cum Prob .75 1.00 21 l a u v l o l e i d i t a g o p g M c a t t p l u h m 0 q 1 0 a 6 6 0 i n 5 9 4 0 p 6 2 7 8 5 r e 2 1 7 1 0 p 4 1 1 8 7 0 T 4 0 2 3 2 7 0 22 S u E S s M t t h q i g u d d q u R h m e f f u a a a a n n 1 4 8 7 6 8 5 1 6 0 2 4 5 2 7 7 6 1 5 0 3 0 0 6 3 5 1 1 4 0 4 0 0 5 6 0 9 1 3 0 5 2 4 6 9 3 3 1 2 3 23 O m ea M u S d u e a F i f g a R 1 4 1 4 5 0 R 9 6 2 T 3 7 R 2 5 2 3 6 0 R 7 5 9 T 3 7 R 3 6 3 9 0 0 R 7 4 3 T 3 7 R 4 9 4 5 7 0 R 3 3 7 T 3 7 R 5 9 5 4 2 0 R 4 2 5 T 3 7 24 f ic i d a r d a r r e i t l y a f e f i d c i e C M o o B P . S o B l e P e a e E V t i l t g r a r o r t a a I r . 1 ( C o 9 0 0 4 2 0 m o 3 0 3 0 0 3 1 3 4 3 4 0 3 0 0 4 4 4 0 0 2 ( C o 1 0 7 7 0 0 m o 4 2 2 7 0 3 8 0 5 8 9 6 3 1 0 4 4 9 9 6 r e l a 6 2 3 7 0 7 0 1 4 9 9 6 2 1 0 2 2 1 9 6 3 ( C o 4 0 4 4 1 0 m o 5 2 3 1 0 3 5 4 2 2 0 4 8 0 0 4 8 1 4 5 r e l a 3 2 3 8 0 7 1 4 1 2 2 5 7 7 0 2 6 0 8 8 i n t e 2 5 7 9 0 8 8 8 9 5 3 0 3 8 0 3 0 9 5 1 4 ( C o 4 0 9 0 7 0 m o 4 2 5 1 0 3 5 5 8 1 7 4 2 0 0 4 2 9 4 5 r e l a 0 2 3 0 0 7 9 8 1 5 2 4 5 3 0 2 2 0 8 7 i n t e 9 4 4 1 0 8 9 3 2 0 4 6 8 4 0 3 0 0 6 4 q u a 8 9 4 1 0 3 7 0 5 7 3 0 9 1 0 0 1 4 0 1 5 ( C o 1 0 5 4 4 0 m o 1 2 3 4 0 3 7 7 5 3 4 2 2 4 0 4 4 8 5 7 r e l a 4 1 0 8 0 7 2 6 0 4 8 7 3 2 0 2 9 4 2 6 i n t e 9 3 9 9 0 8 5 6 6 3 5 4 8 2 0 3 5 1 2 1 q u a 9 4 2 0 0 3 7 3 8 0 5 8 9 5 0 0 8 6 8 0 25 p a r 3 1 3 7 0 2 0 3 6 1 9 1 4 1 3 7 6 5 5 2 u E u M t s q q R m e u a 1 5 7 7 9 a P q r 26 b O m e M d u F i a e g f a 1 R 7 9 5 0 R 0 4 7 T a P q b D 27 i a c d d a a f f i i c c M S B e e t i E g t 1 ( C 1 7 1 0 m 1 1 9 8 0 q 6 9 7 2 7 a 8 8 9 1 9 i n 4 7 4 7 5 p 5 5 5 5 0 r e 3 4 9 3 0 p 2 1 1 6 8 a D 28 Multicollinearity : เกิดจำกตัวแปรทำนำยมีควำมสัมพันธ ์กันเองส ์ ่ 1. สัมประสิทธิกำรถดถอยต ำ่ หรือเปลียนทิ ศทำงจำ บวกเป็ นลบ ์ 2. สัมประสิทธิกำรถดถอยไม่ คงที่ 3. ตีควำมยำกและไม่สำมำรถสรุปอ ้ำงอิงได ้ ์ ๔.ค่ำ R2 สูง แต่สม ั ประสิทธิกำรถดถอยไม่ มน ี ัยสำค แก้ไขได้โดย รวมตัวแปร หรือเลือกตัวแปรเพ 29 ่ ัวทานาย การวิเคราะห ์การถดถอยเมือต เป็ นตัวแปรนามบัญญัต ิ ่ ฒก วุฒก ิ ารศึกษาทานายคะแนนสอบ เมือวุ ิ าร คือ ปริญญาตรี โท และเอก ยนตัวแปรทานายเป็ นตัวแปรดัมมี่ (dummy vari 30 แปรวุฒก ิ ารศึกษามี 3 ค่า จะสร ้างเป็ นตัวแปรดัมมไ 3 - 1 = 2 ตัวแปร ระดับปริญญำตรี (bachelor) กำหนดให ้มีคำ่ ระดับปริญญำโท (master) กำหนดให ้ค่ำเป็ น ระดับปริญญำเอก (doctor) กำหนดให ้มีคำ่ เ ore = a + b1(master) + b2 (doctor) + 31 e = a + b1(master) + b2 (doctor) + er re = 50 + 10(master) + 20(doctor) + แปลผลอย่างไร ??? 32 i p s e N e i i m E a m B B v b 0 6 0 0 0 0 0 m 0 6 0 0 0 0 0 d 0 6 0 0 0 0 0 T 0 9 7 8 2 0 0 i a c a e i d c e B i t M E g 1 ( 0 7 3 0 M 0 3 6 0 6 D 0 3 3 0 0 a D 33 การวิเคราะห ์เปรียบเทียบ ่ T-test ค่าเฉลีย: 34 แนวทางการใช้ t-test ้ ยบเทียบค่าเฉลีย • Independent t-test: ใชเปรี ่ ของกลุม ่ ตัวอย่างสองกลุม ่ ทีเ่ ป็ นอิสระต่อกัน ่ ค่าเฉลีย เชน ่ ของรายได ้ระหว่างชายและหญิง ้ ยบเทียบค่าเฉลีย • Dependent t-test: ใชเปรี ่ ของ ่ กลุม ่ ตัวอย่างสองกลุม ่ ทีไ่ ม่เป็ นอิสระต่อกัน เชน ค่าเฉลีย ่ คะแนนก่อนเรียน และหลังเรียน ค่าเฉลีย ่ ความคิดเห็นของสามี-ภรรยา 35 ่ เปรียบเทียบค่าเฉลียของคะแนน ระหว่างโรงเรียนของร ัฐ vs. โรงเรียน เอกชน 36 Independent t-test ่ • เปรียบเทียบค่าเฉลียของคะแนนระหว่ าง โรงเรียนของร ัฐ vs. โรงเรียนเอกชน H 0 : Pub Pr i H1 : Pub Pr i H 0 : Pub Pr i H1 : Pub Pr i 37 การคานวณ: ความแปรปรวนของ สองกลุ่มเท่ากัน 2 2 ( n 1 ) S ( n 1 ) S 1 2 2 S 2p 1 (n1 n2 2) t 1 2 SE1 2 SE1 2 S 2p n1 S 2p n2 df n1 n2 2 38 การคานวณ: ความแปรปรวนของ สองกลุ่มเท่ากัน t 1 2 SE1 2 SE1 2 2 S1 n1 2 S2 n2 df n1 n2 2 39 ข ้อตกลงเบือ ้ งต ้น • กลุม ่ ตัวอย่างเป็ นอิสระต่อกัน (independence) • ความแปรปรวนของสองกลุม ่ เท่ากัน (Homogeneity of variance) 40 ผลการวิเคราะห ์ t-test ด้วย SPSS 41 ค่า Effect Size ของ t-test t 2 d 2 t df 2 1 2 การแปล d n2 มาก ปานกลาง <.2 .3-.5 <.01 .022-.059 น ้อย .6-.8 .083-.138 SP 42 ่ เปรียบเทียบค่าเฉลียของคะแนน ระหว่างโรงเรียนของร ัฐ vs. โรงเรียน เอกชน 73.29 79.92 d .08 79.114 การแปล d n2 น ้อย ปานกลาง <.2 .3-.5 <.01 .022-.059 มาก .6-.8 .083-.138 43 Dependent t-test คนที่ ความนิ ยมต่อร ัฐบาล ผลต่าง (D) มกราคม มีนาคม 1 42 43 1 2 41 45 4 3 50 56 6 4 52 54 2 5 58 65 7 6 32 29 -3 7 39 46 7 8 42 48 6 9 48 47 -1 10 47 53 6 44 การคานวณ D D D D t SD SD n df n 1 45 การเปรียบเทียบความนิยมต่อรัฐบาล ระหว่างเดือนมกราคมและมีนาคม 46 การวิเคราะห ์ความแปรปรวน (Analysis of Variance: ANOVA) 47 ANOVA ้ ยบเทียบค่าเฉลีย • ใชเปรี ่ ของประชากร ตัง้ แต่สามกลุม ่ ขึน ้ ไป • ถ ้ามีกลุม ่ A B C ถ ้าใช ้ t-test ต ้อง เปรียบเทียบ AB, AC, BC ซงึ่ แต่ละครัง้ มีความคลาดเคลือ ่ น 0.05 ดังนัน ้ มี ความคลาดเคลือ ่ นรวม 3(.05)=0.15 48 ANOVA • One-way ANOVA: มีตัวแปรต ้น 1 ตัว (3 ระดับขึน ้ ่ ภูมภ ไป) เชน ิ าค (ก.ท.ม. เหนือ กลาง ใต ้ อีสาน) • Two-way ANOVA: มีมต ี ัวแปรต ้น 2 ตัว (2 ระดับ ่ เพศ และ สถานภาพสมรส ขึน ้ ไป) เชน ึ ษาทุกระดับ • Fixed variable : ศก ึ ษาบางระดับ • Random variable: ศก 49 ้ การตังสมมติ ฐาน: One-way ANOVA • ถ ้ามี k กลุม ่ H 0 : 1 2 k H1 : 1 2 k 50 การเปรียบเทียบค่าเฉลีย ่ คะแนน วิทยาศาสตร์ระหว่างโรงเรียนทีม ่ อ ี น ิ เทอร์เนตน ้อย ปานกลาง และมาก 51 การเปรียบเทียบค่าเฉลีย ่ คะแนน วิทยาศาสตร์ระหว่างโรงเรียนทีม ่ อ ี น ิ เทอร์เนตน ้อย ปานกลาง และมาก 52 การเปรียบเทียบรายคู่ 53 ตาราง F 54 Two-way ANOVA ี ต่อ • ต ้องการเปรียบเทียบผลของเพศและอาชพ ค่าเฉลีย ่ ของรายได ้ • ต ้องการเปรียบเทียบคะแนนวิทยาศาสตร์ ระหว่างทีต ่ งั ้ ของโรงเรียน (นอกเมือง ในเมือง) และประเภทของโรงเรียน (รัฐบาล เอกชน) 55 ั พันธ์ (interaction) ปฏิสม • ทดลอง บรรยาย คะแ นน ชา ย หญิ ง ชา ย หญิ ง 56 ค่าเฉลีย ่ คะแนนวิทยาศาสตร์ของ โรงเรียนในเมือง (1) และโรงเรียนนอก เมือง (0) 57 ้ การตังสมมติ ฐาน • Main effect ประเภทโรงเรียน (T) H 0 : T 1 T 2 H1 : T 1 T 2 • Main effect ทีต ่ งั ้ ของโรงเรียน (L) H 0 : L1 L 2 H1 : L1 L 2 • Interaction effect H0: ไม่ม ี TxL interaction 58 การทดสอบสมมติฐาน: Homogeneity of variance 59 ผลการวิเคราะห์ด ้วย SPSS 60 ค่าเฉลีย ่ คะแนนวิทยาศาสตร์ของ โรงเรียนในเมือง (1) และโรงเรียนนอก เมือง (0) 61 62 การวิเคราะห ์องค ์ประกอบ (Factor Analysis) การวิเคราะห ์องค ์ประกอบ เป็ น ทางสถิตท ิ ใช้ ี่ ในการหาลักษณะท ่ บายความส หรือองค ์ประกอบทีอธิ ของตัวแปรหลายๆ ตัว (ลดจานว 63 X1 X2 แทนตัวแปรทีวั่ ดได ้ FACTOR แทนองค ์ประกอบ X3 X4 FACTOR X5 ้ านวนองค ์ประก ด ังนันจ น้อยกว่าจานวนตัวแป X6 X7 X8 X9 FACTOR 64 การวิเคราะห ์องค ์ประกอบมี 2 ป 1. กำรวิเครำะห ์องค ์ประกอบเชิงสำรวจ (Exploratory Factor Analysis ; EFA) 2. กำรวิเครำะห ์องค ์ประกอบเชิงยืนยัน (Confirmatory Factor Analysis ; CFA) 65 การวิเคราะห ์องค ์ประกอบเชิงสาร ่ นหาองค ์ประกอ จุดมุ่งหมาย : เพือค้ ของตัวแปรต่าง ๆ โดย ่ ความสัมพันธ ์กัน ค ทีมี ่ วมกันอยู ่ บางอย่างทีร่ องค ์ประกอบ นักวิจ ัยต้องพยายามศึกษาว่าองค ่ าอะไร และมีลก ชือว่ ั ษณะอย่างไร 66 การวิเคราะห ์องค ์ประกอบเชิงย จุดมุ่งหมาย : - ใช้ในการตรวจสอบทฤษ ว่าองค ์ประกอบประกอบด้วยต ้ เหล่านันจริ งหรือไม่ ทฤษฎีถ หรือไม่ -ใช้ตรวจสอบความตรงเชิงโครง (construct validity) ของแบบ แบบสอบถาม แบบทดสอบ 67 68 ตัวอย่างการวิเคราะห ์องค ์ประกอบเช QUALITY REP SEL FAC FIN VAL 69 ้ ข้อตกลงเบืองต้ นของการวิเคราะห ์อ 1. ตัวแปรมีความสัมพันธ ์กัน พิจารณาได้จากค Bartlett’s Test of Sphericity KMO มากกว่า 0.50 2.ใช้กลุ่มตัวอย่างจานวนมาก (20 เท่าของต ัวแ 3. ข้อมู ลวัดได้ในมาตราอน ั ตรภาค (interval) ข ยกเว้น การวิเคราะห ์องค ์ประกอบเชิงยืนยันจะ วิเคราะห ์ตัวแปรนามบัญญัต ิ (categorical varia ได้ 70 ตัวแปร ้ ิ ธิภาพ X1: วางแผนและใชเวลาอย่ างมีประสท X2: ไม่ปล่อยให ้เวลาว่างโดยไม่เกิดประโยชน์ ้ X3: บริหารการใชเวลา X4: ประสบความสาเร็จในการเข ้าสงั คม X5: มีความสามารถในการเข ้าสงั คม ิ ธิภาพ X6: พูดคุยกับคนอืน ่ อย่างมีประสท X7: เปลีย ่ นการคิดเมือ ่ มีแนวคิดทีด ่ ก ี ว่า X8: เปิ ดรับความคิดใหม่ๆ X9: มีการคิดยืดหยุน ่ X10: มีความสามารถทีจ ่ ะทาสงิ่ ทีต ่ ้องการ ื่ มั่นว่าจะประสบความสาเร็จ X11: มีความเชอ ื่ ว่าตนเองทาได ้ X12: ชอ 71 ั พันธ์ของตัวแปร ความสม X1 X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 1.00 0.60 1.00 0.68 0.69 1.00 0.28 0.24 0.29 1.00 0.27 0.27 0.30 0.77 1.00 0.28 0.29 0.37 0.64 0.63 1.00 0.17 0.18 0.21 0.17 0.18 0.23 1.00 0.20 0.22 0.25 0.23 0.26 0.30 0.49 1.00 0.23 0.26 0.29 0.24 0.28 0.32 0.49 0.66 1.00 0.28 0.29 0.34 0.34 0.38 0.37 0.24 0.30 0.32 1.00 0.33 0.33 0.41 0.35 0.39 0.40 0.23 0.32 0.33 0.62 1.00 0.32 0.35 0.41 0.35 0.37 0.40 0.21 0.34 0.35 0.68 0.65 1.00 72 KMO and Bartlett's Test Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .874 Bartlett's Test of Sphericity Approx. Chi-Square 2.926E4 df 105 Sig. .000 73 Initial Eigenvalues Extraction Sums of Squared Loadings Facto %of Cumulativ r Total Variance e % Total 1 2 3 4 5 6 7 8 9 10 11 12 4.967 1.535 1.465 1.149 .562 .422 .397 .368 .334 .305 .271 .223 41.394 41.394 12.791 54.185 12.211 66.396 9.574 75.970 4.680 80.651 3.519 84.170 3.310 87.480 3.070 90.550 2.782 93.332 2.546 95.878 2.261 98.139 1.861 100.000 4.598 1.181 1.144 .829 %of Cumulative Variance % 38.319 9.839 9.530 6.906 38.319 48.158 57.688 64.594 Rotation Sums of Squared Loadingsa Total 3.109 3.231 2.756 3.517 74 75 Pattern Matrix Component 1 X1: X2: X3: X4: X5: X6: X7: X8: X9: X10: X11: X12: 2 3 4 .869 .785 .774 -.944 -.859 -.635 .824 .798 .606 -.847 -.821 -.742 76 Structural Equation modeling 77 SEM คืออะไร ่ ศก • Multivariate Analysis ทีใช้ ึ ษา ความสัมพันธ ์ของตัวแปรต่างๆ • ภาคขยายของ regression และ factor analysis ่ เคราะห ์เป็ นได้ทงตั ้ั วแปรสังเกตุ • ตัวแปรทีวิ ได้ และตัวแปรแฝง 78 แนวคิดของ SEM X1 1.00 X2 .54 1.00 X3 .23 .31 1.00 X4 .19 .43 .89 X1 X3 1.00 X1 X4 X3 X4 X2 e1 X1 e2 X2 F X2 e3 X3 e4 X4 79 แนวคิดของ SEM e1 X1 e2 X2 e3 X3 e4 X4 11 21 31 41 1 F X1 1.00 X2 .54 1.00 X3 .23 .31 1.00 X4 .19 .43 .89 2 11 1 1121 1131 1141 2 2141 1121 21 2 3131 2 21 31 31 3 31 41 11 31 2 3141 31 4 1141 2141 1.00 Fit indices 2 GFI, CFI, RMSEA 80 ตัวอย่าง e4 e5 e6 Depress1 Depress3 Depress3 1 Depression Family Support 1 Physical Health 1 Self e1 Spousal e2 1 Kid e3 2 Self e7 MD e8 # visits to MD e9 81 X1 X2 Sensory X3 X4 X5 Affective X6 X7 X8 Behavioral X9 X10 X11 Intellectual X12 82 Sen Sen Sen Sen Sen Brand Personality .13** .69* .67* Sen Aff Brand Experience .15** Satisfaction .59* Loyalty Intel Beh .24* 83 ิ ธิภาพ โมเดลการใชช้ วี ต ิ ทีม ่ ป ี ระสท X1 X2 Time X3 X4 X5 Social X6 X7 X8 Flexible X9 X10 Confidence X11 X12 84