R For Statistical Analysis

Download Report

Transcript R For Statistical Analysis

ปราณี นิลกรณ์


สำหรับผู ้ไม่คุ ้นกับกำรใช ้ คำสงั่ หรือ กำรเขียนโปรแกรม
มีผู ้พัฒนำ package ทีท
่ ำเป็ นเมนูให ้เลือก ซงึ่ เรียก R
Commander
ในกำรบรรยำยนี้ จะเน ้น กำรวิเครำะห์ข ้อมูลโดยใช ้ R
Commander โดยเรียงลำดับขัน
้ ตอนกำรวิเครำะห์ตัง้ แต่
◦
◦
◦
◦
กำรอ่ำนข ้อมูลเข ้ำ
กำรคำนวณสถิตพ
ิ รรณนำ
กำรสร ้ำงกรำฟ
้ ตอ
่ กำรทดสอบสมมติฐำน กำรวิเครำะห์
กำรใชสถิ
ิ นุมำน เชน
กำรถดถอย
2


้
กำรใช ้ R commander เหมือนกับกำรใชโปรแกรม
่ SPSS) คือมีเมนูและ
สำเร็จรูปทำงสถิตอ
ิ น
ื่ ๆ (เชน
dialog box ให ้คลิก
้ เลือกในกำรอ่ำนข ้อมูลเข ้ำ จัดกำร
ข ้อมูลและวิเครำะห์ข ้อมูล
รำยละเอียดเกีย
่ วกับ R commander และวิธใี ช ้ อ่ำนได ้
จำก Getting Started With the R Commander โดย
John Fox (10 July 2010) (อยูใ่ น Help ของ R
Commander)
3




หน ้ำต่ำง R commander แบ่งเป็ น 3 สว่ น คือ
สว่ นบนสุด เป็ น script window สำหรับเก็บคำสงั่ R ที่
้ ตำ่ งๆ หรือผู ้ใชอำจพิ
้
เกิดจำกกำรใชเมนู
มพ์คำสงั่ R ลง
ไปเองโดยตรง
สว่ นกลำงเป็ น output window
้
สว่ นล่ำง เป็ น message window ทีร่ ะบบใชแสดง
้
ข ้อผิดพลำด คำเตือน หรือ ข ้อมูลอืน
่ ๆให ้ผู ้ใชทรำบ
้ ้ำงกรำฟ จะมีหน ้ำต่ำงกรำฟต่ำงหำก
ถ ้ำผู ้ใชสร
4
5









File จัดกำรเกีย
่ วกับไฟล์
Edit แก ้ไขเนือ
้ หำใน script และ output windows
Data สำหรับอ่ำนและจัดกำรเกีย
่ วกับข ้อมูล
Statistics สำหรับคำนวณสถิตต
ิ ำ่ งๆ
Graphs สำหรับสร ้ำงกรำฟพืน
้ ฐำนทำงสถิต ิ
Models สำหรับคำนวณสถิตท
ิ เี่ กีย
่ วข ้องกับตัวแบบทำงสถิต ิ
่ กำรถดถอยฯลฯ
เชน
Distribution คำนวณควำมน่ำจะเป็ นภำยใต ้กำรแจกแจงต่ำงๆ
Tools สำหรับ load packages และ plug-in ต่ำงๆ
Help
6

ใต ้แถบเมนู จะมี toolbar ดังนี้
Tool Bar
7



้ ด แสดงชุดข ้อมูลทีก
้
ปุ่ มซำยสุ
่ ำลังใชงำนอยู
(่ active
data set) เริม
่ ต ้น จะยังไม่ม ี active data set ถ ้ำคลิก
้
ปุ่ มนี้ จะสำมำรถเลือกชุดข ้อมูลทีม
่ อ
ี ยูใ่ นหน่วยควำมจำมำ
้ ้
ใชได
ตรงกลำงเป็ นปุ่ ม Edit data set และ View data set ใช ้
สำหรับเรียก active data set มำแก ้ไข หรือดูข ้อมูล
้ ่ เริม
ปุ่ มขวำสุด แสดง ตัวแบบสถิตท
ิ ใี่ ชอยู
่ ต ้น จะยังไม่ม ี
active model
8
กำรนำข ้อมูลเข ้ำมำใน R Commander ทำได ้หลำยวิธ ี
 Key ข ้อมูลเข ้ำโดยตรง โดยใช ้ Data -> New data
set …
 import ข ้อมูลจำก text file, SPSS, Minitab, Stata,
Excel, Access, dBase
 อ่ำน data set จำกทีม
่ อ
ี ยูใ่ น R package
9
•ให ้เลือก Data-> New data set .. จำก R
Commander menu จะปรำกฏหน ้ำต่ำงดังนี้
10
ื่ ชุดข ้อมูลลงไปตำมทีต
ให ้พิมพ์ชอ
่ ้องกำรตัง้ (ถ ้ำไม่
ื่ เป็ น “Dataset”)
ตัง้ โดยอัตโนมัตจิ ะมีชอ
ื่ data set อำจเริม
 ชอ
่ ต ้นด ้วย ตัวอักษรเล็ก /
ตัวอักษรใหญ่ แล ้วตำมด ้วย ตัวอักษรทัง้ หมด
/periods/ underscores/ตัวเลข แต่ห ้ำมมี Blank
มิฉะนัน
้ จะถือว่ำมีหลำยชุดข ้อมูล
 แล ้ว Click OK จะปรำกฏ Data Editor Window
ดังภำพต่อไป
ื่ data set ทีต
้ นชอ
ื่ อ ้ำงอิงข ้อมูลที่
 ชอ
่ งั ้ ไว ้นี้ จะใชเป็
อ่ำนเข ้ำมำต่อไป

11
12




่ ้อมูล แต่ละตัวแปรตำมต ้องกำร
ใสข
ื่ ตัวแปรโดยกำรคลิก
ตัง้ ชอ
้ ที่ var1 , var2 ฯลฯ จะทำ
ให ้ปรำกฏ Variable editor dialog box ดังนี้
ื่ ตัวแปรตำมทีต
ให ้พิมพ์ชอ
่ ้องกำรลงไปแทน var1 var2
ฯลฯ
เลือกเมนู File -> Close from the Data Editor หรือ
คลิก
้  ทีม
่ ม
ุ ขวำบนเพือ
่ ปิ ด Data editor ข ้อมูลทีพ
่ ม
ิ พ์
เข ้ำไปจะเป็น active data set
13






ื่ ตัวแปร
ในกำรเก็บข ้อมูลใน Text File แถวแรกควรเป็ นชอ
แถวต่อๆไป เป็ นค่ำของตัวแปร โดย 1 แถวเป็ นข ้อมูล
ของ 1 case(คน) หรือ 1 หน่วยสงั เกต
ข ้อมูลของแต่ละตัวแปรควรแยกจำกกันด ้วย อย่ำงน ้อย
่ งว่ำง หรือ มี comma คัน
1 ชอ
่ หรือ ใช ้ tab คัน
่
ข ้อมูลสูญหำย ให ้ใช ้ NA แทน
ตัวแปรทีม
่ ค
ี ำ่ ข ้อมูลเป็ น string R จะถือว่ำตัวแปรนัน
้
เป็ น factor
ใชค้ ำสงั่ Data -> Import data from text file
14
Id VitaminC
1
145
2
185
3
387
4
593
5
248
6
245
7
349
8
902
9
159
10
122
11
264
12 1052
13
218
14
117
15
185
Placebo
417
279
678
636
170
699
372
582
363
258
288
526
180
172
278
15

R Commander จะขึน
้ หน ้ำต่ำงดังนีใ้ ห ้
16




ื่ data set ตำมทีต
ให ้ตัง้ ชอ
่ ้องกำร แล ้ว Click OK
Read Text Data dialog จะเปิ ด Open file dialog ให ้
ให ้ไปทีไ่ ฟล์ทต
ี่ ้องกำรอ่ำน แล ้วคลิก
้ Open จะทำให ้ไฟล์
ถูกอ่ำนเข ้ำมำใน R และชุดข ้อมูลนีจ
้ ะเป็ น active data
set
ถ ้ำต ้องกำรดูข ้อมูล ให ้ click View data set
การอ่านข้อมูลจาก SPSS, Excel ฯลฯ ทาได้
ทานองเดียวก ัน
17
การ recode
 เลือก Data->Manage variables in active data set>Recode Variables
การคานวณต ัวแปรใหม่
 เลือก Data->Manage variables in active data set
->Compute New Variables
18




เมือ
่ มี active data set แล ้ว สำมำรถคำนวณสถิตต
ิ ำ่ งๆ
ได ้ด ้วย menu ของ R commander
กำรคำนวณสถิตพ
ิ รรณนำ เลือกเมนู Statistics ->
Summaries->Numerical summaries จะปรำกฏ
dialog box ดังนี้
เฉพำะตัวแปร numeric เท่ำนัน
้ ทีป
่ รำกฏใน dialog box
เลือกตัวแปรทีต
่ ้องกำร แล ้วคลิก
้ OK
19


เลือกเมนู Graphs->Histogram….. จะปรำกฏ
Histogram dialog box ให ้เลือกตัวแปรทีต
่ ้องกำร แล ้ว
คลิก
้ OK
กรำฟอืน
่ เลือกได ้ทำนองเดียวกัน
20
ข้อมูลจ ับคู่
 เลือกเมนู Statistics->Means-> Paired t test
ข้อมูลอิสระ
 เลือกเมนู Statistics->Means-> Independent
samples t test
21
เลือกเมนู Statistics->Variances-> Levene’s test
 ตัวอย่ำง output
Levene's Test for Homogeneity of Variance (center
= median)
Df F value Pr(>F)
group 1 12.508 0.0006091 ***
103
--
Signif. codes: 0 '***'
0.001 '**'
0.01 '*'
0.05 '.'
0.1 ' ‘ 1
22

เลือกเมนู Statistics->Dimensional Analysis-> scale
reliability
23