統計諮詢

Download Report

Transcript 統計諮詢

統計諮詢的工具
各階段統計諮詢所需要的工具
電腦輔助電話訪問系統(CATI)
網路問卷資料輸入系統
統計套裝軟體
統計諮詢的階段
 I. 前置作業(CATI)


自行收集
資料庫下載
 II. 資料整理分析(統計套裝軟體)



基本資料分析
初階資料分析
進階資料分析
I. 前置作業
 1. 自行收集




抽樣設計
問卷回收管理
資料檔的建立
軟體程式撰寫
 2. 資料庫下載


資料庫的選擇
資料檔的整理與合併
II. 資料整理分析
1. 基本資料分析
結構分析
樣本代表性探討
加權必要性探討

2. 初階資料分析
信度分析、效度分析、次數分配、交叉分析

3. 進階資料分析
變異數分析、迴歸分析、多變量分析及其他

電腦輔助電話訪問系統(CATI)
 抽樣設計
 電訪問卷回收管理
 資料檔的建立
 自動撰寫資料輸入軟體程式

變數名稱、選項名稱、遺失值設定等
CATI系統的電話抽樣
 電話資料庫的抽樣:從500萬戶資料庫抽
出樣本電話再以尾碼或是尾兩碼隨機取得
待訪樣本電話以增加其涵蓋面。
 電話區域碼資料庫的抽樣:以區域碼的比
例為權重先抽出樣本電話的區域碼,再由
電腦產生四碼隨機數字組合成待訪樣本電
話。此法又稱為RDD抽樣法。
電話資料庫抽樣VS. RDD抽
樣
 電話資料庫抽樣抽出的待訪樣本電話交精
準有效電話比例較高電訪成本較低,但電
話資料庫維護不易。
 RDD抽樣:電話區域碼資料庫變動不大,
區域碼的比例之權重修改容易,不過抽出
待訪樣本電話無效的比例較高。
CATI的分析功能
 線上即時分析:

次數分配與交叉分析
 隨時的資料轉檔

問卷調查的抽樣誤差計算與整份問卷的次術語百分比
結果。
 統計分析軟體的配合

可轉出文字型態的資料檔 *.TXT 或 *.DAT檔,同時
也可轉出對應的SPSS的語法檔 *.SPS 或是SAS的語法
檔 *.SAS。
問卷調查表管理系統
 抽樣設計
 電訪問卷回收管理
 資料檔的建立
 資料檔軟體程式撰寫

變數名稱、選項名稱、遺失值設定等
統計套裝軟體
 常用統計套裝軟體.
 各種統計套裝軟體的比較
常用統計套裝軟體一
 Statistical Analysis System(SAS)1960末期
由North Carolina State University 統計系的
Barr & Goodright所開發。目前有9.1視窗
版。以年租金的方式授權使用。有一些模
組分開授權。
SAS常用模組
 SAS/AP:以簡單的指令控制系統運用來開發應
用功能。
 SAS/BASICS:主要功能為資料處理與資料管理。
 SAS/STAT:特長為多變量分析。
 SAS/ETS:特長為計量經濟與時間序列。
 SAS/IML:為互動式模組專注在矩陣語言。
 SAS/DATA MINING:資料探勘(數據採礦)
資料輸入輸出
 相關的程序:
 DATA workfile;系統資料的儲存與整理。
 PROC FORMAT;變數與變項的輸出格式。
 PROC PRINT;資料的列印與輸出。
 其他分析程序也有資料輸出的指令。
統計分析
 敘述性統計:PROC MEANS; PROC
FREQ; PROC SUMMARY; PROC
TABULATE; PROC UNIVARIATE; PROC
CORR等。
 迴歸分析:PROC REG; PROC STEPWISE;
PROC ORTHOREG; PROC RSREG; PROC
RSQUARE; PROC NLIN等。
統計分析(二)
 變異數分析:PROC ANOVA; PROC
GLM;PROC NESTED; PROC VARCOMP;
PROC TTEST; PROC PLAN; PROC
NPAR1WAY等。
 類別資料分析:PROC CATMOD; PROC
FREQ;
統計分析(三)
 多變量分析:PROC CANCORR; PROC
FACTOR; PROC PRINCOMP; PROC
DISCRIM; PROC CANDISC; PROC
STEPDISC; PROC NEIGHBOR; PROC
CLUSTER; PROC FASTCLUS; PROC
TREE; PROC VARCLUS; PROC
ACECLUS等。
程式範例
 DATA one;
input height weight;
運算
cards;
123 25 127 21 120 24 124 20 118 26;
 PROC MEANS;
程式範例二
 DATA one;
infile “location of filename”;
input height weight;
cards;
 PROC MEANS;
問卷調查資料輸入範例
 94年4月台北大學發展調查。
 問卷檔案。
 CATI的問卷報表html檔案。
 資料輸入程式檔。.sas檔
 資料檔。
SAS資料分析範例
 PROC間的轉檔。
 教學評鑑分析。

資料型態:每位同學的部分基本資料(學院、系別、
年級、性別、課目等),對教學的意見及對學習的意
見兩大提之各小題的填答結果。部分資料檔
(ACCESS)。部分資料檔(Excel)。
 SAS轉檔程式。
 SAS分析程式檔。
 SAS分析紀錄(.log),SAS結果報表(.lst)。
常用統計套裝軟體二
 Statistical Package for the Social Science
(SPSS)社會科學統計套裝軟體是針對社會
及行為科學研究領域中,量化資料常用的
統計分析方法所設計的軟體。操作介面簡
單,以買斷的方式授權。目前中文版為
10.0,英文版為12.0。
資料的輸入
 直接輸入
 轉檔
 程式讀檔
分析程序
 資料畫面- *.sav
 程式畫面- *.sps
 報表畫面- *.spo
SPSS範例
 94年4月台北大學發展調查。
 資料輸入程式檔。.sps檔
 資料檔。
特殊功能
 複選題的處理
 篩選局部資料分析
 加權處理
 Missing value的處理
Minitab統計套裝軟體
 Minitab Statistical Software原是
Pennsylvania State University為初級
統計學學生所開發的軟體。
 目前有14.0版,由一獨立單位 Minitab
Inc.經營維護。
程式型統計套裝軟體
 S plus:源自S language,原是1980年代 AT&T
Technologies Software Sales 所開發在 UNIX 上的資
料分析與繪圖的互動式環境系統S所用的程式語言。有

Richard A. Becker & John M. Chambers於 1984撰寫的 S: An
Interactive Environment for Data Analysis and Graphics,
及1985年撰寫的Extending the S System.
 Richard A. Becker, John M. Chambers & Allan R.
Wilks 整合成The New S Language 於1988年出版。
 目前有S Plus 7由 Insightful Corporation經營維護。
特定領域的統計套裝軟體
 結構方程模式(Structural Equation Model):Lisrel,
EQS, M Plus。
 時間數列分析:RAT, GAUSS。
 一般線性模式:GLIM。
 資料探勘(Data Mining):




SAS: Enterprise Intelligence platform
SPSS: Clementine。
S Plus: Insightful Miner。
Minitab
網頁輸入系統範例
 網頁輸入系統

http://web.ntpu.edu.tw/~ccw2/poll/
 員工手冊說明會滿意度調查




問卷
網頁 http://web.ntpu.edu.tw/~ccw2/poll/ntpu_22.htm
輸入程式、分析程式
資料 http://web.ntpu.edu.tw/~ccw2/poll/ntpu_22.txt
各種統計套裝軟體的比較