Transcript Document
STATISTICA統計軟體的應用
第一講:敘述統計與檢定
南台科技大學企管系
呂金河
1
STATISTICA 7.0 中文版(英文版9.0)
STATISTICA 7.0版產品種類:
STATISTICA 7.0版 Base
STATISTICA 7.0版 Advanced
Linear/Nonlinear
STATISTICA 7.0版 Multivariate
Exploratory
STATISTICA 7.0版 Industrial
Statistics & Six Sigma
STATISTICA 7.0版 Power Analysis
STATISTICA 7.0版 Data Miner
2
STATISTICA Base
3
摘要
一、資料建檔
1.資料輸入
2.資料轉換
3.資料檢核
二、敘述統計
1.次數分配表
2.莖葉圖、直方圖與盒鬚圖
3.敘述統計量的計算
4
摘要
三、各種機率分配的計算
1.累積分配函數 2.反分配函數 3. 產生隨機樣本
四、常態母體的估計與檢定
1. 單一母體
2. 兩個獨立母體比較
3. 配對資料的比較
4. p值的檢定與估計
5. 二個p值的比較
6. 二個相關係數值的比較
7. 常態性假設的檢驗
伍、類別資料的卡方檢定
5
STATISTICA Basic
6
舉例
資訊保護能力,李克特七點量表問卷題目
PP1:公司有避免資訊在內部遭不當利用或竊取的保
護程序
PP2:公司有避免資訊在外部遭不當利用或竊取的保
護程序
PP3:公司有防止其他人接近特定資訊來源的科技
PP4:公司很重視且保護員工擁有的資訊
基本資料: 個人資歷,個人職位階級
7
一、資料建檔
1.資料輸入
(a)新資料建檔
檔案 (File) 開新檔案(New) 在制定新文件
(Create New Document)視窗的試算表(*.sta檔)
取定變數個數(Number of variables)、案例個數
(Number of cases) (另有工作簿(*.stw檔),報告
表(*.str檔)) 按確定(OK)
輸入資料(如Excel) 在Var 欄按左鍵二下
在變數視窗修改變數名稱(Name),或必要的註
解等 按確定(OK) 存檔(Save or Save
as)(*.sta檔)
8
1.資料輸入
編碼
9
一、資料輸入
(b)類別變數的加權模式
例如:先輸入gender及count兩變數,再點
工具 (Tools) 選加權(Weight)
輸入加權變數(Weight variable)名稱
在狀態欄(Status) 勾選開啟(On)
確定(OK) (若要取消加權,則在狀態欄
勾選關閉(Off))
10
一、資料輸入
(c)其他檔案匯入
(1)點選檔案 (File) 開啟舊檔(Open) 在開啟
(Open)視窗的檔案類型選取資料檔案類型 (例如
Excel.xls檔) 點選資料的名稱 開啟(Excel.xls
檔) 在開啟檔案(Open File) 的視窗的Range欄取
定要匯入的變數(Variables)及案例(Cases) 在開
啟Excel檔的視窗 勾選自第一列取得變數名稱(Get
case names from first column)等(視檔案情況勾選)
確定(OK)
(檔案匯出:點選另存檔案(Save
as) 餘操作類同上述)
(2)利用編輯 複製 貼上的功能,將資料轉貼
於STATISTICA視窗
11
2.資料轉換
行列互換(Transpose)
點資料(Data) 轉換(Transpose) 檔案(File)
數據排序(Sort)
點資料(Data) 排序(Sort) 在排序選項(Sort Option)
視窗的變數欄選入(Add Var)排序變數的名稱與排序方向
(Direction)等 確定(OK)
選擇觀察值(Subset/Random Sampling)
按資料(Data) 在制定隨機子集抽樣視窗(Create a
Subset/Random Sampling) 按變數(Variables) 勾選要
抽樣的變數 確定(OK)
按案例(Cases) 勾選案例選取條件(Enable Selection
Conditions) 在包含案例 (Include cases) 欄輸入包含案
例(先點選滿足以下條件式(Specific, selected by)之特定
範圍資料)或在剔除案例 (Exclude cases) 欄輸入剔除案
12
例的條件 確定(OK)
抽樣
在簡單抽樣(Simple Sampling)選項內
勾選簡單隨機抽樣(Simple random sampling) 輸入抽
樣比率近似%(Approximate) 確定 (OK)
勾選系統隨機抽樣(Systematic random sampling) 輸
入抽樣距離k(=N/n=母體個數/樣本個數) 確定(OK)
在分層抽樣(Stratified Sampling)選項內
按分層變數(Strata Variable) 勾選分層變數(Select
Variables) 確定(OK)
按編碼(Codes) 按全部(All) 確定(OK)
設定每一分層(Stratification Groups)的抽樣比率近似
%(Approximate%) 或勾選均勻機率(Uniform probability)
再設定抽樣比率近似%(Approximate) 確定 (OK)
13
2.資料轉換
四則運算創造新變數
點資料 (Data) 批次轉換公式(Batch
Transformation Formulas) 在批次轉換公式視窗
輸入計算公式 (善用右方函數(Functions)功能選項)
確定(OK)
重新編碼(Recode)
滑鼠移至要點重新編碼的變數欄 按資料(Data)
重新編碼(Recode) 在資料重新編碼視窗的對
話框 設定重新編碼新舊值 確定(OK)
14
3.資料檢核
(a)單變量離群值(outlier)或偏離值的檢驗
(1)利用次數分配表
●點選 統計(Statistics) 基本統計/表格(Basic
Statistics/Tables) 次數分配表(Frequency tables)
確定(OK) 按變數(Variables) 選取要分析的變數
按確定(OK) 按快速欄(Quick)的次數分配表(Summary
Frequency tables)
(2)利用直方圖
●點選 統計(Statistics) 基本統計/表格(Basic
Statistics/Tables) 敘述統計(Descriptive Statistics)
確定(OK) 按變數 (Variables) 選取要分析的變數
按確定(OK)按快速欄(Quick)的直方圖(Histograms)
●選 圖表(Graphs) 直方圖(Histograms) 在快速欄
(Quick)對話方框中,按變數(Variables) 選取要畫圖
的變數 按確定(OK) 按確定(OK)
15
3.資料檢核
(3)利用盒形圖
點選 統計(Statistics) 基本統計/表格(Basic
Statistics/Tables) 敘述統計(Descriptive
Statistics) 確定(OK) 按變數 (Variables) 選
取要分析的變數 按確定(OK) 按快速欄(Quick)
的所有變數之盒鬚圖(Box and whisker plot)
● 選 圖表 (Graphs) 2D圖形(2D Graphs) 盒型圖
(Box Plots) 在快速欄(Quick)對話方框中,按變數
(Variables) 選取要畫圖的變數(dependent
variable)或分群變數(Grouping Variable) 按確定
(OK)
●
16
3.資料檢核
(b)多變量偏離值的檢驗
(1)幾個類別變量與一個連續變量,共多個變項的偏離值
檢驗
● 點選 統計(Statistics) 基本統計/表格(Basic
Statistics/Tables) 敘述統計(Descriptive Statistics)
確定(OK) 按變數(Variables) 選取要分析的變數
按確定(OK)按分類圖表欄(Categ. plots)的分類盒
鬚圖(Categorized box & whisker plots) 在對話框選
取分群(類別)變數(Grouping variables) 確定(OK)
在選擇編碼(Select codes)對話框按全部(All) 確定(OK)
● 點選 統計(Statistics) 基本統計/表格(Basic
Statistics/Tables) 敘述統計(Descriptive Statistics)
確定 按變數(Variables) 選取要分析的變數
按確定(OK)按分類圖表欄的分類直方圖(Categorized
histograms) 在對話框選取分群(類別)變數(Grouping
variables) 確定(OK) 在選擇編碼(Select codes)對
17
話框按全部(All) 確定(OK)
3.資料檢核
(2)兩個連續變項的偏離值檢驗
● 點選 統計(Statistics) 基本統計/表格(Basic
Statistics/Tables) 敘述統計 (Descriptive Statistics)
確定(OK) 按變數(Variables) 選取要分析的變數
按確定(OK)按機率圖與散佈圖欄(Prob. &
Scatterplots)的2D散佈圖(2D scatterplot) 在對話框分
別選取X-Y軸的變數 按確定(OK)
● 選 圖表(Graphs) 散佈圖(Scatter plots) 在快速欄
(Quick)對話方框中,按變數(Variables) 選取X-Y軸的
變數 按確定(OK) 確定(OK)
● 選 圖表(Graphs) 2D圖形(2D Graphs) 散佈圖
(Scatter plots) 在快速欄(Quick)對話方框中,按變數
(Variables) 選取X-Y軸的變數 按確定(OK) 確定
(OK)
18
二、敘述統計
1.次數分配表
(a) 點選 統計(Statistics) 基本統計/表格(Basic
Statistics/Tables) 敘述統計(Descriptive Statistics)
確定(OK) 按變數(Variables) 選取要分析的
變數 按確定(OK)在快速欄(Quick)按次數分配
表(Frequency tables)
(b)自訂區間的次數分配表
點選統計(Statistics) 基本統計/表格 (Basic
Statistics/Tables) 次數分配表(Frequency tables)
確定(OK) 按變數(Variables) 選取要分析的
變數 按確定(OK)在進階欄(Advanced)的表格與
圖表之分類方法做勾選與設定按摘要次數分配表
(Summary)
19
二、敘述統計
2.莖葉圖,直方圖與盒鬚圖
點選 統計(Statistics) 基本統計/表格(Basic
Statistics/Tables) 敘述統計(Descriptive
Statistics) 確定(OK) 按變數(Variables) 選
取要分析的變數 按確定(OK)按常態性欄
(Normality)在莖葉圖設定欄(Stem and leaf) 按莖
葉圖(Stem and leaf plot)
直方圖與盒鬚圖的做法如前述。
20
3.敘述統計量的計算
(1)利用'次數分配表'功能
點選統計(Statistics) 基本統計/表格(Basic
Statistics/Tables) 次數分配表 (Frequency tables)
確定(OK) 按變數 (Variables) 選取要分析的變數
按確定(OK)在快速欄(Quick)按敘述統計量
(Descriptive Statistics) 或在敘述統計量欄(Descr.)按敘
述統計量(Descriptive Statistics)
(2)利用'敘述統計量'功能
點選 統計(Statistics) 基本統計/表格(Basic
Statistics/Tables) 敘述統計(Descriptive Statistics)
確定(OK) 按變數 (Variables) 選取要分析的變數
按確定(OK)在快速欄(Quick)按敘述統計量(Summary
Statistics) 或按進階(Advanced)在計算統計量欄
(Compute statistics) 勾選要中位數、偏態係數、變異數
等 按摘要(Summary)或 摘要敘述統計量(Summary
Statistics)
21
3.敘述統計量的計算
(3)利用'區塊統計量'功能
在資料檔將要分析的變數區塊反白 按右鍵 選
取特定區塊資料統計量(Statistics of Black Data),
滑鼠移至右邊的變數欄區塊(Black columns)
(要畫統計圖,則可選取區塊資料圖表(Graphs of
Black Data),滑鼠移至右邊的圖項 按左鍵) 滑鼠
移至右邊的統計量 按左鍵
22
三、各種機率分配的計算
(1)點選 統計(Statistics) 基本統計/表格 (Basic
Statistics/Tables) 機率計算器(Probability
calculator) 確定(OK) 在分配欄(Distribution)選
分配名稱 按左鍵 輸入df,關鍵參數值,機率p值
或x值 ,則對話框顯示 密度函數(Density Function)
與分配函數值(Distribution Function) (左尾累積機
率),若要顯示右尾累積機率,則勾選1-累積機率(1Cumulative p)。
23
三、各種機率分配的計算
(2)點選 資料(Data) 批次轉換公式(Batch
Transformation Formulas) 在批次轉換公式視窗
按函數(Functions) 在函數瀏覽器(Function
Browser)的類別(Category)下選分配(Distribution)按
左鍵 在 項目(Item)選要計算的分配,函數瀏覽器
對話框的下方會出現說明; 按右鍵二下在公式
(Formula)欄輸入上述說明要求輸入的df,關鍵參數
值,機率p值或x值 確定(OK)
例如 chi2(3.84, 1) 可得卡方分配df=1,x=3.84的密
度函數值,ICh2(3.84, 1) 可得卡方分配df=1,x≦
3.84的累積機率值, VCh2(0.95, 1)可得卡方分配
df=1,的0.95分位數3.84,VCh2(rnd(1), 1) 可得卡
方分配df=1的一組隨機樣本
24
四、常態母體的估計與檢定
1. 單一母體
(a) σ值已知,或σ未知,但, n 30 (或 25)
用
X
Z
n
的z-檢定。
點選 統計(Statistics) 基本統計/表格(Basic
Statistics/Tables) 差異性檢定: r,百分比,平均
數(Difference tests:r,%,means) 確定(OK) 在差
異性檢定對話框輸入M1=值,StDv 1=σ或s值,及
樣本大小=N1,輸入M2=虛無假設的μ值 勾選單
一平均數vs.母體平均數(Single mean vs.
population mean 2) 勾選單尾或雙尾(One-sided,
Two-sided) 按計算(Compute) 得出p 值
25
1. 單一母體
(b) σ值未知,且小樣本, n 30 (或 25)
用
●
X
T
S
n
的t-檢定。
點選 統計(Statistics) 基本統計/表格(Basic
Statistics/Tables) 單一樣本t檢定(t-test single
sample) 確定(OK) 按變數 (Variables) 選取
要分析的變數 按確定(OK)在快速欄(Quick)的
給定特定常數(Reference values) ,檢定所有平均
數(Test all means against) 輸入虛無假設的μ值
按選項勾選計算信賴區間(Compute conf. limits)並
輸入信賴度按摘要(Summary):T檢定結果
26
2. 兩個獨立母體比較
(a) 常態下設σ1、σ2值已知或σ未知,但大樣本的
z-檢定
點選 統計(Statistics) 基本統計/表格 (Basic
Statistics/Tables) 差異性檢定: r,百分比,平均
數(Difference tests:r,%,means) 確定(OK) 在
差異性檢定對話框輸入M1= x 值,Stdv 1=σ或s值,
及樣本大小=N1,再輸入第二群的M2= 值,Stdv
x
2=σ或s值,及樣本大小=N2, 勾選單尾或雙尾
(One-sided, Two-sided) 按按計算(Compute) 得
出p 值
27
2. 兩個獨立母體比較
(b)設σ1、σ2 值未知的t-檢定
(b-1)設 σ1 = σ2
點選 統計(Statistics) 基本統計/表格(Basic
Statistics/Tables) 獨立樣本t檢定,依變數定義(t-test,
independent, by variables)或 獨立樣本t檢定,依分群定義(ttest, independent, by groups) 確定(OK) 按變數
(Variables) 選取要分析的變數 按確定(OK)按選項
(Option)勾選Levene’s 檢定(Levene’s test)按摘要
(Summary)
(b-2)設 σ1 ≠σ2
點選 統計(Statistics) 基本統計/表格 (Basic
Statistics/Tables) 獨立樣本t檢定,依變數定義(t-test,
independent, by variables)或獨立樣本t檢定,依分群定義(ttest, independent, by groups) 確定(OK) 按變數
(Variables) 選取要分析的變數 按確定(OK)按選項
(Option)勾選各組變異數估計t檢定(t-test with separate
variance estimates)及Levene’s檢定(Levene’s test)按摘要
(Summary)
28
3. 配對資料的比較
點選 統計(Statistics) 基本統計/表格(Basic
Statistics/Tables) 相依樣本t檢定(t-test
dependent sample) 確定(OK) 按變數
(Variables) 選取要分析的變數 按確定
(OK)在快速(Quick)欄按摘要(Summary):T檢定
結果 或按進階(Advanced)的摘要:T檢定結果
29
4. p值的檢定與估計
點選 統計(Statistics) 基本統計/表格(Basic
Statistics/Tables)敘述統計(Descriptive statistics)
確定(OK) 按變數(Variables) 選取要分析的變數
按確定(OK)按加權(W-weights)在對話框的加權變
數鍵入加權變數名稱, 勾選狀態(Status)為開(On) 按
確定(OK)在快速欄(Quick)按敘述統計量(Summary
Statistics),記下所得的平均數與標準差 再點選 統計
(Statistics) 基本統計/表格(Basic Statistics/Tables)
差異性檢定: r,百分比,平均數(Difference
tests:r,%,means) 確定 在差異性檢定對話框輸入上
述所得的平均數與標準差於M1 及Stdv 1,再輸入樣本
大小=N1,輸入M2=虛無假設的p值 勾選單一平均數
vs.母體平均數(Single mean vs. population mean 2)
勾選單尾或雙尾(One-sided, Two-sided) 按計算
(Compute) 得出檢定的p 值
30
資料輸入如:
是否贊成
人數
0
23
1
55
性別
1
1
2
2
是否贊成
0
1
0
1
人數
23
55
32
46
31
5. 二個p值的比較
點選 統計(Statistics) 基本統計/表格(Basic
Statistics/Tables) 差異性檢定: r,百分比,平均數
(Difference tests:r,%,means) 確定(OK) 在差異性
檢定對話框輸入第一群的%1p值及樣本大小=N1,第二
群的%2 p值及樣本大小N2, 勾選單尾或雙尾(Onesided, Two-sided) 按按計算(Compute) 得出p 值
(T檢定近似)
點選 統計(Statistics) 基本統計/表格(Basic
Statistics/Tables) 獨立樣本t檢定,依分群定義(t-test,
independent, by groups) 確定(OK) 按變數
(Variables) 選取要分析的反應變數與分群變數 按
確定(OK) 按加權(w-weights)在對話框的加權變數
鍵入加權變數名稱,勾選狀態(Status)為開(On) 按確
定(OK)在快速欄(Quick)按按摘要(Summary):T檢定結
32
果
6. 二個相關係數值的比較
點選 統計(Statistics) 基本統計/表格 (Basic
Statistics/Tables ) 差異性檢定: r,百分比,平
均數(Difference tests:r,%,means) 確定(OK)
在差異性檢定對話框輸入第一群的相關係數r1值
及樣本大小=N1,第二群的r2值及樣本大小N2,
勾選單尾或雙尾(One-sided, Two-sided) 按確
定(OK)
33
7. 常態性假設的檢驗
點選 統計(Statistics) 基本統計/表格(Basic
Statistics/Tables ) 敘述統計(Descriptive
statistics) 確定(OK) 按變數(Variables) 選
取要分析的變數 按確定(OK)按常態性欄
(Normality) 在分配(Distribution)下勾選檢定常態
性之Kolmogorov-Smimov與Lilliefors檢定或
Shapiro-Wilk’s W檢定按直方圖(Histograms)或次
數分配表(Frequency tables)
●
34
7. 常態性假設的檢驗
點選 統計(Statistics) 基本統計/表格(Basic
Statistics/Tables ) 敘述統計(Descriptive statistics)
確定(OK) 按變數(Variables) 選取要分析的變數
按確定(OK)按機率圖與散佈圖欄(Prob. &
Scatterplots)的常態機率圖(Normal probability plot)或半
常態機率圖(Half-normal probability plot)
● 選 圖表(Graphs) 2D圖形(2D Graphs) 常態機率
圖(Normal probability plot) 在快速欄(Quick)對話方
框中,按變數(Variables) 選取變數 確定(OK)
勾選Shapiro-Wilk檢定 在圖表類型(Graphtyoe)選常
態(Normal)或半常態(Half-normal) 按確定(OK)
●
35
五、類別資料的卡方檢定
適合度檢定:
點選 統計(Statistics) 無母數統計
(Nonparametrics) 觀察次數與期望次數
(Observed versus expected X2) 確定(OK) 選
取要分析的觀察變數與期望變數 按確定(OK)按
摘要(Summary)
36
五、類別資料的卡方檢定
獨立性檢定:
對2×2 表格
點選 統計 (Statistics) 無母數統計(Nonparametrics)
2×2 表格(2×2 Tables) 確定(OK) 在快速欄(Quick)對話
框,輸入2×2 表格內各分組的次數按摘要(Summary)
對列聯表
點選 統計(Statistics) 基本統計/表格(Basic
Statistics/Tables ) 表列與標誌(Tables and banners) 確
定(OK) 按加權(w-weights)在對話框的加權變數鍵入加權
變數名稱, 勾選狀態(Status)為開(On) 按確定(OK)按交
叉表列 (Crosstabulation) 表格設定(至多六維)或二維表格
(Stub-and-banner) 按制定表格(Specify tables)選取要分
析的行與列變數按確定(OK) 按確定(OK) 在選項
(Option)欄,勾選二維表統計量(Statistics for two-way tables),
內容表格設定(Compute tables) 在進階欄(Advanced),按
詳細二維表格(Detailed two-way tables)
37