Document

Transcript Document

STATISTICA統計軟體的應用
第一講:敘述統計與檢定
南台科技大學企管系
呂金河
1
STATISTICA 7.0 中文版(英文版9.0)
STATISTICA 7.0版產品種類:
STATISTICA 7.0版 Base
STATISTICA 7.0版 Advanced
Linear/Nonlinear
STATISTICA 7.0版 Multivariate
Exploratory
STATISTICA 7.0版 Industrial
Statistics & Six Sigma
STATISTICA 7.0版 Power Analysis
STATISTICA 7.0版 Data Miner
2
STATISTICA Base
3
摘要
一、資料建檔
 1.資料輸入
 2.資料轉換
 3.資料檢核
二、敘述統計
 1.次數分配表
 2.莖葉圖、直方圖與盒鬚圖
 3.敘述統計量的計算
4
摘要
三、各種機率分配的計算
 1.累積分配函數 2.反分配函數 3. 產生隨機樣本
四、常態母體的估計與檢定
 1. 單一母體
 2. 兩個獨立母體比較
 3. 配對資料的比較
 4. p值的檢定與估計
 5. 二個p值的比較
 6. 二個相關係數值的比較
 7. 常態性假設的檢驗
伍、類別資料的卡方檢定
5
STATISTICA Basic
6
舉例
 資訊保護能力，李克特七點量表問卷題目
 PP1:公司有避免資訊在內部遭不當利用或竊取的保




護程序
PP2:公司有避免資訊在外部遭不當利用或竊取的保
護程序
PP3:公司有防止其他人接近特定資訊來源的科技
PP4:公司很重視且保護員工擁有的資訊
基本資料: 個人資歷，個人職位階級
7
一、資料建檔
1.資料輸入

(a)新資料建檔

檔案 (File)  開新檔案(New)  在制定新文件
(Create New Document)視窗的試算表(*.sta檔)
取定變數個數(Number of variables)、案例個數
(Number of cases) (另有工作簿(*.stw檔)，報告
表(*.str檔)) 按確定(OK)

 輸入資料(如Excel)  在Var 欄按左鍵二下
在變數視窗修改變數名稱(Name)，或必要的註
解等 按確定(OK)  存檔(Save or Save
as)(*.sta檔)
8
1.資料輸入
 編碼
9
一、資料輸入
(b)類別變數的加權模式

例如：先輸入gender及count兩變數，再點
工具 (Tools) 選加權(Weight)

 輸入加權變數(Weight variable)名稱
 在狀態欄(Status) 勾選開啟(On)
  確定(OK) (若要取消加權，則在狀態欄
勾選關閉(Off))
10
一、資料輸入
(c)其他檔案匯入
 (1)點選檔案 (File)  開啟舊檔(Open) 在開啟
(Open)視窗的檔案類型選取資料檔案類型 (例如
Excel.xls檔) 點選資料的名稱  開啟(Excel.xls
檔) 在開啟檔案(Open File) 的視窗的Range欄取
定要匯入的變數(Variables)及案例(Cases) 在開
啟Excel檔的視窗勾選自第一列取得變數名稱(Get
case names from first column)等(視檔案情況勾選)
 確定(OK)
(檔案匯出:點選另存檔案(Save
as)  餘操作類同上述)
 (2)利用編輯  複製  貼上的功能，將資料轉貼
於STATISTICA視窗
11
2.資料轉換
 行列互換(Transpose)
點資料(Data)  轉換(Transpose)  檔案(File)
 數據排序(Sort)
點資料(Data)  排序(Sort)  在排序選項(Sort Option)
視窗的變數欄選入(Add Var)排序變數的名稱與排序方向
(Direction)等 確定(OK)
 選擇觀察值(Subset/Random Sampling)
按資料(Data)  在制定隨機子集抽樣視窗(Create a
Subset/Random Sampling) 按變數(Variables) 勾選要
抽樣的變數  確定(OK)
按案例(Cases) 勾選案例選取條件(Enable Selection
Conditions) 在包含案例 (Include cases) 欄輸入包含案
例(先點選滿足以下條件式(Specific, selected by)之特定
範圍資料)或在剔除案例 (Exclude cases) 欄輸入剔除案
12
例的條件 確定(OK)
抽樣
 在簡單抽樣(Simple Sampling)選項內
 勾選簡單隨機抽樣(Simple random sampling)  輸入抽
樣比率近似%(Approximate)  確定 (OK)
 勾選系統隨機抽樣(Systematic random sampling)  輸
入抽樣距離k(=N/n=母體個數/樣本個數) 確定(OK)
 在分層抽樣(Stratified Sampling)選項內
按分層變數(Strata Variable)  勾選分層變數(Select
Variables) 確定(OK)
按編碼(Codes) 按全部(All) 確定(OK)
設定每一分層(Stratification Groups)的抽樣比率近似
%(Approximate%) 或勾選均勻機率(Uniform probability)
再設定抽樣比率近似%(Approximate)  確定 (OK)
13
2.資料轉換


四則運算創造新變數
點資料 (Data) 批次轉換公式(Batch
Transformation Formulas) 在批次轉換公式視窗
輸入計算公式 (善用右方函數(Functions)功能選項)
 確定(OK)
重新編碼(Recode)
滑鼠移至要點重新編碼的變數欄  按資料(Data)
重新編碼(Recode) 在資料重新編碼視窗的對
話框設定重新編碼新舊值  確定(OK)
14
3.資料檢核
 (a)單變量離群值(outlier)或偏離值的檢驗
 (1)利用次數分配表
●點選統計(Statistics) 基本統計/表格(Basic
Statistics/Tables)  次數分配表(Frequency tables) 
確定(OK) 按變數(Variables)  選取要分析的變數 
按確定(OK) 按快速欄(Quick)的次數分配表(Summary
Frequency tables)
 (2)利用直方圖
●點選統計(Statistics) 基本統計/表格(Basic
Statistics/Tables)  敘述統計(Descriptive Statistics)
 確定(OK) 按變數 (Variables)  選取要分析的變數
 按確定(OK)按快速欄(Quick)的直方圖(Histograms)
●選圖表(Graphs)  直方圖(Histograms)  在快速欄
(Quick)對話方框中，按變數(Variables) 選取要畫圖
的變數  按確定(OK) 按確定(OK)
15
3.資料檢核
 (3)利用盒形圖
點選統計(Statistics) 基本統計/表格(Basic
Statistics/Tables)  敘述統計(Descriptive
Statistics)  確定(OK) 按變數 (Variables)  選
取要分析的變數  按確定(OK) 按快速欄(Quick)
的所有變數之盒鬚圖(Box and whisker plot)
● 選圖表 (Graphs) 2D圖形(2D Graphs)  盒型圖
(Box Plots) 在快速欄(Quick)對話方框中，按變數
(Variables) 選取要畫圖的變數(dependent
variable)或分群變數(Grouping Variable)  按確定
(OK)
●
16
3.資料檢核
 (b)多變量偏離值的檢驗
 (1)幾個類別變量與一個連續變量，共多個變項的偏離值
檢驗
● 點選統計(Statistics) 基本統計/表格(Basic
Statistics/Tables)  敘述統計(Descriptive Statistics)
 確定(OK) 按變數(Variables)  選取要分析的變數
 按確定(OK)按分類圖表欄(Categ. plots)的分類盒
鬚圖(Categorized box & whisker plots)  在對話框選
取分群(類別)變數(Grouping variables)  確定(OK) 
在選擇編碼(Select codes)對話框按全部(All) 確定(OK)
● 點選統計(Statistics) 基本統計/表格(Basic
Statistics/Tables)  敘述統計(Descriptive Statistics)
 確定 按變數(Variables)  選取要分析的變數 
按確定(OK)按分類圖表欄的分類直方圖(Categorized
histograms) 在對話框選取分群(類別)變數(Grouping
variables)  確定(OK) 在選擇編碼(Select codes)對
17
話框按全部(All) 確定(OK)
3.資料檢核
 (2)兩個連續變項的偏離值檢驗
● 點選統計(Statistics) 基本統計/表格(Basic
Statistics/Tables)  敘述統計 (Descriptive Statistics)
 確定(OK) 按變數(Variables)  選取要分析的變數
 按確定(OK)按機率圖與散佈圖欄(Prob. &
Scatterplots)的2D散佈圖(2D scatterplot) 在對話框分
別選取X-Y軸的變數  按確定(OK)
● 選圖表(Graphs) 散佈圖(Scatter plots)  在快速欄
(Quick)對話方框中，按變數(Variables) 選取X-Y軸的
變數  按確定(OK)  確定(OK)
● 選圖表(Graphs)  2D圖形(2D Graphs)  散佈圖
(Scatter plots) 在快速欄(Quick)對話方框中，按變數
(Variables) 選取X-Y軸的變數 按確定(OK)  確定
(OK)
18
二、敘述統計
1.次數分配表

(a) 點選統計(Statistics) 基本統計/表格(Basic
Statistics/Tables)  敘述統計(Descriptive Statistics)
 確定(OK) 按變數(Variables)  選取要分析的
變數  按確定(OK)在快速欄(Quick)按次數分配
表(Frequency tables)

(b)自訂區間的次數分配表
點選統計(Statistics) 基本統計/表格 (Basic
Statistics/Tables)  次數分配表(Frequency tables)
 確定(OK) 按變數(Variables)  選取要分析的
變數  按確定(OK)在進階欄(Advanced)的表格與
圖表之分類方法做勾選與設定按摘要次數分配表
(Summary)
19
二、敘述統計
 2.莖葉圖，直方圖與盒鬚圖
點選統計(Statistics) 基本統計/表格(Basic
Statistics/Tables)  敘述統計(Descriptive
Statistics)  確定(OK) 按變數(Variables)  選
取要分析的變數  按確定(OK)按常態性欄
(Normality)在莖葉圖設定欄(Stem and leaf) 按莖
葉圖(Stem and leaf plot)
 直方圖與盒鬚圖的做法如前述。
20
3.敘述統計量的計算
(1)利用'次數分配表'功能
點選統計(Statistics) 基本統計/表格(Basic
Statistics/Tables)  次數分配表 (Frequency tables)
確定(OK) 按變數 (Variables)  選取要分析的變數 
按確定(OK)在快速欄(Quick)按敘述統計量
(Descriptive Statistics) 或在敘述統計量欄(Descr.)按敘
述統計量(Descriptive Statistics)
 (2)利用'敘述統計量'功能
點選統計(Statistics) 基本統計/表格(Basic
Statistics/Tables)  敘述統計(Descriptive Statistics) 
確定(OK) 按變數 (Variables)  選取要分析的變數 
按確定(OK)在快速欄(Quick)按敘述統計量(Summary
Statistics) 或按進階(Advanced)在計算統計量欄
(Compute statistics) 勾選要中位數、偏態係數、變異數
等  按摘要(Summary)或摘要敘述統計量(Summary
Statistics)

21
3.敘述統計量的計算
 (3)利用'區塊統計量'功能
在資料檔將要分析的變數區塊反白  按右鍵  選
取特定區塊資料統計量(Statistics of Black Data)，
滑鼠移至右邊的變數欄區塊(Black columns)
(要畫統計圖，則可選取區塊資料圖表(Graphs of
Black Data)，滑鼠移至右邊的圖項按左鍵) 滑鼠
移至右邊的統計量按左鍵
22
三、各種機率分配的計算
 (1)點選統計(Statistics) 基本統計/表格 (Basic
Statistics/Tables)  機率計算器(Probability
calculator)  確定(OK) 在分配欄(Distribution)選
分配名稱按左鍵  輸入df，關鍵參數值，機率p值
或x值，則對話框顯示密度函數(Density Function)
與分配函數值(Distribution Function) (左尾累積機
率)，若要顯示右尾累積機率，則勾選1-累積機率(1Cumulative p)。
23
三、各種機率分配的計算
 (2)點選資料(Data)  批次轉換公式(Batch
Transformation Formulas) 在批次轉換公式視窗
按函數(Functions) 在函數瀏覽器(Function
Browser)的類別(Category)下選分配(Distribution)按
左鍵  在項目(Item)選要計算的分配，函數瀏覽器
對話框的下方會出現說明; 按右鍵二下在公式
(Formula)欄輸入上述說明要求輸入的df，關鍵參數
值，機率p值或x值  確定(OK)
 例如 chi2(3.84, 1) 可得卡方分配df=1，x=3.84的密
度函數值，ICh2(3.84, 1) 可得卡方分配df=1，x≦
3.84的累積機率值， VCh2(0.95, 1)可得卡方分配
df=1，的0.95分位數3.84，VCh2(rnd(1), 1) 可得卡
方分配df=1的一組隨機樣本
24
四、常態母體的估計與檢定
 1. 單一母體
 (a) σ值已知，或σ未知，但， n  30 (或  25)
用
X 
Z

n
的z-檢定。
 點選統計(Statistics) 基本統計/表格(Basic
Statistics/Tables)  差異性檢定: r，百分比，平均
數(Difference tests:r,%,means)  確定(OK) 在差
異性檢定對話框輸入M1=值，StDv 1=σ或s值，及
樣本大小=N1，輸入M2=虛無假設的μ值 勾選單
一平均數vs.母體平均數(Single mean vs.
population mean 2) 勾選單尾或雙尾(One-sided,
Two-sided)  按計算(Compute) 得出p 值
25
1. 單一母體
 (b) σ值未知，且小樣本， n  30 (或  25)
用
●
X 
T
S
n
的t-檢定。
點選統計(Statistics) 基本統計/表格(Basic
Statistics/Tables)  單一樣本t檢定(t-test single
sample)  確定(OK) 按變數 (Variables) 選取
要分析的變數  按確定(OK)在快速欄(Quick)的
給定特定常數(Reference values) ，檢定所有平均
數(Test all means against) 輸入虛無假設的μ值 
按選項勾選計算信賴區間(Compute conf. limits)並
輸入信賴度按摘要(Summary):T檢定結果
26
2. 兩個獨立母體比較


(a) 常態下設σ1、σ2值已知或σ未知，但大樣本的
z-檢定
點選統計(Statistics) 基本統計/表格 (Basic
Statistics/Tables) 差異性檢定: r，百分比，平均
數(Difference tests:r,%,means)  確定(OK) 在
差異性檢定對話框輸入M1= x 值，Stdv 1=σ或s值，
及樣本大小=N1，再輸入第二群的M2= 值，Stdv
x
2=σ或s值，及樣本大小=N2， 勾選單尾或雙尾
(One-sided, Two-sided) 按按計算(Compute) 得
出p 值
27
2. 兩個獨立母體比較
 (b)設σ1、σ2 值未知的t-檢定
 (b-1)設 σ1 = σ2
 點選統計(Statistics) 基本統計/表格(Basic
Statistics/Tables) 獨立樣本t檢定，依變數定義(t-test,
independent, by variables)或獨立樣本t檢定，依分群定義(ttest, independent, by groups)  確定(OK) 按變數
(Variables)  選取要分析的變數  按確定(OK)按選項
(Option)勾選Levene’s 檢定(Levene’s test)按摘要
(Summary)
 (b-2)設 σ1 ≠σ2
 點選統計(Statistics) 基本統計/表格 (Basic
Statistics/Tables) 獨立樣本t檢定，依變數定義(t-test,
independent, by variables)或獨立樣本t檢定，依分群定義(ttest, independent, by groups)  確定(OK) 按變數
(Variables)  選取要分析的變數  按確定(OK)按選項
(Option)勾選各組變異數估計t檢定(t-test with separate
variance estimates)及Levene’s檢定(Levene’s test)按摘要
(Summary)
28
3. 配對資料的比較

點選統計(Statistics) 基本統計/表格(Basic
Statistics/Tables)  相依樣本t檢定(t-test
dependent sample)  確定(OK) 按變數
(Variables)  選取要分析的變數  按確定
(OK)在快速(Quick)欄按摘要(Summary):T檢定
結果或按進階(Advanced)的摘要:T檢定結果
29
4. p值的檢定與估計
 點選統計(Statistics) 基本統計/表格(Basic
Statistics/Tables)敘述統計(Descriptive statistics) 
確定(OK) 按變數(Variables)  選取要分析的變數 
按確定(OK)按加權(W-weights)在對話框的加權變
數鍵入加權變數名稱，勾選狀態(Status)為開(On) 按
確定(OK)在快速欄(Quick)按敘述統計量(Summary
Statistics)，記下所得的平均數與標準差 再點選統計
(Statistics) 基本統計/表格(Basic Statistics/Tables)
差異性檢定: r，百分比，平均數(Difference
tests:r,%,means) 確定 在差異性檢定對話框輸入上
述所得的平均數與標準差於M1 及Stdv 1，再輸入樣本
大小=N1，輸入M2=虛無假設的p值 勾選單一平均數
vs.母體平均數(Single mean vs. population mean 2) 
勾選單尾或雙尾(One-sided, Two-sided) 按計算
(Compute) 得出檢定的p 值
30
 資料輸入如：
是否贊成
人數
0
23
1
55
性別
1
1
2
2
是否贊成
0
1
0
1
人數
23
55
32
46
31
5. 二個p值的比較



點選統計(Statistics) 基本統計/表格(Basic
Statistics/Tables) 差異性檢定: r，百分比，平均數
(Difference tests:r,%,means)  確定(OK) 在差異性
檢定對話框輸入第一群的%1p值及樣本大小=N1，第二
群的%2 p值及樣本大小N2， 勾選單尾或雙尾(Onesided, Two-sided) 按按計算(Compute) 得出p 值
(T檢定近似)
點選統計(Statistics) 基本統計/表格(Basic
Statistics/Tables)  獨立樣本t檢定，依分群定義(t-test,
independent, by groups) 確定(OK) 按變數
(Variables)  選取要分析的反應變數與分群變數 按
確定(OK) 按加權(w-weights)在對話框的加權變數
鍵入加權變數名稱，勾選狀態(Status)為開(On) 按確
定(OK)在快速欄(Quick)按按摘要(Summary):T檢定結
32
果
6. 二個相關係數值的比較

點選統計(Statistics) 基本統計/表格 (Basic
Statistics/Tables ) 差異性檢定: r，百分比，平
均數(Difference tests:r,%,means)  確定(OK)
在差異性檢定對話框輸入第一群的相關係數r1值
及樣本大小=N1，第二群的r2值及樣本大小N2，
勾選單尾或雙尾(One-sided, Two-sided) 按確
定(OK)
33
7. 常態性假設的檢驗

點選統計(Statistics) 基本統計/表格(Basic
Statistics/Tables )  敘述統計(Descriptive
statistics)  確定(OK) 按變數(Variables)  選
取要分析的變數  按確定(OK)按常態性欄
(Normality)  在分配(Distribution)下勾選檢定常態
性之Kolmogorov-Smimov與Lilliefors檢定或
Shapiro-Wilk’s W檢定按直方圖(Histograms)或次
數分配表(Frequency tables)
●
34
7. 常態性假設的檢驗


點選統計(Statistics) 基本統計/表格(Basic
Statistics/Tables )  敘述統計(Descriptive statistics)
 確定(OK) 按變數(Variables)  選取要分析的變數
 按確定(OK)按機率圖與散佈圖欄(Prob. &
Scatterplots)的常態機率圖(Normal probability plot)或半
常態機率圖(Half-normal probability plot)
● 選圖表(Graphs)  2D圖形(2D Graphs)  常態機率
圖(Normal probability plot)  在快速欄(Quick)對話方
框中，按變數(Variables) 選取變數 確定(OK)
勾選Shapiro-Wilk檢定 在圖表類型(Graphtyoe)選常
態(Normal)或半常態(Half-normal)  按確定(OK)
●
35
五、類別資料的卡方檢定
 適合度檢定：
 點選統計(Statistics)  無母數統計
(Nonparametrics) 觀察次數與期望次數
(Observed versus expected X2) 確定(OK)  選
取要分析的觀察變數與期望變數 按確定(OK)按
摘要(Summary)
36
五、類別資料的卡方檢定



獨立性檢定：
 對2×2 表格
點選統計 (Statistics) 無母數統計(Nonparametrics) 
2×2 表格(2×2 Tables)  確定(OK)  在快速欄(Quick)對話
框，輸入2×2 表格內各分組的次數按摘要(Summary)
 對列聯表
點選統計(Statistics) 基本統計/表格(Basic
Statistics/Tables )  表列與標誌(Tables and banners) 確
定(OK) 按加權(w-weights)在對話框的加權變數鍵入加權
變數名稱，勾選狀態(Status)為開(On) 按確定(OK)按交
叉表列 (Crosstabulation) 表格設定(至多六維)或二維表格
(Stub-and-banner)  按制定表格(Specify tables)選取要分
析的行與列變數按確定(OK) 按確定(OK) 在選項
(Option)欄，勾選二維表統計量(Statistics for two-way tables)，
內容表格設定(Compute tables) 在進階欄(Advanced)，按
詳細二維表格(Detailed two-way tables)
37

Document

Transcript Document

Directory