統計思維 - 數學教師知識庫

Download Report

Transcript 統計思維 - 數學教師知識庫

• 媽媽到超市買蘋果,一顆300公克,買三顆
共幾公克?
– 數學:300*3=900
– 統計:300*3=900
答:900公克
答:可能 約900公克
•數學告訴你完美的結局,統計提供你可能的
想像空間(可能約900公克 )
–美好的結局落在這個範圍的可能性有多少?
•數學說:公主與王子結婚後過著幸福快樂的
生活,統計說:結婚後會像公主與王子一般
的可能性有多少 ?
–統計告訴你要面對現實
• 當你面對現實時統計可以幫助你做決定
– 只要你給它公平和必要的資料
– 依據資料,它可以告訴你想像空間的大小和完
美結局落在這個空間的可能性
• 為什麼不能告訴你確定答案?
–如果收集的資料沒有變異,答案就確定,不需
要統計
–如果資料是確定的變異, 答案就確定,不需要
統計
–因為資料是不確定的變異,所以不能告訴你確
定的答案,只能用統計方法告訴你不確定變異
的答案
• 為什麼需要統計思維?
– 因為生活中充滿了不確定變異的資料
–面對不確定變異的資料,我們要思考如何利用
統計,提供一個極小範圍,使得確定結果落在
這個極小範圍的可能性提高。
• 資料處理方法和統計方法是數學,而資料
的不確定性是機率,如何利用數學和機率
來達到控制、減少和預測資料變異就是統
計思維。
• Moore(1990) 提出統計思維的核心內容包括:
– 過程中處處存在變異 (The omnipresence of
variation in processes)
– 過程中相關資料的需要(The need for data about
processes)
– 資料產出的設計需要考慮變異(The design of data
production with variation in mind)
– 變異的量化(The quantification of variation)
– 變異的解釋(The explanation of variation)
• American Statistical Association (ASA) /
Mathematical Association of America (MAA)
Joint Committee on Undergraduate Statistics以
Moore(1990)的想法,定義統計思維
–
–
–
–
資料的需要(the need for data)
資料產出的重要(the importance of data production)
變異的無所不在(the omnipresence of variability)
變異的測量和建模(the measuring and modeling of
variability)
歸納範例說明
•察覺生活中有許多的事件和現象並不是始
終如一,完全沒有變化。
–例如跑完100公尺需要多少時間?
•為了了解這些事件和現象於是收集相關資
料,許多(預期或非預期)因素的影響,使
得所收集到的資料是變異的
–例如跑100公尺需要多少時間,不會每個人都
跑得一樣快,預期應該是和身高、體重、肌
力、爆發力有關,但是今天早上喝了一瓶蠻
牛,所以跑得比預期還要快。
歸納範例說明
•資料變異的存在,使得人們在收集資料的
時候必須考慮資料變異的影響,包括資料
變異的來源和產生變異的原因。
–變異來源和原因有預期和非預期,資料收集的
時候要將非預期變異的影響降到最低
–例如跑100公尺需要多少時間,預期應該是和
身高、體重、肌力、爆發力有關,但是今天早
上喝了一瓶蠻牛,所以跑得比預期還要快。所
以收集資料的時候規定每個人早上都不能喝蠻
牛。
歸納範例說明
•資料收集後,測量和描述資料的變異。
–統計量:全距(最快幾秒、最慢幾秒);標準差;四
分位距等
–統計圖:觀察資料分布
•從資料變異的測量和描述中,找出可能的特徵、
關係或趨勢,以作為判斷、決策和推論的依據。
–跑100公尺需要花費多少時間?從資料變異的分布和
測量可以得知,大多數的人跑100公尺的時間都在某
個範圍中變動,而身高和體重確實會影響資料的變
異。
• Mallows (1998)認為以上統計思維的定義或
說明並沒有考慮到第零問題(Zeroth
problem),也就是,關心什麼樣的資料可能
是適切的 (what data might be relevant) ,因
而建議以下定義:
– 量化資料之於實際問題的關聯,通常呈現在變
異性和不確定性(the relation of quantitative data
to a real-world problem, often in the presence of
variability and uncertainty)
– 資料應該試圖對問題的要點做出準確且詳盡地
說明(It attempts to make precise and explicit what
the data has to say about the problem of interest)
•統計思考的對象是資料,所以第零問題的
意思就是回到原點:思考資料
–思考收集什麼樣的資料是適當的, 如果資料
收集適當, 那麼統計過程中其他的工作就事半
功倍
• Snee(1990)在品質控制和精進過程的領域中定
義統計思維:
– 透過過程:察覺變異在我們週遭,存在於我們所
做的每件事情 (thought processes, which recognize
that variation is all around us and present in
everything we do)
– 透過過程:察覺所有的工作是一系列相互連繫的
歷程(all work is a series of interconnected processes)
– 透過過程:瞭解確認、定性、定量和減少變異可
提供精進的機會(identifying, characterizing,
quantifying, controlling, and reducing variation
provide opportunities for improvement)
• Snee在品管領域中定義統計思維。
– 大致和Moore提出的想法一樣。
• 比較特殊的是Snee強調統計過程的建構。
– 他認為統計過程中各個工作之間應該是互相牽
連的,應該將此一系列工作視為整體,思考如
何進行。
統計過程的建構-統計思維
•將一系列的工作簡化為 (1) 提出問題;(2)蒐集資料;
(3)分析資料;(4)形成並溝通結果。
–此四個步驟是交互影響,單方向但非直線進行,也
並不是有了結果後此過程就結束。
–例如:這個花園裡的花哪種顏色最多?ㄧ定是依據問
題才能知道要收集什麼必要的資料(花園裡的花)、要
根據收集的資料和問題才能決定如何訂定資料的分類
準則(顏色)進行整理,根據資料的整理,進行呈現和
分析(畫成長條圖,不能計算平均數,只能看眾
數) ,依據分析的結果進行解釋(紅色的花最多) 。
–收集資料時,如果花園裡沒有花?就必須過頭檢視
問題是否適當?進行分析時發現,分類依據的顏色太
多,使得長條圖的分布看不出眾數的位置,就必須回
頭檢視分類準則是否適當?
整理歸納以上統計思維之定義:
察覺變異:變異無所不在
考慮變異:需要什麼資料


(能呈現實際問題的不確定性和變異性)

ㄧ系列過程相互聯繫
(能對問題的要點做出準確詳盡的說明)

如何收集資料

測量變異: 如何呈現資料變異的特徵
建模變異: 如何解釋和減少變異

• Wild and Pfannkuch (1999) 以實徵調查提出
統計思維的架構(framework of statistical
thinking in empirical enquiry) 共四個維度:
–
–
–
–
維度一:調查循環 The Investigative Cycle
維度二:思維型態 Types of Thinking
維度三:質問循環 The Interrogative Cycle
維度四:情意(意向、態度等) Dispositions
• 思維者同時操作這四個維度
– 例如:思維者可能正在思考如何調查某個議題
(什麼樣的教學方法可以提高學生的學習成
效),但同時也察覺到有些變異性和不確定性的
因素需要處理(學生的個別差異,教室環境的影
響,教師個人的特質等) ,這樣的察覺來自於
個人對取得的資料或分析結果的疑惑而對此調
查計畫的提出質問。
統計學家MacKay 與 Oldford在1994年提出PPDAC模型
PPDAC模組(ㄧ系列相互聯繫的過程)
• Problem
– 掌握系統脈動、形成問題
• Plan
– 計畫如何測量系統、如何設計抽樣、如何管理資料、如何
測試和分析
• Data
– 收集資料、管理資料、清理資料
• Analysis
– 資料探索、計畫中的分析、非計畫中的分析、形成假設
• Conclusion
– 解釋、結論、新的想法、溝通
統計思維類型
• 確認資料的需求:知道個人經驗和道聽塗說的證據是不足
以解決問題,因而思考收集資料,依此做決策。
• 轉化數字(改變表徵使理解) :藉由資料收集、測量和分
類,掌握真實系統中某些有意義的訊息,因而思考轉化資
料表徵以溝通訊息。改變表徵為動態過程。
• 考慮變異:察覺到資料的不確定性和變異性,思考如何測
量和建模以達到預測、解釋和控制的目的,處理和解釋變
異,思考調查策略如何影響資料的變異(隨機化和非隨機化)
• 以統計模型理解:使用模型來思考。統計學有其一套自己
的模型。特別是為了研究設計和分析所發展的模型(考慮隨
機的數學模型) 。
• 整合統計和脈絡內容的訊息、知識和概念:思維本身就是
這些元素的整合,如此才能對問題和結果的意涵產生深刻
的理解和合理的猜測。
從最初的想法到形成可精
確地由資料回應的統計問
題,然後執行計畫收集資
料。最初的階段幾乎整個
由內容脈絡所掌控。統計
知識則是漸次地在思維凝
聚中扮演重要的角色。
思維在內容脈絡和統計之
間持續來回穿梭。例如問
題因內容脈絡知識而建
議,但必需要參考資料,
而迫使我們暫時到統計這
邊。當看到了資料中的特
徵後,又迫使我們回到內
容脈絡以回應why和what
的問題。
從美食到統計
作為一個出色的廚師,準
備美食需要有以下一系
列相互關聯的歷程:
• Problem
– 掌握系統脈動:
• 什麼場合?對象是誰? 有幾個人?目前市場有哪 些時令
菜?客人之前有哪些反應(菜單, 服務, 衛生…)?預算多
少?有多少時間準備? …
– 形成問題:
• 某種創新的菜單是否會讓客人滿意?
從美食到統計
• Plan
– 如何測量系統:
• 如何將構想的菜單變成各類且不同份量的食材?
– 如何設計抽樣:
• 有哪些食材需要採購?到哪裡採購?要採購多
少?採購來源是否可靠?
– 如何管理資料:
• 如何管理食材?哪些食材要先醃?哪些食材要先
泡水?哪些食材要先放在冷凍庫或冷藏室?…
– 如何測試和分析:
• 要怎麼煮這些食材?蒸煮炒炸烤? 烹煮的順序? 需
不需要先拿部分食材煮看看 嚐嚐這樣煮法是否合
適
從美食到統計
• Data
– 收集資料:
• 開始採買必要且
可靠的食材
– 管理資料:
• 按照計畫,開始
管理食材
– 清理資料:
• 開始清理食材,
洗、切、銷皮、
清理等
從美食到統計
• Analysis
– 資料探索
• 了解食材的特性,偏甜
或偏酸?是否新鮮?耐
高溫嗎?
– 計畫中的分析
• 依據計劃進行各類食材烹煮
– 非計畫中的分析
• 有些多餘的食材,經過烹煮,也可以有意想不到的美味,
或者發現計畫中的烹煮方法不適當,改用其他的方式烹煮
– 形成假設:
•煮出來的食材,色香味具全? 客人對這份菜單非常滿意?
以後這份菜單會大賺錢? 準備這份菜單需要注意哪些問題
從美食到統計
• Conclusion
– 解釋
• 詮釋美食,擺盤、裝飾、調味
料、淋醬汁、分切
– 結論
• 這份創新菜單可以受到客人歡迎
或者份菜單需要做哪些改進
– 新的想法
• 在準備和烹煮美食的過程中,可能對食材有新的想法,
可作為下次創新料理的參考
– 溝通
• 要讓客人感受到美食的氛圍,上菜的順序,碗盤的選
用、桌面、場地的佈置需要做適當的搭配。
從美食到統計
•一個好的廚師必須知道
–變異處處存在:每天的食材品質不會
ㄧ模一樣,烹飪方法一樣,煮出來的
味道不一定一樣,火侯、調味的影響
等等
–考慮變異:設計菜單,購買食材、烹
飪食材等要考慮可能影響變異的影響
–測量變異:如何檢測食材的品質,看
的摸的聞的聽的?或更科學的方法?
–建模變異:如何控制食材的品質?如
何控制火侯?如何控制調味?
美食思維類型
• 確認資料的需求:依據個人經驗或道聽塗說
不足以證明這道創意料理就是美食,因此思
考購買食材做一次看看,依此下結論。
• 轉化數字(改變表徵使理解) :藉由購買、管
理、準備、清理、烹煮食材,來掌握食材中
可能呈現的美味,因而思考轉化食材以感受
美食的色香味所帶來的愉悅。
美食思維類型
– 考慮變異:
–以統計模型理解:美食也有其一套思維的模
型,美食家(客人)在理解這些美食時,有其一
套通用的標準,例如牛肉麵的麵條要Q,牛肉不
能老。
– 整合統計和脈絡內容的訊息、知識和概念:美
食不能脫離脈絡內容,是否能被大眾所接受(牛
肉麵不能和紅豆一起) ,是否能和場合的氛圍
相得益彰?這些都能提升客人對美食的色香味
有更高的評價。
統計思維研究方向
• 統計課程:
• 統計教學:
• 統計評量: