政策宣導公播簡報-多元評量(102.10.25)

Download Report

Transcript 政策宣導公播簡報-多元評量(102.10.25)

十二年國教五堂課
多元評量樂學工作坊種子教師
培訓分享
新竹縣立 竹東國中
新竹縣 輔導員
黃錫裕
102年10月11日
資料來源:
教育部多元評量宣導簡報
台中市國中國文輔導團12年國教5堂課簡報
龍山國中 祈明輝<多元評量研發案例與經驗分享>
台師大 心測中心<以標準參照的評量促進教育發展十二年國民基本教育的關鍵配套>
國立高雄師範大學教育學系方德隆教授 <多元評量的理念與方法>
五堂課18小時之後..
•
•
•
•
•
•
•
十二年國教基本理念 1小時
有效教學 5小時
多元評量 6小時
差異化教學策略 3小時
適性輔導 3小時
標準評量推廣 2 小時
補救教學 8小時
多元評量理念與應用配合政策
自然與生活科技學習領域
十二年國民基本教育
中等學校教師
教學專業能力研習五堂課
(主政單位:教育部師資培育及藝術教育司)
大綱
壹、多元評量策略推動說明
貳、自然與生活科技多元評量示例
參、評量規準設定
4
多元評量理念與應用推動措施
研發課程內涵:
結合中央課程與教學輔導諮詢教師團隊規劃四大主軸
課程(共6小時,包含講演與實作)
•「高層次認知領域紙筆評量設計實務」
•「多元評量設計實務」
•「檔案評量的設計與實施」
•「各類評量教學示例發表」
多元評量 法源依據
多元評量的法源依據
1. 國民小學及國民中學學生成績評量準則
2. 國民中小學九年一貫課程綱要能力指標
3. 國中學生學習成就評量標準
國民小學及國民中學學生成績評量準則
第3條
國民中小學學生成績評量,應依學習領域及日常生活
表現,分別評量之;其評量範圍及內涵如下:
一、學習領域:其評量範圍包括國民中學及國民小學
九年一貫課程綱要所定之七大學習領域及其所融入之
重大議題;其內涵包括能力指標、學生努力程度、進
步情形,並應兼顧認知、情意、技能及參與實踐等層
面,且重視學習歷程與結果之分析。
二、表現:其評量範圍及內涵包括學生出缺席情形、
獎、日常生活懲紀錄、團體活動表現、品德言行表現
、公共服務及校內外特殊表現等。
國民小學及國民中學學生成績評量準則
第4條
國民中小學學生成績評量原則如下:
一、目標:應符合教育目的之正當性。
二、對象:應兼顧適性化及彈性調整。
三、時機:應兼顧平時及定期。
四、方法:應符合紙筆測驗使用頻率最小化。
五、結果解釋:應標準參照為主,常模參照為輔。
六、結果功能:應形成性及總結性功能並重;必
要時應兼顧診斷性及安置性功能。
七、結果呈現:應質性描述及客觀數據並重。
八、結果管理:應兼顧保密及尊重隱私。
國民小學及國民中學學生成績評量準則
第5條
國民中小學學生成績評量,應依第三條規定,並視學
生身心發展及個別差異,採取下列適當之方式辦理:
一、紙筆測驗及表單:依重要知識與概念性目標,及
學習興趣、動機與態度等情意目標,採用學習單、習
作作業、紙筆測驗、問卷、檢核表、評定量表等方式。
二、實作評量:依問題解決、技能、參與實踐及言行
表現性目標,採書面報告、口頭報告、口語溝通、實
際操作、作品製作、展演、行為觀察等方式。
三、檔案評量:依學習目標,指導學生本於目的導向
系統彙整或組織表單、測驗、表現評量等資料及相關
紀錄,以製成檔案,展現其學習歷程及成果。
國民中小學九年一貫課程綱要
自然科能力指標
1.過程技能:增進科學探究過程之心智運作能力
2.科學與技術認知:科學概念與技術的培養與訓練
3.科學與技術本質:科學是可驗證的、技術是可操作的
4.科技的發展:瞭解科學如何發現與技術如何發展的過程
5.科學態度:處事求真求實、喜愛探究之科學精神與態度、
感受科學之美與影響力
6.思考智能:對事物能夠做推論與批判、解決問題等整合性
的科學思維能力,以及資訊統整能力
7.科學應用:應用科學知識以及探究方法以處理問題的能力
8.設計與製作:能夠運用個人與團體合作的創意來製作科技
的產品
培養學生帶得走的能力!!!
多元評量內涵
一、教學策略多元,評量才能多元 。
二、評量貫穿整個學習過程。
三、學習應兼顧認知、情意、技能等能力。
四、質性評量應建立評量基準與規準。
教學與評量
一、教學與評量相輔相成:能提昇教學與學習成效 。
二、教學目標(學習結果)—是評量的基礎。
三、評量--在教學(前、中、後)過程中持續進行著。
• 非正式:口頭詢問、小組(班級)討論、觀察個人 、
學習單、實驗紀錄本、作業(習題)、……
• 正 式:傳統評量——客觀式測驗、複雜成就測驗、
真實評量——實作、學習檔案、概念圖、……
評量貫穿整個學習過程
安置
測驗
小
考
期
中
考
教學
評量
診斷評量 <<<<< 形成性評量
專案式
學習評
量
>>>>>
(from 2012 E-TEACHER Scholarship Program)
檔案
評量
期
末
考
總結性評量
多元評量類型
 筆試
 口試---口頭問答
 表演
實作
 作業
 報告---實驗報告
 資料蒐集整理
 鑑賞
 晤談
 實踐
 檔案評量
 自我評量
 同儕互評
 其他方式:概念圖
【節自臺北市國民中學學生成績評量補充規定】
多元評量說明
紙筆評量
最小化
認知
5
4
3
2
1
0
情意
技能
實作評量
依據
教學目標
使用
評量類型
認知
5
4
3
2
1
0
情意
檔案評量
目的導向,系統彙整或組織紙筆與實作
等相關紀錄,展現其學習歷程及成果。
技能
多元智能(Gardner,1983)
技
能
情
意
認
知
語文智能:
有效運用口頭語言和書
面文字以表達自己想法
和瞭解他人的能力。
自然觀察者智能:
對生物的分辨觀察能
力,對自然景物敏銳
的注意力,對各種模
型的辨別力。
邏輯數學智能:
有效運用數字和推理
的能力。
Gardner
多元智能
內省智能:
正確自我覺察的能
力,即自知之明。
人際智能:
覺察並區分他人情緒、動
機、意向及感覺的能力,
即察言觀色、善解人意。
視覺空間智能:
能以三度空間來思考
,準確的感覺視覺空
間,並把內在的空間
世界表現出來。
肢體動覺智能:
善於運用肢體來表達
想法和感覺,運用身
體的部分生產或改造
事物。
音樂智能:
能察覺、辨別、改變
和表達音樂的能力。
8.與學生溝
通,確認
同學瞭解
評估的標
準
7.對評量基
準與規準
不斷修正
6. 敘述的文
字要淺顯
易懂明確
1.選擇最適
合本課程
學習的目
標
基準與規
準的建立
5.訂出每個
等級的分
數範圍
2.根據學習
目標發展
評量項目
3.建立定義
清楚的評
估標準
4.決定三或
四個不同等
級的標準,
如: 優秀、
普通、不佳
評量基準與規準
評量基準
教學目標—
學生應該學
習的基礎知
識與技能
4分
全部完成
且表現其
他優點
評量規準
3分
2分
1分
全部完成 部分完成 幾乎沒有
完成
學生表現等級(視需要調整)
評量基準與規準示例
評量基準
學生能突破
性別刻板的
限制,設計
學校的廁所
標誌。
評量規準
3分
2分
1分
能設計無性別
刻板印象的廁
所標誌,並說
明設計理念。
只能設計無
性別刻板印
象的廁所標
誌,或只會
說明設計理
念。
需要幫助才
能設計無性
別刻板印象
的廁所標誌,
或才會說明
設計理念。
貳、自然與生活科技學習領域
多元評量示例
21
評量的設計與功能
1) 以學生的學習經驗為主要的評量內容。
2) 以適切的方式評量,內容應是重要概念且
與日後學習相關者。
3) 評量能協助學生改善學習效果。
4) 評量能幫助學生面對生活情境,以及發揮
問題解決的能力。
5) 評量著重學生運用科學認知、過程技能以
及思考智能的歷程。
口語評量
口語評量的理念與作法
• 兼具總結性與形成性評量的目的
• 型式:提問、口試、晤談、口頭報告等
• 從師生對話中蒐集學習證據,瞭解學生的學習狀
況與學習需求,立即給予學生回饋或是做出教學
決定以促進學習。
• 有效率的問題可以提供教師更多瞭解學生的機
會。
Bloom 分類法
• 記憶層次問題-例如:給出…的定義,誰做了什麼,
什麼時候發生了…,有多少…。
• 理解層次問題-例如:這是如何發生的,為什麼會
發生,舉一個例子說明…。
• 應用層次問題-例如:這個概念可以應用在什麼地
方?
• 分析層次問題-例如:根據……把……歸為這一類,比
較或對照……,假若…發生了,接下來……可能會發
生。
Bloom 分類法
• 評鑑層次問題-例如:你同意…?對於…你認
為…?你要如何做抉擇?你是用什麼標準來評
估…。
• 創作層次問題-例如:請你依這個概念,預測或
推論…接下來的發展情形,或你要如何創造或設
計一個…,你建議的策略或做法是…
評量表---口語評量(規準)
~大家可視自己的需要加以調整
符號
內容
豐富
A
項目符合,
內容詳明豐
富。
B
項目符合
,內容適
中
D
項目缺
漏,內容
也不足
E
未做
或未
交。
用心程度
普通
C
項目大部
分符合,
內容不足
或過少
不夠用
心。
參與
態度
認真努力完
成報告。
敷衍草
率。
表達方式
稍有創意
表達不見
創意。
團隊
精神
擅用各類媒
材,做極佳
表現
合作無間,
團隊合作好
團隊合作
表現不錯
團隊合作
稍嫌不足
毫無創
意,或完
全抄襲
未見合
作。
表達
效果
敘述完整且
表達效果好
敘述言簡
意賅。
表達效果
不夠顯著
表達不順
暢
未做
或未
交。
未做
或未
交。
未做
或未
交。
未做
或未
交。
創意
構想
符號
A
B
C
D
E
評語
內容
豐富
項目符合,
內容詳明豐
富。
參與
態度
認真努力完
成報告。
學生自訂
學生自訂
學生自訂
項目符合 項目大部
,內容適 分符合,
中
內容不足
或過少
用心程度 不夠用
普通
心。
項目缺
漏,內容
也不足
未做
或未
交。
敷衍草
率。
未做
或未
交。
高層次認知領域
紙筆評量設計
學生紙筆表現
(國文科)
30
學生紙筆表現
(社會科)
31
學生紙筆表現
(數學科)
32
學生紙筆表現
(數學科)
33
一般命題原則概說
1. 測量重要的概念,避免偏重純粹
的記憶,重視融會貫通的能力。
2. 內容均勻分佈,參考雙向細目表
3. 題目簡明扼要。
4. 有公認的正確答案。
5. 每個試題獨立,不相互牽涉。
教學目標(橫軸)
• 以Bloom所提的認知領域6個教學
目標為依據:記憶、了解、應用、
分析、評鑑、創作。
• 有些成就測驗將分析、評鑑、創
作,統合成「高層次思考」。
• 為了建立學生信心,高層次思考
佔分最高約25%。
2001年版Bloom認知領域教育目標
知識
向度
A.事實
知識
B.概念
知識
C.程序
知識
D.後設
認知
知識
認知歷程向度
1.記憶
2.了解
3.應用 4.分析 5.評鑑
Remeber Understand Apply Analyze Evaluate
從長期記憶 從口述、書
中取回有關 寫和圖像溝
知識
通形式的教
確認(再認) 學資訊中建
回憶
構意義
詮釋(說明)
舉例
分類
總結
推論
比較
解釋
面對某
情境執
行或使
用一個
程序
實行
執行
分解整體
為許多部
分,並決
定各部分
彼此和與
整體結構
或目的關
係
辨別
組織
歸因
6.創作
Create
根據規準 集合要素以
和標準下 組成一個具
判斷
協調性或功
檢查
能性的整體,
評論
重組要素為
一個新的模
型或結構
通則化(產生)
規劃
製作
(布魯姆認知領域教育目標分類修訂版之探討,暨南國際大學教育政策與行政研究所助理教授 葉連祺、高雄縣政府教育局國民教育輔
導團幹事 林淑萍,教育研究月刊 105 期)
雙向細目表概說
1. 表示測驗的架構藍圖,描述測
驗包含的內容以及評量到的能
力。
2. 以教學目標(橫軸)和學習內
容(縱軸)為兩個軸,分別說
明各項評量目標和內容的關係。
3. 考前考後皆可使用。
學習內容(縱軸)
• 出題的範圍,表示出包含哪些
不同的單元。
雙向細目表簡例
教學目標(能力層次)
知
識
學
習
內
容
︵
單
元
名
稱 合
︶ 計
理
解
應
用
分
析
評
鑑
創
作
合
計
選擇題的命題原則
1/2
1. 題幹宜完整,避免分割成兩部分。
2. 題幹少用否定的敘述。
3. 選目盡量力求簡短,必要敘述放置
於題幹。
4. 選目一致,三到五個,學生較不會
答錯位置。
5. 誘答選目應具有似真性。
選擇題的命題原則
2/2
6. 選目避免暗示正確的答案。
7. 選目之間避免重疊。
8. 選目盡量少用「以上皆非」、「以上
皆是」。
9. 如屬最佳答案題型,務必確信只有一
個最清楚的答案。
10.正確答案出在各選目的次數宜接近相
同,須隨機排列。
學生紙筆測驗怕學生作弊現況
42
這樣監考的老師傷不起啊!堅決不
給學生留一條生路啊~
一個真正的學習高手不僅能在一場
考試中狂砍90分+ 而且能送出許多
60分+的助攻....
現在的孩子們都太厲害了!這是被
考試逼成什麼樣了啊!
試題舉例
 建構反應試題
 國際大型科學測驗
• TIMSS科學試題
• PIRLS科學試題
• PISA科學試題
 借鏡他山
•
•
•
•
美國
上海
日本
新加坡
建構反應試題概述
SR vs. CR試題
• Selected-response items—一個題幹(stem
)與一組選項(alternative response),學
生由選項中選出一個答案。
• Constructed-response items—一個題幹(
stem, prompt, exercise),學生必須自行寫
出答案來。
使CR試題有利於評量的信度1
1.避免使用optional items,允許考生選擇想
要作答的試題會使得考生之間的比較受到
影響(危害)。
2.在準備CR試題的同時,界定如何計分(這
會幫助計分規準[scoring rubric]的形成)。
使CR試題有利於評量的信度2
3.寧可試題多一些,而每題所需的作答時間
短一點,也不要題目少,而每一題所需的
時間長(當然也有人建議題目少,而每議
題所需的時間多一些,但是題目多,通常
信度係數會高一點)。
CR題的計分原則的建議1
• 使用可確保計分過程的公平性和效度的計
分程序:
1.匿名計分,且若要評分的題目比較多時,
建議評分每一個題目時,都將試卷重新洗
排,以使考生出現的次序不同。
2.使用一個專注在測量目標的計分規準,不
要讓無關的因素(文法、寫作技巧、錯別
字)影響分數。
CR題的計分原則的建議2
• 使用可使分數的信度最大化的計分程序:
1. 使用計分規準(清楚定義的計分程序),且在評
分的過程中,得常常回來參考評分規準。可能時
,可以先閱讀過數份學生的作答反應,然後再開
始評分。
2. 如果有多個CR題需要計分時,一次只改一個題目
的分數,等全部考生該題的分數都改完後,再改
下一題。
CR題的計分原則的建議3
• 使用可使分數的信度最大化的計分程序:
3. CR題的分數如果是特別重要時,一定要使用更多
的資訊來源,比如說,第二個評分者。
TIMSS簡介
關於TIMSS 1
• Trends in Mathematics and Science Study
(TIMSS)是國際教育成就調查委員會
(The International Association for the
Evaluation of Educational Achievement,
IEA)自1995 年以來連續每四年一個週期所
舉辦的數學和科學教育成就趨勢調查。
關於TIMSS 2
• TIMSS 主要目的在提供各國長期追蹤學生數學和科學
成就的趨勢與課程、教學、學習環境、家庭背景、以
及教師等影響因素的相關資料,以了解各國在其教育
改革或課程改革等改進措施的成效。
• 另外,因為有近五十個國家的參加,故也提供了各國
在教育實務上執行方法不同而獲致不同教育成果的各
項資訊,作為各國在從事教育改進的參考。
關於TIMSS 3
• 此研究計畫的目的在藉參加此大規模的國際性學生學
習成就比較測驗,來了解我國國小四年級及國中二年
級學生的數學與科學學習成就情況及在國際間比較的
結果。
• 並與1999 年(只含國中二年級部分)參加的第三次國
際數學與科學教育成就研究後續調查(TIMSS 1999)
的結果作比較,其結果可作為我國數學和科學教育實
施與改進的參考,也可提升我國數學和科學教育研究
水準。
TIMSS試題示例 1
• 小玲用同樣大小的方塊堆積木,每層用10
個方塊,共堆了5層,請問這堆積木用了多
少個方塊?
• (1) 5個方塊
• (2) 15個方塊
• (3) 30個方塊
• (4) 50個方塊 (2003四年級)
TIMSS試題示例 2
• 一張桌子可以坐4
人。如果有28個人,
你要用什麼方法找出
需要幾張桌子呢?
(1) 28乘以4
(2) 28除以4
(3) 28減4
(4) 28加4
(2007四年級)
TIMSS試題示例 3
• 下列哪一個是由最大排到最小?
(1) 36, 43, 66, 87
(2) 66, 43, 36, 87
(3) 87, 66, 36, 43
(4) 87, 66, 43, 36
(2003四年級)
PISA簡介
What’s PISA ?
PISA
Programme
?
International
Student
Assessment
國際學生能力評量計畫 老師
OECD
學校
教育
學生
62
生活
教學
PISA 評量週期
• PISA評量自2000年開始,每三年調查一次。
• 每次調查以一個領域為主進行深度了解,
另二個領域為輔。
• 2000 - 閱讀、2003 - 數學、2006 - 科學、
2009 - 閱讀、 2012 - 數學 、2015 - 科學。
63
測驗結果分析
PISA 2006台灣科學素養
形成科學議題能力(第十七名)
解釋科學現象能力(第三名)
科學論證能力(第八名)
科學本質(第十名)
http://www.nc.hcc.edu.tw
100國中自然區策
PISA試題示例1
蒼蠅(一)
閱讀下列短文,並回答下列問題。
有位農夫在農業試驗所,擔任乳牛的管理工作。牛
舍裡蒼蠅很多,影響動物健康。
所以,農夫用含有「殺蟲劑A」的溶液,噴灑牛舍
及乳牛。這種殺蟲劑幾乎殺死所有的蒼蠅。然而,
過了一段時間,又有很多蒼蠅。
PISA試題示例2
於是,農夫再度噴灑一次這種殺蟲劑。這次的噴灑
效果,與第一次噴灑的效果相似。雖沒有殺死全部
蒼蠅,但讓大多數蒼蠅死亡。再經過一段時間,蒼
蠅又很多。於是,又再一次的噴灑殺蟲劑。這樣的
事情一再發生,總共噴灑了五次殺蟲劑:結果很明
顯的,「殺蟲劑A」殺死蒼蠅的效果越來越差。
PISA試題示例3
農夫注意到了他的噴藥過程,他先配好一大瓶的殺
蟲劑溶液,這五次噴藥都用這一瓶溶液。因此,殺
死蒼蠅效果越來越差的可能原因,農夫所提出的建
議是:殺蟲劑因存放時間過久而分解。
來源: Teaching About Evolution and the Nature of
Science, National Academy Press, Washington,
DC,1998, p. 75.
問題1:蒼蠅
農夫所提的建議是:殺蟲劑因存放時間過久
而分解。如何驗證這個建議?請簡要說明之。
.............................................................................
..................................................
計分規準1
•
•
•
•
蒼蠅 問題1 計分
題旨: 過程:確認證據
主題:化學與物理變化
範疇:生命與健康科學
計分規準2
• 滿分
• 代號 5:應用三個變因(蒼蠅的品種、殺蟲
劑的存放時間、與暴露)的控制,進行問
題的回答。例如:選擇品種相同,不曾暴
露過殺蟲劑的一群蒼蠅,將這群蒼蠅分為
兩組。其中一組用新配製的殺蟲劑噴灑,
另一組則用配製後存放較久的殺蟲劑噴
灑,比較兩組的殺蟲效果。
計分規準3
• 部分分數
• 代號 4: 三個變因(蒼蠅的品種、殺蟲劑
的存放時間、與暴露)中,只應用其中兩
個變因的控制,進行問題的回答。例如:
比較新配製的殺蟲劑與存放較久的殺蟲劑,
兩者對牛舍蒼蠅的殺蟲效果。
計分規準4
• 代號 3: 三個變因(蒼蠅的品種、殺
蟲劑的存放時間、與暴露)中,只應
用其中一個變因的控制,進行問題的
回答。例如:針對此一殺蟲劑,定期
取樣,並進行化學分析,以了解殺蟲
劑是否隨存放時間的增加,而產生化
學變化。
計分規準5
• 代號 2: 使用新配製的殺蟲劑噴灑蒼
蠅,但沒有提及與舊的那一批殺蟲劑
做比較。
• 代號 1: 這種殺蟲劑的樣本的化學分
析,但沒有提到不同存放時間的樣本
之分析比較。
• 注意:假如只提及將殺蟲劑的樣本,
送到實驗室。則編碼為代號1。
PISA所提供此題的作答範例1
• 代號 5:
• 你可以捕捉一些蒼蠅,將牠們放在兩個箱子裡,你可以使
用新配製、存放較久的兩種殺蟲劑,分別噴灑這兩箱子中
的蒼蠅,以觀察結果是什麼。[雖然沒有提到相同品種,
但此回應暗示了,蒼蠅是同一品種,而且這些蒼蠅以前未
曾暴露過]
• 配製一批量多一點殺蟲劑。取兩組蒼蠅,每六個月噴一次
殺蟲劑。第一組使用體積較大的這一批殺蟲劑,第二組則
每次都用新配製的殺蟲劑。[雖然沒有提及相同品種,但
此一回應暗示了蒼蠅是同一品種,而且這些蒼蠅以前未曾
暴露過]
PISA所提供此題的作答範例2
• 代號 4:
• 試著配製新的一瓶,過一段時間,等這瓶殺蟲劑有些舊了,
而蒼蠅回來時,再用這瓶殺蟲劑試驗。[控制殺蟲劑的存放時
間與蒼蠅的品種,以探討這位農夫的經驗是否具再現性。
「蒼蠅」可解釋為同一品種的蒼蠅]
• 代號 3:
• 每隔幾個月,從此一殺蟲劑中取一些當作樣本,帶到實驗室
並測試樣本的 效用。
• 代號 2:
• 執行和農夫相同的噴藥的工作,但每次噴藥都買新的殺蟲劑,
以此證明農夫的理論是正確或錯誤的。
PISA所提供此題的作答範例3
• 代號 1:
• 假如他配製新的一批藥,將這批新的藥和那批
舊的藥寄到實驗室,重複驗證這個結果,或許
可以證明他的理論。
• 代號 0:
• 他可以每年測試殺蟲劑一次,以觀察殺蟲劑是
否仍未過期,還可以使用。[沒有指出如何測試
殺蟲劑]
• 從農夫的牛舍以及另一間牛舍,各捕捉一隻蒼
蠅。用這種殺蟲劑分別噴這兩隻蒼蠅。
問題2:蒼蠅
• 為什麼:「殺蟲劑A 殺死蒼蠅的效果愈來愈差…」。
農夫的解釋是:殺蟲劑因為存放時間過久而分解。
除了農夫的解釋之外,請你舉出兩個不同的解釋。
解釋1:
.............................................................................................
.............................................................................................
.......................................................................
解釋 2:
.............................................................................................
.............................................................................................
.......................................................................
實作評量
——以實驗操作評量為例
78
實作評量
實作評量係指根據學生實際完成一
項特定任務或工作表現所作的評量
。這些任務或工作,可能是實際操
作、口頭報告、科學實驗、數學解
題、寫作…等。
(吳清山、林天祐,教育資料與研究雙月刊 第15期,86.03)
79
強調的是「做」,而不僅是「知
」,同時過程與結果並重。如科
學實驗:實驗儀器操作,設計實
驗、執行實驗的技巧,觀察、紀
錄、解釋結果的技巧。
Robert L.Linn & Norman E.Gronlund(鄒慧英譯)(2003),測驗與評量:在教學上
的應用(Measurement and Assessment in Teaching),臺北市:洪葉文化。
80
發展實作評量
Step 1:決定評量甚麼
Step 2:設定評量題目
Step 3:訂定評分範例(規準、檢核表)
Step 4:訂出評量限制(規則)
Gary D. Borich(郝永崴等譯)(2007),有效教學法(Effective Teaching
Methods),臺北市:五南出版社。
81
舉例:測量物體的質量
基準
一、能寫出上皿天平的基本構造(含砝碼)等 4 項:
(a)秤盤,(b)指針,(c)校準螺絲,(d)砝碼。
二、能操作上皿天平測量物體的質量
1.使用天平測量物體質量前,能調整校準螺絲的位置,使天平先「歸
零」。
2.能使用鑷子夾取或放置砝碼。
3.能將待測物體與質量較大的砝碼,置於秤盤的中央。
4.能正確記錄待測物體的質量(500mg)。
5.能利用「平均值」的方法,測量「1 只」迴紋針的質量。
評量規準(Scoring Rubrics)
表現
項目
1
2
3
4
認識上皿
天平的基
本構造
無法寫出
操作上皿
天平測量
物體質量
能正確完
只能正確 只能正確
能正確完
成1~4項其 完成1~4
完成1~4
成1~4項
中0~1項
項其中2項 項其中3項
能正確寫
出1項
能正確寫
出2項
能正確寫
出3項
5
能正確寫
出4項
能正確完
成1~4項,
以及第5項
舉例:竹筷乾餾
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
【評量檢核項目說明】
一、包覆竹筷技巧
(1)樣本排放位置緊密貼合
(2)完整包覆
(3)捏實
(4)留一小洞
二、可燃氣體測試
(1)正確的夾持加熱方式
(2)白煙從小洞口出現
(3)等待白煙完全消失後,才點燃小洞口進行測試
(4)能講出正確的四種氣體產物名稱。
三、液體產物之檢測
(1)有時會用加水方式來方便檢驗
(2)能使用廣用試紙測試,依顏色正確判斷其酸鹼性
(3)能使用石蕊試紙測試,依顏色正確判斷其酸鹼性
(4)能講出正確的液體產物名稱
評量規準(Scoring Rubrics)
評量規準
表現
1
2
3
4
5
項目
一 包覆竹筷技巧 無法完成 達成一項 達成二項
未等待白
煙出現,
二 可燃氣體測試 無法達成 立即點燃
小洞口進
行測試
液體產物之
三
無法達成 達成一項
檢測
達成三項
達成評量要
求
等待白煙消失,
未等待白煙
才點燃小洞口進
消失,就點
達成評量要
行測試,但無法
燃小洞口進
求
完整回答氣體種
行測試
類
達成評量要
達成二項
達成三項
求
舉例:皂化反應
【評量檢核項目說明】
一、實驗樣本準備
(1)使用電子天平秤重前,先放置秤量紙
(2)能進行電子天平的歸零
(3)能準確完成水15克的稱量
(4)能正確攪拌混合油品
二、手工皂製作流程
(1)能將混合油品加熱,持續攪拌至60℃以上後,離開火源
(2)能正確緩慢加入液鹼後,持續攪拌
(3)能正確緩慢加入水後,持續攪拌
(4)能正確緩慢加入精油後,持續攪拌
三、入模程序
(1)能正確將溶液倒入模中
(2)能使用廣用試紙測試,依顏色正確判斷其酸鹼性
(3)能使用石蕊試紙測試,依顏色正確判斷其酸鹼性
(4)能迅速放入保麗龍箱中,避免失溫
評量規準(Scoring Rubrics)
評量規準
表現
項目
一
二
三
1
2
3
4
5
實驗樣本準備
能正確
無 法 完
能 正 確 達 能正確達成
達成一
成
成二項
三項
項
能正確達成評
量要求
手工皂製作流程
能正確
無 法 達
能 正 確 達 能正確達成
達成一
成
成二項
三項
項
能正確達成評
量要求
入模程序
能正確
無 法 達
能 正 確 達 能正確達成
達成一
成
成二項
三項
項
能正確達成評
量要求
檔案評量
檔案的意義
• Portfolio在字典裡的本義是卷宗、
檔案夾或文件夾。
• 最早被用在藝術家向人介紹他的創
作歷程,也經常用於商業上聘用人
才的參考。
• Portfolio 應 用 在 教 育 強 調 的 是
process folio「歷程檔案」。
資料來源:楊忠煌<學生學習歷程系統介紹與教學>
評量的意義
• 幫助教師 / 家長了解學生學會什麼
,還有哪些需要學習。
• 了解學生的學習好到什麼程度。
• 反映學校辦學的好壞。
資料來源:張美玉<檔案評量的設計與實施>
檔案蒐集與檔案評量的差異
檔案評量
評量 有明確的評量
目的 目的,主要透
過學習檔案 ,
瞭解學生的學
習成長。
1/3
檔案蒐集
無明確的評量
目的,提供檔
案夾讓學生自
行擺放資料。
資料來源:涂金堂<是檔案評量或檔案堆積?實施檔案評量時教師應注意的事>
檔案蒐集與檔案評量的差異
2/3
檔案評量
檔案蒐集
資料 有 系 統 性 的 資 料 蒐 照 單 全 收 的 資 料
蒐集 集。
蒐集
資料 有 目 的 性 的 資 料 篩 沒 有 進 行 資 料 挑
挑選 選。
選。
資料 學 習 者 對 於 自 身 學 缺乏自我省思
省思 習 歷 程 與 結 果 , 進
行建設性的省思
資料來源:涂金堂<是檔案評量或檔案堆積?實施檔案評量時教師應注意的事>
檔案蒐集與檔案評量的差異
3/3
檔案評量
檔案蒐集
評分 事 先 提 供 學 習 者 明 沒 有 提 供 學 習 者
規準 確的評分規準。
任何的評分規準。
檔案 評 分 者 根 據 評 分 規 沒 有 進 行 評 分 的
評分 準進行評分。
工作。
檔案 藉 由 檔 案 的 展 示 , 沒 有 檔 案 展 示 的
展示 讓 學 習 者 有 相 互 觀 機會。
摩、評論的機會。
資料來源:涂金堂<是檔案評量或檔案堆積?實施檔案評量時教師應注意的事>
檔案評量的意義
• 有計畫和有目的蒐集與組織學生學
習過(歷程)程與成果(作品)表
現資料、努力與進步情形、知識、
技能,與成就證據成一卷宗(資料
檔案夾),以呈現成果(作品)品
質與進步情形。
• 又稱卷宗評量、歷程檔案評量。
資料來源:方德隆<多元評量的理念與方法>
檔案評量的實施步驟
1. 思考學生的先備條件。
2. 決定檔案評量的目的。
3. 決定評量的內容。
4. 決定評量的方式。
5. 建立評量的基準與規準。
6. 告知受評者應如何做準備。
7. 進行評量。
資料來源:李坤崇<檔案評量理念與實施>、
張美玉<檔案評量的設計與實施>
思考學生的先備條件
評析學生所需先備知識與技
巧,給予必要的訓練或學習(提
供學生學習鷹架),循序漸進引
領學生成長。
因此,若學生無製作經驗,
先提供結構性檔案範例。學生熟
練後,再提供非結構性的檔案。
資料來源:李坤崇<檔案評量理念與實施>
決定評量的目的
1. 學生努力的程度。
2. 學生進步的程度。
3. 學生學習的困難點。
4. 學生對學習的反思。
5. 教師教學成效。
6. 教師教學策略改進的依據。
資料來源:張美玉<檔案評量的設計與實施>
決定評量的內容
1/2
1. 過程中的樣品或還在進行中
的作品。
2. 成果的樣品。
3. 教師的觀察或評量的資料。
4. 家長的評語。
資料來源:張美玉<檔案評量的設計與實施>
決定評量的內容
2/2
檔案內容包羅萬象,具體而言有四類:
1. 背景資料(過去各項學習記錄、成績
單、心理測驗結果等)。
2. 過程記錄(錄音帶、照片、學生作品
、書面成果資料、紙筆作業等)。
3. 反省證據(反省記錄)。
4. 他人的記錄(教師評分等第評量表、
家長或同儕的回饋)。
資料來源:李美奇<淺談檔案評量之理念>
決定評量的方式
1/3
1.自我評量
※挑選這個作品的理由是?
※製作這件作品的過程中,是否遭遇什麼困難?
※從完成這件作品的過程中,學到哪些知識或技能?
※從完成這件作品的過程中,你知道自己的優勢與弱
勢嗎?
※你對這件作品有不滿意的地方嗎?
※假如給你更多時間完成這件作品,你會有什麼不一
樣的作法?
※你對未來的作品,有什麼樣的期許?
資料來源:涂金堂<是檔案評量或檔案堆積?實施檔案評量時教師應注意的事>、張惠珠<國
中國文科實施檔案評量之行動研究>
決定評量的方式
2/3
2.同儕互評
※我覺得○○○很認真,因為 ……。
※我認為○○○總是願意分享、發表
自己的看法,尤其是在○○○課的
時候,他分享了……。
資料來源:張蔚雯<檔案評量的設計與實施>
決定評量的方式
3/3
3.家長評語
※依照您的觀察,您的子女本學期
在國文課堂上的努力是……。
4.教師觀察紀錄。
資料來源:張蔚雯<檔案評量的設計與實施>
檔案評量基準、規準設計的考量
•
•
•
•
•
•
•
兼顧「能力」與「努力」。
資料完整性與周延性。
思考與作品之精密度(學習的深度)。
種類之多樣性(學習的廣度)。
個別項目或整體檔案之表現法或創造法。
知識和技能之成長證據。
在整個期間內,理解力、方法、態度之增進
證據。
• 檔案內所包含項目之品質評鑑結果。
資料來源:李坤崇<檔案評量理念與實施>
張惠珠<國中國文科實施檔案評量之行動研究>
告知受評者應如何做準備
設計檔案使用說明
1. 內容項目。
2. 檔案格式(筆記本、資料簿、光碟片、紙張
大小)。
3. 給分方式(評分人員、基準規準)。
4. 明確時間表(完成期限)。
5. 檔案繳交與發回方式。
6. 檔案管理(修改、更新、刪除)方式。
7. 個人風格。
8. 每件樣品都必須標註日期。
資料來源:張蔚雯<檔案評量的設計與實施>、李坤崇<檔案評量理念與實
施>
檔案評量的限制
1. 檢視檔案和回饋所花的時間。
2. 建立信度、效度的困難。
3. 檔案評量本身的真實性。
資料來源:張美玉<檔案評量的設計與實施>
實施檔案評量前,先問自己十個問題1/2
1. 你是否有意願實施檔案評量?
2. 你是否能清楚說出自己為何要採用檔
案評量?
3. 你是否清楚檔案評量的基本概念?
4. 你是否瞭解檔案評量的實施步驟?
5. 你是否清楚知道檔案評量的優缺點?
資料來源:涂金堂<是檔案評量或檔案堆積?實施檔案評量時教師應注意的事>
實施檔案評量前,先問自己十個問題2/2
6. 你是否懂得如何指導學生蒐集檔案評量的
資料?
7. 你是否懂得如何指導學生挑選檔案評量的
資料?
8. 你是否有能力教導學生進行自我反思?
9. 你是否有能力設計檔案評量的評分規準?
10.你是否能客觀的進行檔案評量的評分工作?
資料來源:涂金堂<是檔案評量或檔案堆積?實施檔案評量時教師應注意的事>
參、評量規準設定
108
何謂基準與規準
• 基準:評分關切的能力。
• 規準:
1.評分的等第。
2.針對不同等第作品的文字描
述(至少3層,具有連續性)。
基準與規準
基準(criteria):能否辨認小雞的叫聲並模仿
小雞的運動方式。
評量規準 3分
2分
(rubric) 能辨認小雞的 只能辨認小雞的
叫聲並模仿小 叫聲,或只會模
雞的運動方式。仿小雞的運動方
式。
兒童姓名
王ㄨㄨ
張ㄨㄨ
V
V
1分
需要幫助才能辨
認小雞的叫聲,
或模仿小雞的運
動方式。
評量的基準與規準原例
想一想,下列這個例子有何問題?
評量規準
(rubric)
兒童姓名
王ㄨㄨ
張ㄨㄨ
3分
在觀察動物時,
是否表現出愛
護、尊重動物
的態度。
2分
模仿動物動作
時,是否能表
達該動物的特
徵。
V
V
1分
能否指出小雞
的外型特徵。
規準撰寫建議1
參考國民中學學生學習成就評量標準—閱讀能力
等級
A
B
C
D
E
文字描述
能深入……
能……
大致能……
僅能做到部分……
未達D級
範例1
基準:能運用合適的語彙,表達出觀察體驗與感覺。
評量規準
分數
能清楚說出自己想法,且表達有深度。
5
能清楚說出自己想法。
4
能大致清楚說出自己想法。
3
能說出自己想法,但表達不清楚。
2
完全說不出自己想法。
1
資料來源:董蕙萍<多元評量設計實務>
範例2
基準:認識顯微鏡的構造。
評量規準
分數
能認識目鏡、物鏡等,並知道放大倍率的計算方 4-5
式
認識目鏡、物鏡的倍率,但不了解放大倍率如何
計算。
3
認識目鏡和物鏡,但不知道如何看目鏡物鏡的倍
率,亦不知如何計算
2
完全不認識目鏡和物鏡,也不知道倍率,亦不知
道如何計算
1
資料來源:阿簡的生物筆記
表現等級
– 配合國內現行的教學評量:五等第在台灣教學現場實施
已久,讓國中端及高中職端對學生畢業表現概況的了解
– 彈性多元整合功能:考量未來用途,可因應彈性合併成
適當的呈現方式
– 通過部分,為避免天花板效應與鼓勵學生精益求精,因
此區分為三等級;未通過部分,為合理與適當地分配補
救教學資源,針對其落後程度的差異區分兩級
115
– 分五級的原因
『評量』應該是一個增加學生學習
信心、強化學生學習動力、以及慶
祝學生學有所成的『機會』。
多元評量,從小做起
•
•
•
•
•
•
設計高層次認知題型於教學及評量。
呈現客製化的質性評語於評量成果。
活用自評、互評、家長評語等方式。
加入口說及聆聽能力於教學及評量。
利用一次段考期間,實施檔案評量。
規劃一個專題報告(一學年一次)。
多元評量的迷思概念
多元評量並非廢除紙筆測驗
多元評量並非一種評量方式
多元評量並非學習終點
多元評量並非主觀評量
多元評量並非萬靈丹
多元評量不是為多元而多元
不做,不會怎樣
做了,很不一樣