Transcript 大數據

大數據時代的中文教學
呂學明
2015 美東中文學校協會年會
5/23-5/24/2015
何為大數據
• 以Exabyte (109G) 為單位的資料儲存量
• GB->TB->PB->EB
• 一般的數據處理或計算邏輯已不敷使用
• 3Vs – Volume (量), Velocity (速), Variety (變)
• 凡走過必留下痕跡
何為大數據
• 大數據本身並無多大意義,不過就是海量資料的儲存
• 大數據分析所能帶來預估走向趨勢的能力,這個能力使現有的電
腦計算模式重新開啟了一個新紀元
大數據的商業用途
• 信用卡公司為減低盜用經由大數據分析以降低風險
• 可以歸納出持卡人的消費地點、物品、金額及頻率
• 預測持卡人下次消費地點、物品及金額
• 信用卡公司將此項訊息轉賣給商家
• 改變市場推銷及商業廣告的策略
• 消費者收到有興趣的商品廣告或推銷訊息
• 顧客側錄 (profile)
• 罪犯研究
大數據的應用
• 太空研究
• 國防及軍事
• 地理資訊 (Geographic Information)
• 生態環境(包括氣候)資訊 (Ecosystem & Environmental Information)
• 醫療資訊 (Medical Informatics)
• 保健資訊 (Health Information)
• 交通數據 (traffic data analytics)
• 災害管理與救助
• 能源資訊及智慧型抄表 (smart meter)
• 網路通信資訊及搜尋引擎
• 雲端大數據
• 這個世界上增長最快的不是物質,而是信息。
- 凱文‧凱利 (Kevin Kelly)
• 未來世界不是依賴石油,而是依存於數據。
- 馬雲於德國漢諾威展覽會
• 信息爆炸 - 人類每秒創造的信息已超過了音速
• 到2050年,數據量將達到100萬Zettabit
大數據分析所能產生的效益
• 商業效益
• 市場效益
• 生產效益
• 安全效益
• 預防效益
• 學習效益 (?)
大數據分析能帶給中文教學什麼樣的未來
• 自然語言 (natural language) 應用在未來語言教學
• 以機器翻譯來說,語言學家和語言專家必須不辭勞苦地編撰大型
詞典和與語法、句法、語義學有關的規則,數十萬詞彙構成詞庫,
語法規則高達數万條,考慮各種情景、各種語境,模擬人類翻譯,
計算機專家再構建複雜的程序
• 採用匹配法,同時結合機器學習,依賴於海量的數據及其相關相
關統計信息,不管語法和規則,將原文與互聯網上的翻譯數據對
比,找到最相近、引用最頻繁的翻譯結果做為輸出。
潘少 : 大數據時代 - 華為 https://chaoglobal.wordpress.com/2014/01/19/huaweibigdata/
大數據分析能帶給中文教學什麼樣的未來
• 語義引擎 (semantics engine) – 非結構化數據 (text, audio, and video)
的搜尋
• User experience 引導的中文教學
大數據與中文教學的未來
• 中文的難學與難教
• 側錄學生的學習方式 (visual, auditory, tactile (觸覺式學習) learner,
or mixed)
• 大數據的推論 (inference) 與預估 (predictability) 的能力
• Inference – accept or reject hypothesis
• Predictability – trend analysis
• 大數據與 adaptive assessment
• Individualized lesson plans
• 線上教學的發展
大數據所帶來的副作用
• 個人隱私的消失
• 資訊安全的重要
• Data Ownership (Kaisler, Armour, Espinosa, & Money 2013)