Transcript 大數據
大數據時代的中文教學 呂學明 2015 美東中文學校協會年會 5/23-5/24/2015 何為大數據 • 以Exabyte (109G) 為單位的資料儲存量 • GB->TB->PB->EB • 一般的數據處理或計算邏輯已不敷使用 • 3Vs – Volume (量), Velocity (速), Variety (變) • 凡走過必留下痕跡 何為大數據 • 大數據本身並無多大意義,不過就是海量資料的儲存 • 大數據分析所能帶來預估走向趨勢的能力,這個能力使現有的電 腦計算模式重新開啟了一個新紀元 大數據的商業用途 • 信用卡公司為減低盜用經由大數據分析以降低風險 • 可以歸納出持卡人的消費地點、物品、金額及頻率 • 預測持卡人下次消費地點、物品及金額 • 信用卡公司將此項訊息轉賣給商家 • 改變市場推銷及商業廣告的策略 • 消費者收到有興趣的商品廣告或推銷訊息 • 顧客側錄 (profile) • 罪犯研究 大數據的應用 • 太空研究 • 國防及軍事 • 地理資訊 (Geographic Information) • 生態環境(包括氣候)資訊 (Ecosystem & Environmental Information) • 醫療資訊 (Medical Informatics) • 保健資訊 (Health Information) • 交通數據 (traffic data analytics) • 災害管理與救助 • 能源資訊及智慧型抄表 (smart meter) • 網路通信資訊及搜尋引擎 • 雲端大數據 • 這個世界上增長最快的不是物質,而是信息。 - 凱文‧凱利 (Kevin Kelly) • 未來世界不是依賴石油,而是依存於數據。 - 馬雲於德國漢諾威展覽會 • 信息爆炸 - 人類每秒創造的信息已超過了音速 • 到2050年,數據量將達到100萬Zettabit 大數據分析所能產生的效益 • 商業效益 • 市場效益 • 生產效益 • 安全效益 • 預防效益 • 學習效益 (?) 大數據分析能帶給中文教學什麼樣的未來 • 自然語言 (natural language) 應用在未來語言教學 • 以機器翻譯來說,語言學家和語言專家必須不辭勞苦地編撰大型 詞典和與語法、句法、語義學有關的規則,數十萬詞彙構成詞庫, 語法規則高達數万條,考慮各種情景、各種語境,模擬人類翻譯, 計算機專家再構建複雜的程序 • 採用匹配法,同時結合機器學習,依賴於海量的數據及其相關相 關統計信息,不管語法和規則,將原文與互聯網上的翻譯數據對 比,找到最相近、引用最頻繁的翻譯結果做為輸出。 潘少 : 大數據時代 - 華為 https://chaoglobal.wordpress.com/2014/01/19/huaweibigdata/ 大數據分析能帶給中文教學什麼樣的未來 • 語義引擎 (semantics engine) – 非結構化數據 (text, audio, and video) 的搜尋 • User experience 引導的中文教學 大數據與中文教學的未來 • 中文的難學與難教 • 側錄學生的學習方式 (visual, auditory, tactile (觸覺式學習) learner, or mixed) • 大數據的推論 (inference) 與預估 (predictability) 的能力 • Inference – accept or reject hypothesis • Predictability – trend analysis • 大數據與 adaptive assessment • Individualized lesson plans • 線上教學的發展 大數據所帶來的副作用 • 個人隱私的消失 • 資訊安全的重要 • Data Ownership (Kaisler, Armour, Espinosa, & Money 2013)