イントロダクション

Download Report

Transcript イントロダクション

自然言語処理(特論)
#1 イントロダクション
2014/10/06(月)
小町 守 [email protected]
TA: 張 培楠 [email protected]
連絡先・ホームページ
• 担当: 小町 守 (こまち まもる)
• メール: [email protected]
• 授業のサポートページ
– http://cl.sd.tmu.ac.jp/~komachi/lectures/nlplecture/
講義・演習を通じて自然言語処理の基礎と応用を学ぶ
2
本講義は反転授業を行ないます
• 予習
– Coursera の Natural Language Processing の Video
Lectures を見る(毎週40分前後)。
https://class.coursera.org/nlp/lecture/preview
– 言語処理100本ノックを解く(毎週2時間程度)。
http://www.cl.ecei.tohoku.ac.jp/index.php?NLP%2010
0%20Drill%20Exercises
• 授業
– Video Lectures の内容に基づいたQAおよび言語処理
100本ノックのディスカッション。
– 授業に出席する必要はありませんが、出席すること
をお勧めします。
3
本講義は書いたコードで評価します
• 評価(100+25=125点満点): 最終期限2/9
– 言語処理100本ノック1問を期限内に提出した場
合1点。期限内に提出できなかった場合は-0.5点。
解答が正しくなかった場合も-0.5点。
• 解答は GitHub にコミットされたもののみを対象とする。
期限内に提出できたかどうかは GitHub のタイムスタン
プによって判断する。
– CodingBat の☆1つにつき1点(最高25点)。
• 大学のメールアドレスでアカウントを作り、課題ページ
をプリントアウトしたしたものを提出。
4
授業の予定: 10月
• 10/06 #1 イントロダクション
• 10/13(授業日)#2
– Git & Python チュートリアル
– CodingBat(最終期限: 2/9)
• 10/20 #3
– Basic Text Processing
– 第1セット: テキスト処理の基礎
• 10/27 #4
– Edit Distance
– 第2セット: 正規表現・日本語の扱い
5
授業の予定: 11月
• 11/03(休日)
• 11/10 #5
– Language Modeling
– 第3セット: 文分割・トークン化
• 11/17 #6
– Spelling Correction
– 第4セット: 辞書引き・Nグラム言語モデル
• 11/24(授業日)#7
– Text Classification / Sentiment Analysis
6
授業の予定: 12月
• 12/01 #8
– Discriminative classifiers: Maximum Entropy classifiers
– 第5セット: 形態素解析・グラフ描写
• 12/08 #9
– Named entity recognition and Maximum Entropy
Sequence Models
– 第6セット: 係り受け解析/クラス
• 12/15 #10
– Relation Extraction
– 第7セット: 類似度分類・クラスタリング
• 12/22 #11
– Information Retrieval
– 第8セット: 機械学習/分類器
7
授業の予定: 1-2月
• 01/05 #12
– Ranked Information Retrieval
– 第9セット前半:データベース
• 01/12(休日)
• 01/19 #13
– Semantics
– 第9セット後半:データベース
• 01/26 #14
– Question Answering
– 第10セット前半: XML処理/CGIによるデモシステム
• 02/02 #15
– Summarization
– 第10セット後半: XML処理/CGIによるデモシステム
8
持ち物
• 各自課題の解説をしてもらうので、PCを持っ
てきてください。
9