Transcript イントロダクション
自然言語処理(特論) #1 イントロダクション 2014/10/06(月) 小町 守 [email protected] TA: 張 培楠 [email protected] 連絡先・ホームページ • 担当: 小町 守 (こまち まもる) • メール: [email protected] • 授業のサポートページ – http://cl.sd.tmu.ac.jp/~komachi/lectures/nlplecture/ 講義・演習を通じて自然言語処理の基礎と応用を学ぶ 2 本講義は反転授業を行ないます • 予習 – Coursera の Natural Language Processing の Video Lectures を見る(毎週40分前後)。 https://class.coursera.org/nlp/lecture/preview – 言語処理100本ノックを解く(毎週2時間程度)。 http://www.cl.ecei.tohoku.ac.jp/index.php?NLP%2010 0%20Drill%20Exercises • 授業 – Video Lectures の内容に基づいたQAおよび言語処理 100本ノックのディスカッション。 – 授業に出席する必要はありませんが、出席すること をお勧めします。 3 本講義は書いたコードで評価します • 評価(100+25=125点満点): 最終期限2/9 – 言語処理100本ノック1問を期限内に提出した場 合1点。期限内に提出できなかった場合は-0.5点。 解答が正しくなかった場合も-0.5点。 • 解答は GitHub にコミットされたもののみを対象とする。 期限内に提出できたかどうかは GitHub のタイムスタン プによって判断する。 – CodingBat の☆1つにつき1点(最高25点)。 • 大学のメールアドレスでアカウントを作り、課題ページ をプリントアウトしたしたものを提出。 4 授業の予定: 10月 • 10/06 #1 イントロダクション • 10/13(授業日)#2 – Git & Python チュートリアル – CodingBat(最終期限: 2/9) • 10/20 #3 – Basic Text Processing – 第1セット: テキスト処理の基礎 • 10/27 #4 – Edit Distance – 第2セット: 正規表現・日本語の扱い 5 授業の予定: 11月 • 11/03(休日) • 11/10 #5 – Language Modeling – 第3セット: 文分割・トークン化 • 11/17 #6 – Spelling Correction – 第4セット: 辞書引き・Nグラム言語モデル • 11/24(授業日)#7 – Text Classification / Sentiment Analysis 6 授業の予定: 12月 • 12/01 #8 – Discriminative classifiers: Maximum Entropy classifiers – 第5セット: 形態素解析・グラフ描写 • 12/08 #9 – Named entity recognition and Maximum Entropy Sequence Models – 第6セット: 係り受け解析/クラス • 12/15 #10 – Relation Extraction – 第7セット: 類似度分類・クラスタリング • 12/22 #11 – Information Retrieval – 第8セット: 機械学習/分類器 7 授業の予定: 1-2月 • 01/05 #12 – Ranked Information Retrieval – 第9セット前半:データベース • 01/12(休日) • 01/19 #13 – Semantics – 第9セット後半:データベース • 01/26 #14 – Question Answering – 第10セット前半: XML処理/CGIによるデモシステム • 02/02 #15 – Summarization – 第10セット後半: XML処理/CGIによるデモシステム 8 持ち物 • 各自課題の解説をしてもらうので、PCを持っ てきてください。 9