Transcript 小町守

共起用例と名詞の出現パターンを用
いた動作性名詞の項構造解析
奈良先端科学技術大学院大学
情報科学研究科
小町守・飯田龍・乾健太郎・松本裕治
研究背景
述語項構造解析
意味役割付与: CoNLL shared task 2004, 2005
He wouldn’t accept anything of value from those he was
writing about.
[A0 He] [AM-MOD would] [AM-NEG n’t] [V accept] [A1
anything of value] from [A2 those he was writing about] .
V: verb; A0: acceptor; A1: thing accepted; A2: acceptedfrom; A3: attribute; AM-MOD: modal; AM-NEG: negation
動作性名詞の項構造解析
ヲ
ガ
【外界】
リスク管理の必要性が強く叫ばれているが、市場
ヲ
の実態が把握できていないため打つ手がないの
が実情。BISが昨年春から調査の手法について検
討していた。
ガ
管理(する) [ ガ:【外界】, ヲ:リスク ]
調査(する) [ ガ:BIS, ヲ:実態 ]
動作性名詞の項構造解析
1階の入り口のところの電話で電話をかけた。
電話 <電話機>
電話(する) [ ガ:(話し手), ニ:(外界) ]
動作性名詞: 動詞由来の名詞, サ変名詞
1. 事態性判別
動作性名詞の用例に事態性があるかどうか判別
2. (狭義の)動作性名詞の項構造解析
事態性のある動作性名詞の項構造を決定し、項を同定
目次
 はじめに
動作性名詞の項構造解析の問題設定
 予備実験コーパスの作成
 動作性名詞の項構造解析へのアプローチ
事態性判定実験
動作性名詞のヲ格同定実験
 関連研究
 まとめ
 今後の予定
予備実験コーパスの作成
新聞記事(京大コーパス)に事態性名詞や照
応のタグをつけたコーパスを作成中 (仕様は
http://cl.naist.jp/~ryu-i/coreference_tag.html)
事態を表現する名詞(形態素)にタグ付与
事態性がある場合、項(格要素)が記事中に
あれば該当する形態素にタグ付与、なければ
「外界」タグ付与
全部で約780記事(約6,500文)タグづけ済み
※文間: 文内には出現しないが同一記事中にある
作業者間のタグの一致率
作業者1のみ
作業者2のみ
指示先不一致
タグ一致
ガ
3
4
138
604
ヲ
15
54
30
280
ニ
13
9
5
43
2名の作業者がタグ付与した140記事
 指示先不一致: 事態性タグを付与した動作性名詞と
項構造は一致したが格要素の指示先が不一致
 タグ一致: 2名の作業者間で事態性タグを付与した
動作性名詞と格要素がいずれも一致
作業者間のタグの一致率
作業者1のみ
作業者2のみ
指示先不一致
タグ一致
ガ
3
4
138
604
ヲ
15
54
30
280
ニ
13
9
5
43
2名の作業者がタグ付与した140記事
 事態性判別はほとんど揺れなくタグ付与可能
 項同定のためにはタグの仕様を再検討する必要
 ヲ格・ニ格は格フレームの選択が難しい
動作性名詞の項構造解析へのアプローチ
モノ
①語の意味クラスの分類問題
出現文脈の情報を使って解く
②文内の項の同定
文構造の情報を
使って解く
名詞
文内
コト
事態性判別
③文内に項の候補が見つからな
かった場合は文外に探しに行く
文間
外界
一人称
二人称
不定
事態性判別の方針
出現用例獲得
…に対する説得工作は失敗に…
辞書
名詞
名詞
リスト
リスト
大量に用意可能
…横にある椅子の取っ手を…
…に対する説得工作は失敗に…
新聞
記事
…横にある椅子の取っ手を…
大量のデータから文構造を教師なし学習
動作性名詞の出現パターンの学習
・・・
説得
交渉
・・・
事態性あり
・・・
椅子
机
・・・
事態性なし
文節内
…説得工作は失敗に…
サ変
サ変
正例
後文脈
…椅子の取っ手を…
負例
の
一般名詞
 用例中の名詞の出現パターンを木構造に変換し、
BACT [Kudo and Matsumoto, 2004] で学習
 学習した木構造が出現パターンのルールに相当
事態性判別実験
方法: SVM を用いて動作性名詞の事態性を
判別(10分割交差検定)
使った素性
意味的な素性
動作性名詞の意味クラス
• 分類語彙表中での分類項目の上位4桁
統語的な素性
動作性名詞の周辺に項になりそうな名詞があるかどうか
• EDR の動詞共起パターン副辞書
BACT で獲得した動作性名詞の出現パターン
事態性判別実験結果
精度
再現率
名詞の出現パターンなし 72.3% 58.7%
73.3% 80.2%
提案手法
新聞記事の事態性判別
 精度=事態性があると分類された動作性名詞のうち正解
 再現率=動作性名詞のうち事態性を正しく判定できた率
 新聞記事80記事(800文)
 動作性名詞1,237個(うち590個が事態性ありの事例)
事態性判別実験エラー分析
項が文外に存在
[ ガ:外界, ヲ:外界 ]
今年の三が日には、お雑煮を食べたらすぐに、のび
のびになっている受賞後第一作の執筆に取りかか
りたい。
周辺文脈が一般名詞のルールにマッチ
「野良黒山の会」のリーダー、木場将弘さん方では、
妻の和枝さんらが現地と電話のやりとりを続けた。
動作性名詞の項構造解析へのアプローチ
モノ
名詞
文内
コト
項構造解析
文間
外界
一人称
二人称
不定
事態性を持つ動作性名詞の項の分布
ガ
ヲ
ニ
文内(同一文節/前文節) 文外(記事内/記事外)
284(18/97)
306(139/167)
235(119/69)
46(44/2)
34(4/13)
6(6/0)
新聞記事80記事(800文)
 ヲ格は文内(かつ動作性名詞から近い場所)に分布
 ガ格は文内・文間・外界に広く分布
 ニ格は絶対数が少ない
ヲ格の項の同定実験
 対象: 文内にヲ格の項がある文
 目的: 動詞の項構造解析モデル [飯田ら, 2006] が
動作性名詞に対しても有効か調査
 使った素性
文の構造情報
ヲ格を持つ動作性名詞の語彙・統語情報
ヲ格候補の語彙・統語・意味・位置情報
ヲ格を持つ動作性名詞とヲ格候補の対の情報
 新聞記事の共起情報から計算した相互情報量
 動作性名詞とヲ格候補の対の距離
ヲ格の項の同定実験結果
精
度
文内に関しては動詞と同じ
モデルでもそこそこ解ける
 評価事例
再現率
新聞記事80記事中文内にヲ格がある動作性名詞235個
関連研究
動作性名詞の項構造解析のコーパス
NomBank [Meyers et al, 2004]
PropBank [Palmer et al, 2005] に従ってタグづけ
文内の項に限定
名詞句の関係解析
名詞の格フレーム辞書の構築 [笹野ら, 2005]
より一般的な枠組み
事態性判別問題を扱っていない
まとめ
動作性名詞の項構造解析のためのコーパス
を作成した
名詞の出現パターンを用いた事態性判別手
法を提案した
精度73.3%・再現率80.2%
動詞の項構造解析モデルを用い、動作性名
詞の文内のヲ格の項同定実験を行った
精度81.9%・再現率81.5%
今後の予定
文外の候補を同定するモデルの作成
ヲ格以外の必須格についても項同定
意味役割や語彙概念構造を用いた解析