ユビキタス空間における ユーザの文脈の把握

Download Report

Transcript ユビキタス空間における ユーザの文脈の把握

Webからの
人間関係ネットワークの抽出と
情報支援
松尾 豊
サイバーアシスト研究センター
産業技術総合研究所
イベント空間支援
AI技術の活用により参加者の満足度向上を目指す
各システム
–
–
–
–
ユーザ位置表示システム,DBサーバ,CoBITシステム
JSAI2003 Scheduling Support System
意味構造検索システムkamome
人間関係ネットワーク支援システム
人間に着目した情報支援
学会や講演会などのイベント空間では
「人」が主役。
– 研究の背景や状況を理解したり、
– 会場の盛り上がりを肌で感じたり、
– 他の研究者と会って話をしたり・・・
人の関係の重要性
初対面の人と会った場合には、自分とその人と
のつながりや、興味、共通の知人が分かればう
れしい。
どのようなグループがあり、自分はどの辺にいる
のか
他システムとの連携可能性
– 自分とある程度近い人の発表を推薦
– 人間関係は遠いけれど、近い内容の研究者を推薦
– 近い人間関係の人が近くにくれば教えてあげる、どこ
にいるか教えてあげる
– どんな人といるか、どういうグループの人といるか
人間関係のWebからのマイニング
コミュニティ(人工知能学会)における人間
関係をWeb上のさまざまな情報から抽出
人間関係ネットワークを作る
人間関係ネットワーク
ノード
– 今年と過去4年のJSAI全国大会参加者
エッジ
– 検索エンジン(Google)を使って、共起関係の強さを測
る。共起が強ければ、エッジを張る。
– 研究室のメンバーのページ、論文リストのページ、会
議のプログラム・・・
エッジの張り方
XさんとYさんの共起の強さ
# ( X Y )
rel( x, y)  Jaccard( X , Y ) 
# ( X Y )
– でも、これだと、有名な人からエッジが張られない。
改良
rel( x, y) 
# ( X Y )
min(# X , #Y )
– でも、これだと、マイナーな人からエッジが出すぎる。
最終的に
 # ( X Y )
if # ( A)  k and# ( B)  k

rel( x, y)   min(#( X ), # (Y ))

0
otherwise
同姓同名
松尾豊 and (東京大学 or 東大 or 産業技術総合
研究所 or 産総研 or 科学技術振興事業団)
産総研=産業技術総合研究所は登録しておく
エッジのラベル
関係の種類まで分かれば、もっと利用しやすい。
次のような関係を判別
–
–
–
–
共著
研究室:同じ研究室か
プロジェクト:同じプロジェクト、委員会か
発表:同じ学会、会議で発表しているか
検索されたページの内容から判定
ページの内容から得る属性
C4.5で得られたルール
Semantic Webでも人間関係は重要
Trust層
– Web of Trust
– Foaf (Friend of a friend):誰が誰を知っているかをRDFで
それぞれが書く
RDFで書く
オーソリティ度の算出
PageRankのような活性伝播
rel(v, v' )
An1 (v)  c 
An (v' )  cE(v)
v 'Neighbor( v ) rel _ sum(v' )
JSAIのオーソリティ度上位
1500人中。ただし、最大要素のクラスタに接続されているのは150人程度。
関連研究
Referral Web
Webページ間の関係の可視化
Know-whoデータベース
論文の共著関係によるネットワーク
FOAF
Web上の多様な情報源から、検索エンジン・Web
マイニングの技術を用いて、特定のコミュニティ
の人間関係を抽出するところが本研究の特徴。
おわりに
Webから人間関係をマイニング
–
–
–
–
共起の強さによりエッジを張る
コンテンツを見てラベル付け
友部博教くん(東大石塚研)
SVG + Javascript
人間関係の背景知識をシステムが持つことで、より効率的
な情報支援を
– 興味が近いがネットワーク上で遠い人の推薦
– ネットワーク上で近い人が近くに来たことの通知
– 優秀論文賞の投票
気をつけるべき点
– プライバシーに関わる人間関係はだめ。「協働関係」
– もとの情報から予測できるような用いられ方であるかどうか。