ISWC2005報告・Ontologies are us(担当:大向)

Download Report

Transcript ISWC2005報告・Ontologies are us(担当:大向)

セマンティックWebの現在
ISWC2005参加報告
国立情報学研究所 実証研究センター 助手
大向 一輝
ISWC2005概要




The 4th International Semantic Web Conference
 アイルランド・ゴールウェイ
参加者数:500名超
 3rd(広島):400
 2nd(フロリダ・サニベル島):250
論文数
 Research Track:55(1/4以下)
 日本人:0
 Industrial Track:17
 Poster・Demo:100以上
ワークショップ:9
 Semantic Desktop
 Semannot
 End User Interaction
 Semantic Network Analysis
 ・・・
ISWC2005
 Best Paper
 Ontologies are us: A Unified Model of Social Networks
and Semantics
 Peter Mika (Free Univ)
 他1件(忘れました…)
 Semantic Challenge Winner
 Confoto - Demo!
 Featured Service
 Piggy Bank
 ISWC Semantic Web Bank
感想
 理論からアプリケーションへ
 Semantic Desktop WS
 Lightweightアプローチ
 理論はRuleML Conferenceに
 コミュニティ指向
 Personal / Community-based Ontologyの定着
 Social Networkとの関連
 世界の動向
 セマンティックWeb研究の中心はヨーロッパへ
 EUのFunding Meeting
 DERI International
 Galway, Stanford, Seoul…
 ASWC2006
 アメリカのWeb2.0勢力
 研究としてのセマンティックWebは?
Piggy Bank(続)
 FirefoxプラグインによるRDF統合環境
 ScraperによるHTMLページ対応
 Solvent:FirefoxプラグインによるXpath抽出 - Demo!
 第6回勉強会 大向の資料参考
Ontologies are us:
A Unified Model of Social
Networks and Semantics
サーベイ
国立情報学研究所 実証研究センター 助手
大向 一輝
Introduction
 セマンティクスとコミュニティ
 従来の知識表現の限界
 意味とコンテキストは切り離せない
 創発的セマンティクス
 現場で意味は発生する
 創発の場としてのコミュニティ
 モデル化
 自己組織的・自律的
 ローカルなエージェント同士のコミュニケーション
 オープン環境
オントロジーのモデル
 Actor - Concept - Instance
 Tripartite Graph(3部グラフ)
 3部グラフの分析から各要素を分析する
Content A
Tag A
User A
Content B
Tag B
User B
Content C
Tag C
User C
Content D
Tag D
User D
Content E
Tag E
User E
モデル分析
 3部グラフをActor-Concept・Concept-Instanceに分割
 それぞれをアフィリエイトネットワーク分析
 要素間の類似度を2次元にマッピング
Concept X
Concept Y
Concept Z
Actor A
1
0
1
Actor B
0
1
1
Actor C
1
1
0
Actor A
Actor B
Actor C
Actor A
1
0.54
0.27
Actor B
0.54
1
0.11
Actor C
0.27
0.11
1
Case Study 1

Del.icio.usからのコミュニティ・オントロジー抽出
 Social Bookmark - Demo!
 30,000 users(2004.12)
 Actor - ユーザ
 Concept - タグ
 Instance - ブックマークのURI
Case Study 1
 概念の上位下位判定
 出現頻度と共起,包含率から
Broader - Narrowerを自動決定
A
B
A
B
Case Study 2
 通常のWebからのオントロジー抽出
 Actor - ページ内の人名
 Concept - あらかじめ用意した語のセット
 Instance - Webページ
 ACモデルとCIモデルで作られる語彙ネットワークを比較
し,有識者に質問
 ACモデルのクオリティが高い
考察
 2つのネットワークの違い
 Concept - Instance
 一般語が強くなる傾向
 人為的な操作・Spamの可能性
 Actor - Concept
 コンテキスト性の強いネットワーク
 1人が持てるConceptには限界がある
まとめ
 コミュニティを考慮に入れたオントロジーのモデル化
 3部グラフから2部グラフへの変換とネットワーク分析
 6パターンのネットワーク
 Case Study
 Social Bookmark
 オントロジー抽出
 理論武装
 これはオントロジーか?
 共起のネットワークを見ているだけではないか?
 → 通常のシソーラスがどのようにして作られている
かを参考に
参考資料
 ISWC2005論文
 http://www-kasm.nii.ac.jp/~i2k/tmp/iswc2005/contents.htm
 Semantic Desctop WS
 http://www.semanticdesktop.org/SemanticDesktopWS2005/Topics
 Piggy Bank(第6回:大向)
 Swoogle(第7回:森田)
 Personal Publication Reader(第6回:松岡)
 http://www-kasm.nii.ac.jp/~i2k/research/archives/cat_swsurvey.html