Finding and Ranking Knowledge on the Semantic Web(担当:森田)

Download Report

Transcript Finding and Ranking Knowledge on the Semantic Web(担当:森田)

Finding and Ranking Knowledge
on the Semantic Web
Li Ding, Rong Pan, Tim Finin, Anupam Joshi, Yun Peng, and Pranam Kolari
Department of Computer Science and Electrical Engineering,
University of Maryland, Baltimore County, Baltimore MD 21250
preprint from the Proceedings of the 4th International Semantic Web Conference,
Galway IE, November 2005, Springer-Verlag.
2005年10月20日(木)
発表者:森田武史 ([email protected])
慶應義塾大学
Abstract
• Swoogle
– ソフトウェアエージェントおよびナレッジエンジニアがWeb
上にあるセマンティックWebの知識(RDFやOWL文書)を
発見するのを支援
– http://swoogle.umbc.edu/
• セマンティックWebナビゲーションモデルの提案
• セマンティックWebオブジェクトのランクキングアル
ゴリズムの開発
– 3つの粒度(document, terms, RDF graphs)
論文の構成
1. Introduction
2. Background and RelatedWork
1. Swoogle
2. Related Work and Motivation
3. SemanticWeb Navigation Model
1.
2.
3.
4.
Overview
Paths between SWTs
Paths between SWDs and SWTs
Paths between SWDs
4. Ranking SemanticWeb Documents
1. Rational Surfer Model and OntoRank
2. Evaluation: OntoRank vs PageRank
5. Ranking for Ontology Dictionary
1. Ranking Semantic Web Terms
2. Ranking Class-Property Bonds
6. Conclusions and FutureWork
用語
• エージェント
– セマンティックWeb知識を利用する,プログラム,ツール,ナレッジエンジニア
を意味する
• ナビゲート
– 初期開始点から望まれる情報リソースへの一連の(明示的または暗黙的な)
リンクに続くプロセスを意味する
• Semantic Web Document (SWD)
– 推奨されるRDF構文言語(RDF/XML, N-Triple, N3)を用いてRDFグラフをシ
リアライズしているWeb文書
• Semantic Web Term (SWT)
– rdfs:Class(またはrdf:Property)のインスタンスをあらわし,一般的に(世界共
通で)URI参照によって参照されることができるRDFリソースを意味する
– クラスまたはプロパティ
• Semantic Web Ontology (SWO)
– かなりの数のSWTを定義しているSWD
• populate
– インスタンスがクラスまたはプロパティを参照?
• class-instances
– ?
1. Introduction
• WWWの発展により,検索エンジンはWebの基盤としての中心的な役割を
担っている
• 同様に,セマンティックWeb言語(RDFS(S), OWL)にエンコードされた知識を
エージェントが発見するのに特化した検索エンジンが必要となる
• セマンティックWeb検索エンジンの2つの重要な側面
– エージェントがセマンティックWebをナビゲートすること
– 検索結果をランキングすること
• Semantic Web Documents (SWDs)のコレクションとして,具体化されたセマ
ンティックWebに焦点を当てている
• ナビゲートの必要性
– コンテンツを公開するために,再利用または新規作成することによって,
情報提供者は適切なドメインオントロジーを得ることが必要となり,その後,
インスタンスやアサーション(文)を作るためにドメインオントロジーを利用
する
– 知識にアクセスする際に,完全にエンコードされた知識を理解するために,
消費者はインスタンスデータを探し,対応するオントロジーを追求する
1. Introduction
• 現状の問題点
– 何千ものオントロジーが,公共機関(CYC, WordNet, DC, FOAF,
RSS)や個人によって開発されているが,しばしば,類似または同じ概
念の用語が重複して定義されている
• 例: 300以上の異なる‘person’概念をあらわすように見えるSWTが定義さ
れている
– 従来のWebナビゲーションとランキングモデルは,セマンティックWeb
には適していない
• 圧倒的な数の他のWebページとSWDを区別しない
• SWDの内部構造やSWD間の外部の意味リンクのパースや利用をしない
– Googleでさえオントロジーを見つける際に時には不十分である
• 例: FOAFオントロジーは,“person ontology”というフレーズを用いて
Googleで検索したとき,最初の10件に含まれない
– 多くの既存のナビゲーションツール(HyperDAMLやSwoopなど)は,
URI参照を利用しているが,以下の問に答えられない
• 与えられたクラスのインスタンスを探せ
• 同一ローカル名としてpersonを利用しているすべてのURIをリストで示せ
2. Background and RelatedWork: 2.1 Swoogle
Swoogle アーキテクチャ
2. Background and RelatedWork: 2.1 Swoogle
•
Discovery
–
1.
2.
3.
4.
•
4つのメカニズムを用いて,SWDを発見,キャッシュするために候補となるURL
を集める
投稿されたSWDのURLやサイト
有望なサイトを探るWebクローラー
従来の検索エンジンを用いて,それっぽいURLを探す,カスタマイズされたメタク
ローラー
新しい候補を生成するために,SWDの整合性チェックや分析をする
SwoogleBot セマンティックWebクローラー
Index
–
–
発見されたSWDを分析して,セマンティックWebについてのSwoogleメタデータ
の大部分を生成
メタデータは,個々のSWDやSWTに関連する特徴だけでなく,以下の間の関連
も追跡
•
•
•
Analysis
–
•
SWDは,与えられたSWTをどのように使用,定義,populateしているか
2つのSWTがどのように関連づけられているか
生成されたメタデータを分析して,モジュールのランキングメカニズムにhostする
Search Service
–
–
検索サービスをエージェントに提供し,メタデータへのアクセスやセマンティック
Webのナビゲーションを可能にする
Swoogle検索サービスとオントロジー辞書サービスが主要サービス
Swoogle
Swoogle
• Semantic Web Documents (SWDs:RDFまたはOWLで
記述された文書)のための索引付け及び検索システム
– オンラインSWDsの獲得,分析,索引付け
– 検索インタフェース
• 提供しているサービス
– Swoogle Search
• SWDのURLおよび,SWDで定義または利用されているクラス・プロ
パティの検索
– Ontology Dictionary
• SWDで定義されているクラスまたはプロパティの索引
– Swoogle Statistics
• 発見されたSWDに関するSwoogleメタデータ
– Swoogle Web Service
• WebサービスからSwoogleのサービスを実行
• URL; http://swoogle.umbc.edu/
• 提供元: Ebiquity research group at UMBC
– http://research.ebiquity.org/
Swoogleで定義される用語
•
Class
– (X, Y, Z)で,Xがクラスとすると
• 1.Xは無名ノードではない
• 2.Yはrdf:type
• 3.Zは,rdfs:Class, owl:Class, owl:Restriction, owl:DataRange, daml:Class, daml:Datatype,
daml:Restriction のどれか
•
Property
– (X, Y, Z)で,Xがプロパティとすると
• 1.Xは無名ノードではない
• 2.Yはrdf:type
• 3.Zは,rdf:Property, owl:ObjectProperty, owl:DatatypeProperty, owl:AnnotationProperty,
owl:FunctionalProperty, owl:InverseFunctionalProperty, owl:SymmetricProperty,
owl:OntologyProperty,owl:TransitiveProperty, daml:Property, daml:ObjectProperty,
daml:DatatypeProperty, daml:TransitiveProperty, daml:UniqueProperty のどれか
•
Individual
– (X, Y, Z)で,Xが個体とすると
• 1.Xは無名ノードではない
• 2.Yはrdf:type
• 3.Zは,owl:Thing, daml:Thing, 名前空間が{owl, rdf, rdfs, daml}でないクラス
•
Semantic Web Document (SWD)
– RDFグラフ,RDF/XML, N-Triple, N3で記述されたファイル
– XHTMLに埋め込まれたものは扱わない
– SWO(Semantic Web Ontologies)+SWI(Semantic Web Instance files)
Swoogleの統計データ(2005年5月12日)
ファイル数
SWD数
1,094,035
337,182
オントロジー数
4,171
定義されているクラス数
97,369
S,V,OのOがURIrefのクラス数
11,312
定義されているプロパティ数
54,631
使用されているプロパティ数
16,505
定義されている個体数
7,279,476
総トリプル数
47,568,299
Swoogle Search
• Document Search
– キーワード:actor
• actorを含む文書を検索
– キーワード: type:rss
• 拡張子がrssの文書を検索
– キーワード: encoding:n3
• N3 形式で記述された文書を検索
• Term Search
– クラスまたはプロパティの検索
• チェックボックスから,クラス,プロパティ,クラスかつプロパティのどれかを選
択可能
– キーワード: person
• URLのローカル名にpersonを含むクラスまたはプロパティ
• 例:
– キーワード: [person]
• URLのローカル名がpersonであるクラスまたはプロパティ
– キーワード: #person
• URLに#personを含むクラスまたはプロパティ
– キーワード: /person
• URLに/personを含むクラスまたはプロパティ
Ontology Dictionary
• Dictionary Lookup
– 辞書的な検索
• ローカル名,名前空間,URI
• Dictionary Index
– アルファベット順の索引
Ontology Dictionary: Dictionary Index
Swoogle Web Service
• Search document
– 入力:キーワード
– 出力:キーワードを含む文書のセット(RDF形式)
• Search Term
– 入力:キーワード
– 出力:キーワードを含むURLのセット(RDF形式)
• Digest Term
– 入力:キーワード
– 出力:キーワードが定義または利用されている文
書のセット(RDF形式)
Swoogle Web Service:Search Document
<rdf:RDF>
<swoogle:Response>
<rdfs:comment> This result is generated by SWOOGLE2 at http://swoogle.umbc.edu.</rdfs:comment>
<swoogle:queryLimit>10</swoogle:queryLimit>
<swoogle:queryTime>1.024</swoogle:queryTime>
<swoogle:totalResults>689</swoogle:totalResults>
<swoogle:querySuccess>true</swoogle:querySuccess>
<swoogle:hasResult>
<rdf:Seq>
<rdf:li><swoogle:Document rdf:about="http://www.cs.umbc.edu/~finin/finin.rdf"/></rdf:li>
<rdf:li><swoogle:Document rdf:about="http://www.cs.umbc.edu/~hchen4/harrychen.rdf"/></rdf:li>
<rdf:li><swoogle:Document rdf:about="http://www.csee.umbc.edu/~finin/finin.rdf"/></rdf:li>
……
</rdf:Seq>
</swoogle:hasResult>
<swoogle:queryStart>1</swoogle:queryStart>
<swoogle:queryString>umbc</swoogle:queryString>
</swoogle:Response>
キーワードを含む文書
</rdf:RDF>
検索キーワード
のURLリスト
Swoogle Web Service:Search Term
<rdf:RDF>
<swoogle:Response>
<swoogle:querySuccess>true</swoogle:querySuccess>
<swoogle:queryString>[person</swoogle:queryString>
<rdfs:comment> This result is generated by SWOOGLE2 at http://swoogle.umbc.edu.
Please note constraints on
the uri of term is case sensitive.
Also note that the result is 1-based, i.e. the minimum value of 'start' is 1.
</rdfs:comment>
<swoogle:hasResult>
<rdf:Seq>
<rdf:li><swoogle:Term rdf:about="http://xmlns.com/foaf/0.1/Person"/></rdf:li>
キーワード:
<rdf:li><swoogle:Term rdf:about="http://xmlns.com/foaf/0.1/PersonalProfileDocument"/></rdf:li>
personを
<rdf:li><swoogle:Term rdf:about="http://xmlns.com/wordnet/1.6/Person"/></rdf:li>
<rdf:li><swoogle:Term rdf:about="http://www.aktors.org/ontology/portal#Person"/></rdf:li>
ローカル名の
<rdf:li><swoogle:Term rdf:about="http://www.amico.org/vocab#Person"/></rdf:li>
先頭に持つ
</rdf:Seq>
</swoogle:hasResult>
URLのセット
<swoogle:totalResults>647</swoogle:totalResults>
<swoogle:queryTime>0.022</swoogle:queryTime>
<swoogle:queryLimit>10</swoogle:queryLimit>
<swoogle:queryStart>1</swoogle:queryStart>
</swoogle:Response>
</rdf:RDF>
Swoogle Web Service: Digest Term
hasDefClassDocument: クラス定義
hasDefPropertyDocument: プロパティ定義
hasPopClassDocument: クラス参照
hasPopPropertyDocument: プロパティ参照
<rdf:RDF>
<swoogle:Response>
<swoogle:queryString>http://xmlns.com/foaf/0.1/Person</swoogle:queryString>
<swoogle:totalResults>1</swoogle:totalResults>
<swoogle:querySuccess>true</swoogle:querySuccess>
<swoogle:queryTime>4.137</swoogle:queryTime>
<swoogle:hasResult>
<swoogle:Term rdf:about="http://xmlns.com/foaf/0.1/Person"/>
</swoogle:hasResult>
</swoogle:Response>
<swoogle:Document rdf:about="http://infomesh.net/2001/12/foaf.rdf"/>
<swoogle:Document
rdf:about="http://www.ecademy.com/module.php?mod=network&op=foafrdf&uid=42477"/>
<swoogle:Document rdf:about="http://peopleaggregator.com/profile?id=100"/>
......
<swoogle:Term rdf:about="http://xmlns.com/foaf/0.1/Person">
<swoogle:hasDefClassDocument rdf:resource="http://infomesh.net/2001/12/foaf.rdf"/>
<swoogle:hasPopClassDocument
rdf:resource="http://www.ecademy.com/module.php?mod=network&op=foafrdf&uid=42477"/>
<swoogle:hasPopPropertyDocument rdf:resource="http://peopleaggregator.com/profile?id=100"/>
.....
</swoogle:Term>
</rdf:RDF>
2. Background and RelatedWork: 2.2 Related Work and Motivation
•
•
Random Surfing Model and PageRank
Variations of PageRank
– Topic-Sensitive PageRank,Weighted PageRank,Several link-semantics-aware
•
Navigating the Semantic Web
– 従来のWebとセマンティックWebのナビゲーションはかなり異なる
– セマンティックWebナビゲーションは,現在,ブラウザ(HyperDAML,Swoopなど),オン
トロジーライブラリ(DAML ontology library and SchemaWebなど),検索エンジン
(Ontaria,Swoogleなど),クローラー(scutter,SwoogleBotなど)のようなツールによっ
て支援されている
– ほとんどのツールは,URI参照の意味に基づいて,ナビゲーションの経路を捕らえるだけ
であるが,Swoogleでは,SWDとSWTの間の追加的なナビゲーション経路の提供により,
効果的なナビゲーションを支援している
•
Ranking SemanticWeb knowledge
– ドキュメントレベルのセマンティックWebオントロジーのランキングは,content analysisと
link-structure-based-analysis)が用いられる
– XML文書の要素のランキング付けを含めた,インスタンスやオブジェクトレベルの知識
のランキング付けは,データベースとセマンティックWeb研究者の両方により調査されて
いる
• データベースまたはWebのオブジェクトのランキング
• 領域固有のRDFデータベースにおける関連するクラス-インスタンスのランキング
– サブグラフレベルの知識のランキングは,セマンティックWebの検索結果のランキングの
文脈において,ontology-based content analysisやcontext-based trust computation
が用いられる
3. SemanticWeb Navigation Model
• セマンティックWebをナビゲートするために,3つの理由からユーザは単
純にURI参照に頼ることはできない
– 1.URIrefの名前空間はSWOを示すが,逆リンクがない
– 2.rdfs: seeAlsoはFOAFベースのアプリケーションでSWDsと相互接続する
のに広く使用されているが,他のSWDsでめったに使われていない
– 3.owl:importsはオントロジーを連結するが,オントロジーは通常単独で開
発され,配布されるため,そのような関係はまれである
• さらに,多くの実用的な問題がWebスケールのSemanticWebデータアク
セスで取り組まれるべきである.
– いかなる他のSWDsによってリンクされないSWDsにどのように至るか?
– URIrefの名前空間がSWDでない場合はどうするか?
• ナビゲーションモデルの対象とする使用者はソフトウェアエージェントとセ
マンティックWeb研究者の両方
– ソフトウェアエージェント: 通常,外部知識としてSWDsを探して,次に,
SWDsを完全に理解するためにSWOsを検索
– セマンティックWeb研究者: 主に知識を公開するためにSWTsとSWOsを探
す
3. SemanticWeb Navigation Model: 3.1 Overview
Fig.2. The Semantic Web navigation model
3.2 Paths between SWTs → ①
3.3 Paths between SWDs and SWTs → ②,③,④,⑤
3.4 Paths between SWDs → ⑥,⑦
3. SemanticWeb Navigation Model: 3.1 Overview
Fig.3. A navigation use-case
3. SemanticWeb Navigation Model: 3.2 Paths between SWTs
•
•
Fig2の①
1. sameNamespace and sameLocalname
– 名前空間が指すドキュメントでSWTsが必ずしも定義されないため,同じ名前空間を共
有するSWTsをリンクすることは必要
– SWTの部分であるローカル名は,通常その意味をあらわすため,同一ローカル名を共
有するSWTsをリンクすることは必要
•
2. extends
– iまたはiiのとき,SWT t1はSWT t2により拡張されている
i.
(t1, P, t2)という3つ組があり,P(e.g. rdfs:subClassOf, owl:inverseOf, owl:complementOfな
ど)によって2つのクラスまたはプロパティがつながれているとき
ii. (t1, P, LIST)という三つ組みがあり,P(e.g., owl:unionOf)がクラスt1とrdf:List List(nilでないク
ラスt2を含む)をつないでいるとき
•
3. class-property bond
– フレームベースのシステムでは,クラスとそれらの属性はきつく結びついているが,セマ
ンティックWebでは,クラスとプロパティの間のつながりはゆるい
•
例: Dublin Coreは,定義域と値域を特定することなく,広く使われるプロパティを定義
– Swoogleはクラスとそのインスタンスプロパティを2つのソースを用いてリンク
i. SWO内のrdfs:domainアサーション
ii. class-instanceでのそのようなbondのインスタンス化
3. SemanticWeb Navigation Model: 3.3 Paths between SWDs and SWTs
• Fig2 ②,③,④,⑤
• SwoogleはSWDとSWTを横断する3つのタイプのナビゲーション経
路を保持
i. Fig2の経路②と⑤は,SWTの利用方法を分析することによって,SWD
から抽出できる
ii. 経路③と④は,主に経路②と⑤の反対
iii. 経路④のofficialOnto関係は,SWTとSWOをリンクしている
• ソフトウェアエージェントが,明示的なインポート命令が記述されていない
SWTsを定義するオントロジーの場所を見つける際に必要
3. SemanticWeb Navigation Model: 3.3 Paths between SWDs and SWTs
• Fig2 ④ (officialOnto)
• Swoogleは,Table2 に示すヒューリスティクスを用いて,SWT Tの
“official ontology”を追跡する
FOAFとDCの”official ontology”を発見
DCの場合,名前空間にアクセスすると,定義場所にリダイレクトされる
FOAFの場合,名前空間+index.rdf
3. SemanticWeb Navigation Model: 3.4 Paths between SWDs
•
rdfs:isDefinedByとrdfs:seeAlsoプロパティをpopulateしている三つ組みは,広く
WebページまたはSWDをリンクするのに使われている
– 実際には,多くのRDFクローラーがSWDを発見するためにrdfs:seeAlsoを用いる
•
owl:OntologyPropertyのインスタンスは,2つのSWOを関連づけるために明示的
に定義される
– 例: owl:imports, owl:versionInfo, owl:priorVersion, owl:backwardCompatibleWith
– owl:importsは,他よりもはるかに頻繁に使われているため,Swoogleは,imports関係
の使用を索引付けしている
•
RDF test-caseオントロジーに着想を得て,セマンティックWebの明示的な
‘hyperlinks’を支援するために,wob:RDFDocumentクラスを開発
– RDF test-case オントロジー
• http://www.w3.org/2000/10/rdf-tests/rdfcore/testSchema
– あるリソースがSWDであることをアサート(assert)
– RDF sitemap
– Webサイトが特別な索引ファイルを通してそれらのSWDsを公開することを許す
• http://swoogle.umbc.edu/site.php
4 Ranking SemanticWeb Documents
•
RDFグラフは通常,ドキュメントレベルでアクセスされるため,ナビゲーション
経路を以下の3つのドキュメントレベルのタイプに一般化することにより,セマ
ンティックWebナビゲーションモデルを単純化する
その後,'rational' surfing behaviorによるランキング手法に基づいたリンク分
析を適用
•
– extension(EX)
• defines SWT-SWD relation,extends SWT-SWT relation,officialOnto SWT-SWD
relationを一般化
• 例: SWD d1 EX SWD d2は,d1がクラスt1を定義し,t1がクラスt2のサブクラスであり,t2
のofficial オントロジーがd2であるとき成り立つ
– use-term(TM)
• uses and populates SWT-SWD relation,officialOnto SWT-SWD relationを一般化
• 例: SWD d1 TM SWD d2は,d1がリソースtをクラスとして使っており,tのofficialオントロ
ジーがd2のとき成り立つ
– import(IM)
• SWDが直接または遷移的に他のSWDをインポートするときに成り立つ
• imports SWD-SWD relation
SWD d1 EX SWD d2
define
officialOnto
t1 subClassOf t2
SWD d1 TM SWD d2
use
クラスt
officialOnto
SWD d1 IM SWD d2
d1 import d2
4 Ranking SemanticWeb Documents: 4.1 Rational Surfer Model and OntoRank
•
•
•
•
•
•
•
OntoRankは,ドキュメントレベルのエージェントのナビゲーションの振る舞いをエ
ミュレートしたrational surfer modelに基づいている
random surfer modelのように,エージェントは,SWDから他のSWDへのリンクを
たどるかまたは,新しいランダムなSWDに1-dの確率でジャンプする
エージェントは,リンクの意味に従って,不均等な確率でSWD内のリンクをたどる
SWDαにエージェントが遭遇したとき,エージェントは,αによって参照されるクラス
やプロパティを定義する“official”オントロジーを(遷移的に)インポートする
link(α,l, β)は,SWDαからSWDβへのセマンティックリンクをあらわす
linkto(α)は,直接SDWαにリンクされるSWDのセットをあらわす
weight(l)は,user specified navigation preference
– 例: TMとEX
•
•
OTC(α)は,オントロジーとしてαとIMまたはEXの(遷移的)関係にあるSWDのセッ
ト
OntoRankは2つのステップから計算される
– それぞれのSWDαが収束するまで繰り返しランク(wPR(α))を計算する(式(1)と(2))
– SWDのランクをそれをインポートするすべてのオントロジーに遷移的にわたす(式(3))
4 Ranking SemanticWeb Documents: 4.1 Rational Surfer Model and OntoRank
4 Ranking SemanticWeb Documents: 4.2 OntoRank vs PageRank
•
2005年4月までにSwoogleによって集められた実際のデータセットDS-APRILで,
OntoRankを評価
– 330K(33万: 1.5%=>SWO, 24%=>FOAF, 60%=>RSS) SWDs
– 200K(20万) の文書レベルの関係による内部リンク
•
最初の実験はPageRankとOntoRankで,SWDsの中でSWOsのランクキング性
能の比較を行った
– DS-APRILでのSWDsをPageRankとOntoRankの両方でランキング
– 10個の人気のあるローカル名(Swoogleの統計による)をキーワードとして選択
– PageRankとOntoRankにおける,各キーワードの検索結果それぞれ上位20件の厳
密なSWO数を比較
4 Ranking SemanticWeb Documents: 4.2 OntoRank vs PageRank
• Definition 1. ontology ratio
– SWDsの中のSWOsを特定
– 例: “Color”クラスの定義がSWDで与えられ,3つのインスタンス‘blue’,
‘green’,‘red’でColorクラスがpopulateされている場合,ontology ratioは25%
• 4つのうちの1つのみが,クラスとして定義されているため
– オントロジードキュメント: 最低1つの用語が定義されているSWD
– 厳密なSWO: オントロジーの割合が0.8より大きい場合
• 2番目の実験は,PageRankとOntoRankにおける,それぞれのSWDの
ベストランクを調査
• Table 4
– 多くの人気のあるオントロジーに参照されるため,OWLはRDFよりもランクが
高い
– RSSとFOAFは,インスタンスデータ多いためPageRankでは高くランキング
されているが,他のオントロジーからの参照は少ないためOntoRankではラン
クが下がっている
– Web of trust(WOT)オントロジーは,280個のFOAF文書しか参照していな
いため,PageRankでは29位だが,OntoRankでは,FOAFオントロジーに参
照されていることで認知度が上がり8位となっている
4 Ranking SemanticWeb Documents: 4.2 OntoRank vs PageRank
5 Ranking for Ontology Dictionary
• 同一SWO内で定義されるSWTは,かなり異なる頻度でインスタンス化さ
れるため,用語レベルでのオントロジーのランキングも重要
– 例: owl:versionInfoは,owl:Classと比べるとほとんど使われていない
• そのため,ユーザはオントロジーを分割したいかもしれず,そのとき,
SWOの一部分をインポートする
• ユーザはしばしば,複数のオントロジーから同時にSWTを利用する
– 例: rdfs:seeAlsoとdc:titleは,foaf:Personのインスタンスを修飾するために
頻繁に使われる
• ”Do It Yourself” 戦略
– 例: ユーザは、完全にオントロジーをインポートすることなく,人気のあるオン
トロジーから関連する用語を組み立てることによって,オントロジーをカスタマ
イズできる
• Swoogleのオントロジー辞書は,ユーザが人気によりランキングした関連
する用語を見つけるのを支援
• CONSTRUCT-ONTO手続きを支援
1. 適切なクラスCを見つける
2. 定義域としてCをもつ,人気のあるプロパティを見つける
3. 他のクラスが必要ならば,ステップ1に戻る.
5 Ranking for Ontology Dictionary: 5.1 Ranking Semantic Web Terms
TWeight(α, t):
ユーザがSWDαをブラウズしたときに,
SWT tにアクセスする確率をあらわす
cnt_uses(α, t):
αの中でtが出現する回数(α中のtの人気度)
|{α|uses(α, t)}|
tを含むSWDの数(tの重要性)
5 Ranking for Ontology Dictionary: 5.1 Ranking Semantic Web Terms
pop(swd): SWTをpopulateしているSWD数
pop(i): SWTのインスタンス数
def(swd): SWTの定義数
5 Ranking for Ontology Dictionary: 5.2 Ranking Class-Property Bonds
•
•
クラスとプロパティの結合度のランキングはCONSTUCT-ONTOのステップ2に
直接関連する(Definition2 参照)
ユーザがデータの可視性を最大にする願望をもってデータを公開するとき,ユー
ザがクラスについて最も人気のあるプロパティを選ぶのを助ける
– 例: foaf:Personのインスタンスを公開するとき,常に,最も共通のプロパティである
foaf:mbox_sha1sumをpopulateする3つ組を提供
•
Definition2. A class-property bond (c-p bond)
– プロパティとクラスの間のrdfs:domainの関係を言及
– c-p bondが様々な方法でオントロジー中で特定することができるが,(直接の関係やク
ラス継承など)我々は,2つの3つ組グラフパターンにより記号化されたクラスインスタ
ンスでc-p bondsを発見する
• (_x, rdf:type, class), (_x, property, _)
– c-p bondsをインスタンス化したサブグラフをランキングすることによって評価
• foaf:nameにより修飾されるfoaf:personのインスタンスの数など
– DS-APRILにおけるfoaf:Personの上位5位のプロパティは,以下のとおり
1.
2.
3.
4.
5.
foaf:mbox sha1sum (67,136 SWDs)
foaf:nick (62,266)
foaf:weblog (54,341)
rdfs:seeAlso (47,228)
foaf:name (46,590)
6 Conclusions and FutureWork
• Swoogle
– セマンティックWebナビゲーションモデルの提案
– セマンティックWebオブジェクトのランクキングアルゴリズ
ム(OntoRank)の開発
– ナレッジエンジニアとソフトウェアエージェントを支援