Rerank-By-Example - Satoshi Nakamura

Download Report

Transcript Rerank-By-Example - Satoshi Nakamura

サーチとインタラクション
中村 聡史 (twitter: nakamura)
京都大学大学院 情報学研究科
[email protected]
研究活動
•
•
•
•
•
•
Double Mouse: 両手入力インタフェース
SoundWeb/KyOTO: 音声ウェアラブルシステム
WebP2P: ウェブコンテンツ共有
EnergyBrowser: 運動を支援するウェブブラウザ
Calendar for Everything: カレンダーで全てを管理
Search Interaction: インタラクションと再ランキング
– Editable Web Browser, Rerank-by-Example, SyncRerank, Rerank
Everything, Rerank.jp, Cross Sense Search, …
• WeBrowSearch: 検索と閲覧の融合
• SBRank/Thermarry: アノテーションに基づくランキング
• Onomatoperori: オノマトペによるレシピ検索
人に注目した研究
Web に関する研究 (1): 2002年~
• Web P2P = WeBoX + P2P
– パーソナルウェブアーカイブの共有
中村聡史, 塚本昌彦, 西尾章治郎: コンテンツ流通制御を考慮したウェブコンテンツ共有システムの実現,
情報処理学会論文誌, Vol. 45, No. 1, pp. 74-83 (2004年1月).
Web に関する研究 (2): 2004年~
• EnergyBrowser: 運動支援のための Web 閲覧
システム (知的好奇心と運動のマッピング)
Satoshi Nakamura, Mitsuru Minakuchi and Katsumi Tanaka: Energy Browser:
To Make Exercise Enjoyable and Interesting, ACE 2005, pp.258-261. (June 2005).
Web に関する研究 (3): 2004年~
• 実況チャットに基づく動画のダイジェスト生成
Hisashi Miyamori, Satoshi Nakamura, Katsumi Tanaka: Generation of Views of TV Content Using TV Viewers'
Perspectives Expressed in Live Chats on the Web, ACM Multimedia2005, pp.853-861 (Nov. 2005).
興味
• Web上の膨大な情報群とどう関わるか?
• 人の力をどううまく引き出していくか?
サーチとインタラクション
• 各種サーチはユーザの意図を満たせているか?
– 検索結果は膨大
– ユーザは上位5件しか見ない [Nakamura 07]
– 過度の商業化したSEO技術の問題
[Nakamura 07] Satoshi Nakamura, Shinji Konishi, Adam Jatowt, …, and Katsumi Tanaka:
Trustworthiness Analysis of Web Search Results, Proceedings of ECDL 2007.
ユーザ側の情報
• 検索意図
– 美味しいレストランで料理を食べたい.私は現地の料理やお酒が
好きなので,美味しいアメリカの料理とくにバークレーで有名な料
理を食べることができるお店で美味しいカリフォルニア産ワインを
楽しみたい.そこで,この周辺で美味しいご飯とワインを・・・
• コンテキスト
– 今,私はお腹がすいている.UCバークレーの近くにいます.ホテ
ルはShuttack Plaza Hotel.アメリカに入国したばかりなので時差ぼ
けもありますしうろうろする元気はありません.今,日本円で3万円
,ドルで400ドルを持っています・・・
• プロファイル
Search
バークレー
レストラン
– 私は日本人です.長崎生まれで今は京都に住んでいます.私は
日本食が大好きで,特に魚や鶏に関する料理が好きです.私は
温泉も好きですし,ビールや日本酒,ワイン,バーボンなども大好
きです.旅行の時には現地の料理を食べるのが好きで・・・
ユーザ・サービス間ギャップ
Search Service
検索意図
User
Profile
情報量
コンテキスト
Keyword(s)
Page
Page
Page
Prod.
Info
ギャップ
Web Pages
Products
ユーザ・サービス間ギャップ
複雑なクエリは入力できない
Search
upto
$400 h
good restaurant regional food date:tomorrow loc:CA
“+”, “-”, “site:” を使えるユーザは9%以下
[Ryen, SIGIR07]
目的
ユーザとサーチサービスの橋渡し
Information Amount
• シンプルなインタフェースによる意図伝達
• ユーザのインタラクションを引き出す
サーチとインタラクション
Get
Page
Search
Search
Crawling
Results
Pages
Results
Interact
Reranked
Results
Get Annotation
Annotation
Annotations
サーチとインタラクション
• 直接的なインタラクションに基づく再ランキング
• ソーシャルアノテーションに基づく再ランキング
• 柔らかいクエリに基づく検索
サーチとインタラクション
• 直接的なインタラクションに基づく再ランキング
• ソーシャルアノテーションに基づく再ランキング
• 柔らかいクエリに基づく検索
Rerank-by-Example
• インタラクションに
よる検索結果の再
ランキング
Query (Jaguar)
1. Jaguar (Animal)
2. Jaguar (Mac OS)
3. Jaguar (Car)
4. Jaguar (Car)
5. Jaguar (Animal)
:
N-1. Jaguar (Car)
N. Jaguar (Animal)
Rerank-by-Example
Takehiro Yamamoto, Satoshi Nakamura, and Katsumi Tanaka: Rerank-By-Example:
Efficient Browsing of Web Search Results, Proc. of DEXA2009, pp.801-810.
Satoshi Nakamura, Takehiro Yamamoto and Katsumi Tanaka: Editable Web Browser:
Edit-and-Propagate Operation for Web Browsing, Proc. of WIDM 2007, pp.73-80.
http://rerank.jp/
Rerank Everything
サービス横断ですべてを並び替える!
Takehiro Yamamoto, Satoshi Nakamura, Katsumi Tanaka: RerankEverything:
A Reranking Interface for Browsing Ranked Results, WISS 2009, in Japanese
Rerank Everything
• サービスごとに構造を認識し,インタラクション
により手軽に再ランキングできるようにする
数値ベース
文字列ベース
1
1
¥ 5,000
2
熱海温泉
熱海温泉
N-1
2
¥10,000
N-1
¥ 1,000
N
N
熱海温泉
¥20,000
¥
2,000
Takehiro Yamamoto, Satoshi Nakamura, Katsumi Tanaka: RerankEverything:
A Reranking Interface for Browsing Ranked Results, WISS 2009, in Japanese
5
Rerank Everything
• サービスごとに構造を認識し,インタラクション
により手軽に再ランキングできるようにする
数値ベース
文字列ベース
1
1
¥ 5,000
2
熱海温泉
熱海温泉
N-1
2
¥10,000
N-1
¥ 1,000
N
N
熱海温泉
¥ 2,000
Takehiro Yamamoto, Satoshi Nakamura, Katsumi Tanaka: RerankEverything:
A Reranking Interface for Browsing Ranked Results, WISS 2009, in Japanese
5
Rerank Everything
• サービスごとに構造を認識し,インタラクション
により手軽に再ランキングできるようにする
数値ベース
文字列ベース
2
熱海温泉
熱海温泉
N
熱海温泉
1
2
1
N-1
N-1
N
¥ 5,000
¥10,000
¥ 1,000
¥ 2,000
Takehiro Yamamoto, Satoshi Nakamura, Katsumi Tanaka: RerankEverything:
A Reranking Interface for Browsing Ranked Results, WISS 2009, in Japanese
5
Rerank Everything
• Demonstration
http://rerank.jp/everything
SyncRerank: 並列検索
• 複数の対象を比較検索
– 垂直方向のみならず水平方向での再ランキング
– テキストの類似性,画像の類似性
Satoshi Nakamura, T. Yamamoto, K. Tanaka: SyncRerank: Reranking Multi Search Results Based
on Vertical and Horizontal Propagation of User Intention, Proc. of WISE 2008, pp.120-135.
サーチとインタラクション
• 直接的なインタラクションに基づく再ランキング
• ソーシャルアノテーションに基づく再ランキング
• 柔らかいクエリに基づく検索
SBSearch
• Social Bookmark を利用した検索
– ブックマーク数,傾向,印象タグに基づく検索および
再ランキングを可能に
[Yambe ’07a] Yusuke Yambe, Adam Jatowt, Satoshi Nakamura and Katsumi Tanaka:
Can Social Bookmark Enhance Web Search?, Proceedings of JCDL2007, pp.107-116.
[Yambe ’07a] Yusuke Yambe, Adam Jatowt, Satoshi Nakamura and Katsumi Tanaka: Towards
Improving Web Search by Utilizing Social Bookmarks, Proceedings of ICWE 2007,.
SBSearch: Example of Reranking
Query: wii / SBRank:0.5 / 印象タグ: useful
1st (from 63th) :
Wii-Tube – Let’s watch
YouTube with wii
2nd (from 80th):
3rd (from 33rd):
Yahoo News: a man confirmed
effect of diet by playing wii
Itmedia Biz ID: Can we control
PowerPoint with Wii remote?
Thermarry: 印象による動画検索
• 動画に対するアノテーションを活用した印象で
の検索および再ランキング
・・for student・・・・
・・・ Actor
・・・・・・・・・・・・・・・・・
・Uni Name・・・・
・・Good・・・・・・
・・・・・・・・・・・・・・・・・
・・・・・Science・・・
・・・・・・・・・・・・・・・・・
・・・・・・・・・・・・・・・・・
・・・・・・・・・・・・・・・・・
・・・・・・・・・・・・・・・・・
・・・・・・・・・・・・・・・・・
・・・・・・・・・・・・・・・・・
・・・・・・・・・・・・・・・・・
・・Useful・・
Japan・・・・・・・・・・・・
・・・・・・・・・・・・・・
Social
Annotation
A video clip
Title
Summary
time
Social
Annotation
感性の抽出
Comments to
a video clip
Blogs
Satoshi Nakamura, K. Tanaka: Video Search by Impression Extracted from Social Annotation,
Proc. of WISE 2009, pp.401-414.
Control for Reranking
Impression
Graph
11位から再ランキング
8位から再ランキング
10位から再ランキング
サーチとインタラクション
• 直接的なインタラクションに基づく再ランキング
• ソーシャルアノテーションに基づく再ランキング
• 柔らかいクエリに基づく検索
緩和検索
• 人の意図はもっと漠然としている
– 京都で豆腐とか湯葉とかそういった京都っぽい和食
を食べたい
京都で
京都 豆腐とか京都っぽい...
豆腐? 和食
京都
湯葉
湯豆腐
京野菜
豆腐
和食
Yasufumi Kaneko, Satoshi Nakamura, Hiroaki Ohshima, Katsumi Tanaka: Query Relaxation Based
on Users' Unconfidences on Query Terms and Web Knowledge Extraction, ICADL 2008, pp. 71-81
http://www.dl.kuis.kyoto-u.ac.jp/kaneko/
オノマトペロリ
• 人はそんなに意図を明確化できない
– 「ふわふわの卵料理」「ピリッとした茄子料理」
– レシピにオノマトペが入っていることは少ない
カンウィパーラートサムルアイパン,渡辺知恵美,中村聡史:オノマトペロリ:オノマトペを利用した料理推薦
システム,情報処理学会第73回デジタルドキュメント研究会(2009)
挟み込む検索
• A と B の間のあれなんだっけ?
– A の後で B より前の出来事
– A より難しく B より簡単な本
– A より有名で B ほど有名じゃない芸能人
ワカナゴ
ハマチ
ブリ
Naoto Asahi, Takehiro Yamamoto, Satoshi Nakamura and Katsumi Tanaka: Finding
Intermediate Entity between Two Examples on the Web, ACM WIDM 2009 (Nov. 2009).
http://www.dl.kuis.kyoto-u.ac.jp/~n.asahi/BetweenFinder/
WeBrowSearch
• ブラウジングとサーチの融合
– ブラウジング行為自体がサーチクエリになる
iPod
サーチで繋げる
Zune
Taiga Yoshida, Satoshi Nakamura, Katsumi Tanaka: WeBrowSearch: Toward Web Browser
with Autonomous Search, WISE2007, LNCS 4831, Springer, pp. 135-146 (Dec. 2007).
橋渡し
• インタラクションがユーザとサービスの架け橋
– サービスが少しユーザに歩み寄る
– ユーザも少しサービスに歩み寄る
情報量
情報到達容易性とインタラクションの
モデルの確立
サービスの多様化と
クエリから最適なサービスの選択
世界に影響を与えるには・・・
Next 人の力を活用
Generation Search
Google (62.4%), Yahoo! (12.8%), Baidu (5.2%), MSN
Live! (2.9%), Naver (2.4%) [2007/12, comScore]
検索ランキングを人の手に
Internet Explorer (84.66%), Mozilla Firefox (12.72%),
Safari (1.79%), Opera (0.61%), … [2007/07, OneStat]
Windows (91.46%), Mac OS (7.57%), Linux (0.67%)
[2008/01, Net Applications]
Intel (80.2%), AMD (11.1%)
[2007/04, iSuppli]
コラボレーションを
ウェブは、技術、学術、ビジネス、制度、文化が一体となっ
て進化します。「世界に影響を与えるウェブ研究を行う」に
はどうすればよいか、「世界に影響を与えるビジネスを生
み出す」にはどうすればよいかを、研究者、エンジニアをは
じめ、経営者、投資家、法律家、行政・政策担当者など、さ
まざまな人が「高いレベルで」交流することが重要だと考え
ます。本シンポジウムは、学術に軸足をおいた相互交流の
機会を提供し、世界に影響を与えるウェブ研究・ウェブビジ
ネスを継続的に生み出す場となることを目的とします。皆
様のご参加をお待ちしております。
http://web-gakkai.org/
Search & Interaction
http://snakamura.org/
http://rerank.jp/
http://rerank.net/
http://rerank.jp/everything
http://sync.rerank.jp/
http://calendar2.org/
[email protected]
Twitter: nakamura