Transcript 発表資料(PPT)
自動車レビューにおける検索と分析 H208032 松岡 智也 H208060 中西 潤 H208082 松井泰介 研究背景 • 特徴から自動車を検索できるものを作ること が出来ないのか • 自動車レビューを基に検索サイトの作成 • 内輪健一、鈴木貴裕 (2009) 「自動車レビュー簡潔化の手法の提案」 卒業論文 研究目的 • レビューサイトに投稿されたレビューか ら文を抽出し、自動車の特徴を分析 • 特徴を入力することで自動車を検索する システムの構築 使用するレビューについて • 本研究ではcarview(URL : http://www.carview.co.jp/)と いう自動車総合情報ウェブサイトにあるレビュー・評価を 利用した • レビューの数が多い、レビューが内容別に書かれて いる Carviewのレビューページ 評価 なんでここまで売れてないのか?? もう少し売れてもおかしくない気がします。 満足している点 エクステリアデザイン。 普段使いでは十分なトルク。 不満な点 150キロあたりから若干フワつく。 アフターパーツが少ない。 システムの全体図 レビューの抽出について ・「トヨタ」「日産」「ホンダ」「マツダ」からそれぞ れ10車種 ・2006年以降のレビュー ・グレードの区別なし レビュー文の分析 • 本研究では特徴分析の際にKH-Coderを利 用した。 KH-Coder :テキストマイニング、特に 内容分析 (計量テキスト分析)のためのフリーソフトウェア。 • KH-Coderによる特徴分析 レビュー文の中から自動車の特徴となる単語を 抜き出し、特徴リストを作成し、検索の材料とし ている。 分析結果(特徴リスト) • 一車種につき、以下の条件で特徴を抽出 個数は5個程度 出現割合が0.20%以上 • 特徴を表す語の中に類似した語がある場合、 その中で出現頻度が高く、わかりやすい語に 統一 特徴の分析 • 共起ネットワーク 語と語の繋がりの関係性を表示 • 多次元尺度法 似たものは近くに、異なったものは遠くに配置 ウェブページ 検索結果 「デザイン」が特徴リストに含まれ ている車種がリストアップされる。 車種ページ 特徴としてあげられた語と他の 語の関係性を表示。 レビュー (デザイン) エクステリアデザイン。ずいぶん洗練されている印象です。 近未来を感じさせるデザインで、欧州車に負けないボディ サイズ。 外観デザインは斬新かつ流麗で非常に満足。 評価方法 • 作成したシステムをウェブで公開 • 情報理工学部の4年生の研究協力者10名 • システムの評価基準として使いやすさ、見や すさ、機能性 評価内容 • ホームページの見やすさ、使いやすさ • 特徴での検索結果 • レビューを使用した情報提示の仕方 • 実際に自動車を求める際に使用できるか • 使用した感想、改善点 良い評価 • ウェブページも見やすく自動車の特徴もちゃんと 分析できている。 • 自動車の特徴がグラフで見ることができ、様々な 自動車の特徴をすぐ知ることができる。 • 自動車の特徴で検索が出来るということが便利 だと思う。 悪い評価 • 自動車の数が少ないから、自分の調べたい自動 車がない。 • キーワードの特徴は特徴なら何でも検索するこ とができるのか。また、特徴の種類は何種類あ るのか。 • 調べたい特徴が少ない。 評価のまとめ 自動車の特徴について知ることが簡 単にできるという好評価とともに、情 報量が少ないという問題点の指摘が あった。 考察 • 情報量(メーカー、車種数)を増やすために自 動でレビュー文を抽出し分析する機能を付け 加えるという改善が必要。 • 自動車の特徴を数値だけではなくグラフを用 いたこと、レビューから情報を集めることで見 えてきた特徴を生かした検索の仕方にするな ど、他とは違ったものを作成出来た。 展望 • 情報量の問題、自動車の特徴とする単語を 設定する上での基準の設定などの改善点が ある。 • 情報は常に更新されていくので如何にして今 回、作成したシステムを自動で更新させてい くのかというところが大きな課題の一つである。 先行研究について 内輪健一、鈴木貴裕 (2009) 「自動車レビュー簡潔化の手法の提案」 情報理工学部情報知能学科 内容 サイトに投稿された評価、レビューの中から必 要な情報だけを抜きだし、簡潔化して見やす い形に表示する。