080605_Complete

Download Report

Transcript 080605_Complete

CONTENTS
01
Concept
02
Development
03
Analysis / Evaluation
04
Result
2
1. CONCEPT
A.
B.
C.
D.
Opinion Mining
Comparison
Goal
Target Site
Opinion Mining
문장 내에서 의견 문장을 추출
문장을 분석
의견에 대한 전반적인 평가 도출
4
ex) Live.com
시스템을 통해 평가된
정보
고객의 상품
평
Target :
6
Comparison
기존 상품평 시스템
Opinion Mining을 이용한
상품평 자동평가시스템
상품평과 평가 점수를 따로 주는
쇼핑을 하기 위해 일일이 상품평
번거로운 방식
을 뒤져볼 필요가 없어짐
평가 점수의 경우
기본점수를 최고점으로 처리함
고객이 직접 쓴 상품평에서 단어
쇼핑몰에서 제공하는 상품평가
를 추출함으로써 좀더 상품평에
에 대한 신뢰도 떨어짐
대해 신뢰도를 높일 수 있음
편리한 시스템을 요구하는 사용자들의 요구를 충족
상품 판매 및 홍보 등의 전략으로 이용할 수 있음
7
2. DEVELOPMENT
A. System Configuration
B. Development Tool
C. Data Flow Chart
System Configuration
Data Base
상품 이름
웹 페이지
사용자
사전정보
분석된 내용을 포함한
상품의 모든 내용
분석된 형태소,
점수
상품 정보, 상품평
상품평 주소
관리자
웹크롤링
오피니언 마이닝
KLT
(형태소분석기)
Data Flow Chart
분석된 형태소
상품평의
주소
상품에 대한 상
품평 정보
사전정보
평가 결과
요약된
상품평
평가된 상품평
Development - Tool
개발 언어 및 Tool
개발 언어 : JAVA, HTML, JSP
개발 Tool : Eclipse3.2, MySQL, TomCat5.5
KLT 라이브러리 (한글 형태소 분석기)
11
3. ANALYSIS / EVALUATION
A. Web Crawling Reviews
B. Morpheme Analysis
C. Evaluation
Web Crawling Reviews
Morpheme Analysis
Web Crawling을 통해 상품평 추출
추출한 상품평 문장에 대한 형태소 분석
감정을 표현할 수 있는 가중치 단어 추출
Evaluation - 1
분석 알고리즘을 통해 도출된 총점으로 평가
0점을 기준으로 긍정(+)/중립(0)/부정(-)으로 나눔
Evaluation - 2
배송은 느리지만, 제품은 이쁘고 좋네요
배송은 느리지만
배송은
느리지만
noun
Adjective
-1
제품은 이쁘고 좋네요
제품은
noun
이쁘고 좋네요
이쁘고
좋네요
Adjective
+1
Adjective
+1
Evaluation - 3
• 가중 평가 처리
ex) 품질이 대단히 좋네요
→ 대단히+ 좋다 ( 1점 ) = 2점
4. RESULT
A. UserInterface
B. Measure to Improve
UserInterface – Search page
검색 기능
카테고리 : MP3
UserInterface – Particular page
UserInterface – Review page
제목 가중치를 두어 제목에는 가중치 점수를 줌.
점수 평가 연산 결과를 보임.
hscomplete.tistory.co.kr