Lucene소개

Download Report

Transcript Lucene소개

대규모 검색: Lucene과 Solr
•
Search Engine이란?
–
–
•
문서 Index 구성 후 이를 이용해 검색
Indexing 절차: 문서변환 > Metadata추출 > 텍스트 정규화 > (inverted) index 기록
Apache Lucene 및 관련 프로젝트
–
–
–
–
Lucene Java 2.2
Solr 1.2
Nutch 0.9
Hadoop
= indexing 및 검색 용 Java 라이브러리
= http 기반의 index 및 검색 서버 (Web Application)
= Internet search engine software
= 분산 컴퓨팅 플랫폼 (Map/Reduce)