Transcript Lucene소개
대규모 검색: Lucene과 Solr • Search Engine이란? – – • 문서 Index 구성 후 이를 이용해 검색 Indexing 절차: 문서변환 > Metadata추출 > 텍스트 정규화 > (inverted) index 기록 Apache Lucene 및 관련 프로젝트 – – – – Lucene Java 2.2 Solr 1.2 Nutch 0.9 Hadoop = indexing 및 검색 용 Java 라이브러리 = http 기반의 index 및 검색 서버 (Web Application) = Internet search engine software = 분산 컴퓨팅 플랫폼 (Map/Reduce)