信息检索课程作业 2014.04.24 作业内容 Lucene是一个全文检索引擎

Download Report

Transcript 信息检索课程作业 2014.04.24 作业内容 Lucene是一个全文检索引擎

信息检索课程作业
2014.04.24
作业内容

Lucene是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎。即它提
供了数据导入(索引)和导出(查询)两个服务。

将给定的微博数据导入到Lucene中建立索引并能利用索引根据关键词查询微博内
容。

微博数据

数据格式:消息id \t 用户名 \t 时间 \t 内容(时间格式:YYYY-MM-DD HH:MM:SS)

数据编码:utf8

下载地址:http://pan.baidu.com/s/1i3oQG1f
示例

将微博数据插入Lucene建立索引:
示例

查询“周一见 文章”结果: