Transcript 信息检索课程作业 2014.04.24 作业内容 Lucene是一个全文检索引擎
信息检索课程作业 2014.04.24 作业内容 Lucene是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎。即它提 供了数据导入(索引)和导出(查询)两个服务。 将给定的微博数据导入到Lucene中建立索引并能利用索引根据关键词查询微博内 容。 微博数据 数据格式:消息id \t 用户名 \t 时间 \t 内容(时间格式:YYYY-MM-DD HH:MM:SS) 数据编码:utf8 下载地址:http://pan.baidu.com/s/1i3oQG1f 示例 将微博数据插入Lucene建立索引: 示例 查询“周一见 文章”结果: