Transcript 信息检索基础与利用
信息检索基础与利 用 主讲:丛淑丽 电话:85250211 E-mail:[email protected] http://lib.ccu-edu.cn/ QQ:674909087 信息检索QQ群:91353518 第1章 文献信息资源概论 第1节 文献 文献是记录有一切知识的载体。 图书、期刊、光盘、电子文献……清晰地了解文献的不同类型、 特点,有助于信息检索的准确定位,为及时、准确快捷的查找文 献奠定基础。 一、文献的演变过程 世界最早的文献是纸莎草文献 。 中国最早的文献是发现于安阳殷墟的甲骨文。 青铜文献: 一位历史学家曾说,……铜文化是 一部缩写的中国百科全书。 竹简文献: 在竹简和木简上写字,我国最古的书籍就是用竹简文献。 古代文献演变: 纸莎草文献 甲骨文文献 青铜文献 竹简文献 2020/4/27 现代文献 印刷文献(纸质文献) 以纸张为存储介质制作而 成的文献。 是传统文献的基本形式。 优点:便于阅读和流通。 缺点:存贮密度低,占据空 间大。 2020/4/27 缩微文献 以感光材料为存储介质,以缩微照相为记录 手段制作而成的一种文献形式。 包括:缩微胶卷、缩微卡片等。 缩微型文献主要用于保存过期文献.目前国家正在利用缩微技 术建立一个过期报纸库,吉林省图书馆负责东三省地方报纸缩微工作。 优点:同时它的体积小,存储密度高。 缺点:必须借助于专门设备才能阅读。 2020/4/27 声像文献 又称为视听型文献。 借助专用设备。 2020/4/27 数字文献 指以数字形式信息,并通过计算机进行阅读的文献。 优点:存储量大,检索效率高; 主流U盘容量发展为8-16G, 相当于2-4张DVD光盘的容量。 最大容量则已达到1T, 相当于240余张DVD光盘的容量。 2020/4/27 演变过程: 从古代的纸莎草文献、甲骨文献、青铜文献、竹 简文献,发展到现在的印刷型文献、缩微型文献、 声像型文献 、数字文献。 定义:文献是记录有一切知识的载体。 清晰地了解文献的不同类型、特点,有助于准确 定位,便于及时、准确查找文献。 2020/4/27 二、文献特征 从检索角度 文献具有以下两个重要特征: 1.文献的外部特征: 不反映文献的实质意义。 如: 编著者、机构名等。 2.文献的内部特征: 指表征文献实质意义的特征。 如:关键词、分类号等。 2020/4/27 2020/4/27 2020/4/27 文献的分类 按文献的出版形式划分 1. 期刊:采用统一名称,定期或不定期出版的连 续刊物。 占情报来源的65%以上。 2. 图书:是对已发表的科研成果、生产技术和经 验的总结性概括论述。包括专著、丛书、教科书 等。 内容全面、系统。周期长。 文学类在图书馆东侧 3. 报纸:报道及时、内容丰富。 材料分散、知识不系统。 2020/4/27 4. 标准文献:主要是指由技术、管理 、工作标准及其他规范性文件所组成 。 企业标准化 ,有助于企业在竞争中赢得市场。 国际标准化机构: 国际标准化组织(ISO) 5.会议文献: 获取最新技术的一个重要途径。科技 新成果大多是在学术会议上首先公布。 2020/4/27 6.学位论文: http://192.168.170.135/kns50/index.aspx 非常重要的信息源:较高的学术水平,具有独创性和一定的参考价值。 7.政府出版物: 了解一个国家方计、政策、经济等现状的信息来源。 8.专利文献: http://worldwide.espacenet.com/ 反应世界各国科学技术的发展水平,是一种重要的科技信息来源。 世界知识产权组织提供数据表明,在研究工作中经常查专利文献可以节约60%的时间和 40%的经费。美国的科研人员利用专利文献每年节约科研经费达40亿美元 9. 科技报告:是对研究和试验过程实际记录。 10. 技术档案:所有的新技术,都是技术档案记载的对象, 比如某企业生产(设计)一种新型用环保汽车 2020/4/27 3.按加工层次 零次文献: 未经出版的原始记录,包括书信、手稿、笔记、 会议记录等。重要信息价值。 如:名人的手稿 http://news.xinhuanet.com/collection/201105/24/c_121452102.htm 一次文献: 反映研究成果公开发表的原始文献。原文 是信息交流中的主要情报源。 2020/4/27 二次文献: 把一次文献的特征按着一定的科学方法进行编排, 系统地反映某学科领域的文献线索的文献。 包括:目录、索引、文摘等。 提供原始文献的线索。 查找原始文献的检索工具。 2020/4/27 三次文献: 是对有关的一次文献二次文献的概括和综合而产 生的评论性文献。 由于现在的综述多为“现状综述”,所以在引用文 献中,70%的应为3年内的文献。 特点:综合性、实用性 三次文献的实用性是它可以直接提供使用、参考、 借鉴。 2020/4/27 综上所述,从一次文献到二次文献,再到三次文献是一个由 分散到集中,由无序到有序的过程,对此,我们总结出一个 “文献信息链”概念,如图: 起点 终点 用户 研究活动 一次文献 零次文献 加工 综合 二次文献 三次文献 信息流 文献起点的用户的研究活动,即是信息的发源地,同 时又是信息流的目的。 2020/4/27 第2节 电子文献信息资源 一、电子文献的产生与发展 当代“网络化信息资源系统”的构成离不开三大支柱: 1.存储与检索技术系统---计算机为主 2.通信网络系统—数据通信为基础。 3.电子文献资源系统---数据库等为基础。 电子文献是信息社会文献载体发展、进化的必然产物。 二、电子文献的特点 以数字形式把文字、图像、声音、动画等多种形式 的信息存储在光、磁等载体上,通过计算机阅读的文献。 特点: 1.以网络为传播媒体 : 2.以多媒体为内容特征,存储信息数字化: 3.传播方式的多样性、交互性 : 不受时间、空间的限制,实现跨时空、跨地域的传播。 4. 检索功能强: 具有多个检索点,通过多种检索途径可以检索全文 。 第2章 第1节 信息检索基础 信息检索的基本原理 一、信息检索 “检索”源自英文“Retrieval”,其涵义是“查找”。 定义: 将信息按一定的方式和规律组织和存储起来,根据用 户特定需求查找出所需信息的过程称为信息检索。 实质: 信息需求的提问特征,同检索系统中的信息特征标 识进行比较,从中找出相一致的信息。 二、信息检索类型 1. 按检索内容(方式)区分,信息检索可以分为 文献型信息检索:报刊、图书原文 数据型信息检索:物理、数学常数 事实型信息检索:企事业名录等 第二节 信息检索语言 一、检索语言 是用于文献标引和检索提问的约定语言。 如果没有检索语言,信息检索不可能顺利实 现。 二、类型 有分类、主题、序词、关键词四种 第三节 信息检索技术 一. 逻辑组成: 采集 加工 数据库 检索服务 用户接口 词表管理 信 息 源 信 息 采 集 分 配 加工 处理 文献 库 加工 处理 事实 库 加工 处理 数值 库 检 索 服 务 子 系 统 联机定购 定题服务 查询解释 用户私人数据库 电子邮件服务 用 户 接 口 2 5 第3章 世界著名综合文献检索工具 第1节 SCI-科学引文索引(P46) 概述、收录范围、Web of Science检索方法 第2节 E I-工程索引 概述、检索实例 第3节 ISTP-科学会议录索引 第4节 一、艺术与人文科学引文索引(A&HCI)数据库 二、社会科学引文索引(SSCI)数据库 2020/4/27 第4章 世界著名专业文献检索工具 第1节 第2节 第3节 第4节 第5节 CA-化学文摘(美国) BA-生物学文摘 (美国) SA-科学文摘 (英国) 科学技术文献速报 (日本) 文摘杂志 (俄罗斯) 2020/4/27 第5章 网络信息检索 第一节 网络概述 一、 Internet网络 网络就是在一定的区域内两个或两个以上的计算机以一 定的方式(协议、操作系统)连接,使用户能够用户共享文件、 程序、数据等资源。 特点: (1)是一个基于TCP/IP协议的国际互联网络。 (2)是一个网络用户的团体。 (3)是所有可被访问和利用的信息资源的集合。 第二节 搜索引擎 一、搜索引擎定义 搜索引擎是因特网上具有检索功能的一类网站。 搜索引擎存有庞大的索引数据库,收集了全世界上千万 个web页的文字信息。 二、搜索引擎的类型 1.根据信息覆盖范围分类 (1)综合性搜索引擎 综合性搜索引擎主要以Web网页和新闻组为搜索对象, 信息覆盖范围广。 如:Google、Yahoo……均属于此类。 2 9 第6章 国内著名综合文献检索工具 第1节 CNKI数据库 第2节 CSCI(中国科学引文索引)数据库检 索 第3节 万方数据资源系统 第4节 重庆维普资讯系统 第5节 超星数字图书馆 2020/4/27 第7章 计算机联机检索 ☆联机检索的功能 ☆联机检索的一般步骤 ☆国际主要联机检索系统 最著名、规模较大的有Dialog、ORBIT、ESA/ IRS、STN、OCLC等系统 。 ☆国内主要联机检索系统 2020/4/27 3 1 目的及要求: 掌握大型数据库的基本检索方法 独立完成课题检索(毕业论文信息检索) 上课 时间:1.2.4.6.8.10周 实习 时间:3.5.7.9周 要求:完成布置任务 2020/4/27 3 2 纪律: 点名三次不到没有成绩 (平时成绩占60%包括实习) 考试:10周 2020/4/27