Transcript 信息检索基础与利用
信息检索基础与利
用
主讲:丛淑丽
电话:85250211
E-mail:[email protected]
http://lib.ccu-edu.cn/
QQ:674909087
信息检索QQ群:91353518
第1章
文献信息资源概论
第1节
文献
文献是记录有一切知识的载体。
图书、期刊、光盘、电子文献……清晰地了解文献的不同类型、
特点,有助于信息检索的准确定位,为及时、准确快捷的查找文
献奠定基础。
一、文献的演变过程
世界最早的文献是纸莎草文献 。
中国最早的文献是发现于安阳殷墟的甲骨文。
青铜文献:
一位历史学家曾说,……铜文化是 一部缩写的中国百科全书。
竹简文献:
在竹简和木简上写字,我国最古的书籍就是用竹简文献。
古代文献演变:
纸莎草文献 甲骨文文献 青铜文献 竹简文献
2020/4/27
现代文献
印刷文献(纸质文献)
以纸张为存储介质制作而
成的文献。
是传统文献的基本形式。
优点:便于阅读和流通。
缺点:存贮密度低,占据空
间大。
2020/4/27
缩微文献
以感光材料为存储介质,以缩微照相为记录
手段制作而成的一种文献形式。
包括:缩微胶卷、缩微卡片等。
缩微型文献主要用于保存过期文献.目前国家正在利用缩微技
术建立一个过期报纸库,吉林省图书馆负责东三省地方报纸缩微工作。
优点:同时它的体积小,存储密度高。
缺点:必须借助于专门设备才能阅读。
2020/4/27
声像文献
又称为视听型文献。
借助专用设备。
2020/4/27
数字文献
指以数字形式信息,并通过计算机进行阅读的文献。
优点:存储量大,检索效率高;
主流U盘容量发展为8-16G,
相当于2-4张DVD光盘的容量。
最大容量则已达到1T,
相当于240余张DVD光盘的容量。
2020/4/27
演变过程:
从古代的纸莎草文献、甲骨文献、青铜文献、竹
简文献,发展到现在的印刷型文献、缩微型文献、
声像型文献 、数字文献。
定义:文献是记录有一切知识的载体。
清晰地了解文献的不同类型、特点,有助于准确
定位,便于及时、准确查找文献。
2020/4/27
二、文献特征
从检索角度
文献具有以下两个重要特征:
1.文献的外部特征:
不反映文献的实质意义。
如: 编著者、机构名等。
2.文献的内部特征:
指表征文献实质意义的特征。
如:关键词、分类号等。
2020/4/27
2020/4/27
2020/4/27
文献的分类
按文献的出版形式划分
1. 期刊:采用统一名称,定期或不定期出版的连
续刊物。
占情报来源的65%以上。
2. 图书:是对已发表的科研成果、生产技术和经
验的总结性概括论述。包括专著、丛书、教科书
等。
内容全面、系统。周期长。 文学类在图书馆东侧
3. 报纸:报道及时、内容丰富。
材料分散、知识不系统。
2020/4/27
4. 标准文献:主要是指由技术、管理
、工作标准及其他规范性文件所组成
。
企业标准化 ,有助于企业在竞争中赢得市场。
国际标准化机构:
国际标准化组织(ISO)
5.会议文献: 获取最新技术的一个重要途径。科技
新成果大多是在学术会议上首先公布。
2020/4/27
6.学位论文:
http://192.168.170.135/kns50/index.aspx
非常重要的信息源:较高的学术水平,具有独创性和一定的参考价值。
7.政府出版物:
了解一个国家方计、政策、经济等现状的信息来源。
8.专利文献: http://worldwide.espacenet.com/
反应世界各国科学技术的发展水平,是一种重要的科技信息来源。
世界知识产权组织提供数据表明,在研究工作中经常查专利文献可以节约60%的时间和
40%的经费。美国的科研人员利用专利文献每年节约科研经费达40亿美元
9. 科技报告:是对研究和试验过程实际记录。
10. 技术档案:所有的新技术,都是技术档案记载的对象,
比如某企业生产(设计)一种新型用环保汽车
2020/4/27
3.按加工层次
零次文献:
未经出版的原始记录,包括书信、手稿、笔记、
会议记录等。重要信息价值。
如:名人的手稿 http://news.xinhuanet.com/collection/201105/24/c_121452102.htm
一次文献:
反映研究成果公开发表的原始文献。原文
是信息交流中的主要情报源。
2020/4/27
二次文献:
把一次文献的特征按着一定的科学方法进行编排,
系统地反映某学科领域的文献线索的文献。
包括:目录、索引、文摘等。
提供原始文献的线索。
查找原始文献的检索工具。
2020/4/27
三次文献:
是对有关的一次文献二次文献的概括和综合而产
生的评论性文献。
由于现在的综述多为“现状综述”,所以在引用文
献中,70%的应为3年内的文献。
特点:综合性、实用性
三次文献的实用性是它可以直接提供使用、参考、
借鉴。
2020/4/27
综上所述,从一次文献到二次文献,再到三次文献是一个由
分散到集中,由无序到有序的过程,对此,我们总结出一个
“文献信息链”概念,如图:
起点
终点
用户
研究活动
一次文献
零次文献
加工
综合
二次文献
三次文献
信息流
文献起点的用户的研究活动,即是信息的发源地,同
时又是信息流的目的。
2020/4/27
第2节 电子文献信息资源
一、电子文献的产生与发展
当代“网络化信息资源系统”的构成离不开三大支柱:
1.存储与检索技术系统---计算机为主
2.通信网络系统—数据通信为基础。
3.电子文献资源系统---数据库等为基础。
电子文献是信息社会文献载体发展、进化的必然产物。
二、电子文献的特点
以数字形式把文字、图像、声音、动画等多种形式
的信息存储在光、磁等载体上,通过计算机阅读的文献。
特点:
1.以网络为传播媒体 :
2.以多媒体为内容特征,存储信息数字化:
3.传播方式的多样性、交互性 :
不受时间、空间的限制,实现跨时空、跨地域的传播。
4. 检索功能强:
具有多个检索点,通过多种检索途径可以检索全文 。
第2章
第1节
信息检索基础
信息检索的基本原理
一、信息检索
“检索”源自英文“Retrieval”,其涵义是“查找”。
定义:
将信息按一定的方式和规律组织和存储起来,根据用
户特定需求查找出所需信息的过程称为信息检索。
实质:
信息需求的提问特征,同检索系统中的信息特征标
识进行比较,从中找出相一致的信息。
二、信息检索类型
1. 按检索内容(方式)区分,信息检索可以分为
文献型信息检索:报刊、图书原文
数据型信息检索:物理、数学常数
事实型信息检索:企事业名录等
第二节 信息检索语言
一、检索语言
是用于文献标引和检索提问的约定语言。
如果没有检索语言,信息检索不可能顺利实
现。
二、类型
有分类、主题、序词、关键词四种
第三节 信息检索技术
一. 逻辑组成:
采集
加工
数据库
检索服务
用户接口
词表管理
信
息
源
信
息
采
集
分
配
加工
处理
文献
库
加工
处理
事实
库
加工
处理
数值
库
检
索
服
务
子
系
统
联机定购
定题服务
查询解释
用户私人数据库
电子邮件服务
用
户
接
口
2
5
第3章
世界著名综合文献检索工具
第1节 SCI-科学引文索引(P46)
概述、收录范围、Web of Science检索方法
第2节 E I-工程索引
概述、检索实例
第3节 ISTP-科学会议录索引
第4节
一、艺术与人文科学引文索引(A&HCI)数据库
二、社会科学引文索引(SSCI)数据库
2020/4/27
第4章
世界著名专业文献检索工具
第1节
第2节
第3节
第4节
第5节
CA-化学文摘(美国)
BA-生物学文摘 (美国)
SA-科学文摘 (英国)
科学技术文献速报 (日本)
文摘杂志 (俄罗斯)
2020/4/27
第5章 网络信息检索
第一节
网络概述
一、 Internet网络
网络就是在一定的区域内两个或两个以上的计算机以一
定的方式(协议、操作系统)连接,使用户能够用户共享文件、
程序、数据等资源。
特点:
(1)是一个基于TCP/IP协议的国际互联网络。
(2)是一个网络用户的团体。
(3)是所有可被访问和利用的信息资源的集合。
第二节
搜索引擎
一、搜索引擎定义
搜索引擎是因特网上具有检索功能的一类网站。
搜索引擎存有庞大的索引数据库,收集了全世界上千万
个web页的文字信息。
二、搜索引擎的类型
1.根据信息覆盖范围分类
(1)综合性搜索引擎
综合性搜索引擎主要以Web网页和新闻组为搜索对象,
信息覆盖范围广。
如:Google、Yahoo……均属于此类。
2
9
第6章
国内著名综合文献检索工具
第1节 CNKI数据库
第2节 CSCI(中国科学引文索引)数据库检
索
第3节 万方数据资源系统
第4节 重庆维普资讯系统
第5节 超星数字图书馆
2020/4/27
第7章
计算机联机检索
☆联机检索的功能
☆联机检索的一般步骤
☆国际主要联机检索系统
最著名、规模较大的有Dialog、ORBIT、ESA/
IRS、STN、OCLC等系统 。
☆国内主要联机检索系统
2020/4/27
3
1
目的及要求:
掌握大型数据库的基本检索方法
独立完成课题检索(毕业论文信息检索)
上课
时间:1.2.4.6.8.10周
实习
时间:3.5.7.9周
要求:完成布置任务
2020/4/27
3
2
纪律:
点名三次不到没有成绩
(平时成绩占60%包括实习)
考试:10周
2020/4/27