文献信息检索教学课件第一章

Download Report

Transcript 文献信息检索教学课件第一章

第一章
信息检索概论
吉林建筑大学城建学院
认识信息检索课
 从适用性的角度说,这门课应该定义
为信息素养教育课程中重要的一门课。
美国教育技术CEO论坛(2001)
对“21世纪能力素养”作出界
定:
 基本学习技能,是指“读、写、算”能力;
 信息素养,是指能够有效地对信息进行获
取、分析、加工、利用和评价;
 创新思维能力,创新思维包括发散思维、
批判思维、联想、想像以及抽象概括与逻
辑推理等方面的思维能力;
 人际交往与合作精神;
专业素养
教育素养
信息素养
这是我们在面对信息需求时,常碰到的问题:
本章内容:
1.1
1.2
1.3
1.4
1.5
信息与信息检索
信息检索的变革与意义
信息检索手段
信息检索的类型
信息检索系统及原理
1.1 信息与信息检索
1.1.1
什么是信息
“信息”一词的古意有“兆、音、音问、音尘、信
、音信”等,据考证,南唐诗人李中的《暮春怀
故人》一诗是“信息”一词的最早出处。“梦断
美人沉信息,目穿长路倚楼台。”宁陈亮的《梅
花诗》“欲传春信息,不怕雪埋藏”,不仅恰当
地引用还赋予了新意。
信息这一概念首先是由C.E.Shannon和W.Weaver提
出来的,他们试图给信息一个正式的和定量的定义,
从通信工程、计算机和电信的角度出发,把一个消息
中携带的信息量的大小用比特(bit)来度量。
学者们的见解:他们从不同学科方向出发,有不同的观
点。
哲学家认为:信息是人类认识世界的依据;
数学家认为:信息是一种概率;
物理学家认为:信息是“熵”(物理名词,用温度
除热量所得的商,标志热量转化为功的程度);
通信学认为:信息是“不定度”的描述;
图书信息领域的专家认为:信息是可以以各种形式
进行传播、记录、出版及发行的观念、事实及论著。
经典工具书中的定义:
我国《辞海》对信息的释义是:音讯、消息;
通讯系统传输和处理的对象,泛指消息和信号的
具体内容和意义。
美国《韦氏字典》对信息释义为:接受由
他人传来的知识,这些知识是由他们通过调研和
学习获得的;从特定的事件或状况下,如消息、
新闻、通知中获得的知识;用来传播的事实和数
据。
信息普遍存在于自然界,人类社会和
思维领域。可以这么来认识:自然界与人
类活动的事实及人类对它们的认识和创造
是信息的内容组成,而载体记录和媒体传
播则是信息存在的物理形式。

因此,通过自然力作用在树干上生成的年轮,通
过口授相传的故事,通过凿刻保留在石板上的碑
文,通过无线电广播的新闻,通过印刷出版的图
书等等,它们都是信息。

时至今日,信息呈现的类型多样,包括:文字、
图片、图形、广播、电视、电话通话、语音、音
乐、影视、数据库等等。信息量与日俱增,如世
数据的存储单位:Byte、KB 、MB 、GB 、TB 、PB 、EB 、
界收藏量最大的信息资源中心美国国会图书馆的
ZB 、YB、NB、DB换算关系:1KB=1024B, 1MB=1024KB,
1GB=1024MB 1TB=1024GB,
1PB=1024TB=1024*1024GB
………
信息量就达到3P(Pet
bytes,
即2^50 bytes)。
二十世纪八十年代以后,“信息社会”一词出现了。首先是记者出
身的美国社会学家阿尔温托夫勒。他在1980年出版的《第三次浪潮》一书
中,把我们这个充满着大量信息的现代化社会称为“信息社会”。其后,
美国经济学家约翰奈斯比特于1982年秋出版了《大趋势 改变我们生活的
十个新方向》,也提出了美国社会“从工业社会向信息社会变化”的观点
。同年,日本经济学家松田米津写了《信息社会》一书,对“信息社会”
进行了进一步的分析。现今,“信息”一词已经成为最时新的词语之一。
信息的特点
信息具有时效性、传递性、可扩充性、可替
1.时效性:指信息发出、收到利用的时间间隔及其效率,也包括信息本身
代性和共享性
更新的速度。时效性是信息的重要特征。如果信息传递很慢,那么再有
用的信息常常也会失去其应用的价值。
2.传递性:信息借助于物质载体才能进行传递,其渠道如下:
编码:把要传递的信息用语言、文字、图形、公式、代码、符号、音频、
视频等表达形式,形成可传递的信息。
译码:把传递的信息转换成可接收的信息。
3.可扩充性:人们对信息的感知和获取是不断增长的,
因此信息资源的扩充和积累也是无限的。人们对信
息的处理能力越强,信息就扩充的越快。
4.可替代性:信息的物质形态是可以互相转移变换的。
5.共享性:信息可共享,在信息扩散和用户分享信息
的过程中,信息载
体本身的信息量并不因此过程而减少,各用户分享
的信息份额不因为分享的人的多少而受影响。
1.1.2
信息的种类
1
2
按信息的广义内涵划分:分为自
然信息和社会信息。
自然信息:是指宇宙间、自
然界客观存在或随机发生的各种
生命信息、动植物界信息、物质
按信息的社会属性划分:可划分为政
物理信息等。
治信息、军事信息、科技信息、经济
信息、管理信息、生活信息等。
社会信息:人类和社会维系
生存、生产和发展过程中所产生
、传递和利用的信息。这类信息
就是人们日常所说的信息,也是
本书内容所涉及的信息。
3
4
5
按信息的处理加工程度划分:可分为
一次信息、二次信息、三次信息。
一次信息是指未加工或粗略加工过的原
按信息的传递范围划分:可划分
始信息,如:试验记录、技术报告、会议记
为公开信息、半公开信息和非公
录、论文、专利、图书、期刊文章等。
开信息。
二次信息是指在原始信息的基础上经过
采集、整理、加工而形成的信息,常见的形
式有文摘、题录、索引、目录等。
按价值观念划分:可分为有价值
信息和无价值信息。
三次信息是根据二次信息提供的线索,
利用一次信息,经过调研、分析、综合后形
成的信息,如研究报告、综述等。
6
按运动状态划分:可分为动态信
息和静态信息。
动态信息是指
按显示的形式划分:可分为文献
随时都在变化着的
7
信息、声像信息、多媒体信息。
时效性强的信息。
静态信息则是
指历史的、不再发
文献信息是指将文字记录
生变化的信息。
在各种载体上的信息。
当动态信息失
声像信息是指各种声音和
效以后就成为静态
图像的信息。
信息。
多媒体信息是将文字、声
音和图像融为一体的信息。
1.1.3
与信息相关的几个概念
资讯
文献
泛指一切
可以记录
知识信息
的载体
是海外学
者对
Informat
ion的译
名,与信
息有相同
的意义
情报
《辞海》中解
释为:(1)以
侦察手段或其
他方法获得的
有关敌人军事、
政治、经济等
各方面的情况,
以及对这些情
况进行分析研
究的成果,是
军事行动的重
要依据之一。
(2)泛指一切
最新的情况报
道
资料
知识
为工作、
生产、学
习和科学
研究等参
考需要而
收集或编
写的一切
公开或内
部的材料
是人们在
社会实践
中积累起
来的经验
信息、知识、文献的关系
Wisdom智慧
↑
Knowledge知识
↑
Information信息
↑
Date数据
Media(媒体化)
Document文献
1.1.4 信息检索
信息检索
广义信息检索
是将信息按一定的
方式进行加工、组
织并贮存起来,再
根据信息用户的需
要找出有关的信息
过程。它的全过程
又叫信息存储与检
索。
狭义信息检索
指用户根据需要
,借助于检索工
具,从信息集合
中找出所需要信
息的过程。本书
所介绍的信息检
索就是狭义信息
检索 。
1.2
信息检索的变革与意义
1.2.1 信息检索的变革
1.信息资源的变革
信息资源类型的多样化
信息资源容量海量化
信息资源更新迅速
图书馆馆藏资源向因特网无限延伸
2.信息检索手段和方式的变革
网络、计算机和多媒体信息技术的集成使
信息检索、咨询和解答方式实现智能化:
1
信息检索由传统的手工
检索为主发展为计算机
智能化的信息检索为主;
由单一的文献检索发展
到数据检索、事实检索、
全文检索、网络资源检
索、多媒体检索;检索
途径越来越多。
2
信息用户和咨询专家可
以方便地借助信息网络
以电子邮件、Web、Form、
BBS、讨论组和网络计算
机专家咨询系统等方式
进行交互式咨询提问和
解答,还可将网络电话
等技术应用到信息检索
咨询中。
3
信息资源集成开发技术
的应用。运用信息技术
将大量印刷型信息数字
化,建立特色学科数据
库;应用HTML、XML技术,
结合动态Web信息发布技
术,开发出大量多功能
网络检索系统和在线咨
询系统。
3.信息需求的变革
信息需求的全方位化
检索咨询问题的复杂化和深化
信息用户的发散化
4.信息检索人员的变革
网络时代要求信息检索人员具备“T型人才”
的智能结构。主要包括:
信息能力
科研能力
外语水平
信息技术技能
综合能力
开创精神
1.2.2
信息检索的意义
对成才和
终身教育
的意义
在我国科研项目
的重复约为40%。
进行科研,不论
是立题前,还是
立题后,乃至课
题完成的全过程
,都不可离开文
献检索和情报调
研。
据专家调查估计
,一个大学生在
学校学到的知识
是他一生中所用
知识的10%,其
余90%是靠在工
作中不断地接受
继续教育而获得
的。
对科研立项
和课题研究
的意义
对加快科学
研究和促进
经济发展的
意义
据统计,科研人员在
他们从事科研活动中
用于查找和翻阅文献
信息的时间约占1/3
。如果熟悉检索方法
,那么查阅文献的时
间就会由1/3降至1/5
,反之,将会由1/3
增至1/2。
信息检索课的目的
走上工作岗位,仍可继续应用已学
得的信息检索的理论、方法与技能
,及时获得新知识和新信息,不断
加强自我教育。
随时了解有关专业与学科的
进展动态和趋势,通过所掌
握的信息检索技术进行某
项科研或撰写毕业论文。
帮助大学生
提高信息意识。
进行自我教育
3
掌握获取信息
的方法和手段
2
提高信息意识
1
1.3
信息检索手段
1.3.1
传统信息检索
直接检索
利用一次文献信息进行检索。这是人们最常用的一
种查找信息的方法。
间接检索
(1)追溯法:通过已知文献后附的参考文献,“由
一变十,由十变百”地进行追溯查找有关信息。
(2)工具法:利用各种检索工具(文摘、题录、目录
等)进行查找文献,这是文献检索最常用的方法。
1.3.2
现代信息检索
计算机单机检索
目前主要有三种形式:计算机磁盘检索、计
算机磁带检索和计算机光盘检索。
计算机网络检索
目前主要有三种形式:图书馆的局域网络的
检索、联机检索系统的检索及Internet网上
检索。
1.4
信息检索的类型
1.4.1
根据检索对象划分
文献检索
是从一个文献集合中检索出切题文献的过程、方法
与策略。它是利用检索工具和系统查找文献线索,
获取情报信息的过程。
包括书目题录检索和全文检索。
多媒体检索
是从存储有多媒体文件的检索系统中获取多媒体
信息的一种检索方式。检索结果是以多媒体形式
反映特定信息的文字、图像、声频、视频等。
可以在因特网上利用特定的搜索引擎进行检索。
事实检索
是从存储有大量知识信息、事实信息和数据信
息的检索工具和系统中获取某一事物的现状、
结果、发生的时间、地点及过程的检索。
可以利用各种百科全书、年鉴、名录等进行检
索。
数据检索
从存储有大量数据、图表的检索工具和系统中
获取数值型信息的一种检索类型。
可以利用各种百科全书、手册、年鉴和图谱等
进行检索。
1.4.2
根据检索手段划分
根据检索手段的不同,信息检索可分为:
手工检索
通常使用的是一些印刷型的检索工具,通过手
翻、眼看、大脑判断来完成。
计算机检索
计算机检索使用的是检索系统,检索系统包括
计算机设备、通信网络、数据库和其他辅助设
备等。
1.5
信息检索系统及原理
1.5.1
信息检索系统的概念
信息检索系统是为满足各式各样的信息需
求而建立的一整套文献信息的收集、加工、存
储和检索的完整系统。
存储子系统
信息检索系统
检索子系统
存储子系统的主
检索子系统的主
要功能是通过著
要功能是通过编
录、标引等手段
制检索策略在检
建立检索工具体
索工具体系(数
系。
据库)中查找信
息。
1.5.2
信息检索系统的组成
检索文档
如:手工检索系
统的书目、索引
、文摘中由文献
款目组成的正文
,工具书中由条
目组成的主体以
及计算机检索系
统主文档中存储
的书目信息或事
实、数据等。
检索规则是系统
用来规范信息采
集、分析、标引
著录、组织管理
信息检索系统
、检索与传输等
过程的各项标准
体系。
检索规则
检索设备
如:手工检索系统
的卡片目录或检索
刊物,计算机检索
系统的输入装置、
运算器、存储器、
控制器、输出装置
等。
1.5.3 信息检索系统的类型
按信息存储介质划分
可分为手工式检索系统、穿孔卡片检索系统、
缩微品检索系统、计算机检索系统。
按信息组织形式划分
可分为一般文本检索系统、超文本检索系统、
多媒体检索系统。
按计算机检索方式划分
可分为脱机检索系统、联机检索系
统、光盘检索系统、网络检索系统。
1.5.4 信息检索原理
信息存贮过程
信息检索过程
原始信息
检索课题
主题概念分析
课题主题内容分析
检索语言(主题法、分类法等)
信息标引标识
检索标识
检索工具和系统
检索结果
谢
谢 !