信息检索与利用 - 青岛理工大学图书馆

Download Report

Transcript 信息检索与利用 - 青岛理工大学图书馆

信息检索与利用
贾芳华
图书馆信息部
TEL:85071729
QQ:149552480
EMAIL:[email protected]
2015年7月20日
检索课主要内容与要求
课程重点:
了解图书馆现有电子资源(各类数据库收录范围
和类型)
信息检索基础:信息源、检索的概念与原理、
检索工具(系统)类型、计算机检索技术、检
索的基本程序
典型数字资源检索系统的使用方法
网上免费资源的获取
文献信息与学术论文写作
要求:
掌握信息检索的基础知识、基本原理和基本技能
熟练地利用图书馆各种网络学术数据库来检索、
获取学习中所需的文献信息
掌握一定的文献阅读、整理和分析研究的基本方
法和技能,具备基本的研究论文写作能力。
检索课的作用
检索课是知识时代培养学生终身所需的信息意识
与获取文献信息能力的重要课程,是一门科学方
法课。对学生不断吸取新知识,改善知识结构,
有着重要的意义。
借鉴前人成果,避免重复研究
掌握检索技术,节省信息获取
时间
信息检索是科研活动的重要组
成部分
科研选题、立项、研究与成功
撰写、结题、成果申报
撰写报告
9%
思考计划
8%
科学实验
32%
查阅文献
51%
知识载体和学习环境的变化
Papers,printing
born digital,e-publish,e-only
e-reading,e-learning,net surf
信息获取和利用的困惑
不知道有哪些可以利用的信息资源;
不知道从哪里获取有用的信息;
不知道如何去获取和利用信息;
获取的信息很多不符合自己的需求;
信息爆炸,不知道怎么筛选有价值的信息资源;
……
信息获取途径
传统模式
图书馆借阅
网上直接查询下载
网络模式
网上全文传递
信息获取途径
图书
信息资源
获取渠道
多种多样
互联网:门户网站、
专业网站、搜索引擎)
论文(期刊论文、
会议论文、学位论文)
专业信息服务机构
大众传媒(广播、
电视、报纸)
数据库
有效的信息
检索是提高
学习与研究
效率的捷径
信息
知识
文献
检索系统
第一章
第一节
第二节
第三节
第四节
信息检索基础
信息概述
信息源简介
信息检索的基本原理
检索系统概述
第一节
信息概述
美国哈佛大学的研究小组提出了著名的资源三角
形:没有物质,什么也不存在;没有能量,什么
也不会发生;没有信息,任何事物都没有意义。
物质、能量、信息共同构成现实世界的三大要素。
一、信息的概念
1、控制论创始人N·维纳(N·Veinner)在《控制论和社会》一书中定
义为:“信息就是信息,既不是物质,也不是能量,信息是我们在
适应外部世界并使这种适应为外部世界所感到的过程中,同外部
世界进行交换的内容的全称。”
2、信息论创始人C·E·申农(又译为香农) ( C·E·shanon) 在《通
讯的数学理论》认为:“信息是能够用来消除不确定性的东西。”
3、原国际文献联合会副主席,前苏联信息学家A.И.米哈依洛夫认为:
“信息——作为存贮、传递和转换的对象的知识。”
4、英国信息学家B.C.Brookes的定义则认为:“信息是使人原有的知
识结构发生变化的那一小部分知识。”并采用公式描述:
K(S)+△I=K(S+△S) 其中
K(S)——原有知识结构(knowledge structure)
K(S+△S)——改变后的知识结构(changed knowledge structure)
△I——信息增量(information addition)
这些定义从不同的角度阐明了信息的概念,不管
是从通讯的角度、从知识的角度、还是从数据的
角度进行描述,都是建立在以人及人的认识的基
础上的,属于狭义的信息定义。
在此基础上,一些学者拓展了信息的主体。如我
国信息论专家钟义信教授进一步从信息本题出发,
对信息的概念作出了广义的定义:
信息——是事物运动的状态和(状态改变的)方
式。(如万有引力现象、地震预兆、电磁波、声
波、日蚀、月蚀等)
二、信息的特征
第一,普遍性与绝对性。存在
第二,特殊性与相对性。价值
第三,可共享性。
第四,可识别性。
第五,可转换性。
第六,可存贮性。
第七,可传递性。
第八,表征性。
第九,动态性。
信息、文献、知识与情报
信
息
有 情
用 报
的
信
息
文献
知
识
三、信息的类型
1、广义的信息的分类
(1)人类社会信息
(2)非人类社会信息(自然信息)
2、狭义的信息的分类
(1)按信息的功能分
军事信息
政治信息
经济信息
科技信息
社会文化生活信息等等。
(2)按信息的载体分:
文字信息
声像信息
实物信息
多媒体信息
(3)按应用范围(流通范围)分:
公开信息
内部信息
秘密信息
第二节 信息源简介
一、信息源的概念和类型
(一)概念:UNESCO认为,个人为满足其信息需
要而获得信息的来源,称为信息源。指产生(或
汇集)信息并提供传递信息可能性的系统(既包
含信息的有形载体,也包含无形的载体或人们的
某种交往活动,汇集了交往信息、文献信息、实
物信息等多种形式的可资利用的信息)。任何运
动着的事物都可以产生信息,都可以成为信息源。
信息从信息源发出,以物质和能量为媒介,超越
空间和时间传送到接收者那里,这就是信息传递。
信息源的类型
(二)类型:按信息存在的形式,信息源可分为:
1、文献信息源:储存在纸张、胶片、磁介质和
光盘等载体上的信息源。包括图书、报刊、会
议文献、专利、标准、产品样本及说明书、政
府文献、统计资料(包括相应的各种电子出版
物)、各种数据库等。
2、非文献信息源:包括交往信息源、实物信息
源(自然物,人工制品,事物发生的现场 )等。
信息源与信息资源
信息源不等于信息资源。在时间序列上,信息源
是信息资源的源,是先于信息资源的。从信息的
开发利用上,信息源可以不断的转化为信息资源。
信息资源:是经过加工处理有序化并大量积累起
来的有用信息的集合
狭义信息资源是指信息本身。是可利用的信息的集合
(有用的数据和资料)。
广义信息资源是信息活动中各种要素(信息本身、技
术、设备、资金和人)的总称。指人类社会信息活动
中积累起来的以信息为核心的各类信息活动要素(信
息技术、设备设施、信息生产者等)的集合。
信息资源的类型
一般根据现代与传统的区别,信息资源可以分成
两大类,即文献型信息资源和数字化(电子化)
信息资源。
文献型信息资源就是传统的文献资源, 包括刻写型、
印刷型、缩微型和视听型信息资源。
数字化信息资源按其传播利用方式分为网络信息资源
与单机型信息资源2 种。
网络信息资源根据使用形式可以分为联机检索信息资源和因特
网信息资源;
单机型信息资源一般仅存储在个人计算机上, 但不在网络上
传输,因此又叫机读资料。
数字化信息资源的类型
数字化信息资源的根据其内容表现形式, 可以分
为文本型信息资源、数值型信息资源、事实型信
息资源和多媒体信息资源等。
文本型信息资源以文本方式存在的信息资源;
数值型信息资源最具代表性的便是统计数据, 经济类
学科和专业的用户对此需求很大;
事实型信息资源一般是三次文献,如百科全书型、字
词典等;
多媒体信息资源是由文本、图片、图像、声音、视频
等多种媒体的集成,如视频数据库、图片数据库等。
数字化信息资源的特点
1、组织形式发生变化:由传统的文本、线性,发展成超文本、
超媒体等多种形式,并组成相互联系、非线性的网状结构
2、数字化:存储密度高,容量大。
3、内容丰富多样:从文字、图表到多媒体信息,文献类型多
样,涉及领域宽广。
4、数据具有通用性、开放性、动态性
5、信息资源体积小、数量大
6、传播方式的无限性,不受时间、空间限制
7、检索功能强大,使用方便、快捷。
文献型信息源及其信息特征
文献是在空间和时间上积累和传播信息的最有效的手段,
是获取信息的最基本、最主要的来源。文献信息源是人们
获取全面系统的信息的主要保障。
文献的功能:1)存贮知识的功能;2)传递和交流信息的功
能;3)保存知识的功能。
从检索结果要获取原始文献,就必须知道文献来源,我们
可以用代表文献特点的检索标识(一般是缩写)确定该文献
来源于图书、期刊、会议文献或科技报告等。
著录(Description)就是编制文献目录时,对文献内容和形
式特征进行分析、选择和记录的过程。它将有关某一文献
的基本信息摘录下来,供人们间接地了解、识别该文献。
文献的概念
文献——国家标准局颁布的《文献著录总则》将
文献定义为“记录有知识的一切载体”。就是指用
文字、图形、符号、声频、视频等手段记录下来
的人类知识。也可称为固化在一定载体上的知识。
科技文献是科技成果的最终表达形式。它凝聚着
无数有用的事实、数据、理论方法、构想和设想
等,反映着一定时代、一定社会条件下科技的进
展和水平,预示着未来的发展趋势和方向。
文献要素
信息内容:文献中所表达的思想意识和知识观念。
信息符号:符号系统是揭示文献信息内容的标识,表
达知识情报的手段,记录和传播文献信息内容的媒介。
文献信息符号主要是从语言不断衍化而来的,并逐步
发展为文字、图画、表格、公式、编码、声频和视频
等类型。
记录方式:是指将文献符号系统所代表的信息内容通
过特定的人工记录手段和方法使其附着于一定的文献
载体材料上。文献记录方式具体包括刻划、书写、印
刷、拍摄、录制、复印和计算机录入等。
载体材料:是可供记录信息符号的物质材料。
文献是物化的精神产品,或者说,文献是知识信
息的物化形态。其中:
信息内容是文献的知识内核
载体材料是文献的存在形式和外壳
符号系统和记录方式则是二者联系的桥梁和纽带。
这4个要素相互联系就构成了文献的四维框架结构。
文献的类型
1、内容加工深度(文献级别)
零次文献、一次文献、二次文献、三次文献
(1)零次文献:是指未经过任何加工的原始文献。如:
私人笔记、底稿、手稿、个人通信、新闻稿、工程图
纸、考察记录、实验记录、调查稿、原始统计数字、
原始录音、原始录像、谈话记录等。零次文献在原始
文献的保存、原始数据的核对、原始构思的核定(权
利人)等方面有着重要的作用。
特点:是信息来源直接真实, 内容新颖。但不成熟,
不公开交流,难以获得。
(2)一次文献:以作者本人取得的成果为依据而创作的以
论文、报告等形式公开发表或出版的各种文献,习惯上称
做原始文献。如:期刊论文、学术论文、学位论文、科技
报告、会议论文、专利说明书、阅读性图书、技术档案、
技术标准等。一次文献是人们学习参考的最基本的文献类
型,也是最主要的文献情报源。是产生二、三次文献的基
础,是文献检索和利用的主要对象。
特点:在形态上具有多样性,在内容上具有原创性,在出
处上具有分散性。内容新颖丰富,叙述具体详尽,参考价
值大,但数量庞大、分散。
确定一篇文献是否一次文献,主要是根据其内容性质,而
不是根据其物质形式(如载体、语种、出版形式等),只
要是作者根据自己的科研成果而发表的原始创作,都属于
一次文献。
(3)二次文献:按一定的方法对一次文献进行搜集、提炼、
浓缩、加工、整理,以使之有序化而形成的文献。是为了
更有效地管理和利用一次文献而编辑的工具性文献。主要
包括目录、索引、文摘及机读型书目数据库、网上检索引
擎等都属于二次文献。二次文献以不同的深度揭示一次文
献,其主要功能是检索、通报、控制一次文献,帮助人们
在较少时间内获得较多的文献信息。
特点:二次文献中的信息是对一次文献信息进行加工和重
组而成,并不是新的信息,具有汇集性、工具性、综合性、
系统性、交流性和检索性的特点。提供的文献线索集中、
系统、有序。
(3)三次文献——根据二次文献提供的线索,选用大量一
次文献的内容,经过筛选、分析、综合和浓缩而撰写的文
献。主要包括三种类型:
综述研究类:综述、述评、年度进展报告、信息预测、
未来展望等;
参考工具类:年鉴、手册、百科全书、词典、大全等;
文献指南类:专科文献指南、索引与文献服务目录、
书目之书目、工具书目录等。
特点:文字精炼、叙述简明扼要,在内容上具有综合性
和知识性,在功效上具有参考性和工具性。
2、内容公开程度(流通范围):
白色文献(公开文献)、灰色文献(内部文献)、黑色文
献(秘密文献)。
(1)白色文献:一切正式出版并在社会上公开流通的文献。包括图
书、报纸、期刊等。这类文献通过出版社、书店、邮局等正规的
渠道公开发行,向社会所有成员公开,其蕴涵的信息大白于天下,
人人均可利用。
(2)灰色文献:非公开发行的内部文献和限制流通的文献。包括社
会公开传播的内部刊物、内部技术报告、内部教材和会议资料等。
这类文献出版量小、发行渠道复杂、流通范围有一定限制,不易
收集。
(3)黑色文献:包括两个方面,一是人们未破译和未辨识其中信息
的文献,如考古发现的古老文字未经分析厘定的文献;二是处于
保密状态和不愿公布其内容的文献,如未解密的政府文件、内部
档案、个人日记、私人信件等。这类文献除作者及特定人员外,
一般社会成员极难获得和利用。
3、内容与专业相关程度
根据相对利用率的多少,我们把与一个学科有关
的文献分成核心文献、相关文献、边缘文献。
(1)核心文献是指与本学科发展水平、发展动向密
切相关的一些文献。
(2)相关文献和边缘文献是指所含内容与学科的关
系相对疏远一些的文献。
4、载体类型
书写型文献
印刷型文献
缩微型文献
声像型文献
电子型文献
5、按出版形式:
连续出版物(期刊、报纸)、图书、科技报告、
会议文献、标准文献、专利文献、学位论文、政
府出版物、产品资料、档案文献等。这十种文献
被人们称为十大文献信息源。其中除图书、期刊
外的其它类型文献又统称为特种文献。
十大科技文献信息源简介
是指人们在进行科研及技术工作时使用频率比较高的
十种情报来源的总称
(一)期刊(Journal杂志;Transaction汇刊;Acta学报;
Periodical期刊)
1、类型
(1)按出版周期:周刊、双周刊、半月刊、月刊、双月刊、
季刊、半年刊、年刊等。
(2)按报道范围:综合性期刊、专业性期刊
(3)按内容、性质和用途:学术性、技术性期刊;检索性
期刊;通讯性期刊;评述性期刊;数据资料性期刊。
2、期刊的特点和作用
与图书相比,期刊出版周期短,发表文章快;内容新颖,
能迅速反映国内外的各种学科专业的水平和动向;品种多,
数量大;内容涉及领域广泛;作者队伍及读者队伍均非常
庞大。占阅读量的70%。是获取信息的最主要的信息源。
期刊中记载和传递的多属理论性、探讨性的信息。
期刊的著录:刊名(一般用缩写)、出版年月、卷、期、起
止页码等。
期刊论文的著录:篇名、作者、出处(刊名、卷号、期号、
起止页码、出版年)、国际标准刊号
期刊的识别:卷号或期号(vol. no or v. n);刊名缩写(如
PE&RS);ISSN号(8位)
3、核心期刊——对某学科或专业领域而言,登载该
学科或专业大量相关论文的少数权威性期刊,称
为该学科或专业的核心期刊。
根据B.C.Brookes等人的研究,一个学科或专业领
域的核心期刊一般占该领域相关期刊总量的10%
左右,但这些核心期刊所提供的相关文章数却占
相关文章总数的50—60%。因此,科学地确定和
利用核心期刊是非常重要的,可以节省时间和精
力。
检索期刊论文的数字资源系统
中文:
中国知网《中国学术期刊数据库》
重庆VIP《中文科技期刊数据库》
北京万方《中国学术期刊数据库》
外文:
EBSCO外文期刊数据库
Springer外刊数据库
ASME期刊数据库
ASCE期刊数据库
ieee CS
SCOPUS((文摘)等
(二)图书
1、种类。图书按其内容和用途可划分为如下几类:
(1)专著:是针对某一主题分章列节地作深入系统的全面论述的科学著作。
(2)教科书:是适应教学需要,针对某种教学大纲编写的主要用于教学的
图书。高校用的某些专业教科书就内容而言接近于专著。
(3)丛书:是在一个总书名下,汇集多种单行本图书成为一套,并以编号
或不编号方式出版的图书。其中每一单本都是一部独立完整的书。在内
容上,每套丛书围绕一个中心题目或具有某些共同特征,但彼此并无内
在联系。
(4)参考工具书:是在大量一次文献或原始信息基础上,经过进一步比较
分析,精心提炼,综合而成的高度浓缩的、精确的特定信息的集合事实
和数据性信息的集合。主要包括百科全书、年鉴、手册、字典、词(辞
典)、地图集等。
图书从使用的角度可分为两类:一是为了求知或者欣赏;二是为了查
阅特定的资料或遇到疑难需要解决时,才去翻阅或引用的书。
2、特点和作用
与期刊相比,图书所论述的内容一般比较系统、全面、成
熟、可靠,也有涉及面广,品种多,出版量大、作者群与
读者群大等特点。但编撰和出版的周期较长,内容相对滞
后,传递情报的速度较慢。图书同样也是日常使用广泛的
基本的传播信息的手段。参考图书资料有助于人么对范围
较广的问题获得一般的知识,或对陌生的问题获得初步的
了解,内容一般只反映一至二年以前的研究成果。
图书的著录项目包括书名、著者,出版项(出版地、出版
社、出版年)、总页码等。
图书的识别主要依据出版项(出版地、出版社、出版年)、
ISBN(10位)、总页码(PP or P)等著录项。
检索图书的数字资源系统
中文:
超星数字图书馆
方正Apabi数字资源平台
中国知网中国年鉴网络出版总库
中国知网中国工具书网络出版总库
外文
Springer Ebooks
IET ebooks
(三)会议文献
1、类型
(1)按文献产生的时间,可分为:会前出版物,会后出版物
(2)按出版形式,分:
A、期刊类:在期刊的某一期中刊载,或作为某刊物的特辑或专
辑出版。
B、专题性论文集:汇编成册,有一个专门书名,一图书形式出
版。占大多数。
C、连续性会议文献:以定期或不定期连续出版物形式出版。有
的按会议的届次顺序出版,直接以会议主题名称作为出版物名
称;有的则由某学术机构(一般是会议的主持者或召开者)以
丛书、丛刊形式出版。此类会议文献一般都是在级别比较高,
有比较权威或知名的机构组织主持召开的会议上选定的文献。
(3)以系统性科技报告形式出版
2、特点和作用
一般代表一门学科或专业的最新研究成果,反映国内外发
展水平和趋势,内容新,发表快。在传播交流信息方面
(尤其是对通行之间的信息交流与沟通沟通)具有特定的
重要作用。
著录:论文名称、著者和著者工作单位;会议录名称、会
议地点、会议时间;会议录出版情况,论文页码。
识别:会议录名称、会议地点、会议时间、会议届次。
会议录名称常含有: meeting (会议) 、congress(大会)、
conventionsymposium(专题讨论会)、workshop(专题学术讨
论会)、seminar(学术研讨会)、conference(学术讨论会)
colloquium(学术讨论会)、proceedings(会议录)
检索会议论文的数字资源系统
中文
北京万方中国学术会议论文全文库
北京万方西文会议论文全文库
中国知网中国重要会议论文全文数据库
中国知网国际会议论文全文数据库
超星发现系统
外文
ASCE会议录数据库
超星发现系统
(四)科技报告
1、类型。按产生过程和形式,分
(1)报告书(R):研究结束后产生的较为正式的文件。
(2)札记(N):研究过程中的临时性记录或小结,往
往是撰写报告书的素材。
(3)论文(P):打算在会议上或刊物上发表的文章,
一般是报告的一个部分。
(4)备忘录(M):供同一专业或机构内部研究人员之
间沟通情况的材料。
(5)通报(B):一般是对外公布的内容成熟的摘要性
材料。
2、特点和作用
研究内容专深具体,层次水平高,往往涉及尖端学科的最新研究领域;
成文叙述详尽,数据完整;时滞短;是科研人员的重要参考资料,具
有很高的信息利用价值。理论性强,但保密性强,难以获取。一般都
编有号码,供识别报告本身及其发行机构 ,报告是一种典型的机关
团体出版物。科技报告的流通范围有绝密、秘密、保密、非密限制发
行、非密、解密等
著录:篇名;著者和著者工作单位;报告号;出版年月
识别:根据报告号
Report:研究报告
PR(progress report)进展报告
AR(annual report)年度报告
FR(final report)年终报告
CR(contract report)合同报告
TR(technical report)技术报告
检索技术成果的数字资源系统
中文:
北京万方数据知识服务平台
超星发现系统
中国科技项目创新成果鉴定意见数据库(知网版)
外文
超星发现系统
国道外文专题数据库
重庆尚唯科技报告资源服务系统
(五)标准文献
1、类型
(1)按使用范围
A、国际标准:如ISO、IEC等。
B、区域性标准:如CEN(欧洲标准化委员会)、ABC(美英加工程
标准同意化会议标准)、ASMO(阿拉伯标准化与计量组织标准)
等。
C、国家标准:如GB、JIS(日本工业标准)
D、专业(部)标准:如JB、JC、ASTM(美国材料与试验协会标准)
等、SGMA(日本齿轮学会标准)等。
E、企业标准:如Q/HB(沈阳标准件厂标准)、SPO(美国通用电器
公司标准)、BMS、PECR(美国波音飞机公司标准)等。
(2)按内容分
A、基础标准:如名词术语、符号、代码、计量单位、机
械制图等方面的标准
B、产品标准:对产品质量、规格做的同意规定。
C、方法标准:对试验、检验、分析、测定方法和产品验
收规则的标准。
(3)按成熟程度分:
A、正式标准
B、试行标准
C、推荐标准
D、标准草案
2、特点和作用
(1)特点:约束性;计划性和协调性;明确的使用范围;
可靠性和显示可行性;规范标准的编制和编排格式;严谨
的撰写叙述方法。但时滞较长,一般难以涉及最新的产品
和技术。标准一般过若干时间就要进行修订, 新的标准不
断地替代旧的标准。因此,查阅时应以最新标准为准。
(2)作用:是工程建设、产品生产和检验中必不可少的重
要依据,是一种特殊的重要的信息源。
著录:标准制定单位、标准题目、表示标准的词,如
standard、recommendation等;标准号。标准号由标准颁布
机构代码、顺序号和颁布年份三部分组成。如ANSI TI601-1988
识别:标准号
检索标准文献的数字资源系统
中文
超星发现系统
北京万方中外标准数据库(题录)
中国知网国家标准全文数据库
中国知网中国行业标准全文数据库
中国知网国内外标准题录数据库
外文
超星发现系统
国道外文专题数据库
北京万方中外标准数据库
中国知网国内外标准题录数据库
(六)学位论文(Dissertation):
1、类型:学士论文、硕士论文、博士论文
2、特点和作用:博硕士学位论文探讨的问题较为专
深,阐述较系统详尽,具有一定独创性,一般都
具有非卖品、不发行和报道的特点。既是撰写者
学业考评的重要依据和记录,也对科研生产的相
关领域具有重要的借鉴作用。
著录:论文名称;著者;学位;授予学位的大学名称;
时间、论文页码;导师或答辩委员会顾问的姓名。
识别方法:学位名称、大学名称。如“dissertation”、
“thesis”。
检索学位论文的数字资源系统
中文
北京万方博硕士论文全文库
中国知网中国博士论文数据库
中国知网中国优秀硕士论文数据库
外文
超星发现系统
国道外文专题数据库
PQDT(ProQuest Dissertations & Theses)
(七)政府出版物
1、类型:按其性质,大体可分行政性文件和科技性文件两
类。行政性文件包括国会记录、政府法令、方针政策、规
章制度、决议指示、调查统计资料等;科技性文件主要包
括政府各部门科技研究报告、科普材料、技术政策文件等,
科技性文献在列入政府出版物前,往往已由所在单位出版
过,因此它与其他科技文献有一定重复。
2、特点和作用:其典型特点是具有政策指导性和约束性,
它所包含的技术内容往往滞后于科技报告、专利等文献。
对了解某一国家的科技和经济政策及其演变情况,具有参
考作用。
检索政府出版物的数字资源系统
中文
北京万方中国法律法规全文数据库
超星发现系统
中国知网中国法律知识资源总库法律法规库
中国知网中国经济社会发展统计数据库
外文
超星发现系统
国道外文专题数据库
(八)产品资料(产品样本)
1、类型:
(1)各厂商的出版物。包括产品目录、单项产品样本、产品说明说、企
业介绍和广告性厂刊等。
(2)各协会或行会、出版社等的出版物,包括单项产品样本汇编、全行
业产品一览表及工业展览会目录等。
2、特点和作用:介绍的是已投产和推销的产品,反映的技术较为可靠成
熟;图文并茂,直观形象,数据资料丰富具体,便于识别和参考利用;
时间性强,出版迅速,免费赠送,便于收集。能从一定程度上反映同
类产品的技术水平和发展动向。能从一定程度上反映同类产品的技术
水平和发展动向。产品样本既是厂商推销产品的重要手段,也是人们
了解厂商及其产品的重要工具,而且从技术上讲,对选型、设计、研
制、外貌和技术引进等工作都有较大参考价值
检索产品资料的数字资源系统:尚唯产品样本数据库
(九)档案文献
1. 类型
(1)从档案形成领域的公、私属性角度分类:公务档案和私人档案
(2)从档案形成时间的早晚以及档案作用角度分类:历史档案和现
行档案
(3)从档案内容属性角度分类:文书档案、科技档案、人事档案、
专门档案等
2. 特点和作用:档案是人们在社会实践活动中直接形成的
原始性信息记录,对以往社会实践具有直接的原始记录
作用。档案学一般认为“原始记录性”是档案的本质属性。
具有系统性、完整性等特点,除了作为原始凭证外,在
各类活动中可起参考借鉴作用。
档案一般为内部使用,不公开发行,有些有密级限制,
因此在参考文献和检索工具中极少使用。
(十)专利文献
1、概念
专利文献——是由专利局公布或归档的有关专利的文件
和资料。 invention(发明)、utility patent(实用新型)
和design patent(外观设计)
2、类型
(1)专利说明书
(2)专利分类资料和检索工具书
(3)专利申请档案
3、专利文献的特点
特点
(1)新颖性、独创性、实用性
(2)内容详尽实用,可靠性强
(3)编写格式标准,文字上难懂
(4)融技术、经济、法律信息于一体,具有一定的法律约束性。
专利技术本身是依法具有权属性的,可以转让、买卖、继承等。
识别:有patent;专利国别及专利号。专利国别代码是
由国际标准化组织(ISO)规定的,专利文献由各国专
利局出版发行,因此,无出版地、出版社等项目。
检索专利文献的数字资源系统
中文:
北京万方中外专利数据库
中国专利全文数据库(知网版)
国家知识产权局:http://www.sipo.gov.cn/
外文:
北京万方中外专利数据库
海外专利摘要数据库(知网版)
美国专利商标局http://patft.uspto.gov/
欧洲专利局http://ep.espacenet.com/
第三节:信息检索及其基本原理
一、 信息检索(Information Retrieval)的概念
1、广义概念——是指将信息按一定的方式组织和存
储起来,并根据信息用户的需要找出有关的信息
过程,故全称:“信息的存储与检索(Information
(Information Storage and Retrieval ) 。
2、狭义概念——仅指上述过程的后半部分,即从信
息集合中找出所需要的信息的过程,相当于人们
通常所说的信息查寻(Information Search)
网络环境下的信息检索和原文获取
二、检索的类型
1、按照存储的载体和查找的技术手段进行划分(按检索的手段):
(1)手工检索(Manual retrieval):用人工方式查找所需信息的检
索方式。
检索的对象是书本型的检索工具,检索过程是由人脑和手工操作相
配合完成,匹配是人脑的思考、比较和选择。
(2)机械检索Mechanical retrieval:利用某种机械装置来处理和查
找文献的检索方式。
穿孔卡片检索:Punch card是一种由薄纸板制成的、用孔洞位置表
示信息,通过穿孔或轧口方式记录和存储信息的方形卡片。
缩微品检索:把检索标识变成黑白点矩阵或条形码,存储在缩微胶
片或胶卷上,利用光电效应,通过检索机查找。
(3)计算机检索(computer-based retrieval)是指把信息及其检索
标识转换成电子计算机可以阅读的二进制编码,存储在磁性载体
上,由计算机根据程序进行查找和输出。
三、信息检索的基本原理与检索处理流程分析
信息检索基本原理是以检索语言为基础,将检索提问
标识与存储在检索工具中的标引标识进行比较,两者
一致或信息标引标识中包含提问标识即是命中的信息。
检索语言是标引者与检索者共同使用的语言。
所有的信息检索查询系统都要对所收集存储的信息进
行一定形式的描述(标引和著录),形成供用户查询
的信息集合,信息检索就是在用户信息需求与系统信
息集合之间进行匹配和选择
信息源
信息采集
信息标引
(特征抽取与表示)
信
息
存
储
信
息
检
索
检索辅助工具
创建/更新数据库
及索引文档
用户
检索接口
提问处理
检索匹配
检索系统
数据库
信息检索处理过程流程图
第四节
检索系统概述
一、概念:
根据一定的目标,将有关文献或数据按某种检索
语言进行标引,在特定载体上以一定结构次序组
织起来,并借助于一定工具提供特定检索方式的
系统。
检索系统按某种方式、方法建立起来的供读者查
检信息的一种有层次的体系,是表征有序的信息
特征的集合体。其中二次或三次文献信息是文献
信息系统的核心和概括。
二、特征
1、必须包含对所收录的文献特征(内容特征和外表特征)
的描述;
2、每条描述记录(即款目)都标明有可供检索用的标
识——入口词;
3、全部描述记录科学地组织成一个有机整体——有序化;
4、能提供多种必要的检索手段和途径。
三、检索系统类型
1、按检索手段
(1)手工检索工具。工具书,一般为印刷型。
(2)机械检索工具。借助力学、光学、电子学等手段完
成检索操作。包括机电检索系统(机检穿孔卡)、光
电检索系统、计算机检索系统等,现在机电检索系统
和光电检索系统已基本被淘汰,而计算机检索系统正
逐渐成为检索的主要工具。
2、按出版形式
(1)卡片式
(2)书本式
又可分期刊式(是检索工具的主要品种)、单卷
式(如专题性文摘目录等)、附录式(一般指各
种辅助索引等)。
(3)机读式。光盘版、网络版
计算机检索系统
四、计算机检索系统构成及工作原理
1、逻辑构成:主要指它所包含的功能模块或子系统
及其相互关系
信息源选择与采集子系统
标引子系统
建库子系统
词表管理子系统
用户接口子系统
提问处理子系统
2、物理构成
数据库的一般结构:
数据库是在计算机存储设备上按一定方式存储的相互关联
的数据集合。
字段
记录
文档
数据库
①字段是文献著录的基本单元,反映文献的外部特征和内容
特征的每一个项目。
【中文题名】 XML语言及其应用
【英文题名】XML LANGUAGE AND ITS APPLICATION
【作
者】黄婉秋;黄筱霞;贾旭光
【作者单位】北京工商大学,计算机学院,北京,100037;北京工商大学,计
一个字段
算机学院,北京,100037;北方交通大学,计算机学院,北京,100044;
【刊
名】北京工商大学学报(自然科学版)
【英文刊名】JOURNAL OF BEIJING TECHNOLOGY AND BUSINESS
UNIVERSITY(NATURAL SCIENCE EDITION)
【年 卷 期】2002 Vol.20 No.3
【关 键 词】XML; HTML; Web页面语言; 置标语言
【摘
要】简要阐述了XML语言的概念及特点,对它的语言结构进行了
详细的分析,包括DTD、XSL、 XLL三部分.并将XML和HTML进行了比较,同
时也对它和数据库之间的关系进行了描述.最后论述了XML的 发展与前景.
②记录是由若干不同字段组成的文献单元,在数据库中
每一个记录都有一个记录号。
一条记录
③文档由若干逻辑记录组成的信息集合。
文档