信息检索与利用 - 青岛理工大学图书馆

Download Report

Transcript 信息检索与利用 - 青岛理工大学图书馆

信息检索与利用
贾芳华
图书馆信息部
TEL:85071729
QQ:149552480
EMAIL:[email protected]
2015年7月17日
Papers,printing
born digital,e-publish,e-only
e-reading,e-learning,net surf
不知道有哪些可以利用的信息资源;
不知道从哪里可以获取和利用信息资源;
不知道如何去获取和利用信息资源;
获取的信息资源总是不符合自己的需求;
信息爆炸,不知道怎么筛选有价值的信息资源;
……
资源获取途径
传统模式
图书馆借阅
网上直接下载
网络模式
网上全文传递
信息检索
图书、工具书
信息资源
获取渠道
多种多样
互联网(门户网站、
专业网站、搜索引擎)
论文(期刊论文、
会议论文、学位论文)
专业信息服务机构
大众传媒(广播、
电视、报纸)
各种综合、专业数据库
有效的信息
检索是提高
学习与研究
效率的捷径
检索课是知识时代培养学生终身所需的信息意识
与获取文献信息能力的重要课程,是一门科学方
法课。对学生不断吸取新知识,改善知识结构,
有着重要的意义。
检索课的意义
继承和借鉴前人成果,避免重
复研究
掌握信息检索技术,节省信息
搜索的时间
信息检索是科研活动的重要组
成部分
科研选题、立项、结题
撰写报告
9%
思考计划
8%
科学实验
32%
查阅文献
51%
本课程教学内容与要求
课程重点要求:
了解图书馆现有电子资源(各类数据库收录范围和类型)
信息检索基础:信息源、检索工具类型、机检基础
典型数据库系统的使用方法
网上免费资源的获取等
文献信息与学术论文写作
通过本课程的学习,希望学生能够掌握信息检索
的基础知识、基本原理和基本技能,较为熟练地
利用图书馆各种网络学术数据库来检索、获取学
习中所需的文献信息;掌握一定的文献阅读、整
理和分析研究的基本方法和技能,具备初步的科
学研究方法与研究论文的写作能力。
信息
知识
文献
检索系统
第一章
第一节
第二节
第三节
第四节
信息检索基础
信息概述
信息源简介
信息检索的基本原理
检索系统概述
第一节
信息概述
美国哈佛大学的研究小组提出了著名的资源三角
形:没有物质,什么也不存在;没有能量,什么
也不会发生;没有信息,任何事物都没有意义。
物质、能量、信息共同构成现实世界的三大要素。
一、信息的概念
1、控制论创始人N·维纳(N·Veinner)在《控制论和社会》一书中定
义为:“信息就是信息,既不是物质,也不是能量,信息是我们在
适应外部世界并使这种适应为外部世界所感到的过程中,同外部
世界进行交换的内容的全称。”
2、信息论创始人C·E·申农(又译为香农) ( C·E·shanon) 在《通
讯的数学理论》认为:“信息是能够用来消除不确定性的东西。”
3、原国际文献联合会副主席,前苏联信息学家A.И.米哈依洛夫认为:
“信息——作为存贮、传递和转换的对象的知识。”
4、英国信息学家B.C.Brookes的定义则认为:“信息是使人原有的知
识结构发生变化的那一小部分知识。”并采用公式描述:
K(S)+△I=K(S+△S) 其中
K(S)——原有知识结构(knowledge structure)
K(S+△S)——改变后的知识结构(changed knowledge structure)
△I——信息增量(information addition)
这些定义从不同的角度阐明了信息的概念,不管
是从通讯的角度、从知识的角度、还是从数据的
角度进行描述,都是建立在以人及人的认识的基
础上的,属于狭义的信息定义。
在此基础上,一些学者拓展了信息的主体。如我
国信息论专家钟义信教授进一步从信息本题出发,
对信息的概念作出了广义的定义:
信息——是事物运动的状态和(状态改变的)方
式。(如万有引力现象、地震预兆、电磁波、声
波、日蚀、月蚀等)
文献与信息的关系
文献
信
息
二、信息的特征
第一,普遍性与绝对性。存在
第二,特殊性与相对性。价值
第三,可共享性。
第四,可识别性。
第五,可转换性。
第六,可存贮性。
第七,可传递性。
第八,表征性。
第九,动态性。
三、信息的类型
1、广义的信息的分类
(1)人类社会信息
(2)非人类社会信息(自然信息)
2、狭义的信息的分类
(1)按信息的功能分
军事信息
政治信息
经济信息
科技信息
社会文化生活信息等等。
(2)按信息的载体分:
文字信息
声像信息
实物信息
多媒体信息
(3)按应用范围(流通范围)分:
公开信息
内部信息
秘密信息
(4)按加工层次分:
零次信息
一次信息
二次信息
三次信息
四、信息的价值评价
1、有价值的信息应具备的条件
有价值的信息是在特定的问题和状态中被利用并有效发挥其功能的信
息,是实现某种目标所需要的知识,是进行决策判断所必须的资料。
有价值的信息必须具备及时性、准确性、综合性、获取简易性和经济
性等特性。
具体的说,有价值的信息应具备如下条件
(1)能够及时地以适当的方式提供解决问题所需要的依据;
(2)符合需求;
(3)可信赖度高
(4)具有综合性
(5)容易获取;
(6)费用与目标吻合
2、有价值的信息的评价指标
(1)信息源的选择评价
对于通过一般的信息搜集活动得到的信息,首先
必须确定它是通过哪种信息载体、从什么样的信
息源获得的,其次还要评价信息发生的意图和可
靠性。
(2)信息准确度的比较评价
A、第一种角度包括下面三种方法
从不同的信息源获得同一性质的信息,对这些信
息进行比较;
定期地、系统地搜集信息,调查过去同种信息是
否出现并和新获取的信息进行比较评价;
从多种信息源搜集、分析同种信息和相关信息,
与切题的信息进行比较评价。
B、第二种角度是从信息六要素出发评价信息的准确度
任何信息都包含六个要素:即常说的“5W1H”
内容(what)
原因(why)
时间(when)
地点(where)
人(who)
方法、途径、状况(how)
对信息进行比较评价时,要把信息分解成上述六个方面。
(3)信息的经济性评价
信息的搜集、分析、加工、利用需要人力、财力、时间。
由于信息分布的广泛性和信息利用的时效性之间的矛盾,
信息搜集受到约束和限制。一般都要求迅速准确廉价的获
得所需信息。但是对于迫切需要的信息,有时也不惜高价。
企业利用信息时,信息的经济性是一个重要的影响因素。
为了经济有效的搜集信息,可以从下面几个方面出发来评
价信息:
A、所需信息的存在率评价。调查有关的信息源、载体是否存在,如
果存在,要用什么方法从什么途径获得,评价获取的难易程度。
B、所需信息适合率的评价。评价获取的信息与所需信息的内容吻合
程度。
C、所需信息的可靠性评价。对于二次信息和三次信息,应评价其性
质、加工深度。是否能获得证明性信息以确认其可靠性。
第二节 信息源简介
一、信息源的概念和类型
(一)概念:UNESCO认为,个人为满足其信息需
要而获得信息的来源,称为信息源。指产生(或
汇集)信息并提供传递信息可能性的系统(既包
含信息的有形载体,也包含无形的载体或人们的
某种交往活动,汇集了交往信息、文献信息、实
物信息等多种形式的可资利用的信息)。是人们
借以获取信息的来源。任何运动着的事物都可以
产生信息,都可以成为信息源。信息从信息源发
出,以物质和能量为媒介,超越空间和时间传送
到接收者那里,这就是信息传递
(二)类型:按信息存在的形式,信息源可分为:
1、文献信息源:储存在纸张、胶片、磁介质和光盘等
载体上的信息源。包括图书、报刊、会议文献、专利、
标准、产品样本及说明书、政府文献、统计资料(包
括相应的各种电子出版物)、各种数据库等。
2、非文献信息源:包括交往信息源、实物信息源(自然
物,人工制品,事物发生的现场, )、广播电视信
息源、网络信息源等。
信息源不等于信息资源。在时间序列上,信息源
是信息资源的源,是先于信息资源的。从信息的
开发利用上,信息源可以不断的转化为信息资源。
信息资源:是经过加工处理有序化并大量积累起
来的有用信息的集合
狭义信息资源是指信息本身。是可利用的信息的集合
(有用的数据和资料)。
广义信息资源是信息活动中各种要素(信息本身、技
术、设备、资金和人)的总称。指人类社会信息活动
中积累起来的以信息为核心的各类信息活动要素(信
息技术、设备、设施、信息生产者等)的集合。
一般根据现代与传统的区别,信息资源可以分成
两大类,即文献型信息资源和数字化(电子化)
信息资源。
文献型信息资源就是传统的文献资源, 包括刻写型、
印刷型、缩微型和视听型信息资源。
数字化信息资源可以分为网络信息资源与单机型信息
资源2 种。
网络信息资源根据使用形式可以分为联机检索信息资源和因特
网信息资源;
单机型信息资源一般仅存储在个人计算机上, 但不在网络上
传输,因此又叫机读资料。
数字化信息资源的内容根据其表现形式, 可以分
为文本型信息资源、数值型信息资源、事实型信
息资源和多媒体信息资源等。
文本型信息资源以文本方式存在的信息资源;
数值型信息资源最具代表性的便是统计数据, 经济类
学科和专业的用户对此需求很大;
事实型信息资源一般是三次文献,如百科全书型、字
词典等;
多媒体信息资源是由文本、图片、图像、声音、视频
等多种媒体的集成,如视频数据库、图片数据库等。
数字信息资源的特点:
1、组织形式发生变化:由传统的文本、线性,发展成超文本、超媒体
等多种形式,并组成相互联系、非线性的网状结构。
2、数字化:存储密度高,容量大。
3、内容丰富多样:从文字、图表到多媒体信息,文献类型多样,涉及
领域宽广。
4、数据具有通用性、开放性、动态性
5、信息资源体积小、数量大
6、传播方式的无限性,不受时间、空间限制
7、检索功能强大,使用方便、快捷。
二、文献信息源及其信息特征
文献是在空间和时间上积累和传播信息的最有效的手段,
是获取信息的最基本、最主要的来源。文献信息源是正式
是人们获取全面系统的信息的主要保障。
文献的功能:1)存贮知识的功能;2)传递和交流信息的功
能;3)保存知识的功能。
从检索结果要获取原始文献,就必须知道文献来源,我们
可以用代表文献特点的检索标识(一般是缩写)确定该文献
来源于图书、期刊、会议文献或科技报告等。
著录(Description)就是编制文献目录时,对文献内容和形
式特征进行分析、选择和记录的过程。它将有关某一文献
的基本信息摘录下来,供人们间接地了解、识别该文献。
我们分别对不同类型文献的定义、著录特征及其识别方法
进行讲述。
(一)文献的概念
文献——国家标准局颁布的《文献著录总则》将文献定义
为“记录有知识的一切载体”。就是指用文字、图形、符号、
声频、视频等手段记录下来的人类知识。也可称为固化在
一定载体上的知识。
科技文献是科技成果的最终表达形式。它凝聚着无数有用
的事实、数据、理论方法、构想和设想等,反映着一定时
代、一定社会条件下科技的进展和水平,预示着未来的发
展趋势和方向。
文献要素:人们认识文献的关键
信息内容:文献中所表达的思想意识和知识观念。它是文献的内
涵、灵魂之所在,直接体现了文献精神产品的性能,具有知识和
情报价值。
信息符号:符号系统是揭示文献信息内容的标识,表达知识情报
的手段,记录和传播文献信息内容的媒介。文献信息符号主要是
从语言不断衍化而来的,并逐步发展为文字、图画、表格、公式、
编码、声频和视频等类型。
记录方式:是指将文献符号系统所代表的信息内容通过特定的人
工记录手段和方法使其附着于一定的文献载体材料上。文献记录
方式具体包括刻划、书写、印刷、拍摄、录制、复印和计算机录
入等。
载体材料:是可供记录信息符号的物质材料,是全部信息载体中
一个重要的子系统。文献载体反映了文献物质产品的性能,具有
商品、保存和流通价值。文献载体大体经历了泥板、纸草、羊皮、
蜡板、甲骨、金文、石头、简牍、缣帛等早期载体,到纸的出现,
再到现代各种新兴文献的发展过程。
文献是物化的精神产品,或者说,文献是知识信
息的物化形态。其中,信息内容是文献的知识内
核,载体材料是文献的存在形式和外壳,而符号
系统和记录方式则是二者联系的桥梁和纽带。这4
个要素相互联系就构成了文献的四维框架结构。
(二)文献的类型
1、内容加工深度(文献级别)
零次文献、一次文献、二次文献、三次文献
(1)零次文献:是指未经过任何加工的原始文献。如:
私人笔记、底稿、手稿、个人通信、新闻稿、工程图
纸、考察记录、实验记录、调查稿、原始统计数字、
原始录音、原始录像、谈话记录等。零次文献在原始
文献的保存、原始数据的核对、原始构思的核定(权
利人)等方面有着重要的作用,其特点是信息来源直
接真实, 内容新颖。但不成熟,不公开交流,难以获
得。
(2)一次文献:以作者本人取得的成果为依据而创作的论
文、报告等经公开发表或出版的各种文献,习惯上称做原
始文献。如:期刊论文、学术论文、学位论文、科技报告、
会议论文、专利说明书、阅读性图书、技术档案、技术标
准等。一次文献是人们学习参考的最基本的文献类型,也
是最主要的文献情报源。是产生二、三次文献的基础,是
文献检索和利用的主要对象。其主要特点是
特点:在形态上具有多样性,在内容上具有原创性,在出
处上具有分散性。内容新颖丰富,叙述具体详尽,参考价
值大,但数量庞大、分散。
确定一篇文献是否一次文献,主要是根据其内容性质,而
不是根据其物质形式(如载体、语种、出版形式等),只
要是作者根据自己的科研成果而发表的原始创作,都属于
一次文献。
(3)二次文献:按一定的方法对一次文献进行搜集、提炼、
浓缩、加工、整理,以使之有序化而形成的文献。是为了
更有效地管理和利用一次文献而编辑的工具性文献。主要
包括目录、索引、文摘及机读型书目数据库、网上检索引
擎等都属于二次文献。二次文献以不同的深度揭示一次文
献,其主要功能是检索、通报、控制一次文献,帮助人们
在较少时间内获得较多的文献信息。
特点:二次文献中的信息是对一次文献信息进行加工和重
组而成,并不是新的信息,具有汇集性、工具性、综合性、
系统性、交流性和检索性的特点。提供的文献线索集中、
系统、有序。
(3)三次文献——根据二次文献提供的线索,选用大量一
次文献的内容,经过筛选、分析、综合和浓缩而撰写的文
献。主要包括三种类型:
综述研究类:综述、述评、年度进展报告、信息预测、
未来展望等;
参考工具类:年鉴、手册、百科全书、词典、大全等;
文献指南类:专科文献指南、索引与文献服务目录、
书目之书目、工具书目录等。
特点:文字精炼、叙述简明扼要,在内容上具有综合性
和知识性,在功效上具有参考性和工具性。
2、内容公开程度(流通范围):
白色文献(公开文献)、灰色文献(内部文献)、黑色文
献(秘密文献)。
(1)白色文献:一切正式出版并在社会上公开流通的文献。包括图
书、报纸、期刊等。这类文献通过出版社、书店、邮局等正规的
渠道公开发行,向社会所有成员公开,其蕴涵的信息大白于天下,
人人均可利用。
(2)灰色文献:非公开发行的内部文献和限制流通的文献。包括社
会公开传播的内部刊物、内部技术报告、内部教材和会议资料等。
这类文献出版量小、发行渠道复杂、流通范围有一定限制,不易
收集。
(3)黑色文献:包括两个方面,一是人们为破译和未辨识其中信息
的文献,如考古发现的古老文字未经分析厘定的文献;二是处于
保密状态和不愿公布其内容的文献,如未解密的政府文件、内部
档案、个人日记、私人信件等。这类文献除作者及特定人员外,
一般社会成员极难获得和利用。
3、内容与专业相关程度
根据相对利用率的多少,我们把与一个学科有关
的文献分成核心文献、相关文献、边缘文献。
(1)核心文献是指与本学科发展水平、发展动向密
切相关的一些文献。
(2)相关文献和边缘文献是指所含内容与学科的关
系相对疏远一些的文献。
4、载体类型
书写型文献、印刷型文献、缩微型文献、声像型文献、电
子型文献
(1)书写型文献:载体是竹简、纸张、帛等,人工抄写而成。 例如,
写在竹简、帛等上的古代文献、书法作品、原始记录等
(2)印刷型文献:以纸张为载体的文献。这是一种历史悠久的传统
文献形式,是文献信息传递的主要载体。其优点是传递知识方便
灵活、广泛,保存时间相对较长;缺点是存储密度小,体积庞大。
(3)缩微型文献:以感光材料为载体的文献。如缩微胶卷、缩微平
片等。这类文献的特点是体积小、信息密度高、轻便、易于传递、
容易保存。缺点是使用时必须借助专门的放大设备。
(4)声像型文献:通过特定设备,使用声、光、磁、电等
技术将信息转换为声音、图像、影视和动画等形式,给
人以直观。形象感受的知识载体。如唱片、录音带、录
像带、CD、VCD、DVD、等。声像型文献提供的形象、
声音逼真,宜于记载难以用文字表达和描绘的形象资料
和音频资料。
(5)电子型文献:采用高科技手段,将信息存储在磁盘、
磁带或光盘等一些媒体中,形成的多种类型的电子出版
物。特点时信息存储密度高,存取速度快、具有电子加
工、出版和传递功能。电子出版物包括电子图书、电子
期刊、网络文献信息、光盘数据库等。
5、按出版形式:
连续出版物(期刊、报纸)、图书、科技报告、
会议文献、标准文献、专利文献、学位论文、政
府出版物、产品资料、档案文献等。这十种文献
被人们称为十大文献信息源。其中除图书、期刊
外的其它类型文献又统称为特种文献。
三、十大科技文献信息源简介:
是指人们在进行科研及技术工作时使用频率比较高的
十种情报来源的总称
(一)期刊(Journal杂志;Transaction汇刊;Acta学报;
Periodical期刊)
1、概念。
我国著作权法中规定,期刊是指经国家行政出版机关、国家科委、
中国人民解放军总政治部或省、自治区、直辖市等主管部门批准,
在主办单位所在地的省级出版管理机构登记,领取了登记号的定
期出版的发行物。期刊有固定的名称,有统一的出版形式,有一
定的出版规律,每期刊载不同著者、译者、编者所撰写的论文,
是按一定编号顺序连续出版下去的出版物。
期刊也称杂志,期刊一词,着眼于它的周期性特征;杂志一词,
侧重于它的内容性质的博杂。
2、类型
(1)按出版周期:周刊、双周刊、半月刊、月刊、
双月刊、季刊、半年刊、年刊等。
(2)按报道范围:综合性期刊、专业性期刊
(3)按内容、性质和用途:学术性、技术性期刊;
检索性期刊;通讯性期刊;评述性期刊;数据资
料性期刊。
3、期刊的特点和作用
与图书相比,期刊出版周期短,发表文章快;内容新颖,
能迅速反映国内外的各种学科专业的水平和动向;品种多,
数量大;内容涉及领域广泛;作者队伍及读者队伍均非常
庞大。占阅读量的70%。
期刊是传递科技信息,交流学术思想的最简便、最基本的
手段,是获取信息的最主要的信息源。期刊中记载和传递
的多属理论性、探讨性的信息。
期刊的著录:刊名(一般用缩写)、出版年月、卷、期、起
止页码等。
期刊论文的著录:篇名、作者、出处(刊名、卷号、期号、
起止页码、出版年)、国际标准刊号
期刊的识别:卷号或期号(vol. no or v. n);刊名缩写(如
PE&RS);(3)ISSN号(8位)
4、核心期刊——对某学科或专业领域而言,登载该
学科或专业大量相关论文的少数权威性期刊,称
为该学科或专业的核心期刊。
根据B.C.Brookes等人的研究,一个学科或专业领
域的核心期刊一般占该领域相关期刊总量的10%
左右,但这些核心期刊所提供的相关文章数却占
相关文章总数的50—60%。因此,科学地确定和
利用核心期刊是非常重要的,可以节省时间和精
力。
(二)图书
1、概念
我国著作权法中所指图书,是由国家正式批准的出版单位
出版,标有中国标准书号的出版物。
ISO将书定义为:“49页及49页以上构成一个书单元的文献
(不包括封面和扉页)。”是对某专门知识或某学科进行
系统的论述或概括的一种情报来源。阅读量占到文献总量
的15%左右。
2、种类
图书按其内容和用途可划分为如下几类:
(1)专著:是针对某一主题分章列节地作深入系统的全面论述的科学著作。
(2)教科书:是适应教学需要,针对某种教学大纲编写的主要用于教学的
图书。高校用的某些专业教科书就内容而言接近于专著。
(3)丛书:是在一个总书名下,汇集多种单行本图书成为一套,并以编号
或不编号方式出版的图书。其中每一单本都是一部独立完整的书。在内
容上,每套丛书围绕一个中心题目或具有某些共同特征,但彼此并无内
在联系。
(4)参考工具书:是在大量一次文献或原始信息基础上,经过进一步比较
分析,精心提炼,综合而成的高度浓缩的、精确的特定信息的集合事实
和数据性信息的集合。主要包括百科全书、年鉴、手册、字典、词(辞
典)、地图集等。
图书从使用的角度可分为两类:一是为了求知或者欣赏,而从头到尾
嘻嘻哈哈阅读;二是为了查阅特定的资料或遇到疑难需要解决时,才
去翻阅或引用的书,是作为工具书转供查检用的书。
3、特点和作用
与期刊相比,图书所论述的内容一般比较系统、全面、成
熟、可靠,也有涉及面广,品种多,出版量大、作者群与
读者群大等特点。但编撰和出版的周期较长,内容相对滞
后,传递情报的速度较慢。图书同样也是日常使用广泛的
基本的传播信息的手段。参考图书资料有助于人么对范围
较广的问题获得一般的知识,或对陌生的问题获得初步的
了解,内容一般只反映一至二年以前的研究成果。
图书的著录项目包括书名、著者,出版项(出版地、出版
社、出版年)、总页码等。
图书的识别主要依据出版项(出版地、出版社、出版年)、
ISBN(10位)、总页码(PP or P)等著录项。
(三)会议文献
1、概念
是指在国内外各种会议上宣读或发表的论文及其它有关材料。会议类型
大致可分为国际会议、全国性会议及地区会议等。
2、类型
(1)按文献产生的时间,可分为:会前出版物,会后出版物
(2)按出版形式,分:
A、期刊类:在期刊的某一期中刊载,或作为某刊物的特辑或专辑出版。
B、专题性论文集:汇编成册,有一个专门书名,一图书形式出版。占大多数。
C、连续性会议文献:以定期或不定期连续出版物形式出版。有的按会议的届次
顺序出版,直接以会议主题名称作为出版物名称;有的则由某学术机构(一
般是会议的主持者或召开者)以丛书、丛刊形式出版。此类会议文献一般都
是在级别比较高,有比较权威或知名的机构组织主持召开的会议上选定的文
献。
(3)以系统性科技报告形式出版
3、特点和作用
一般代表一门学科或专业的最新研究成果,反映国内外发
展水平和趋势,内容新,发表快。在传播交流信息方面
(尤其是对通行之间的信息交流与沟通沟通)具有特定的
重要作用。
著录:论文名称、著者和著者工作单位;会议录名称、会
议地点、会议时间;会议录出版情况,论文页码。
识别:会议录名称、会议地点、会议时间、会议届次。
会议录名称常含有: meeting (会议) 、congress(大会)、
conventionsymposium(专题讨论会)、workshop(专题学术讨
论会)、seminar(学术研讨会)、conference(学术讨论会)
colloquium(学术讨论会)、proceedings(会议录)
(四)科技报告
1、概念:是科研工作的正式成果报告或课题研究进展情况的实际记
录。
2、类型,按产生过程和形式,分
(1)报告书(R):研究结束后产生的较为正式的文件。
(2)札记(N):研究过程中的临时性记录或小结,往往是撰写报
告书的素材。
(3)论文(P):打算在会议上或刊物上发表的文章,一般是报告
的一个部分。
(4)备忘录(M):供同一专业或机构内部研究人员之间沟通情况
的材料。
(5)通报(B):一般是对外公布的内容成熟的摘要性材料。
3、特点和作用
研究内容专深具体,层次水平高,往往涉及尖端学科的最新研究领域;
成文叙述详尽,数据完整;时滞短;是科研人员的重要参考资料,具
有很高的信息利用价值。理论性强,但保密性强,难以获取。一般都
编有号码,供识别报告本身及其发行机构 ,报告是一种典型的机关
团体出版物。科技报告的流通范围有绝密、秘密、保密、非密限制发
行、非密、解密等
著录:篇名;著者和著者工作单位;报告号;出版年月
识别:根据报告号
Report:研究报告
PR(progress report)进展报告
AR(annual report)年度报告
FR(final report)年终报告
CR(contract report)合同报告
TR(technical report)技术报告
(五)标准文献
1、概念:一般指由技术标准及其它具有标准性质的技术
文件(如规格、规范、定额、规则等)所组成的一种特定
形式的技术文献体系。
所谓技术标准,是对工程建设、产品与零部件的质量、规
格、参数、及其检验方法等所做的技术规定。是从事生产
建设工作的一种共同依据。
标准文献是指标准化工作的文件,是经过公认的权威当局
批准的标准化工作成果。其中主要为有关工业产品和工程
建设的质量、规格和检验方法的技术规定文件。作为一种
规章性文献,它具有一定的法律约束力。一个国家的标准
文献反映该国的生产工艺水平和技术经济政策,而国际现
行标准则代表了当前世界水平。国际标准和工业先进国家
的标准常是科研生产活动的重要依据和信息来源。
2、类型
(1)按使用范围
A、国际标准:如ISO、IEC等。
B、区域性标准:如CEN(欧洲标准化委员会)、ABC(美英加工程
标准同意化会议标准)、ASMO(阿拉伯标准化与计量组织标准)
等。
C、国家标准:如GB、JIS(日本工业标准)
D、专业(部)标准:如JB、JC、ASTM(美国材料与试验协会标准)
等、SGMA(日本齿轮学会标准)等。
E、企业标准:如Q/HB(沈阳标准件厂标准)、SPO(美国通用电器
公司标准)、BMS、PECR(美国波音飞机公司标准)等。
(2)按内容分
A、基础标准:如名词术语、符号、代码、计量单位、机
械制图等方面的标准
B、产品标准:对产品质量、规格做的同意规定。
C、方法标准:对试验、检验、分析、测定方法和产品验
收规则的标准。
(3)按成熟程度分:
A、正式标准
B、试行标准
C、推荐标准
D、标准草案
3、特点和作用
(1)特点:约束性;计划性和协调性;明确的使用范围;
可靠性和显示可行性;规范标准的编制和编排格式;严谨
的撰写叙述方法。但时滞较长,一般难以涉及最新的产品
和技术。标准一般过若干时间就要进行修订, 新的标准不
断地替代旧的标准。因此,查阅时应以最新标准为准。
(2)作用:是工程建设、产品生产和检验中必不可少的重
要依据,是一种特殊的重要的信息源。
著录:标准制定单位、标准题目、表示标准的词,如
standard、recommendation等;标准号。标准号由标准颁布
机构代码、顺序号和颁布年份三部分组成。如ANSI TI601-1988
识别:标准号
(六)学位论文(Dissertation):
概念:是为了取得各级学位进行公开答辩而撰写的科学论文。
类型:学士论文、硕士论文、博士论文
特点和作用:博硕士学位论文探讨的问题较为专深,阐述较系统
详尽,具有一定独创性,一般都具有非卖品、不发行和报道的特
点。既是撰写者学业考评的重要依据和记录,也对科研生产的相
关领域具有重要的借鉴作用。
著录:论文名称;著者;学位;授予学位的大学名称;时间、论
文页码;导师或答辩委员会顾问的姓名。
识别方法:学位名称、大学名称。如“dissertation”、“thesis”。
(七)政府出版物
概念:是国家机关及其所属部门颁发的文件,包括政府报告、政
策法令、规章制度、会议纪要、调查统计资料等。
类型:按其性质,大体可分行政性文件和科技性文件两类。行政
性文件包括国会记录、政府法令、方针政策、规章制度、决议指
示、调查统计资料等;科技性文件主要包括政府各部门科技研究
报告、科普材料、技术政策文件等,科技性文献在列入政府出版
物前,往往已由所在单位出版过,因此它与其他科技文献有一定
重复。
特点和作用:其典型特点是具有政策指导性和约束性,它所包含
的技术内容往往滞后于科技报告、专利等文献。对了解某一国家
的科技和经济政策及其演变情况,具有参考作用。
由于政府出版物与其它类型文献有一定重复,如:有书、报告、
会议录等多种形式,因此,可根据具体情况按具体出版形式加以
识别。
(八)产品资料(产品样本)
概念:一般是指产品样本,即产品说明书。是各厂商为推销产品而印发
的一种宣传性出版物。好的产品说明书含有丰富的内容,包括产品规格、
性能、特点、产品专利号、构造原理、用途、使用方法、操作规程、等
所作的具体说明。
类型:
(1)各厂商的出版物。包括产品目录、单项产品样本、产品说明说、企业介绍
和广告性厂刊等。
(2)各协会或行会、出版社等的出版物,包括单项产品样本汇编、全行业产品
一览表及工业展览会目录等。
特点和作用:介绍的是已投产和推销的产品,反映的技术较为可靠成熟;
图文并茂,直观形象,数据资料丰富具体,便于识别和参考利用;时间
性强,出版迅速,,免费赠送,便于收集。能从一定程度上反映同类产
品的技术水平和发展动向。能从一定程度上反映同类产品的技术水平和
发展动向。产品样本既是厂商推销产品的重要手段,也是人们了解厂商
及其产品的重要工具,而且从技术上讲,对选型、设计、研制、外貌和
技术引进等工作都有较大参考价值
(九)档案文献
概念:档案是使国家机构、社会组织和个人从事政治、经济、科
学文化等社会实践活动直接形成的文字、图表、声像等形态的历
史纪录。
类型
(1)从档案形成领域的公、私属性角度分类:公务档案和私人档案
(2)从档案形成时间的早晚以及档案作用角度分类:历史档案和现行
档案
(3)从档案内容属性角度分类:文书档案、科技档案、人事档案、专
门档案等
特点和作用:档案是人们在社会实践活动中直接形成的原始性信
息记录,对以往社会实践具有直接的原始记录作用。档案学一般
认为“原始记录性”是档案的本质属性。具有系统性、完整性等特点,
除了作为原始凭证外,在各类活动中可起参考借鉴作用。
档案一般为内部使用,不公开发行,有些有密级限制,因
此在参考文献和检索工具中极少使用。
(十)专利文献
1、概念
专利文献——是由专利局公布或归档的有关专利的文件和资料。
invention(发明)、utility patent(实用新型)和design patent
patent(外观设计)
狭义的专利文献仅指专利说明书。
广义的专利文献包括专利说明书、专利公报、专利分类资料、专利
检索工具书刊,以及专利申请、审批及诉讼程序中的有关文件等。
专利文献既包括描述新的发明创造成果的技术说明书,又包括记载
所有权状况的法律文件,融技术、经济、法律信息于一体。
2、类型
(1)专利说明书
(2)专利分类资料和检索工具书
(3)专利申请档案
3、专利文献的特点
特点
(1)新颖性、独创性、实用性
(2)内容详尽实用,可靠性强
(3)编写格式标准,文字上难懂
(4)融技术、经济、法律信息于一体,具有一定的法律约束性。
专利技术本身是依法具有权属性的,可以转让、买卖、继承等。
识别:有patent;专利国别及专利号。专利国别代码是
由国际标准化组织(ISO)规定的,专利文献由各国专
利局出版发行,因此,无出版地、出版社等项目。
第三节:信息检索及其基本原理
一、 信息检索(Information Retrieval)的概念
1、广义概念——是指将信息按一定的方式组织和存
储起来,并根据信息用户的需要找出有关的信息
过程,故全称:“信息的存储与检索(Information
(Information Storage and Retrieval ) 。
2、狭义概念——仅指上述过程的后半部分,即从信
息集合中找出所需要的信息的过程,相当于人们
通常所说的信息查寻(Information Search)
网络环境下的信息检索和原文获取
二、检索的类型
1、按照存储的载体和查找的技术手段进行划分(按检索的手段):
(1)手工检索(Manual retrieval):用人工方式查找所需信息的检
索方式。
检索的对象是书本型的检索工具,检索过程是由人脑和手工操作相
配合完成,匹配是人脑的思考、比较和选择。
(2)机械检索Mechanical retrieval:利用某种机械装置来处理和查
找文献的检索方式。
穿孔卡片检索:Punch card是一种由薄纸板制成的、用孔洞位置表
示信息,通过穿孔或轧口方式记录和存储信息的方形卡片。
缩微品检索:把检索标识变成黑白点矩阵或条形码,存储在缩微胶
片或胶卷上,利用光电效应,通过检索机查找。
(3)计算机检索(computer-based retrieval)是指把信息及其检索
标识转换成电子计算机可以阅读的二进制编码,存储在磁性载体
上,由计算机根据程序进行查找和输出。
三、信息检索的基本原理与检索处理流程分析
信息检索基本原理是以检索语言为基础,将检索提问
标识与存储在检索工具中的标引标识进行比较,两者
一致或信息标引标识中包含提问标识即是命中的信息。
检索语言是标引者与检索者共同使用的语言。
所有的信息检索查询系统都要对所收集存储的信息进
行一定形式的描述(标引),形成供用户查询的信息
集合,信息检索就是在用户信息需求与系统信息集合
之间进行匹配和选择
信息源
信息采集
信息标引
(特征抽取与表示)
信
息
存
储
信
息
检
索
检索辅助工具
创建/更新数据库
及索引文档
用户
检索接口
提问处理
检索匹配
检索系统
数据库
信息检索处理过程流程图
四、检索的意义
可充分发挥人类知识宝库的作用,促进智力资源的开
发与利用
在数千年的人类文明发展中,生产和积累了大量的文
献资料,成为人类社会的一个巨大的知识宝库,充分
检索和利用这些文献资料所包含的信息和知识,是开
发人类智力资源的重要而有效手段。
信息检索就像一把开启知识宝库的钥匙,掌握并有效
利用它,便能获得和利用人类的精神财富,并使其转
化为社会物质财富,并创造出更多的精神财富,推动
社会的进步和发展。
正确决策、提高效率、减少重复浪费:
科研人员在开始着手研究一项课题前,必须利用
信息检索的方法来了解这个课题是如何提出来的,
前人或他人在此方面已经做什么工作,是如何做
的,有何成果和经验、教训,还存在什么问题,
等等。只有这样才能正确地制订研究方案,防止
重复研究,提高研究起点,降低研究过程中获取
信息和知识的成本。
节省科研人员的宝贵时间:
科研人员如果掌信息检索的方法,能熟练地查找
自己所需的信息资料,无疑将大大缩短查询信息
资料的时间,这等于增加或延长了科研人员的寿
命,这是发展科学技术的一个巨大潜力。同时,
提高科研工作效率、缩短科研周期,达到多出成
果、早出成果的目的
有利于培养学生的信息意识,提高自学能力和独
立研究的能力,不断完善知识结构
在信息社会、知识经济时代的今天,培养劳动者
不仅要有生产经营的知识和技能,而且更要有善
于收集、加工、处理和应用知识与信息的能力,
信息检索能力是当代大学应该具备的一种重要的
信息素养之一,具备了这种能力,就可以说具备
了终身学习的能力基础,它可以帮助人们解决在
一生的学习和工作中可能遇到的各种疑难问题,
掌握了索取知识的门径,使自己在接受新教育和
获取新知识的过程中更加顺利。
第四节
检索系统概述
一、概念:
根据一定的目标,将有关文献或数据按某种检索
语言进行标引,在特定载体上以一定结构次序组
织起来,并借助于一定工具提供特定检索方式的
系统。
检索系统按某种方式、方法建立起来的供读者查
检信息的一种有层次的体系,是表征有序的信息
特征的集合体。其中二次或三次文献信息是文献
信息系统的核心和概括。
二、特征
1、必须包含对所收录的文献特征(内容特征和外表特征)
的描述;
2、每条描述记录(即款目)都标明有可供检索用的标
识——入口词;
3、全部描述记录科学地组织成一个有机整体——有序化;
4、能提供多种必要的检索手段和途径。
三、检索系统类型
1、按检索手段
(1)手工检索工具。工具书,一般为印刷型。
(2)机械检索工具。借助力学、光学、电子学等手段完
成检索操作。包括机电检索系统(机检穿孔卡)、光
电检索系统、计算机检索系统等,现在机电检索系统
和光电检索系统已基本被淘汰,而计算机检索系统正
逐渐成为检索的主要工具。
2、按出版形式
(1)卡片式
(2)书本式
又可分期刊式(是检索工具的主要品种)、单卷
式(如专题性文摘目录等)、附录式(一般指各
种辅助索引等)。
(3)机读式。光盘版、网络版
计算机检索系统
四、计算机检索系统构成及工作原理
1、逻辑构成:主要指它所包含的功能模块或子系统
及其相互关系
信息源选择与采集子系统
标引子系统
建库子系统
词表管理子系统
用户接口子系统
提问处理子系统
2、物理构成
检索系统主机:是指装有检索软件系统的各种信息资源数
据库的服务器。,它们能够进行信息的存储、处理、检索
以及整个系统的运行和管理,相对地说,硬件部分决定了
系统的检索速度和存储容量,而软件部分则是充分发挥硬
件的功能,确定检索方法。
通讯网络:电话通讯网、数据通讯网、卫星通讯网等。
检索终端:信息用户与检索系统主机进行人机对话,实现
联机检索的设备。包括上网设备、调制解调器等。
数据库:数据库就是在计算机存储设备上按一定方式存储
的相互关联的数据集合。是检索系统的信息源,也是用户
检索的对象。数据库可以随时按不同的目的提供各种组合
信息,以满足检索者的需求。检索系统中的数据库一般由
各个数据库生产者提供,也有一些是系统本身建的。
数据库的一般结构:
数据库是在计算机存储设备上按一定方式存储的相互关联
的数据集合。
字段
记录
文档
数据库
①字段是文献著录的基本单元,反映文献的外部特征和内容
特征的每一个项目。
【中文题名】 XML语言及其应用
【英文题名】XML LANGUAGE AND ITS APPLICATION
【作
者】黄婉秋;黄筱霞;贾旭光
【作者单位】北京工商大学,计算机学院,北京,100037;北京工商大学,计
一个字段
算机学院,北京,100037;北方交通大学,计算机学院,北京,100044;
【刊
名】北京工商大学学报(自然科学版)
【英文刊名】JOURNAL OF BEIJING TECHNOLOGY AND BUSINESS
UNIVERSITY(NATURAL SCIENCE EDITION)
【年 卷 期】2002 Vol.20 No.3
【关 键 词】XML; HTML; Web页面语言; 置标语言
【摘
要】简要阐述了XML语言的概念及特点,对它的语言结构进行了
详细的分析,包括DTD、XSL、 XLL三部分.并将XML和HTML进行了比较,同
时也对它和数据库之间的关系进行了描述.最后论述了XML的 发展与前景.
②记录是由若干不同字段组成的文献单元,在数据库中
每一个记录都有一个记录号。
一条记录
③文档由若干逻辑记录组成的信息集合。
文档