信息检索与利用 - 青岛理工大学图书馆

Download Report

Transcript 信息检索与利用 - 青岛理工大学图书馆

信息检索与利用
牟海伟
图书馆
TEL:85071726
QQ:77512603
EMAIL:[email protected]
2015年7月17日
课程的性质与任务
《网络信息检索》课程是根据国家教育部的文件精神开
设的高等学校公共基础课程,也是高等院校唯一的一门培
养学生信息意识、获取文献信息能力的课程。作为一门公
共课程,直接为培养学生的信息素质、尤其是为提高学生
的信息检索能力服务。为各专业学生了解文献检索的基本
知识和检索技术,掌握各种检索工具的使用方法和检索技
巧,具备信息分析、检索,信息获取、使用的能力,使之
能在学习期间和未来的职业活动中独立地获取和运用文献
信息资源,解决实际问题。
检索课主要内容与要求
课程重点:
了解图书馆现有电子资源(各类数据库收录范围
和类型)
信息检索基础:信息源、检索的概念与原理、
检索工具(系统)类型、计算机检索技术、检
索的基本程序
典型数字资源检索系统的使用方法
网上免费资源的获取
文献信息与学术论文写作
要求:
掌握信息检索的基础知识、基本原理和基本技能
熟练地利用图书馆各种网络学术数据库来检索、
获取学习中所需的文献信息
掌握一定的文献阅读、整理和分析研究的基本方
法和技能,具备基本的研究论文写作能力。
检索课的作用
检索课是知识时代培养学生终身所需的信息意识
与获取文献信息能力的重要课程,是一门科学方
法课。对学生不断吸取新知识,改善知识结构,
有着重要的意义。
借鉴前人成果,避免重复研究
掌握检索技术,节省信息获取
时间
信息检索是科研活动的重要组
成部分
科研选题、立项、研究与成功
撰写、结题、成果申报
撰写报告
9%
思考计划
8%
科学实验
32%
查阅文献
51%
信息获取和利用的困惑
不知道有哪些可以利用的信息资源;
不知道从哪里获取有用的信息;
不知道如何去获取和利用信息;
获取的信息很多不符合自己的需求;
信息爆炸,不知道怎么筛选有价值的信息资源;
……
信息获取途径
传统模式
图书馆借阅
网上直接查询下载
网络模式
网上全文传递
信息获取途径
图书
信息资源
获取渠道
多种多样
互联网:门户网站、
专业网站、搜索引擎)
论文(期刊论文、
会议论文、学位论文)
专业信息服务机构
大众传媒(广播、
电视、报纸)
数据库
有效的信息
检索是提高
学习与研究
效率的捷径
第一章
第一节
第二节
第三节
第四节
信息检索基础
信息概述
信息源简介
信息检索的基本原理
检索系统概述
第一节
信息概述
美国哈佛大学的研究小组提出了著名的资源三角
形:没有物质,什么也不存在;没有能量,什么
也不会发生;没有信息,任何事物都没有意义。
物质、能量、信息共同构成现实世界的三大要素。
一、信息的概念
1、控制论创始人N·维纳(N·Veinner)在《控制论和社会》一书中定
义为:“信息就是信息,既不是物质,也不是能量,信息是我们在
适应外部世界并使这种适应为外部世界所感到的过程中,同外部
世界进行交换的内容的全称。”
2、信息论创始人C·E·申农(又译为香农) ( C·E·shanon) 在《通
讯的数学理论》认为:“信息是能够用来消除不确定性的东西。”
3、原国际文献联合会副主席,前苏联信息学家A.И.米哈依洛夫认为:
“信息——作为存贮、传递和转换的对象的知识。”
4、英国信息学家B.C.Brookes的定义则认为:“信息是使人原有的知
识结构发生变化的那一小部分知识。”并采用公式描述:
K(S)+△I=K(S+△S) 其中
K(S)——原有知识结构(knowledge structure)
K(S+△S)——改变后的知识结构(changed knowledge structure)
△I——信息增量(information addition)
这些定义从不同的角度阐明了信息的概念,不管
是从通讯的角度、从知识的角度、还是从数据的
角度进行描述,都是建立在以人及人的认识的基
础上的,属于狭义的信息定义。
在此基础上,一些学者拓展了信息的主体。如我
国信息论专家钟义信教授进一步从信息本题出发,
对信息的概念作出了广义的定义:
信息——是事物运动的状态和(状态改变的)方
式。(如万有引力现象、地震预兆、电磁波、声
波、日蚀、月蚀等)
信息、文献、知识与情报
信
息
有 情
用 报
的
信
息
文献
知
识
二、信息的类型
1、广义的信息的分类
(1)人类社会信息
(2)非人类社会信息(自然信息)
2、狭义的信息的分类
(1)按信息的功能分
军事信息
政治信息
经济信息
科技信息
社会文化生活信息等等。
(2)按信息的载体分:
文字信息
声像信息
实物信息
多媒体信息
(3)按应用范围(流通范围)分:
公开信息
内部信息
秘密信息
第二节 信息源简介
一、信息源的概念和类型
(一)概念:国际教科文组织(UNESCO)认为,
个人为满足其信息需要而获得信息的来源,称为
信息源。指产生(或汇集)信息并提供传递信息
可能性的系统(既包含信息的有形载体,也包含
无形的载体或人们的某种交往活动,汇集了交往
信息、文献信息、实物信息等多种形式的可资利
用的信息)。任何运动着的事物都可以产生信息,
都可以成为信息源。信息从信息源发出,以物质
和能量为媒介,超越空间和时间传送到接收者那
里,这就是信息传递。
信息源的类型
(二)类型:按信息存在的形式,信息源可分为:
1、文献信息源:储存在纸张、胶片、磁介质和
光盘等载体上的信息源。包括图书、报刊、会
议文献、专利、标准、产品样本及说明书、政
府文献、统计资料(包括相应的各种电子出版
物)、各种数据库等。
2、非文献信息源:包括交往信息源、实物信息
源(自然物,人工制品,事物发生的现场 )等。
信息源与信息资源
信息源不等于信息资源。在时间序列上,信息源
是信息资源的源,是先于信息资源的。从信息的
开发利用上,信息源可以不断的转化为信息资源。
信息资源:是经过加工处理有序化并大量积累起
来的有用信息的集合
狭义信息资源是指信息本身。是可利用的信息的集合
(有用的数据和资料)。
广义信息资源是信息活动中各种要素(信息本身、技
术、设备、资金和人)的总称。指人类社会信息活动
中积累起来的以信息为核心的各类信息活动要素(信
息技术、设备设施、信息生产者等)的集合。
信息资源的类型
一般根据现代与传统的区别,信息资源可以分成
两大类,即文献型信息资源和数字化(电子化)
信息资源。
文献型信息资源就是传统的文献资源, 包括刻写型、
印刷型、缩微型和视听型信息资源。
数字化信息资源按其传播利用方式分为网络信息资源
与单机型信息资源2 种。
网络信息资源根据使用形式可以分为联机检索信息资源和因特
网信息资源;
单机型信息资源一般仅存储在个人计算机上, 但不在网络上
传输,因此又叫机读资料。
数字化信息资源的类型
数字化信息资源的根据其内容表现形式, 可以分
为文本型信息资源、数值型信息资源、事实型信
息资源和多媒体信息资源等。
文本型信息资源以文本方式存在的信息资源;
数值型信息资源最具代表性的便是统计数据, 经济类
学科和专业的用户对此需求很大;
事实型信息资源一般是三次文献,如百科全书型、字
词典等;
多媒体信息资源是由文本、图片、图像、声音、视频
等多种媒体的集成,如视频数据库、图片数据库等。
数字化信息资源的特点
1、组织形式发生变化:由传统的文本、线性,发展成超文本、
超媒体等多种形式,并组成相互联系、非线性的网状结构
2、数字化:存储密度高,容量大。
3、内容丰富多样:从文字、图表到多媒体信息,文献类型多
样,涉及领域宽广。
4、数据具有通用性、开放性、动态性
5、信息资源体积小、数量大
6、传播方式的无限性,不受时间、空间限制
7、检索功能强大,使用方便、快捷。
文献型信息源及其信息特征
文献是在空间和时间上积累和传播信息的最有效的手段,
是获取信息的最基本、最主要的来源。文献信息源是人们
获取全面系统的信息的主要保障。
文献的功能:1)存贮知识的功能;2)传递和交流信息的功
能;3)保存知识的功能。
从检索结果要获取原始文献,就必须知道文献来源,我们
可以用代表文献特点的检索标识(一般是缩写)确定该文献
来源于图书、期刊、会议文献或科技报告等。
著录(Description)就是编制文献目录时,对文献内容和形
式特征进行分析、选择和记录的过程。它将有关某一文献
的基本信息摘录下来,供人们间接地了解、识别该文献。
文献的概念
文献——国家标准局颁布的《文献著录总则》将
文献定义为“记录有知识的一切载体”。就是指用
文字、图形、符号、声频、视频等手段记录下来
的人类知识。也可称为固化在一定载体上的知识。
科技文献是科技成果的最终表达形式。它凝聚着
无数有用的事实、数据、理论方法、构想和设想
等,反映着一定时代、一定社会条件下科技的进
展和水平,预示着未来的发展趋势和方向。
文献要素
信息内容:文献中所表达的思想意识和知识观念。
信息符号:符号系统是揭示文献信息内容的标识,表
达知识情报的手段,记录和传播文献信息内容的媒介。
文献信息符号主要是从语言不断衍化而来的,并逐步
发展为文字、图画、表格、公式、编码、声频和视频
等类型。
记录方式:是指将文献符号系统所代表的信息内容通
过特定的人工记录手段和方法使其附着于一定的文献
载体材料上。文献记录方式具体包括刻划、书写、印
刷、拍摄、录制、复印和计算机录入等。
载体材料:是可供记录信息符号的物质材料。
文献是物化的精神产品,或者说,文献是知识信
息的物化形态。其中:
信息内容是文献的知识内核
载体材料是文献的存在形式和外壳
符号系统和记录方式则是二者联系的桥梁和纽带。
这4个要素相互联系就构成了文献的四维框架结构。
文献的类型
1、内容加工深度(文献级别)
零次文献、一次文献、二次文献、三次文献
(1)零次文献:是指未经过任何加工的原始文献。如:
私人笔记、底稿、手稿、个人通信、新闻稿、工程图
纸、考察记录、实验记录、调查稿、原始统计数字、
原始录音、原始录像、谈话记录等。零次文献在原始
文献的保存、原始数据的核对、原始构思的核定(权
利人)等方面有着重要的作用。
特点:是信息来源直接真实, 内容新颖。但不成熟,
不公开交流,难以获得。
(2)一次文献:以作者本人取得的成果为依据而创作的以
论文、报告等形式公开发表或出版的各种文献,习惯上称
做原始文献。如:期刊论文、学术论文、学位论文、科技
报告、会议论文、专利说明书、阅读性图书、技术档案、
技术标准等。一次文献是人们学习参考的最基本的文献类
型,也是最主要的文献情报源。是产生二、三次文献的基
础,是文献检索和利用的主要对象。
特点:在形态上具有多样性,在内容上具有原创性,在出
处上具有分散性。内容新颖丰富,叙述具体详尽,参考价
值大,但数量庞大、分散。
确定一篇文献是否一次文献,主要是根据其内容性质,而
不是根据其物质形式(如载体、语种、出版形式等),只
要是作者根据自己的科研成果而发表的原始创作,都属于
一次文献。
(3)二次文献:按一定的方法对一次文献进行搜集、提炼、
浓缩、加工、整理,以使之有序化而形成的文献。是为了
更有效地管理和利用一次文献而编辑的工具性文献。主要
包括目录、索引、文摘及机读型书目数据库、网上检索引
擎等都属于二次文献。二次文献以不同的深度揭示一次文
献,其主要功能是检索、通报、控制一次文献,帮助人们
在较少时间内获得较多的文献信息。
特点:二次文献中的信息是对一次文献信息进行加工和重
组而成,并不是新的信息,具有汇集性、工具性、综合性、
系统性、交流性和检索性的特点。提供的文献线索集中、
系统、有序。
目录
全国期刊联合目录:
http://159.226.100.141/Union/
《中文核心期刊要目总览》
索引:
1)以一定的文献资料作为索取范围;
2)以特定的文献标识为索取对象;
3)按一定的排检法编排文献标识;
4)每个表示后面详细注明出处或存储地址
主题索引、分类索引、著作索引、题名索引、语词
索引、引文索引、等
(3)三次文献——根据二次文献提供的线索,选用大量一
次文献的内容,经过筛选、分析、综合和浓缩而撰写的文
献。主要包括三种类型:
综述研究类:综述、述评、年度进展报告、信息预测、
未来展望等;
参考工具类:年鉴、手册、百科全书、词典、大全等;
文献指南类:专科文献指南、索引与文献服务目录、
书目之书目、工具书目录等。
特点:文字精炼、叙述简明扼要,在内容上具有综合性
和知识性,在功效上具有参考性和工具性。
综述性论文
是指在全面搜集、阅读大量的有关研究文献的基础上,
对所研究的问题(学科、专题)在一定时期内已经取得的
研究成果、存在问题以及新的发展趋势等信息进行比较全
面系统的收集、分析、研究后,归纳整理出的专题调研报
告。
区别:不要求在研究内容上的创新性,它要求在综合
分析和评价已发表过的资料基础上,提出涉及该专题在特
定时期发展演变的规律和趋势。
有关恐龙绝灭的综述文章
研究动态
参考文献量大
综述文章在题名上常用的词汇
研究历史、研究现状、回顾、
展望、综述、进展、评述等
应用地球物理数据处理与分析
[作者] 杨文采
[机构] 中国地质科学研究院地质研究所
[刊名] 地学前缘-1998.5(2).-231-236
[关键词] 应用地球物理 数据处理 数据分析 反演 地球物理
[ISSN] 1005-2321
[分类号] P622.2 P631
[文摘] 从理论的和方法技术两个角度讨论了应用地球物理学数据分析
当前存在的问题,并对当前学科发展前沿的非线反演问题进行了重点分
析。笔者认为,当前这个领域主要存在8个理论问题,它们影响了学科
的发展,同时还存在4个方法技术问题,限制了应用效果。由于从地球
物理数据中提取信息和数据处理中不可避免地产生人造假象是相互矛盾
的,当前的研究方向是“最大限度地从地球物理数据中提取信息的同时,
有效地抑制人造假象”。主要的研究应集中在非线性技术与地球物理反演
的结台部上。以开创非线性反演的理论体系。进个体系应突破正则化思
维的束缚,引入非线性系统自组织、地球物理场的非线性属性等新概念,
融信息科学、数理科学与地球科学为一体。
2、内容公开程度(流通范围):
白色文献(公开文献)、灰色文献(内部文献)、黑色文
献(秘密文献)。
(1)白色文献:一切正式出版并在社会上公开流通的文献。包括图
书、报纸、期刊等。这类文献通过出版社、书店、邮局等正规的
渠道公开发行,向社会所有成员公开,其蕴涵的信息大白于天下,
人人均可利用。
(2)灰色文献:非公开发行的内部文献和限制流通的文献。包括社
会公开传播的内部刊物、内部技术报告、内部教材和会议资料等。
这类文献出版量小、发行渠道复杂、流通范围有一定限制,不易
收集。
(3)黑色文献:包括两个方面,一是人们未破译和未辨识其中信息
的文献,如考古发现的古老文字未经分析厘定的文献;二是处于
保密状态和不愿公布其内容的文献,如未解密的政府文件、内部
档案、个人日记、私人信件等。这类文献除作者及特定人员外,
一般社会成员极难获得和利用。
3、内容与专业相关程度
根据相对利用率的多少,我们把与一个学科有关
的文献分成核心文献、相关文献、边缘文献。
(1)核心文献是指与本学科发展水平、发展动向密
切相关的一些文献。
(2)相关文献和边缘文献是指所含内容与学科的关
系相对疏远一些的文献。
4、载体类型
书写型文献
印刷型文献
缩微型文献
声像型文献
电子型文献
5、按出版形式:
连续出版物(期刊、报纸)、图书、科技报告、
会议文献、标准文献、专利文献、学位论文、政
府出版物、产品资料、档案文献等。这十种文献
被人们称为十大文献信息源。其中除图书、期刊
外的其它类型文献又统称为特种文献。
十大科技文献信息源简介
是指人们在进行科研及技术工作时使用频率比较高的
十种情报来源的总称
(一)期刊(Journal杂志;Transaction汇刊;Acta学报;
Periodical期刊)
1、类型
(1)按出版周期:周刊、双周刊、半月刊、月刊、双月刊、
季刊、半年刊、年刊等。
(2)按报道范围:综合性期刊、专业性期刊
(3)按内容、性质和用途:学术性、技术性期刊;检索性
期刊;通讯性期刊;评述性期刊;数据资料性期刊。
2、期刊的特点和作用
与图书相比,期刊出版周期短,发表文章快;内容新颖,
能迅速反映国内外的各种学科专业的水平和动向;品种多,
数量大;内容涉及领域广泛;作者队伍及读者队伍均非常
庞大。占阅读量的70%。是获取信息的最主要的信息源。
期刊中记载和传递的多属理论性、探讨性的信息。
期刊的著录:刊名(一般用缩写)、出版年月、卷、期、起
止页码等。
期刊论文的著录:篇名、作者、出处(刊名、卷号、期号、
起止页码、出版年)、国际标准刊号
期刊的识别:卷号或期号(vol. no or v. n);刊名缩写(如
PE&RS);ISSN号(8位)
3、核心期刊——对某学科或专业领域而言,登载该
学科或专业大量相关论文的少数权威性期刊,称
为该学科或专业的核心期刊。
根据B.C.Brookes等人的研究,一个学科或专业领
域的核心期刊一般占该领域相关期刊总量的10%
左右,但这些核心期刊所提供的相关文章数却占
相关文章总数的50—60%。因此,科学地确定和
利用核心期刊是非常重要的,可以节省时间和精
力。
检索期刊论文的数字资源系统
中文:
中国知网《中国学术期刊数据库》
重庆VIP《中文科技期刊数据库》
北京万方《中国学术期刊数据库》
外文:
EBSCO外文期刊数据库
Springer外刊数据库
ASME期刊数据库
ASCE期刊数据库
ieee CS
SCOPUS((文摘)等
(二)图书
1、种类。图书按其内容和用途可划分为如下几类:
(1)专著:是针对某一主题分章列节地作深入系统的全面论述的科学著作。
(2)教科书:是适应教学需要,针对某种教学大纲编写的主要用于教学的
图书。高校用的某些专业教科书就内容而言接近于专著。
(3)丛书:是在一个总书名下,汇集多种单行本图书成为一套,并以编号
或不编号方式出版的图书。其中每一单本都是一部独立完整的书。在内
容上,每套丛书围绕一个中心题目或具有某些共同特征,但彼此并无内
在联系。
(4)参考工具书:是在大量一次文献或原始信息基础上,经过进一步比较
分析,精心提炼,综合而成的高度浓缩的、精确的特定信息的集合事实
和数据性信息的集合。主要包括百科全书、年鉴、手册、字典、词(辞
典)、地图集等。
图书从使用的角度可分为两类:一是为了求知或者欣赏;二是为了查
阅特定的资料或遇到疑难需要解决时,才去翻阅或引用的书。
2、特点和作用
与期刊相比,图书所论述的内容一般比较系统、全面、成
熟、可靠,也有涉及面广,品种多,出版量大、作者群与
读者群大等特点。但编撰和出版的周期较长,内容相对滞
后,传递情报的速度较慢。图书同样也是日常使用广泛的
基本的传播信息的手段。参考图书资料有助于人么对范围
较广的问题获得一般的知识,或对陌生的问题获得初步的
了解,内容一般只反映一至二年以前的研究成果。
图书的著录项目包括书名、著者,出版项(出版地、出版
社、出版年)、总页码等。
图书的识别主要依据出版项(出版地、出版社、出版年)、
ISBN(10位)、总页码(PP or P)等著录项。
检索图书的数字资源系统
中文:
超星数字图书馆
方正Apabi数字资源平台
中国知网中国年鉴网络出版总库
中国知网中国工具书网络出版总库
外文
Springer Ebooks
IET ebooks
(三)会议文献
1、类型
(1)按文献产生的时间,可分为:会前出版物,会后出版物
(2)按出版形式,分:
A、期刊类:在期刊的某一期中刊载,或作为某刊物的特辑或专
辑出版。
B、专题性论文集:汇编成册,有一个专门书名,一图书形式出
版。占大多数。
C、连续性会议文献:以定期或不定期连续出版物形式出版。有
的按会议的届次顺序出版,直接以会议主题名称作为出版物名
称;有的则由某学术机构(一般是会议的主持者或召开者)以
丛书、丛刊形式出版。此类会议文献一般都是在级别比较高,
有比较权威或知名的机构组织主持召开的会议上选定的文献。
(3)以系统性科技报告形式出版
2、特点和作用
一般代表一门学科或专业的最新研究成果,反映国内外发
展水平和趋势,内容新,发表快。在传播交流信息方面
(尤其是对通行之间的信息交流与沟通沟通)具有特定的
重要作用。
著录:论文名称、著者和著者工作单位;会议录名称、会
议地点、会议时间;会议录出版情况,论文页码。
识别:会议录名称、会议地点、会议时间、会议届次。
会议录名称常含有: meeting (会议) 、congress(大会)、
conventionsymposium(专题讨论会)、workshop(专题学术讨
论会)、seminar(学术研讨会)、conference(学术讨论会)
colloquium(学术讨论会)、proceedings(会议录)
检索会议论文的数字资源系统
中文
北京万方中国学术会议论文全文库
北京万方西文会议论文全文库
中国知网中国重要会议论文全文数据库
中国知网国际会议论文全文数据库
超星发现系统
外文
ASCE会议录数据库
超星发现系统
(四)科技报告
1、类型。按产生过程和形式,分
(1)报告书(R):研究结束后产生的较为正式的文件。
(2)札记(N):研究过程中的临时性记录或小结,往
往是撰写报告书的素材。
(3)论文(P):打算在会议上或刊物上发表的文章,
一般是报告的一个部分。
(4)备忘录(M):供同一专业或机构内部研究人员之
间沟通情况的材料。
(5)通报(B):一般是对外公布的内容成熟的摘要性
材料。
2、特点和作用
研究内容专深具体,层次水平高,往往涉及尖端学科的最新研究领域;
成文叙述详尽,数据完整;时滞短;是科研人员的重要参考资料,具
有很高的信息利用价值。理论性强,但保密性强,难以获取。一般都
编有号码,供识别报告本身及其发行机构 ,报告是一种典型的机关
团体出版物。科技报告的流通范围有绝密、秘密、保密、非密限制发
行、非密、解密等
著录:篇名;著者和著者工作单位;报告号;出版年月
识别:根据报告号
Report:研究报告
PR(progress report)进展报告
AR(annual report)年度报告
FR(final report)年终报告
CR(contract report)合同报告
TR(technical report)技术报告
检索技术成果的数字资源系统
中文:
北京万方数据知识服务平台
超星发现系统
中国科技项目创新成果鉴定意见数据库(知网版)
外文
超星发现系统
国道外文专题数据库
重庆尚唯科技报告资源服务系统
(五)标准文献
1、类型
(1)按使用范围
A、国际标准:如ISO、IEC等。
B、区域性标准:如CEN(欧洲标准化委员会)、ABC(美英加工程
标准同意化会议标准)、ASMO(阿拉伯标准化与计量组织标准)
等。
C、国家标准:如GB、JIS(日本工业标准)
D、专业(部)标准:如JB、JC、ASTM(美国材料与试验协会标准)
等、SGMA(日本齿轮学会标准)等。
E、企业标准:如Q/HB(沈阳标准件厂标准)、SPO(美国通用电器
公司标准)、BMS、PECR(美国波音飞机公司标准)等。
(2)按内容分
A、基础标准:如名词术语、符号、代码、计量单位、机
械制图等方面的标准
B、产品标准:对产品质量、规格做的同意规定。
C、方法标准:对试验、检验、分析、测定方法和产品验
收规则的标准。
(3)按成熟程度分:
A、正式标准
B、试行标准
C、推荐标准
D、标准草案
2、特点和作用
(1)特点:约束性;计划性和协调性;明确的使用范围;
可靠性和显示可行性;规范标准的编制和编排格式;严谨
的撰写叙述方法。但时滞较长,一般难以涉及最新的产品
和技术。标准一般过若干时间就要进行修订, 新的标准不
断地替代旧的标准。因此,查阅时应以最新标准为准。
(2)作用:是工程建设、产品生产和检验中必不可少的重
要依据,是一种特殊的重要的信息源。
著录:标准制定单位、标准题目、表示标准的词,如
standard、recommendation等;标准号。标准号由标准颁布
机构代码、顺序号和颁布年份三部分组成。如ANSI TI601-1988
识别:标准号
检索标准文献的数字资源系统
中文
超星发现系统
北京万方中外标准数据库(题录)
中国知网国家标准全文数据库
中国知网中国行业标准全文数据库
中国知网国内外标准题录数据库
外文
超星发现系统
国道外文专题数据库
北京万方中外标准数据库
中国知网国内外标准题录数据库
(六)学位论文(Dissertation):
1、类型:学士论文、硕士论文、博士论文
2、特点和作用:博硕士学位论文探讨的问题较为专
深,阐述较系统详尽,具有一定独创性,一般都
具有非卖品、不发行和报道的特点。既是撰写者
学业考评的重要依据和记录,也对科研生产的相
关领域具有重要的借鉴作用。
著录:论文名称;著者;学位;授予学位的大学名称;
时间、论文页码;导师或答辩委员会顾问的姓名。
识别方法:学位名称、大学名称。如“dissertation”、
“thesis”。
检索学位论文的数字资源系统
中文
北京万方博硕士论文全文库
中国知网中国博士论文数据库
中国知网中国优秀硕士论文数据库
外文
超星发现系统
国道外文专题数据库
PQDT(ProQuest Dissertations & Theses)
(七)政府出版物
1、类型:按其性质,大体可分行政性文件和科技性文件两
类。行政性文件包括国会记录、政府法令、方针政策、规
章制度、决议指示、调查统计资料等;科技性文件主要包
括政府各部门科技研究报告、科普材料、技术政策文件等,
科技性文献在列入政府出版物前,往往已由所在单位出版
过,因此它与其他科技文献有一定重复。
2、特点和作用:其典型特点是具有政策指导性和约束性,
它所包含的技术内容往往滞后于科技报告、专利等文献。
对了解某一国家的科技和经济政策及其演变情况,具有参
考作用。
检索政府出版物的数字资源系统
中文
北京万方中国法律法规全文数据库
超星发现系统
中国知网中国法律知识资源总库法律法规库
中国知网中国经济社会发展统计数据库
外文
超星发现系统
国道外文专题数据库
(八)产品资料(产品样本)
1、类型:
(1)各厂商的出版物。包括产品目录、单项产品样本、产品说明说、企
业介绍和广告性厂刊等。
(2)各协会或行会、出版社等的出版物,包括单项产品样本汇编、全行
业产品一览表及工业展览会目录等。
2、特点和作用:介绍的是已投产和推销的产品,反映的技术较为可靠成
熟;图文并茂,直观形象,数据资料丰富具体,便于识别和参考利用;
时间性强,出版迅速,免费赠送,便于收集。能从一定程度上反映同
类产品的技术水平和发展动向。能从一定程度上反映同类产品的技术
水平和发展动向。产品样本既是厂商推销产品的重要手段,也是人们
了解厂商及其产品的重要工具,而且从技术上讲,对选型、设计、研
制、外貌和技术引进等工作都有较大参考价值
检索产品资料的数字资源系统:尚唯产品样本数据库
(九)档案文献
1. 类型
(1)从档案形成领域的公、私属性角度分类:公务档案和私人档案
(2)从档案形成时间的早晚以及档案作用角度分类:历史档案和现
行档案
(3)从档案内容属性角度分类:文书档案、科技档案、人事档案、
专门档案等
2. 特点和作用:档案是人们在社会实践活动中直接形成的
原始性信息记录,对以往社会实践具有直接的原始记录
作用。档案学一般认为“原始记录性”是档案的本质属性。
具有系统性、完整性等特点,除了作为原始凭证外,在
各类活动中可起参考借鉴作用。
档案一般为内部使用,不公开发行,有些有密级限制,
因此在参考文献和检索工具中极少使用。
(十)专利文献
1、概念
专利文献——是由专利局公布或归档的有关专利的文件
和资料。 invention(发明)、utility patent(实用新型)
和design patent(外观设计)
2、类型
(1)专利说明书
(2)专利分类资料和检索工具书
(3)专利申请档案
3、专利文献的特点
特点
(1)新颖性、独创性、实用性
(2)内容详尽实用,可靠性强
(3)编写格式标准,文字上难懂
(4)融技术、经济、法律信息于一体,具有一定的法律约束性。
专利技术本身是依法具有权属性的,可以转让、买卖、继承等。
识别:有patent;专利国别及专利号。专利国别代码是
由国际标准化组织(ISO)规定的,专利文献由各国专
利局出版发行,因此,无出版地、出版社等项目。
检索专利文献的数字资源系统
中文:
北京万方中外专利数据库
中国专利全文数据库(知网版)
国家知识产权局:http://www.sipo.gov.cn/
外文:
北京万方中外专利数据库
海外专利摘要数据库(知网版)
美国专利商标局http://patft.uspto.gov/
欧洲专利局http://ep.espacenet.com/
重点说一下期刊
世界上最早的期刊
世界上最早的期刊,也是最早的科学技术期刊有两种:
一为1665年1月5日由法国议院参事戴·萨罗律师(Denys de Sallo)创办
于巴黎的《学者杂志》(Journal des Scavans);
二为1665年3月6日由英国皇家学会秘书亨利·奥尔登伯格(Henry
Oldenburg)创办于伦敦的《哲学汇刊——世界各地有创造才能者当前的
探索、研究和劳动的若干总结》(Philosophical Transactions of the Royal
Society,1776年后改为《英国皇家学会会刊》)。
《学者杂志》是在法国高级官员科尔贝的支持下创办的,它是一份文学
与科学兼顾的期刊,首次采用Journal一词作为刊名,其办刊宗旨为:
“满足我们的好奇心和不用花费多大气力就能学到东西的一种手段”。
其内容主要是报道法国和其他国家出版的各类图书,包括新书出版动态、
目次和文摘,也发表一些解释自然现象的物理、化学和解剖学实验,以
及气象观测记录数据等。可贵的是,这份期刊创造了世界上第一个由科
学家组成的编委会,以协助编辑评审稿件并形成了期刊同仁评审体制的
雏形。《学者杂志》并未延续下来,创办不久即以干涉法律与神学事务
而被查禁,而时隔两个月之后创办的《哲学汇刊》却一直延续至今,成
为世界上连续办刊时间最长的学术期刊。
核心期刊概念
1931年著名文献学家布拉德福首先揭示了文献集中与分散
规律,发现某时期某学科1/3的论文刊登在3.2%的期刊上;
1967年联合国教科文组织研究了二次文献在期刊上的分布,发
现75%的文献出现在10%的期刊中;1971年,SCI的创始人加
菲尔德统计了参考文献在期刊上的分布情况,发现24%的引文
出现在1.25%的期刊上,等等,这些研究都表明期刊存在“核
心效应”,从而衍生了“核心期刊”的概念。
核心期刊 :
某学科(或某领域)的核心期刊,是指那些发表该
学科(或该领域)论文较多、使用率(含被引率、摘转
率和流通率)较高、学术影响较大的期刊。
目前: 国际三大索引:
SCI《科学引文索引》,Science Citation Index
EI《工程索引》,The Engineering Index
CPCI [ISTP] 《科技会议录索引》,Conference
Proceedings Citation Index (Index to Scientific &
Technical Proceedings)
SCI简介
即《科学引文索引》(Science Citation Index),是由美国科学
信息研究所(Institute for Scientific Information 简称ISI)创建的,
收录文献的作者、题目、源期刊、摘要、关键词,不仅可以从文
献引证的角度评估文章的学术价值,还可以迅速方便地组建研究
课题的参考文献网络。SCI创刊于1961年。经过40年的发展完善,
已从开始时单一的印刷型发展成为功能强大的电子化、集成化、
网络化的大型多学科、综合性检索系统。
SCI从来源期刊数量划分为SCI和SCI-E。SCI指来源刊为3500多
种的SCI印刷版和SCI光盘版(SCI Compact Disc Edition, 简称SCI
CDE),SCI-E(SCI Expanded)是SCI的扩展库,收录了5600多种
来源期刊,可通过国际联机或因特网进行检索。SCI涵盖学科超过
100个,主要涉及农业、生物及环境科学;工程技术及应用科学;
医学与生命科学;物理及化学;行为科学。
EI简介
EI是美国《工程索引》(The Engineering
Index)的简称。EI创刊于1884年,由美国工程情
报公司(Engineering Information Co.)出版发行。
EI是工程技术领域内的一部综合性检索工具,报
道内容包括:电类、自动控制类、动力、机械、
仪表、材料科学、农业、生物工程、数理、医学、
化工、食品、计算机、能源、地质、环境等学科。
CPCI [ISTP] 简介
ISTP是Index to Scientific & Technical Proceedings的缩写,是美国
科学情报研究所的网络数据库Web of Science Proceedings中两个数据
库(ISTP和ISSHP)之一。专门收录世界各种重要的自然科学及技术
方面的会议,包括一般性会议、座谈会、研究会、讨论会、发表会等
的会议文献,涉及学科基本与SCI相同。
ISTP现在已经更名为CPCI(Conference Proceedings Citation Index ),
但由于传统称呼,现在各大科研单位大部分依旧称之为ISTP。原科学
技术会议录索引ISTP,提供1990年以来以专著、丛书、预印本、期刊、
报告等形式出版的国际会议论文文摘及参考文献索引信息,涉及自然
科学和工程技术的所有领域。自2008年10月20日起,在全新升级的
Web of Science中,ISTP更名为CPCI。
在ISTP、 EI、 SCI这三大检索系统中,SCI最
能反映基础学科研究水平和论文质量,该检索系
统收录的科技期刊比较全面,可以说它是集中各
个学科高质优秀论文的精粹,该检索系统历来成
为世界科技界密切注视的中心和焦点。
国内有7大核心期刊(或来源期刊)遴选体系:
• 北京大学图书馆“中文核心期刊”
• 南京大学“中文社会科学引文索引(CSSCI)来源期刊”
• 中国科学技术信息研究所“中国科技论文统计源期刊”(又称
“中国科技核心期刊”)
• 中国社会科学院文献信息中心“中国人文社会科学核心期刊”
• 中国科学院文献情报中心“中国科学引文数据库(CSCD)来
源期刊”
• 中国人文社会科学学报学会“中国人文社科学报核心期刊”
• 万方数据股份有限公司正在建设中的“中国核心期刊遴选数据
库”
第三节:信息检索及其基本原理
一、 信息检索(Information Retrieval)的概念
1、广义概念——是指将信息按一定的方式组织和存
储起来,并根据信息用户的需要找出有关的信息
过程,故全称:“信息的存储与检索(Information
(Information Storage and Retrieval ) 。
2、狭义概念——仅指上述过程的后半部分,即从信
息集合中找出所需要的信息的过程,相当于人们
通常所说的信息查寻(Information Search)
网络环境下的信息检索和原文获取
二、检索的类型
1、按照存储的载体和查找的技术手段进行划分(按检索的手段):
(1)手工检索(Manual retrieval):用人工方式查找所需信息的检
索方式。
检索的对象是书本型的检索工具,检索过程是由人脑和手工操作相
配合完成,匹配是人脑的思考、比较和选择。
(2)机械检索Mechanical retrieval:利用某种机械装置来处理和查
找文献的检索方式。
穿孔卡片检索:Punch card是一种由薄纸板制成的、用孔洞位置表
示信息,通过穿孔或轧口方式记录和存储信息的方形卡片。
缩微品检索:把检索标识变成黑白点矩阵或条形码,存储在缩微胶
片或胶卷上,利用光电效应,通过检索机查找。
(3)计算机检索(computer-based retrieval)是指把信息及其检索
标识转换成电子计算机可以阅读的二进制编码,存储在磁性载体
上,由计算机根据程序进行查找和输出。
三、信息检索的基本原理与检索处理流程分析
信息检索基本原理是以检索语言为基础,将检索提问
标识与存储在检索工具中的标引标识进行比较,两者
一致或信息标引标识中包含提问标识即是命中的信息。
检索语言是标引者与检索者共同使用的语言。
所有的信息检索查询系统都要对所收集存储的信息进
行一定形式的描述(标引和著录),形成供用户查询
的信息集合,信息检索就是在用户信息需求与系统信
息集合之间进行匹配和选择
第四节
检索系统概述
一、概念:
根据一定的目标,将有关文献或数据按某种检索
语言进行标引,在特定载体上以一定结构次序组
织起来,并借助于一定工具提供特定检索方式的
系统。
检索系统按某种方式、方法建立起来的供读者查
检信息的一种有层次的体系,是表征有序的信息
特征的集合体。其中二次或三次文献信息是文献
信息系统的核心和概括。
信息检索基本原理的核心是用户信息需求与文献信息集
合的比较和选择, 是两者匹配(match)的过程。文献
检索可分6个步骤进行:
分析
课题
选择检
索工具
确定检
索途径
检索课题
选题:问题和课题?
选择检
索方法
检索结束
索取原
始文献
查找文
献线索
图 2.1 检索过程示意图
二.数据库的一般结构
数据库是在计算机存储设备上按一定方式存储的相互关联
的数据集合。
字段
记录
文档
数据库
①字段是文献著录的基本单元,反映文献的外部特征和内容
特征的每一个项目。
【中文题名】 XML语言及其应用
【英文题名】XML LANGUAGE AND ITS APPLICATION
【作
者】黄婉秋;黄筱霞;贾旭光
【作者单位】北京工商大学,计算机学院,北京,100037;北京工商大学,计
一个字段
算机学院,北京,100037;北方交通大学,计算机学院,北京,100044;
【刊
名】北京工商大学学报(自然科学版)
【英文刊名】JOURNAL OF BEIJING TECHNOLOGY AND BUSINESS
UNIVERSITY(NATURAL SCIENCE EDITION)
【年 卷 期】2002 Vol.20 No.3
【关 键 词】XML; HTML; Web页面语言; 置标语言
【摘
要】简要阐述了XML语言的概念及特点,对它的语言结构进行了
详细的分析,包括DTD、XSL、 XLL三部分.并将XML和HTML进行了比较,同
时也对它和数据库之间的关系进行了描述.最后论述了XML的 发展与前景.
②记录是由若干不同字段组成的文献单元,在数据库中
每一个记录都有一个记录号。
一条记录
③文档由若干逻辑记录组成的信息集合。
文档
三.分析检索课题
文献检索都是围绕具体目的和要求在一定范围内进
行的,因此在检索之前,首先必须对检索课题进行分析。
主要包含以下几项内容:
1.分析主题内容(提炼检索词:显性词
和隐性词)
A单元概念
B单元概念
---多个单元
主
题
要
素
主
题
中
心
例1:地质灾害预警技术在长输管道中的应用研究
主题概念:地质灾害,预警,长输管道
例2:钎焊.热压多层有序排列金刚石钻头研制及机理
研究
例3:激光诱导离解光谱技术定量分析方法研究及宝
石学应用
显性主题
例4:新疆西准噶尔地区古生代岩浆活动
例5:深层稠油油藏天然气吞吐方法研究及应用
例6:嫦娥一号干涉成像光谱影像超分辨率重建理论
与方法
例7:基于产业链理论的海口市游艇产业发展研究
例1:”高温下使用的不锈钢”这一概念,既包含 “不
锈钢”这一显性主题,同时又包含“耐热钢”这一隐性
主题。由于“耐热钢”这一主题要素隐在“高温下使用
的钢”这一概念之中,如不提炼就可能被淹没,影响
用户对“耐热钢”文献信息的需求。
例2:“黄姜皂素的SMRH(糖化-陶瓷膜回收-酸
水解)工业化清洁生产技术”这一概念 所包含的“黄
姜皂素废水”这一显性主题,同时应注意这是一种高
盐废水,外文检索中应增加“high salt wastewater”
文献。
2.分析课题的学科范围、
所需要的文献类型,选择检索工具
1.选择检索工具的原则:
1)专业对口原则:土木类-ASCE;计算机-IEE;经管类全
文:emerald,elsevier, EBSCO等;
2)语种熟悉原则:中文库-外文库
3)与检索要求匹配:
a.新产品、新技术等信息,应关注专利库和产品库等
b.获取产业或经济数据,-事实性数据库
c.下载全文
4)检索工具质量原则:全面性和广泛性(学科范围、类型
全、更新快)
3.分析与课题有关的著名专家和学者
在各个领域的科技成果中,一些专家长期从事
某一地域、某一领域的研究工作,发表一系列研
究论文或专著。对这些专家的成果进行追踪,对
于了解该地区、该领域的进展概况,是十分必要
的。
4.了解课题检索文献的目的
分析课题需要查找的特定年代和地域范围以及涉
及的语种等。以明确检索范围。
例1:山东沂沭断裂带内中基性脉岩深部岩浆演化
过程及金的富集与成矿:熔融包裹体证据
中基性岩,闪长玢岩,煌斑岩,辉长岩,辉绿岩,
沂沭断裂-沂南断裂;郯庐断裂-山东
例2:近五年我国西部地区城镇居民人均消费性
支出变化情况
时间范围——从现在起回溯五年
地域范围——中国西部地区(包括四川、山西、
甘肃、青海等省区)
信息源类型——统计资料;
主题概念——城镇居民人均消费性支出。
变化情况——增长还是减少?幅度如何?
从获得的具体统计资料中进行比对
从招标范围中选题
从科学前沿和研究热点中选题
利用科学新闻进行选题
从碰到的问题中选题
从文献的空白点选题
从已有课题延伸中选题
从改变研究要素组合中选题