第2章.ppt

Download Report

Transcript 第2章.ppt

目次

• 第1章 绪 论 • 第2章 信息检索基础 • 第3章 搜索引擎 • 第4章 事实和数值型信息检索 • 第5章 图书信息检索 • 第6章 期刊信息检索 • 第7章专利信息及商标信息检索 • 第8章 其他信息检索 • 第9章 检索案例选编 • 第10章 检索效率 • 第11章信息的分析利用

第2章信息检索基础 2.1 检索的概念及类型 2.2 检索工具概述 2.3 检索方法及检索途径 2.4 计算机检索概述 2.5检索与分析步骤 2.6综合检索案例 例题1 遥感技术在土地规划中的应用 例题2 治疗乙肝的中药

实习题

学生作业

2.1 检索的概念及类型 2.1.1信息检索的概念 2.1.2信息检索类型及特点

2.1.1信息检索的概念 1.狭义的检索(Retrieval) 是指依据一定的方法,从已经组织好的大量有关文献信息 集合中,查找并获取特定的相关文献信息的过程。 2.广义的检索 包括信息的存储(Storage)和检索Retrieval)两个过程。

2.1.2信息检索类型及特点 1.依据数据格式和检索技术的层次 (1)文本信息的检索方式 (2)多媒体检索 (3)超媒体及超文本检索 2.依据用户使用信息的目的 (1)撰写论文的信息检索 (2)学科建设和科学研究的信息检索 (3)生产开发的信息检索 (4)回答或解决单一问题的信息检索 (5)对已知文献的查找

返回目次

2.2 检索工具概述 2.2.1检索工具的定义及类型 2.2.2检索工具的鉴别与评价 2.2.3常见检索工具及其选择原则

2.2.1检索工具的定义及类型 • 检索工具是人们用来存储、报道和查找各类信息的工具 1.按所收信息的学科内容划分 综合性、专科及专题 2.按著录信息的特征划分

1)目录型检索工具

2)题录型检索工具

3)文摘型检索工具

4)索引型检索工具

2.2.1检索工具的定义及类型 1)目录型检索工具 分类: 国家书目、联合目录、馆藏目录、出版社目录。 作用: (1)了解本学科的研究历史和研究现状。 (2)通过各类新书目,掌握本学科最新研究成果。 代表性书目: 《四库全书总目提要》、《民国时期总书目》、《中国国家书目》、 《全国总书目》、《全国新书目》。 【实例】图书馆的馆藏目录实例: 查 看 题 名 馆藏信息 知识产权100点 馆藏信息 知识产权200问 责任者 小野昌延 曾荇 索书号 出版社 D913 X966 专利文献出版社 D923.404 Z844 湖南人民出版社 出版时间 1992 2003

2.2.1检索工具的定义及类型 2)题录型检索工具 题录是将文献的篇目按照一定的排检方法编排而成的,供人们查找篇目 出处的工具。 【实例】 在《中文科技期刊数据库》的期刊论文著录格式如下: 【题 名】 辽宁老工业基地振兴与发展中的生态产业研究 【作 【机 【刊 者】 张军涛 构】 东北财经大学公共管理学院,辽宁大连116025 名】 社会科学辑刊.2004(1).-74-78 【ISSN号】 1001-6198 【C N 号】 21-1012 【馆藏号】 80414X 【关键词】 生态产业 循环经济 环境

经济协调发展

2.2.1检索工具的定义及类型 3)文摘型检索工具 特点:具有文摘。 • 【 实例】美国《化学文摘》的一则文摘: • • ①123:②3m ③Molecular therapeutic strategies in hepatities B Virus infection ④Offensperger, W.B.; Blum, H. E.; Gerok, W.⑤ (Med. klin. Univ, Freiburg, D-79106 Freiburg/br., Germany)⑥Clin Invest⑦ 1994,⑧ 72(10), 737-41⑨ (Eng)⑩. A review with 40 refs. ⑾Discussing strategies aimed at blocking gene expression in hepatitis B virus infection based on deploying antisense DNA/RNA and ribozymes acting either at the posttranscriptional level or in blocking triple helix formation at the transcriptional level.

注释说明:①该文摘所在卷号;②文摘号,通卷连续排号,一个号码代表一 篇文摘,文摘号中的末位英文字母为计算机校验字母;③论文题目,用黑体 排印,一律用英文,其它文种均按原意转译成英文;④著者姓名,姓在前, 名在后。合著者最多列10人,超过10人则列前9人姓名,其余作者用et al (等等)表示;⑤著者工作单位或论文寄发单位,置于圆括号内,有的还包 括单位地址,以上一般均用缩写表示;⑥刊物名称,用斜体字排印,一般用 缩写表示。刊名全称可查“资料来源索引”;⑦出版年份,用黑体字排印; ⑧卷期数,括号内为期数;论文起止页码;⑨原文文种,以缩写表示于括号 中;⑩文献类型和参考文献数;⑾文摘

2.2.1检索工具的定义及类型 4)索引型检索工具 按其内容可分为主题索引、分类索引、关键词索引、引文索引。 • 【实例】美国《化学文摘》的化学物质索引的实例: Benzoic acid① [65-85-0]②, analysis③ Detn.of, in food④, 4180d⑤ Benzoic acid [65-85-0], compounds⑥ 30919W Copper and urany complexes, formation of, in extn. Benzoic acid

——

⑦,2

——

acetly

——

⑧[577

56

0] esterification of, with phenols, 10076t • 注释说明:①索引标题,表示母体化合物,其下可有取代基,也可没有 取代基;②化学物质登记号;③普通副标题;④说明语,位于标题之下, 对标题和副标题起一个说明解释作用,使之能表达一个完整的具体内容; ⑤文摘号;⑥化学功能基副标题;⑦横线代表上行母体化合物(此例为 Benzoic acid);⑧取代基副标题。

2.2.2检索工具的鉴别与评价 1.信息收录范围与信息质量 2.著录的详略 3.著录、标引的质量 4.信息报道的时效 5.检索功能 • 另外可读性和权威性可作为选 择百科全书和词典等参考型工 具的辅助指标,而网络检索必 须考虑速度和检索费用。

2.2.3常见检索工具及其选择原则 2.2.3.1 常见检索工具概况 2.2.3.2检索工具的选择

2.2.3.1 常见检索工具概况  计算机检索工具 电子图书、网络版期刊库、专利文献、学位论文数据库。  印刷本检索工具 目前的电子版图书与印刷版图书相比没有明显优势,特别是古籍的电子 版图书还不能代替纸本图书。  综合性检索工具 其加工深度不及专业性检索工具,检索途径少。  专科性检索工具 详细完整的专业信息极具针对性。

2.2.3.2检索工具的选择 1.考虑学科范围、信息类型和数据量 【例题】用____检索α-呋喃甲醇羧酸酯的合成、含有碳和氢元 素的化合物的英文综合学术性文献。 选项 A.外文EBSCO数据库 C.外文农业类AGRICOLA数据库 FSTA B.外文农业类CAB文摘数据库 D.外文食品科技文摘数据库 2.了解收录的文献类型 【例题】 已知参考文献:徐经长等.国际会计学.中国人民大学 出版社.1999.要找原文,使用______检索《国际会计学》。 选项 A.中文科技期刊数据库 C.国研网 B.中国人民大学报刊全文数据库 D.图书馆的馆藏查询

2.2.3.2检索工具的选择 3.考虑信息的时间范围 同一个数据库版本不同,时效性也不一定相同。 例如清华大学图书馆收藏的《工程索引》(EI)各种载 体及馆藏的简况比较: 印刷版(EI)月刊,年度更新,收录文献源2600种, 馆藏年限1968-1996。 光盘版(Ei Compendex)季度更新,收录文献源2600种, 馆藏年限1970

1997年。 网络版(Ei CompendexWeb)包括光盘版(Ei Compendex)和Ei PageOne两部分,半月更新,收录文献 源5000种,馆藏年限1970至今。 因此网络版(Ei CompendexWeb)信息更新最快,量最大。

2.2.3.2检索工具的选择 4.考虑检索工具的检索功能 【例题】 同样是检索标准信息,如何选择不同的检索工具? 5.检索工具的检索费用 【例题】 要检索下载期刊、学位论文等文献原文,如何选 择便宜的服务?

返回目次

2.3 检索方法及检索途径

2.3.1检索方法 2.3.2检索途径

2.3.1检索方法 • 1.常规法 顺查法、倒查法、时间抽样法 • 2.引文法 由远及近地搜寻 ;由近及远地追溯 • 3.交替法 引文法和常规法结合

2.3.2检索途径

所谓检索途径就是利用信息的什么特征来查询相关的 信息,也就是用什么作为检索标识通过检索工具查到 所需的信息。信息类型的著录格式本身就是检索途径。

返回目次

2.3

图2-7是几种信息类型的数据库检索 途径 对照。

常见检索途径

2.3.2.1主题途径 2.3.2.2分类途径 2.3.2.3责任者/著者途径 2.3.2.4号码途径

2.3.2.1主题途径 • 1.主题词的规范 • 2.如何提取主题词 • 3.主题途径的优缺点 • 4.自由词

2.3.2.1主题途径 1.主题词的规范 【什么是主题】 主题“是一组具有共性事物的总称,用以表达文献所论述 和研究的具体对象和问题”,即文献的“中心内容”。 【什么是主题词】 表达主题概念的词汇就是主题词。 狭义的主题词仅指叙词 ; 广义主题词可以分为规范词汇和自由词汇,包括关键词、 主题词、标题词、叙词。 【主题词的规范】 同义词(近义词)、多义词(一词多义)和相关关系词的 规范化处理 。

2.3.2.1主题途径 1.主题词的规范 1)同义词的规范 (1) 对完全等同的同义词的规范 (2)对近义词的规范 (3)对学名和俗名的规范 (4)对不同译名、简称与全称的规范 对不同译名、简称与全称只选择正式的一个词。

同义词的规范实例 【实例】

煤炭”与“煤”是同义词,都可以使用,但是只能用 “煤”作为主题词。术语“商品煤”,英文是Commercial coal/salable coal,含义是作为商品出售的煤,其同义词“销 煤”,现在已经停止使用。术语“精煤”,英文是cleaned coal, 含义是煤经精选(干选或湿选)后生产出来的、符合质量要求的

产品,其同义词“洗精煤”现在已经停止使用。

【实例】

如“实验”与“试验”、“天然资源”与“自然资源”

这两组词汇,应该选择“实验”和“自然资源”作为主题词。

【实例】

计算机”与 “电脑”,是同义词,都可以使用,电脑是 俗名,计算机是正式用名,就用“计算机”作为主题词。“发动 机”与“马达”(motor)是同义词,但是选择“发动机”作为 主题词;同理,“贫铜矿”宜用“低品位铜矿”表达;土豆、洋

芋用“马铃薯”表达。

【实例】

对不同写法,如“X射线”与“爱克斯射线”,“氟利昂”

与“氟里昂”,应该选择最常用的“X射线”、“氟利昂”。

2.3.2.1主题途径 1.主题词的规范 (2)多义词的规范 限定多义的主题词含义或在特定检索工具规定只 有一个特定意义,排除歧义。 • 【实例】

Cell

既表示生物学中的“细胞”,又表示电学 中的“电池”,这种多义词易造成误检。在生物学检索工 具里规定“Cell

表示生物学中的“细胞”,“battery

表示电学中的“电池”。 • 【实例】杜鹃既表示一种鸟,也表示一种花,就须限定说

明为:杜鹃(动物)、杜鹃(植物)。

2.3.2.1主题途径 2.如何提取主题词 ( 1)检索词词意应该具体 【例题】查1980年代以来发表的有关继承和发扬中华民族优 秀传统道德方面的文章,如何确定检索标识? (2)同一文献,可以供多种研究课题作参考,可适应 多种需要,因此,同一文献内容,可用不同的检 索词组合表达 【例题】《加压素治疗休克引起冠心病》一文,其主题词可 以是“休克,药物治疗”、“加压素,临床应用”、“冠

心病,化学诱导”、“加压素,副作用”等多个检索词组

合。

2.3.2.1主题途径 3.主题途径的优缺点 1)优点 适合特性检索,查准率高 【实例】主题词“C语言

程序设计”就比分类号TP312表达得更准 2)缺点 通常不适合族性检索,查全率比分类号低。 【实例】计算机类词典采用“计算机”、“词典”等词组合检索,不如 用一个分类号“TP3-61

检索的数量多。 3)由于很规范,非专业人士难以掌握。 【实例】图书《C++ Builder5程序设计》应该用“C语言

程序设计” 作为主题词。 【获取主题词的技巧】在图书的版权页可以找到在版编目里面的主题词 和分类号码。或者在图书馆的馆藏数据找到主题词。例如查找《C++ Builder5程序设计/基础教学篇》一书的版权页可以找到主题词是“C 语言

程序设计”等。

阅读图书版权页

2.3.2.1主题途径 4.自由词 自由词指未经过规范化处理的词语。 优点:直接、简明 【实例】 想将“土豆烧牛肉” 翻译英文,只要知道 土豆的英文,输入自由词“土豆烧牛肉 potato

,找到含有土豆烧牛肉的英文网页。 这时,不必用“马铃薯”一词。

2.3.2.2分类途径 1.图书期刊分类法 2.专利分类法 3.标准文献分类法 4.分类途径的优缺点

2.3.2.2分类途径 1.图书期刊分类法 世界三大图书分类法 《杜威十进分类法》(DDC)(Dewey decimal Classification ) 《国际十进分类法》(UDC)(Universal Decimal Classification) 《国会图书馆图书分类法》(LCC)(Library congress classification) 中国图书分类法 《中国图书馆分类法》

(中图法)

《中国科学院图书馆分类法》(科图法) 《中国人民大学图书馆分类法》(人大法)

A 马克思主义、列宁主义、毛泽东思想 N 自然科学总论 B 哲学法律 C 社会科学总论 D 政治 E 军事 F 经济 O 数理科学和化学 P 天文学 Q 生物科学 R 医药、卫生 S 农业科学 G 文化、科学、教育、体育 H 语言 I 文学 J 艺术 K 历史地理 T 工业技术 U 交通运输 V 航空航天 X 环境科学 Z 综合性图书 表2-1《中国图书馆分类法》基本大类表

Ⅰ文学 Ⅰ0 文学理论 Ⅰ1 世界文学 Ⅰ2 中国文学 Ⅰ3/7 各国文学 Ⅰ22诗歌、韵文 Ⅰ23戏剧文学 Ⅰ24小说 Ⅰ25报告文学 Ⅰ26散文 Ⅰ27民间文学

…………… ..

Ⅰ222 古代至近代作品(~1919年) Ⅰ226 当代作品(1919~1949年) Ⅰ227 现代作品(1949年~) Ⅰ227.1 自由诗 Ⅰ227.2 抒情诗 Ⅰ227.3 叙事诗 Ⅰ227.7 格律诗 Ⅰ227.8 词 Ⅰ227.9 其他 表2-2文学类的类目设置

【题解】 (1)分析课题属于经济大类,具体是会计学。 (2)时间要求一般是10年。 (3)选择检索工具维普《中文科技期刊数据库》 (4)确定检索途径 采用分类途径具有纲举目张的族性检索功能。 (5)确定检索标识 【例题】 通过分类途径 检索“会计检 查和监督”的 此处的检索标识就是准确的分类号。 如下: F23会计 期刊论文 通过维普《中文科技期刊数据库》的“分类检索”可以更快捷地检索分类号。结果 F230 会计学(簿记学、会计核算理论入此) F231 会计簿记方法 F231.1 资产负债表 F231.2 复式记帐和帐户 F231.3 会计凭证和财产清查 F231.4 帐簿和记帐技术 F231.5 会计报表 F231.6 会计检查和监督 确认 “会计检查和监督”的分类号是“F231.6

。 (6)检索 在分类号字段输入“F231.6

就能检索出期刊论文。

国 际 专 利 分 类 法 2.3.2.2分类途径 2.专利分类法

A

生活必需品(农业、医 学、轻工业)

B

作业 C 化学与冶金 D 纺织与造纸 E 固定构造 F 机械工程、热工、照明、 军工、爆破 G 物理技术 H 电子技术 表2-3国际专利分类表(IPC)大类: 化工(分部不设类号) 04 水泥,陶瓷等,音或热 的绝缘材料 B 石灰、水泥、陶瓷、 石料及其类似物,

……

35/00 按组区分的成 型陶瓷品、陶瓷组分 35/02 碱性耐火制品 35/04

品 35/06

品 氧化镁基制 白云石基制 注意: “碱性耐火制品”完整分类号:C04B35/02 C是部名称,04为大类,B为小类, 35/00为大组,35/02是小组。

1)专利文献分类原则 (1)功能性类目 按发明的技术功能进行分类,即按发明的内在特点与性质进行分类, 而不按照其用途分类。 【实例】家庭的水管阀门与啤酒厂的水管阀门在IPC是否归入一个类? 【题解】是。一个机械阀门的内在功能(如开或关一个通道),是由其 结构或功能所决定的,至于这个阀门用在何处,是用在水管系统还是 用在啤酒厂的管道系统中,那是无关紧要的。 (2)应用性类目 应用性分类法是把物或方法限定于特定使用领域的分类法。 【例题】肥料或洗涤剂在国际专利分类表中是否归入一个类? 【题解】不。作肥料或洗涤剂的化合物,它们虽然是化合物,但从其用 途考虑,将它们分在肥料或洗涤剂的不同位置上。 采用两种分类中的哪一种,主要根据公开的发明的具体内容确定。 (3)混合归类 【例题】F16C包括所有轴悬,不管其用途如何,而B26K则限制得更窄, 仅包括专用于自行车上的轴悬。 因此在检索时,应同时兼顾两种类目。忽略任何一种相关类目都可能造 成漏检。

【例题】 查询A63H3/42的具体含义 【题解】 查询A部号码,结果如下: A人类生活必需(农、轻、医) A63运动、游戏、娱乐活动 A63H玩具,如陀螺、玩偶、滚铁环、积木 A63H3/00玩偶 A63H3/36

·

零件;附属物 A63H3/38

··

玩偶的眼睛 A63H3/40

···

会动的 A63H3/42

···

眼睛的制作(人用的假眼睛入A61F2/14) 因此A63H3/42的含义是“玩偶的会动的眼睛的制造”。 注意:若干下级小组,用园点数目表示分类级次。 如A63H3/40后有三个圆点,则为八级类。作为小组一级的A63H3/36以下还有两 个细类,A63H3/40和A63H3/42,但从IPC号表面是看不出来的。 上位类对下位类有约束力,而且有时一些类目加起来才行。 如A63H3/38玩偶的零件或附件之一:“眼睛”,A63H3/40为“玩偶的会动的眼 睛”, 因此A63H3/42含义是为“玩偶的会动的眼睛的制造”。

【例题】如何确定检索课题“皱纹纸的加工”的专 利分类号? 【题解】 (1)根据课题确定关键词“纸”和“加工”,查询一篇专利 信息,试找出分类号B31。 (2)按B31阅读分类表,查到: B31F 纸或纸板的机械加工或变形 B31F 1/12皱纹纸 在B31F 1/12之下,又有三个下一级分组: 1/14,1/16,1/18 (3)故该课题完整的IPC类号应为: B31F 1/12、B31F 1/14、B31F 1/16、B31F 1/18。

3.标准文献分类法 中国标准分类法 (Chinese Classification for Standards) CCS部分分类

A

综合

………………………………………………………………… 00

09

标准化管理与一般规定

10

19

经济、文化

20

39

基础标准

40

49

基础学科

50

64

计量

65

74

标准物质

75

79

测绘

80

89

标志、包装、运输、贮存

90

94

社会公共安全

B

农业林业

…………………………………………………………… 00

09

农业、林业综合

10

14

土壤与肥料

15

19

植物保护

20

29

粮食与饲料作物

30

39

经济作物

40

49

畜牧

50

59

水产、渔业

60

79

林业

90

99

农、林机械与设备

4.分类途径的优缺点 1)优点 (1)族性检索,查全率较高。 (2)按照人们认识事物的习惯,以学科分类为基础,容易被 人们接受和应用 【例题】检索英语会话类辞典,例如《美国语会话百科》、 《英语会话大全》、《现代英汉生活用语图解词典》,请 选择,哪种检索途径才能够同时查出这3本书? 【选项】 A.用关键词“会话”和“词典” B.用中国图书分类号H319.9-61 C.用书名“英语会话”和“大全” D.用书名“英语会话”和“词典”

4.分类途径的优缺点 2 )缺点 (1)不适用于特性检索,查准率比主题词低 【例题】论文《多功能昆虫鸣声信号采集和分 析系统及其在褐飞虱鸣声研究中的应用》和论文 《活菌制剂与抗生素对仔猪饲料消化率和肠道微 生物数量的影响》适合用分类途径还是主题途径 检索? 【题解】这类课题仅仅采用分类号无法准确表 达课题,用分类号只能粗略表达,并且分到两个 类目,不易归类,适宜用主题途径检索。 论文1的【关键词】是:昆虫 insect鸣声信 号acoustic signal 信号采集signal acquisition 信号分析 signal analysis行为观 察 褐飞虱brown planthopper 水稻rice 害虫 pest

(2)不能适应学科发展中的变化,难以反映新学科和新名词 术语 【实例】食品风险分析是保证食品安全的一种新模式, 同时也是一门正在发展中的新兴学科。风险分析的目标在 于保护消费者的健康和促进公平的食品贸易。目前的文章 在分类上暂时归入[ R155.5 ] 食品卫生与检验和 [ TS201.6 ] 食品安全与卫生。没有一个专门的“食品风 险分析”分类号。 (3)人们认识的不统一,往往造成分类不一致及排检的错误, 不易反映交叉学科。 【实例】例如管理心理学,它是心理学的一个分支,主 要是研究企业中人的心理活动规律,用科学的方法改进管 理工作,充分调动人的积极性的一门学科。但是,人们很 可能误解为归入管理学。

返回

目次2.3.2

2.3.2.3责任者/著者途径 英文版著者索引中人名规则 1.按姓、名次序排列。 2.同姓名著者,先按名字的首字母顺序排列,不全者排在全者 之前,单名排在双名之前,简名排在全名之前。 3.复姓作者,将复姓作整体看待 4.团体著者也同个人著者一样,按团体单位名称的字顺排列。 5.翻译为英文的中国著者姓名

2.3.2.3责任者/著者途径 翻译为英文的中国著者姓名如何处理 (1)翻译的规则 分为音译和意译。中国著者姓名和团体机构名称的音译,一 般用汉语拼音。 【实例】原西南师范大学在欧洲专利数据库就有三种写法: Southwest China Normal University / Southwest Normal University/ Xinan Teachers, University 有的数据库例如《工程索引》常将University缩写成Univ。 原西南农业大学就缩写成“sw agri univer

。 (2)拼写形式 【例题】在英文数据库检索作者“金长青”的论文,作者名 除了“Jin, ChangQing

还有其他拼写形式? 【题解】Jin, Chang-Qing /Jin, CQ/Jin, C.Q/ Jin,

C.Q./ Jin, C.-Q 返回 目次2.3.2

2.3.2.4号码途径 常见的号码索引: ISBN号、索书号、ISSN号、专利号、入藏号、报告号、标准编号 常见的专用符号代码索引: 元素符号、分子式、结构式等 常见的专用名词术语索引 地名、机构名、商品名、生物属名等 注 :索书号 :由两部分组成,中间用空格隔开。 第一部分是根据图书的学科主题所取用的分类号码。 第二部分是按照图书作者姓名所编排的著者号码,或者是按照图 书进入馆藏时间的先后所取用的顺序号码。

如何在书架准确找出一本书 一个书架几层,每层分成几格。 按照带有字母和数字的索书号 排列,先排满上层,再排下层。 每层从左到右排列。 一个书架排完,接着排到右边的 书架。

书架的顺序

A

马 列 毛 邓

B

哲 学 宗 教

…… X

环 境 、 安 全 科 学

Z

综 合 图 书

图书的书标和排架号(索书号) 组成

中图分类号 种次号,依据作者来取号

书架上图书的顺序

I712 L315 I712 L471 I712.4

B232 I75 C144

【例题】 检索课题“植物生长调节剂5,6-二氯吲哚乙 酸的制备方法”的外文文献,该选择哪种途径? 用户仅知道5,6-二氯吲哚乙酸的英文名称是 “5,6-dichloro-3indolylacetic acid

。 【题解】最好采用号码途径。 因为一种结构唯一的化学物质即使有几个别名, 也只有一个化学登记号,如同人的身份证号码, 不会重复,因此首选的检索途径是登记号途径。

先选择收藏化学信息最权威的STN国际联机检索系统, 用美国《化学文摘》数据库附属的化学登记号数 据库,检索到化学登记号是“98640-00-7

,用该 号码检索出21篇信息,查全率高。检索发现该生 长调节剂的正式的化学物质名称是“IH-Indole 3-acetic acid,5,6- dichloro-(9CI)”,而 用户知道的是一个别名,还有一个别名是“5,6 Dichloroindole-3-lacetic acid

。 用一个别名检索会遗漏文献。

图 2-9 化学文摘的化学物质登记号样例

• 幻 灯 片 4

2.4 计算机检索概述

2.4.1计算机检索简况 2.4.2计算机检索的相关概念 2.4.3检索式的拟订

2.4.1计算机检索简况 计算机检索指利用计算机及相关设备进行的文献信息检索。 信息检索技术正向两个方向迅速发展: 一是在深度上提高管理和组织信息的能力 传统信息检索向全文文本、多媒体、多载体、多原理等 新型信息检索的发展.

二是在广度上提高管理和组织信息的能力 文献资源的网络化和分布化,面向Internet中浩瀚无垠的 资源。

2.4.2计算机检索的相关概念 1.检索系统 信息检索系统包括两个子系统:存储子系统和检索子系统。 2.联机检索 利用与检索系统或信息中心的主机连接,在中央处理机控制下查询系 统内的数据库,并能够与系统实时对话,随时调整检索策略。 3.网络信息 是指利用网络检索软件或搜索引擎查询各地在互联网上发布的信息资源。 4. 数据库 是在计算机存储设备上按一定方式存储的相互关联的数据集合。 字段(

Field

) 记录(

Record

) 文档

(file)

数据库

按国际上通用的分类方法,数据库分为以下三大类 1)参考数据库(Reference databases) 包括书目数据库(Bibliographic databases) 指南数据库(Referral databases或Directory databases)。 2)源数据库(Source databases) (1)数值数据库 (2)文本-数值数据库 (3)全文数据库 (4)术语数据库 (5)图像数据库 3)混合型数据库(Mixed databases)

2.4.3检索式的拟订 2.4.3.1布尔逻辑检索算符 2.4.3.2位置检索算符 2.4.3.3截词检索算符

2.4.3.4字段揭示及限制算符

2.4.3.5其它符号 2.4.3.6注意事项

2.4.3检索式的拟订 2.4.3.1布尔逻辑检索算符 1.逻辑“与” 用“and

、“*”或者空格表示。 在网络搜索引擎中习惯用空格代替 “and

。 【实例】检索“中国人民政府”这个网站,可以输入“中国*政 府”、“中国 and政府”、“中国 政府”等。 2.逻辑“或” 用“or

、“十”或逗号表示。 “OR

。 在网络搜索引擎中习惯用逗号代替 【实例】在搜索引擎中输入“计算机,多媒体,Windows98

则查询至少包含 “计算机”、“多媒体”、“Windows 98

三者之一的信息。 3.逻辑“非” 用”not

或”-

表示 【实例】输入“automobile not car

,就要求查询的结果中包含automobile (汽车),但同时不能包含car(小汽车)。 在搜索引擎中输入“电视台-中央电视台”,查询结果不包含“中央电视台”。

2.4.3检索式的拟订 2.4.3.2位置检索算符 常用的位置检索算符有以下几种: 1.邻近位置检索算符(W) 【实例】Powder(W)Coating表示这两个单词相当于一 个组合词。 2.邻词位置检索算符(nw) 【实例】Fluidized bed reactor(流化床反应 器)可用Fluidized(1W)reactor检索,中间可 存在1个词。 《EBSCO》数据库使用邻近位置检索算符(Wn)。

【实例】用《EBSCO》数据库检索税收改革文献,检 索式“tax W8 reform

表示tax一定在前,距离 reform最多是8个词汇,因此可以检索出 “tax reform

,不能检索出“reform of income tax

注意 Tax 与 reform 的距离

3.句子位置检索算符(S)

A(s)B表示A和B必须同时出现在记录的 同一个句子或短语中,但次序可能随意改 变,A与B之间可以有若干个其他的词。 在农业生物数据库CAB用“near

表示 (S)。 有的数据库用“(N)” 表示 (S)。

返回

目次2.4

返回

目次2.4.3

2.4.3检索式的拟订 2.4.3.3截词检索算符 1. 后截词 后截词就是保持检索词的前部分的检索。中文数据 库里面习惯称为“前方一致”。 【实例】输入“tele*

,将检索出 telecommunications、telecom、telephones 、 television等开头字母为tele的词。 2. 前截词 【实例】如果要把含有“computer

、 “microcomputer

、“minicomputer

这三个词的文 献全部检索出来,在多数外文数据库只要输入 “*computer

即可。中文数据库里面习惯称为“后 方一致”。

3. 中间截词 【实例】在多数外文数据库输入“B?nard

可命中Banard和 B

é

nard。 【实例】在多数外文数据库输入“sul*ate

,检索结果将包 含“sulphate

、“sulfate

等。 4. 前后截词 中文数据库里面习惯称为“中间一致”。 【实例】在多数外文数据库输入“*computer*

能检出含有 “computer

、“computerized

、 “computerization

、 “computers

、“microcomputer

、“minicomputer

这 些词的全部文献记录。

2.4.3检索式的拟订 2.4.3.4字段揭示及限制算符 字段揭示符 用文字或字母来表述某字段所代表的含义。 如字段揭示符“AUTHOR

或“作者”或“AU

表示作者字段 字段限制符 用来连接字段揭示符和检索词的算符,表明检索词隶属于某字 段。 如Proquest数据库中,检索式AU(JOHN)中,()为字段限制 符,将检索词JOHN限定到AU字段中,即检索出的文献的作者 是JOHN。 相同的检索词在不同的字段中

检索到的结果不同。

2.4.3检索式的拟订 2.4.3.4字段揭示及限制算符 【实例】用《中文科技期刊数据库》检索机械产品 采用计算机辅助设计的论文。 用不同字段作为途径,如下所示: 选择”u=任意字段” 输入“计算机辅助*产品”, 查出12篇; 选择“t=题名”输入“计算机辅助*产品”,查出2 篇; 选择“k=关键词”输入“计算机辅助*产品”,查出 2篇; 检索入口 选择“c=分类号”输入“机械产品”的分 类号“TH122

年限设定 - 查到243条。

返回目次 2.4

返回目次 2.4.3

选错了字段,还可能导致检索失败。例如某学生检 索课题“纳米技术在除螨功能纺织品中的应用”, 在检索中国国家知识产权局的专利时,无论选择 “名称”还是“摘要”字段,输入:纳米

and

螨 虫

and

称”字段输入“纳米”,选择“摘要”字段输入 “螨”,选择“主分类号”字段输入国际专利分 类号“ 纺织品,检索结果都是零。后来选择“名

D

——

的处理类”分类号“ 《一种纳米防螨抗菌针织服装的生产工艺》。造 成漏检的原因是事先不知道该专利的准确名称, 没有提取准确的检索词,也没有考虑发挥不同字 段的协同作用。 纺织与造纸”的纺织类的“织物

D06”

,检索结果是一篇名为

找到专利分类表纺织类号码

多字段协同的检索过程

检索结果

2.4.3检索式的拟订 2.4.3.5其它符号 1.括号 括在其中的操作符先起作用。 2.引号 引号内的检索项以整体形式出现。 3.个别数据库使用的特殊符号 某些搜索引擎使用加号(+)表示该单词 必须出现。

【实例】在某些搜索引擎中输入“+电脑+电 话+传真”就表示要查找的内容必须要同时 包含“电脑、电话、传真”这三个关键词。 个别数据库例如“国研网”、山东标准 网使用“&

代替“and

;欧洲专利局光盘 数据库的“without

、美国专利商标局数 据库的“andnot

就是通用的“not

返回目次 2.4

返回目次 2.4.3

Proquest 所用的运算符号 within 3,pre/1

2.4.3检索式的拟订 2.4.3.5注意事项 1. 正确理解数据库检索标识 2. 确保检索策略与课题的匹配性 1) 检索项与检索词的正确匹配 2) 检索式中各个检索项或检索元素之间的逻辑关系 3) 课题的隐含主题概念的挖掘

实例

1. 正确表达课题

• 不能总是简单地把课题名称当成文献的题目直接 检索。 用《中文科技期刊数据库》检索有关“法 律的渊源”的期刊论文,有的题目是《

……

法制 的渊源 源”。

……

》,而关键词是“法律”,所以最好 选择关键词字段而不是标题字段输入“法律*渊 • 【实例】某专利申请的主题涉及商店待出售衣服 上防止衣服被偷窃的装置,该装置由两个从衣服 正反面锁合在一起的部件组成,其中一个部件上 有针状结构,另一个部件上有将针啮合住的机构, 欲将这两部分分开时,如果不用特殊工具,机构 中的装有液体的小容器就被损坏,液体流出,污 染衣服。要检索这类专利信息,如何表达检索课 题的意图?

【题解】课题不能简单地表达为“防止衣服被偷窃 的装置”,而要表达为关键词“防盗” (theftproof)、“液体”(liquid)与“衣服” (cloth)和国际专利分类号例如物理部的 G08B15/02、G08B13/00、G09F3/03、生活部的 A44B9/18等。在发明名称字段输入“防盗and衣 服”,加用分类号,在结果中选择摘要或者发明 名称字段再输入关键词“液体”作进一步检索。 如果检索到的信息不是很多,可逐一浏览。为了 避免漏检,还可以增加上述关键词的同义词。

• 在书目数据库中人名多半可以作为责任者,而且 检索时不必考虑责任者的年龄和是否健在,因此 有些初级检索者错误地把这些概念用在期刊论文 的检索上。 • 【实例】检索著名经济学家胡鞍钢2000年在《中 国软科学》上面发表的论文,如果用《中文科技 期刊数据库》可以这样输入“A=胡鞍钢*J=中国软 科学”,时间限定- 。但是要检索关于研究鲁迅 的论文,输入“鲁迅”时必须选择途径为标题或 者关键词,不能选择为作者途径。这是因为“鲁 迅”在这里是被研究的对象而不是论文的作者。

2. 确保检索策略与课题的匹配 性

• 1) 编检索式时最重要的是注意检索项与检索词的 正确匹配。例如当选择的检索项是关键词,输入 的检索词就必须是关键词,如果一个词不能完整 地表达检索要求,需要进一步描述时,只能添加 关键词,用算符来联结它们,而不能用一个句子 来代替。例如检索“法律的渊源”的中英文信息, 虽然用“法律的渊源”、on sources of law这样 的词组能够在一些数据库实现检索,但是检索量 少,严格说不算是检索式。检索式顾名思义就像 数学的算式一样必须有加减乘除的符号,而不是 仅有长串数字。

2)注意检索项之间的逻辑关系。

• 特别要区分课题与论文标题的区别,不能做字面 的解析。例如研究“法律与经济和政治的关系” 的课题,需要检索的信息是法律与经济或者政治 两者之一的关系,因此“经济”与“政治”的关 系是“逻辑或”,不是“与”,则检索式“法律* (经济+政治)”比“法律*经济*政治”检索的范 围大得多。

• 反过来,有的课题应该用“逻辑与”的关 系,例如检索“缓释制剂在中药中的应 用”,在《中文科技期刊数据库》的检索 式应该是选择题名或者关键词字段(代码 是m=)输入“缓释制剂*中药”,但是不少 学生采用了检索式“ 缓释制剂+中药”,这 样检索到许多含有“缓释制剂”与“中药” 之一的论文,“缓释制剂”与“中药”没 有必然联系。

检索式“ 缓释制剂*中药”的结 果

检索式“ 缓释制剂+中药”的结 果

3)注意隐含概念

• 3) 用词汇检索时,一定要对课题的主题概 念、特别是课题的隐含主题概念认真分析, 掌握课题的内容实质,概括出能最恰当地 代表主题概念的检索词,同时注意用词的 通用性、准确性和规范性。例如“知识产 权”一词隐含着“专利权”、“版权”、 “著作权”等概念。 • 若用《中文科技期刊数据库》检索,参考 检索式是:知识产权+(专利权+版权+著作 权+商标权+工业产权)。

如果词汇涉及面太广,难以一一枚举,最好用分类 号。例如检索“工农业废水循环利用”、“纳米 技术在生物学领域的应用”等课题,用中国图书 馆分类号表达工业(T)、农业(S)、生物学 (Q),才能保障查全率。而“废水”和“纳米” 是比较专指的检索词,也没有形成学科,所以直 接作为关键词,不用分类号表达。同时,检索式 前面排列范围比较狭窄的检索项例如“废水”、 “纳米”,后面连接范围较宽的检索项例如工农 业的分类号,可以提高速度。

若用《中文科技期刊数据库》检索,参 考检索式是: • M=废水*利用*(循环+合理)* C= (T+S) • M=纳米*C=Q • 4)当检索过于复杂,检索要求难以用 一个检索式来表达时,应该采用分步 检索或二次检索以提高查准率。

返回目次 2.4

返回目次 2.4.3

仅使用关键词或者题名检索的结果

结合工业、农业分类的检索结果

检索专利文献

仅使用专利分类号检索有结果

其中一篇的名称没有“工业”,却 是工业废水处理工艺的专利

2.5检索和分析的步骤

1.检索准备 2.选择合适的检索工具 3.选择检索途径 4.拟订检索式 5.实施检索 6.筛选文献 7.索取原文

步骤示意图

2.5检索步骤 2.5.1检索准备 1.弄清课题学科属性、专业范围及其相关内容 2.弄清检索课题的信息类型和时间要求 3. 考虑课题的特殊要求 4.明确用户自身的信息需求

【例题】中文研究课题为“法国文艺复兴时期文学作品浅 析”。要求查询国内中文检索工具。如何具体分析课题? 【题解】: (1)学科属性、专业范围 属于社会科学,具体属于外国文学,还涉及外语等 多学科。 (2)文献类型 文献类检索结合事实数据类检索: 事实数据类检索包括①查询“文艺复兴”这个概 念②文艺复兴时期有多长?③在该期间法国诞生 了哪些重要的有影响的作品?可以从百科全书、 文学辞典等参考工具书中查到。

文献类检索就是查询是否有前人撰写的法国文艺复 兴时期文学作品浅析的期刊论文、学位论文、专 著或者网页。 (3)课题的特殊要求 补充检索标识:文学家、F

·

拉伯雷、小说、《巨 人传》。 因为查阅《中国大百科全书》第5卷2757页上关于 F

·

拉伯雷的记载,知道在当时的法国文学家F

·

拉 伯雷以长篇小说《巨人传》在欧洲获得崇高声誉。

2.5检索步骤 2.5.2筛选文献 对于课题查新和写开题报告而进行的检索 1.还应将所有相关文献信息汇总,并分析 梳理,编辑,选择密切相关文献,调阅文 献的全文,提取有关数据及指标。 2.应当根据课题的科学技术要点,将检索 结果分为密切相关文献和一般相关文献。 对相关文献情况及对相关文献的主要论点 进行对比分析。

2.5检索步骤

2.5.3获取原文

1.网上传递原文 2.就近借阅 3.特种文献的索 取方式

一篇会计管理系统的专利说明书

【例题】西南大学学生已知一些农业大学学位论文题 目,如何获得原文? 【题解】 方法1: 使用西南大学图书馆的馆藏目录查询到图书形式的学位论文,直接 借阅: 广西大学硕士学位论文摘要汇编.第二辑 广西大学研究生科编 浙江农业大学硕士学位论文摘要汇编(九三届) 浙江农业大学编 方法2:使用图书馆购买的学位论文数据库检索,可以直接查看近 年来的原文。 方法3:本地没有的则通过网上检索得到题目后,再从高校图书馆、 国家科技图书文献中心(NSTL)通过馆际互借寻找全文,收费较 低,时差也短。 方法4:外文图书、会议论文可以通过OCLC获取。

返回目次

2.6综合检索案例 案例1 【综合案例】如何检索课题“遥感技术在土 地利用规划中的应用”的中外文信息? 提示:遥感在土地利用规划方面中主要是利 用遥感提供的瞬间成像,对地表面一定区 域景观的真实、客观的记录和形象显示, 对土地利用及发展趋势作出更好的预先估 算。

2.6

例1课题:遥感技术在土地利用与规划中的应用 1. 分析课题: 1)学科范围 本课题的学科分类主要属于“地球科学”,跨多科学,根 据《中图书馆图书分类法》的类目设置,涉及“遥感”及 其分类号P237,土地规划学及其分类号F301.2、自动化技 术/计算机技术类及其分类号TP7; 2)时间范围 查找最近10年的文献。 3)文献类型 主要属于文献类检索,信息类型涉及图书、学位论文、期 刊、专利、报纸等文献类型。 4)语种 先查中文,后查外文

综合检索案例 2. 选择检索工具 例1 【题解】 1) 中文数据库(部分) 维普《中文科技期刊数据库》、清华同方CNKI的论 文库、国家科技图书文献中心、万方公司数据库、 中国国家知识产权局 2)外文类数据库(部分) 综合数据库EBSCO的学术期刊库ASP 、荷兰 ELSEVIER数据库、Engineering Index(美国《工 程索引》)、欧洲专利局、美国专利商标局数据 库(可以通过中国国家知识产权局链接)、搜索 引擎Google。

就本题而言,首选的检索工具是维普中文期刊数据 库,是收录全国1989年以来各类科技期刊最全、 更新速度最快的中文期刊全文数据库,正合本题 使用,而期刊文献具有连续性与新颖的特点,是 最重要的信息源之一。 备选的检索工具:第一是同方或者万方硕士博士论 文数据库,检索学位论文。学位论文写作周期长, 篇幅较大,内容成熟系统,能全面反映各方面的 资料。第二类是综合类EBSCO、ELSEVIER数据库等。

综合检索案例 【题解】 3. 确定检索途径 本课题可选用主题(关键词)途径为主,结合分类途径。 4. 确定检索词: 通过清华开发的CNKI数据库的博士硕士论文数据库可以检索 到论文的英文关键词,首选的检索词:土地利用(land use)、遥感技术RS(Remote Sensing)、规划 (planning) 备用的同义词:土地:land、ground、earth、soil;利用: use、exploitage、utilization;规划:plan、program、 project

综合检索案例 【题解】 5. 拟定检索式(部分) 1) 中文科技期刊数据库的检索式:k=遥感*(土地利用+土地规划+技术) *c=(TP7+F301.2+P237) 图2-3中文科技期刊库检索界面

综合检索案例 2)外文检索范例之一 从西南大学图书馆的“外文数据库”进入Ebsco 数据库 图2-4 西南大学图书馆外文数据库EBSCO界面

综合检索案例 图2-5西南大学图书馆外文数据库EBSCO界面

• Sensing) 综合检索案例 3)搜索引擎Google的检索式: 图2-6 Google的界面

综合检索案例

6. 实施检索

筛选检索结果,按照参考文献格式列出部分 信息: 1) 期刊论文 李巧玲.区域土地利用规划研究中遥感空间 信息系统技术的应用.湛江海洋大学学 报,1999.

2) 网络论文 吴秋华 白强.鄂伦春旗土地利用遥感动态监 测信息系统.www.Google.com

7. 索取原文

获取原文的方法较多,参考答案:

期刊、学位论文、电子图书和专利直接点击阅读原文。

图书馆收藏的纸本图书需要借阅;国家科技图书文献中心的 文献可以付费从网上传递原文。 中文科技期刊数据库、万方学位论文等和中国国家知识产权 局专利数据库提供图片格式的原文文件; EBSCO、ELSEVIER等外文数据库大多有论文原文。 书生之家、超星等数字图书馆提供图片格式的电子图书。

综合检索案例部分原文 图2-7《中文科技期刊数据库》的原文 图2-8 用Google检索到的原文

【例题2】综合分析治疗乙型肝炎的 中药的信息 • 【例题】综合分析治疗乙型肝炎的 中药的信息,特别是中国专利,筛 选其中最常用的中药基础方,并作 评价。(资料来源:陈蔚杰完成的 一项研究的节选) • 【参考题解】主要步骤:

• 1.分析课题 • 提示:乙型肝炎是我国多发病,危害大,虽然治 疗药物多,但是没有特效药。为了客观地筛选而 不是主观地凭经验判断最常用的中药,依据需要 检索信息,统计分析。 • 本课题的学科分类主要属于“医学”,特别是中 药学、化学。涉及《中国图书馆分类法》 第7版国际专利详细分类号:A61P1/16 药[7]

中药学” 分类号R28,如图2-16所示,国际专利分类号A61。 治疗肝脏 或胆囊疾病的药物,例如保肝药、利胆药、溶石

• 课题提示时间范围是查找最近10年的文献,最好 能上溯多年不限。主要属于文献类检索,信息类 型涉及图书、学位论文、期刊、专利、报纸等文 献类型。先查中文,后查外文。 • 2. 选择检索工具 • 1) 中文数据库(部分) • 维普(www.cqvip.com)《中文科技期刊数据库》、 清华同方CNKI的论文库、国家科技图书文献中心 (www.nstl.gov.cn)、读秀电子图书网、万方公 司(www.wanfangdata.com)

• 数据库、中国国家知识产权局(www.sipo.gov.cn)、中 医药专题数据库。 • 2)外文类数据库(部分) • 综合数据库EBSCO的学术期刊库ASP、荷兰ELSEVIER数据库、 《生物学文摘》数据库、《化学文摘》数据库、 Engineering Index(美国《工程索引》)、欧洲专利局、 美国专利商标局数据库(可以通过中国国家知识产权局链 接)、搜索引擎Google。 • 选择原则一般是先用中文,后用外文数据库。先用期刊数 据库,后用图书、学位论文、专利数据库,最后用其他特 种文献数据库或者搜索引擎。就本题而言,首选的检索工 具是维普《中文科技期刊数据库》,是收录全国1989年以 来各类科技期刊最全、更新速度最快的中文期刊全文数据 库,正合本题使用,而期刊文献具有连续性与新颖的特点, 是最重要的信息源之一。

• 备选的检索工具:第一是同方或者万方硕 士博士论文数据库,检索学位论文。学位 论文写作周期长,篇幅较大,内容成熟系 统,能全面反映各方面的资料。第二类是 综合类EBSCO、ELSEVIER数据库等。 • 3. 确定检索途径 • 本课题可选用主题(关键词)途径为主, 结合分类途径。

4. 确定检索词: 通过清华开发的CNKI数据库的博士 硕士论文数据库可以检索到论文的 英文关键词,首选的检索词:乙型 肝炎(hepatitis B)、中药 (Chinese medicine)、中草药 (Chinese herb) • 备用的同义词:中成药

• 1) 《中文科技期刊数据库》的检索式 选择题名或者关键词字段(代码是m=) 输入“(乙型肝炎+乙肝)*(中药+中 成药+中草药) • 或者选择分类检索途径R282结合关键 词,选择任意字段,输入“(乙型肝 炎+乙肝)*R282

图2-17 《中文科技期刊数据库》 检索结果界面

2) 清华CNKI数据库检索过程

【注意】框架式的界面没有指令检索式 的精度。如图2-18所示的检索式的本 意用指令检索式表达是:“乙型肝炎 and (中药or中成药)”,实际效果 却等于“乙型肝炎and中药 or中成 药”,先检索“乙型肝炎and中药”, 然后检索所有含有“中成药”的论文, 与乙型肝炎可以无关。

3) 国家科技图书文献中心检索范例

图2-21 中国国家科技图书文献中心 检索界面(经过剪辑)

图2-22 中国国家科技图书文献中心 检索结果界面

4)检索中国专利 进入中国国家知识产权局的专利检 索数据库,输入最常用的检索式: (乙型肝炎OR 乙肝)(中药 OR中 成药 OR 中草药) 或者(乙型肝炎+乙肝)(中药+中 成药)

图2-23中国国家知识产权局专利检索界面

检索到从1993年以来申请公开和授权的发明 专利 66 条,没有实用新型专利。按照查 准率检查,排除第16条:治疗非甲非乙型 肝炎的中药丸剂,还发现专利申请号 03122829的专利获得授权,与在先的 02115832是同一专利内容。实际统计专利 64条。

图2-24中国国家知识产权局 专利检索结果界面

图2-25中国国家知识产权局 专利检索结果界面

用分类号扩大检索范围

• 为了防止漏检,阅读专利摘要和权利要求书,找 出国际专利分类号A61K35/78;A61P1/16,单击展 开中国国家知识产权局的IPC分类,阅读类目释义: • A61K35/78 来源于植物的材料〔2〕 • A61P1/16 治疗肝脏或胆囊疾病的药物,例如保 肝药、利胆药、溶石药[7] • 用分类号A61K35/78和A61P1/16扩大检索范围,查 出名称并无“中药”一词的专利,例如 :乙肝 “转阴排毒丸”和内蒙古福瑞制药有限责任公司 申请的专利“复方鳖甲软肝片用于治疗慢性乙型 肝炎肝纤维化的用途”。但是又会降低查准率, 例如:抗乙肝多色降脂营养味精、抗乙肝降脂十 八全营养调料。因此将重点研究发明名称含有 “中药”的64件发明专利。

5)检索中文电子图书。选择超星电 子图书公司的读秀网

6) 检索外文期刊数据库

(1)检索综合型的EBSCO数据库。 从西南大学图书馆的“外文数据库”进入综 合型的EBSCO数据库。

图2-29 EBSCO的检索界面

(2)检索《生物学文摘》数据库 从OVID数据库进入BIOSIS PREVIEWS (2000-2004年)。检索到部分论 文包括专利,但是由于OVID数据库 检索功能不强,实际检索到的论文 在内容上没有谈到治疗乙肝。

(3)检索外文专利数据库

在欧洲专利局检索世界范围的专利,输入检 索式hepatitis AND Chinese AND(herbs OR medicine),检索结果为零。这是由于 其数据库检索功能不强,只有减少检索词, 检索6篇专利,都是中国专利。

图2-32欧洲专利局检索结果界面

图2-33《美国专利商标局数据库》 检索结果

• 最后用收录化学类专利最多,功能比一般外文数 据库强大的《化学文摘》数据库检索,选择子库 《SciFinder》的检索界面“Explore by Research Topic

,在文本框输入检索式: hepatitis with medicine with Chinese Traditional。 • 检索结果多数是中国专利申请。检索过程和结果 比较多,此处从略,详见本教材的配套课件第6章 外文数据库用法示例。检索结果之一如图2-34所 示。

7) 补充搜索 •用搜索引擎Google检索,参 考检索式是:(乙型肝炎OR 乙肝)(中药 OR中成药 OR 中草药)OR(hepatitis B Chinese (herbs OR medicine))

6.筛选检索结果 • 6.筛选检索结果,按照参考文 献格式列出部分信息: • 1) 图书 • 王坤山,王慧艳.乙型肝炎良方 1500首.北京:中国中医药出版 社.1998

• 2)期刊论文 • 于洪亮,唐立尧等.4种常见中药治疗乙肝 的研究进展.药学实践杂志.2006,24(1): 31-34 • 曹俊岭; 孙玉琦. 大黄蟅虫丸的临床研究 与展望. 中国药房.2006,17(6):464-465 • LiuJ,McIntosh H ,Lin H.Chinese medcinal herbs for chronic hepatitis B:a systematic review.

Liver, 2001:21:280-286

• 3)学位论文 • 谈博.肝外DHBV复制治疗学意义及中药体外抗肝纤 维化筛选平台的探讨.博士论文.广州中医药大 学.2002

• 4)专利信息 • 何述金.治疗乙肝的中药及其制备方法.CN1435244.

• 5)网络论文 • 杨柳明等.强肝胶囊治疗慢性乙型肝炎肝纤维化的 临床病理研究..www.hankangyaoye.com.2006-7 27

7. 索取原文

• 获取原文的方法较多,期刊、学位论文、 电子图书和专利直接点击阅读原文。图书 馆收藏的纸本图书需要借阅;国家科技图 书馆的文献可以付费从网上传递原文。 • 电子图书、期刊、学位论文等和中国国家 知识产权局专利数据库提供图片格式的原 文文件。如果没有原文,可以根据期刊的 年卷期号、图书的书名到附近图书馆查阅。 以下是部分原文。

除了图书馆购买的信息资源,还可利用网上 其他学术信息检索工具和可免费查询的外 文数据库。如Google学术搜索 (http://scholar.google.com)、Google 图书搜索(http://books.google.com)、 读秀知识库(www.duxiu.com)、CNKI知识 搜索 (http://search.cnki.net/index.aspx)、 Scirus科学搜索引擎 (http://www.scirus.com)、开放获取期 刊指南(http://www.doaj.org/)等;

后者如Sciencedirect(SD)、IEEE、 Springerlink的互联网网站及国家科技图 书文献中心的全国在线免费期刊和数据库 等。目前迅速发展的网上联合咨询系统也 是读者获取原文的一种选择途径,在读者 不能或没条件利用图书馆时,可通过这种 方式索取所需信息。如中科院国家科学数 字图书馆的参考咨询系统、广东联合参考 咨询网、上海网上联合知识导航站等。这 些系统为读者提供免费的文献传递服务。

图2-36《中文科技期刊数据库》的原文

图2-37《中国博士学位全文数据库》原文

图2-38中国国家知识产权局专利说明书原文

图2-40 用Google检索到的网络论文原文

图2-41 电子图书原文

图2-42《 EBSCO数据库》检索到的 外文期刊原文

8.定量分析

• 8.定量分析 • 专利的价值较高,格式统一,具有分析价 值。本研究作为范例,仅使用Excel统计, 对专利用药作分析。 • 1)统计授权专利的分布 • (1)空间上的分布:北京、湖北有4件、 安徽3件、河南、吉林、江苏、陕西、四川 各有2件;广西、广州、黑龙江、湖南、辽 宁、内蒙古、宁夏和新疆各有1件。

(2)时间上的分布:

最早的申请是从1993年开始,申请量最多的 年份是1998年、2000年和2003年,达到5件。 图2-43显示申请量呈现两年一次波动的规 律。 6 5 4 3 2 1 0 1990 1995 2000 2005 申请年份

• (3)授权专利申请人的行业分布:29 件授权专利只有14个申请人是医院、 中医学院、制药公司或者医疗工作者。 湖北、吉林、陕西省最多,各有2件。 • (4)计算授权专利的技术生长率:对 65件专利统计1993年以来的历年申请 量,技术生长率v=当年申请量/前五 年总量。

0.5

0.4

0.3

0.2

0.1

0 1992 1994 1996 1998 2000 申请年份 2002 2004 2006

2)统计全部专利的所用中药

• 统计出处方68个,用药969种(含重复的中 药名),去掉重复部分,实际使用283种中 药。排名前12位的中药使用次数,结果如 表2-6。

9.定性分析

• 定性分析包括寻找用药规律、筛选药 方和评价专利。上述12种以及排名在 后的9种中药按照中药药性归类,各种 中药出现次数,其中清热中药有191次, 补气血的中药86次,活血药24次,收 敛药21次,利尿药物18次,通便排毒 药物16次。如图2-30。

图2-45 按性能归类的中药所占比例

16, 4% 18, 5% 21, 6% 24, 7% 总次数 191, 54% 86, 24% 清热 补气血 活血 收敛 利尿 通便

筛选出的最终基础方是:柴胡5~25、 丹参5~30、茵陈10~40、虎杖5~ 30、叶下珠5~10、大黄(酒制) 5~10、五味子5~10、黄芪10~40、 白术10~30、茯苓10~30、甘草 3~10(份)。

10.定性与定量相结合的专利评估

综合实习题

根据专业和年级任选,有的题目要求检索专 利文献、外文文献。对于期刊论文和专利 文献要作统计分析,撰写综述。检索工具 的用法可参考3-8章。一些数据库的用法还 可以参考教材配套的课件(可在清华大学 出版社相关主页下载)。信息的统计分析 和撰写综述可以参考11章。

关于作业的要求

要求检索过程的图片不要多,写明步骤,一 个检索工具要求2-3个图片,分别是含有检 索式的图片、原文图片各一幅。图片截取 局部,放大,图中文字清晰可见。然后对 期刊或者图书的关键词/主题词做统计分析, 得出结论。

含有检索式的图片

原文的图片

• 互联网环境下的多媒体编码与信号 处理技术

• • • 背景资料:本项目将围绕这一关键问题重点研究两方面技术: ⑴保证多媒体信息高效率、高质量传输的视音频信号编码技术; ⑵保证信息在网络环境下高度安全、可靠的信息隐藏技术和身份识别技术。 • • • 本项目在以下六个方面有所创新: ⑴复杂交叉背景下VOP自动提取; ⑵多交叠前景对象的VO分隔; • ⑶多层稳健主分量高保真音频水印; • ⑷基于模拟音频数字水印的隐蔽传输信道; • • • ⑸任意形状图像目标变换编码; ⑹第二代小波变换的DSP实现。 查询点: • ⑴保证多媒体信息高效率、高质量传输的视音频信号编码技术; • ⑵保证信息在网络环境下高度安全、可靠的信息隐藏技术和身份识别技术。 • 检索要求:查找与本课题有关的国内外文献包括专利

• 有同学准备报考北京大学的研 究生

,需要检索复习资料比如研究生招生考试 和入学考试题目、招生简章、相关大学最新资料、 某专业的就业前景、专业内不同导师A和B各自的 简历、发表的专著、期刊论文、科技成果或者申 请专利的详细信息。如果需要去该大学复试,要 检索该城市和大学的地图,最好是电子地图,以 及具体的联系人。请问该如何检索?(提示:参 考第3章电子地图搜索引擎、第4章的考试信息检 索、第5章检索某人写的图书、第6章检索某人发 表的期刊论文、第7章检索某人发明的专利、第8 章检索某导师指导的学位论文的示例。)

学生作业举例

3.确定检索途径:

• 本课题可以选择主题途径,结合分类号。 • 4.确定检索词: • 中国西部,新疆,青海,甘肃,宁夏,土 地利用 • land use, ground,earth,soil,exploitage,utilizat ion检索式如下: • (西部+新疆+青海+甘肃+宁夏)*(土地+利 用)*土地 • (Land or ground or earth or soil) and (use or explitage or utilization) and (west* and China)

5.检索界面及索取原文

6.关键词统计表如下:

关键词分布频数表 15 频数 10 5 0 中国西部 土地 荒漠化 环境 新疆 青海 宁夏

• 7.总结分析:从检索结果及上表可 以看出中国西部的土地问题是研究 的热点;不过针对于这方面的专利 则少了点,土地荒漠化的研究才刚 刚起步;还可以看出在西部的城市 中,新疆是热点.

另一例作业节选

• 二.选择检索工具: • 期刊:维普《中文科技期刊数据库》,中国 知网CNKI(www.cnki.net),综合数据库 EBSCO的学术期刊库ASP • 图书: 我馆公共检索系统,国家科技图书文 献中心( www.nstl.gov.cn

) • 专利:中国国家专利局,欧洲专利局

• 学位论文: 万方公司(www.wanfangdata.com.cn) 数据库(改为CNKI的博士论文库), • 标准:中国标准服务网( www.cssn.net.cn

), 国 际标准化组织(www.iso.org) • 报纸:《全国报刊索引数据库》,《纽约时报》 • 最后用搜索引擎Google来做补充

七.关键词分布表,如下:

相关关键字分布表 相对数量 10 8 6 4 2 0 保温 纺织 材料 纤维 隔热 节能 远红外织物

第三例作业

• 七.总结分析 • 检索结果显示:网页中与之相关内容最多, 但多数无实用价值;专利与期刊中与之对应 的内容很多;论文数量次之,图书最少.说明 在这方面编制图书很有市场潜力.

• 关键词的分布表格如下:

关键词分布图 丝绸 纺织 蚕丝 纤维 织物

• 从该图可以看出,蚕丝在纺织中是研究 的热点;它给我们这样的提示,就是说 我们可以从事编写“织物“方面的书 籍。 • 各种文献上面该方面的研究的分布情 况表如下。(此处省略)