网络信息资源搜索 - 吉林农业大学图书馆

Download Report

Transcript 网络信息资源搜索 - 吉林农业大学图书馆

网络信息资源搜索

一、网络信息资源含义

所有以电子数据形式把文字、图像、 声音、动画等多种形式的信息存储在光、 磁等非纸介质的载体中,并通过网络通信、 计算机或终端等方式再现出来的资源。 即通过计算机网络可以利用各种 信息资源的总和。

二、构成

信息内容 信息内容的记录符号 信息内容的记录方式 信息表述所依附载体

二、网络信息资源特性  离散性 海量信息、内容丰富  动态性 时效性强,无序且不稳定  不均衡性 地区、学科、行业……

 不规范性 质量良莠不齐、难于 管理  开放性 节点多、链接多

三、网络信息资源检索方法  浏览;  直接访问法;  通过网络资源指南查找信息;  利用网络信息检索工具查找信息。

四、 网络信息搜索引擎 广义:在Web中主动搜索信息并将其自动标引 以及将标引的内容存储在可供检索的大型数据 库中,建立相应的索引和目录服务,从而对用 户提出的各种检索做出响应,提供用户所需的 信息或相关的链接。 狭义:对WWW站点资源和其他网络资源进行标 引和检索的一类检索系统机制

发展历程  基于文档内容的搜索引擎 上个世纪90年代 目录思想 yahoo 匹配和排序 提问词出现频率  基于链接分析的搜索引擎 1996-20世纪初 引文分析思想  基于自然语言搜索 引擎 2003年 中搜 自然语言 语义 百度 网页之间链接

搜索引擎的工作原理

 从互联网上抓取网页  建立索引数据库  在索引数据库中搜索排序

 搜索器 搜索引擎派出网页搜索工具如 spider(蜘蛛)在Internet上搜索信息,并 把信息带回搜索引擎;  索引器 数据库; 将信息进行分类索引,建立网页  检索器 通过Web服务器端软件,为用户 提供浏览器界面下的信息查询。  用户接口 接纳用户查询、显示查询结果、 提供个性化查询项。

搜索器 用户接口 检索器 索引器

网络搜索引擎的类型  索引型搜索引擎(全文 网页级)  目录型搜索引擎(网站级)  元搜索引擎

“元搜索引擎” 实例 百度 谷歌 搜狗 雅虎 必应

……

..

搜索引擎的查询方式 简单检索(Simple Search)

直接输入一个字或词,提 交搜索 引擎查询,最基本的搜索方式。

输入“搜索引擎”

搜索引擎” 方面信息

词组搜索(Phrase Search) 输 入 两 个 单 词 以 上 的 词 组 ( 短 语),当做一个独立运算单元提交搜 索引擎查询,叫词组搜索。

词组搜索实例——“中草药 栽培”

词组搜索实例——“中草药︱栽培”

词组搜索实例——“中草药 –栽培”

百度—书名号特殊用处 24 22

百度—双引号特殊用处 23 23

语句搜索(Sentence Search) 直接采用自然语言句子,作提 问式进行检索。也叫任意查询。

例如:

中国有哪些农业大学

中国的农业大学

中国农业大学

“现代爱情故事歌词” “现代 爱情故事 歌词” “新文化报在长春发行情况” “新文化报 长春 发行” “奥迪车的各种图案” “奥迪 图案” “长春到上海列车时刻表” “长春 上海列车 时刻表”

限制搜索范围

按链接和网域等进行搜索范 围的限制。

百度的检索技术——文献类型限定  百度支持对Office文档(包括Word、 Excel、PowerPoint)、Adobe PDF文档、 RTF文档的全文搜索。  基本输入格式为: 检索词(空格)filetype:文献类型  注意:空格问题,在英文半角状态下 输入“:”。

信息检索 filetype:文献类型PPT 27 29

常用文件格式 文件格式 rar zip exe xls ppt htm 文件类型 压缩文件 压缩文件 可执行程序 表格文件 幻灯片 网页 相应软件 winrar winrar,winzip 一般双击打开 excel powerpoint IE

常用文档格式 文件格式 txt doc wps pdf caj 文件类型 纯文字文档 文档 文档 文档 文档 相应软件 记事本 word wps Acrobat reader cajviewer

常用图像格式 文件格式 bmp jpg,jpeg gif swf psd 文件类型 图像 图像 图像,动画 动画 图像 相应软件 Acdsee、ie等 Acdsee、ie等 Acdsee、ie等 flashplayer、ie等 photoshop

常用多媒体格式 文件格式 mp3 wma avi rm rmvb mpeg 文件类型 音频 音频 视音频 同上 同上 同上 相应软件 winamp等 winamp等 realplayer,windows media player等 同上 同上 同上

百度文档文件格式限定界面

百度的检索技术——字段限定 intitle: 把搜索范围限定在网页标题中 inurl: site: 查找url(统一资源定位器 )中 包含检索词的页面 限定在某个特定站点中进行检索

新闻 intitle:吉林农业大学

乔丹经典 inurl:photo 30 37

检索示例——inurl用法 31 38

微博 site:sina.com.cn

32 39

就业 site:edu.cn

高级搜索(Advance Search) 用布尔逻辑组配方式查询,也 叫定制搜索。

百度高级检索界面 高级搜索

谷歌高级检索界面

分类目录搜索 按搜索引擎提供的分类目录逐级查 询,用户一般不需要输人查询,而是按 照查询系统所提供的几种分类项目,选 择类别进行搜索,也叫分类搜索。

360目录——网址导航

搜狐分类检索

特色查询功能  手气不错  网页快照  类似网页  集成化工具条  多元化服务  相关搜索

 英汉互译  百度百科  百度文库  天气查询  计算器和度量衡转换  …………………

更多

搜索设置 手写

搜索引擎的检索技巧  选择合适的搜索引擎; 信息量、速度、准确性、舒适度、功 能等  选择合适的字、词; 大小写区分、错别字等  使用逻辑符号、限定功能;  特殊功能;  求助于搜索引擎帮助系统 ;  积累经验,向高手学习。

常用搜索引擎 谷歌 搜狐 新浪 网易 雅虎< http://cn.yahoo.com/> 百度< htt://www.baidu.com/> 中国搜索< http://www.zhongsou.com>

万维搜索 爱问 有道 搜狗 一搜 天网搜索< http://e.pku.edu.cn/> …………………

五、 专题网络信息资源 检索与利用

图书 图书出版信息网站 中国出版信息网 中国图书出版网 各图书出版社网站 ……………………..

馆藏图书目录 馆藏目录主要有两大类,包括单一馆藏目 录与联合目录,他们的共同特点是均有提示性 良好的人机对话界面,按照这些目录查询系统 的规定提供需要的检索条目即可获得相应的馆 藏内容。

单一馆藏目录可到各个图书馆或文献 收藏机构的公共书目查询系统(OPAC)中 检索。 OPAC全称Online Public Access Catalogue

联合目录一般是某个较大的机构,与 某一类相近或有共性的图书馆结合形成统 一界面的检索目录。 如 CALIS 公 共 目 录 检 索 系 统 (http://opac.calis.edu.cn)

电子图书

电子图书(e Book)指采用二 进制的数字化形式将纸质图书文献 的文本存储在磁盘或光盘载体上, 在计算机软件的支持下形成电子图 书数据库,并把图书内容再现出来 供人们阅读利用。 目前只在网上发表的图书不 包括在此。

免费电子图书

免费读书网站,动态性较强,类别 有限。 

收费电子图书

超星数字图书馆、书生数字图书馆、 北大方正数字图书馆等

收费电子图书 超星数字图书馆、书生数字图书馆、 北大方正 (Apabi) 数字图书馆等。

中国数字图书馆(国家图书馆)

网上书店

 亚逊网上书店 ( http:// www. amazon. com)  当当网上书店 (http://www.dangdang. com)  中国图书网 (http: //www. bookschina. com) ………………………….

读书网站

文献传递——读秀学术搜索系统

期刊  印刷型期刊数字化电子期刊  纯网络电子期刊

期刊查询方法  期刊数据库(中国知网、万方数据、重 庆维普、EBSCO、Elsevier、Springer等 数据库)  电子期刊网站  期刊出版社  馆藏期刊目录  文献传递  免费资源  . …………………

龙源期刊网

(http://www.qikan.com.cn)

中国高校人文社会科学文献中心(CASHL) (p160-165)(http://www.cashl.edu.cn) 中国高校人文社会科学文献中心(CASHL China Academic Humanities and Social Sciences Library)是全国性人文科学外文 期刊保障体系,为用户提供文献传递服务。 主要资源有:  高校人文社科外文期刊目次数据库  高校人文社科核心期刊总览

开放存取期刊 又称OA 期刊,同行评议过的科学 论文或学术文献放到互联网上。使用户 可以免费获得,而不需考虑版权或注册 的限制。开放获取运动旨在打破学术研 究的人为壁垒。 开放存取

OA _ Open Access

开放存取数字资源(国内):  中国科技论文在线  中国预印本服务系统  奇迹文库

专利文献  中华人民共和国国家知识产权局网站  中国知识产权网  中国专利信息网

中国知识产权网

标准文献—中国标准服务网

人参

学位论文

数据库

授予学位的机构及其网站

学科信息门户 学科信息门户是利用网络集成 技术,将分散的网络学科信息资源通过科 学的知识组织体系进行有机集成,而后向 用户提供特定学科领域的各种类型网上信 息资源,同时提供对这一学科信息资源的 “一站式”检索入口的“信息资源超市”。

中草药数据库

 专业相关单位、科研院所等网站  利用搜索引擎搜索专业相关网站  日积月累—与专业相关的网站