网上国际交流

Download Report

Transcript 网上国际交流

网上国际交流
沈卫平
E-mail: [email protected]
科学网博客地址:
http://www.sciencenet.cn/blog/沈卫平.htm
电话:62332472(办)62333451(宅)
手机:13693054652
本课程主要内容
Internet的过去和现在
网络信息搜索
网上信息交流
网页与网站制作
网上联系出国留学
请同学们及早提出教学要求和意见
作
业
在Internet网上进行如下工作之一:
关于网络的论文
检索所需的英文信息并下载(可只下载感兴趣的几页)
制作中英文网页、网站或博客
联系出国留学经历
并下载有关外文信息
要求自己写出至少一页完成作业的过程、心得感想,学
期12周前,E-Mail给我。
网页或网站只要告诉我网址,不要传给我的信箱,太大
了进不来。
作业文件名:学号-姓名-班级。
本学期12周前,E-Mail给我。
未来50年我国现代化要迈三道“坎”
城镇化
大约从2000年到2010年,基本目标包括全
国基本完成工业化和城镇化,沿海发达地
区基本完成信息化和基本普及高等教育,
民主化取得新进展,平均生活质量达到世
界平均水平,基本实现第一次现代化。全
国平均从第一次现代化的发展期进入成熟
期,发达地区进入第二次现代化。
信息化
约为2010年至2020年。基本目标包括全
国基本实现信息化,完成工业化和城镇
化,发达地区普及高等教育,全国知识
传播水平超过当时世界平均水平等,完
成第一次现代化。全国平均进入第二次
现代化的起步期,发达地区进入第二次
现代化的发展期。
知识化
约为2020年至2050年。基本目标是知识创
新、知识传播、生活质量、经济质量和现
代化水平全面超过当时世界平均水平;发
达地区完成知识化,达到或接近当时世界
发达国家水平;全国完成信息化和普及高
等教育,基本实现第二次现代化。
中国现代化战略研究课题组提出了九大重点:
工业化和工业转移并重
城市化和城市扩散并举
大力促进民主化进程
继续推进信息化和网络化
大力促进知识化和发展高等教育
继续参与经济全球化
建设国家创新体系
实施生态现代化战略
积极推行按贡献分配
2001年我国加入WTO后,面对日益激烈的国际
竞争形势,我们起码要具备三个方面的知识。
本专业的知识
工商管理方面的知识
信息管理方面的知识
比如如何对情报进行收集和分析。在英文
原文中,科技情报被称作information,而竞争
情报则被称作intelligence,从字面上就可以看
出竞争情报在内容分析上的智力成分要更多一
些。要想在竞争中取得胜利,首先就要有情报
的意识,掌握收集情报的技术。重要的公开情
报来源之一就是Internet。
飞速发展的因特网正将全世界的丰富信息资
源带到我们每个人面前,已成为知识经济时
代不可或缺的基本工具。可以说,你所需要
的绝大多数信息都在因特网上存在,而且它
们中的多数都可以免费获得,关键在于你能
否准确地找到它们。为了帮助你检索和获得
网络上的丰富信息,一大批网上信息检索工
具应运而生。但是,令你苦恼的是,即使使
用这些检索工具,你往往得到的是成千上万
条似是而非的网站名称,面对它们你不得不
承认“因特网信息检索定律”:在因特网上
你花了时间和金钱却总是找到(甚至只能找
到)很多你不需要的信息。
Internet概况
Internet是通过标准通信方式将世界各地
的计算机网络连接起来的网络体系。
Internet 起源于美国在20世纪60年代和
70年代初所建立的军用实验通信网
APPANET(阿帕网)。Internet是通过
TCP(Transmission Control Protocol,传
输控制协议)/IP(Internet Protocol,网
际协议)协议连接起来的计算机网络的
集合。
第一代是20世纪70~80年代,主要的成就是把
分布在世界各地的计算机用TCP/IP协议连接起
来,主要的应用是e-mail。
第二代是20世纪90年代,主要成就是把成千上万
个网站上的网页连接起来,主要的应用是Web
信息浏览以及电子商务等信息服务。
目前正处于从第二代Internet向第三代Internet过
渡的转型期。
第三代Internet可称为信息服务网格
(Information Service Grid),其主要特点是不
仅仅包括计算机和网页,网格试图实现互联网上
所有资源的全面连通,包括计算资源、存储资源、
通信资源、软件资源、信息资源、知识资源等,
都连接成一个整体,整个网格如同一台巨大无比
的计算机,向每个用户提供一体化的服务。
物质与能量原则上只能分享,一吨水、一度电甲使
用了,乙就不能使用。而信息的最大特点是可以共
享,不会因使用同一信息资源的用户多而耗尽。
第三代Internet要解决的信息共享不是一般的文件
交换与信息浏览,而是要把所有个人与单位连接成
一个虚拟的社会组织(Virtual Organization),实
现在动态变化环境中有灵活控制的协作式信息资源
共享。信息服务网格与Web最大的区别是一体化,
即用户看到的不是数不清的门类繁多的网站,而是
单一的入口和单一系统映象。比如一个用户打算出
去旅游,只要向网格系统一次性输入出游人数、出
游地点和时间以及其他特殊要求,不必分别与航空
公司、铁路、旅行社、旅馆、气象部门、商店等单
位联系,信息服务网格将自动与各有关部门协调,
给用户完整的旅游方案并做好全部预订手续。
随着网格研究在学术界的加速,信息产业界的大公
司也相继公布了与网格目标一致的研究开发计划。
惠普、IBM、微软、Sun等公司最近取得共识,支
持XML、SOAP、UDDI等万维网标准,从而更有
利于开发新一代的网络应用,即万维网服务。其目
的是将因特网上的资源和信息汇聚在一起,组合成
企业和消费者所需要的服务。惠普推出了eSpeak
万维网服务平台;IBM用它的WebSphere平台和
一系列中间件实现万维网服务;微软的路线是通过
其.Net计划和C#语言实现万维网服务;Sun则通
过Open Network Environment(Sun ONE)
计划和Java平台来实现它。另外,IBM最近宣布,
将投资40亿美元,启动一个全公司的“网格计算
创新计划”;Sun则在2000年9月公布了其网格
引擎软件。
国际上的网格研究主要采用开放源码、公开合作
的模式。全球网格论坛(Global Grid Forum)
是目前主要的合作组织,感兴趣的读者可以从其
网址www.gridforum.org找到关于网格研究现状
的信息。
在国内,中国科学院计算技术研究所对网格技术
的研究已较为深入。计算所的网格技术研究在尽
量使用国际上已有的先进技术的同时,坚持自己
的创新。有特色,才能参与国际标准的制订。计
算所网格研究的最大特色是“服务网格”的思想,
而国际上的网格研究目前主要面向科学计算。
Internet基本结构
IP地址
为了在分布于世界各地的计算机间准确地传输
信息,Internet为连入的每一台主机确定了一个
机器地址,称为IP地址。IP地址是一个32位二
进制数字,往往将它按每8位换算成十进制数
字(0-256)写成所谓“点分十进制”IP地址,
例如可写为202.96.128.110。IP地址由网络管理
机构分配给入网主机。
下一代互联网协议IPv6采用128位IP地址,“让
每一粒沙子都有IP地址”。
域名
IP地址的“点分十进制”方式对一般人没有逻辑意
义,因此人们常用带有逻辑意义、容易记忆的域名
(Domain Name)来表示IP地址。
美国域名由主机名、子网名、网络分类名从左到右
构成,中间用“.”分隔成。
在其它国家,域名组成一般是从左到右“主机名.机
构子网名.分类名或地区名.国家名”。
Internet实际使用的只是IP地址,Internet主机需和
相应的域名服务器相连,将用户输入的域名转换为
IP地址。
分类名或地区名如:edu(教育和科研机构)、com
(商业界)、gov(政府机构)、mil(军事机构)、
net(网络管理机构)、org(非盈利机构)、bj(北
京)、sh(上海)和sc(四川)等。
统一资源定位器
为了确定具体信息资源在网络中的位置,
Internet用URL(Uniform Resource Locator,
统一资源定位器)来描述具体资源及其位置。
URL由三部分组成:应用协议、主机地址、目录
路径和文件名,例如
http://www.ustb.edu.cn/xxgl/students/xxx97.ht
m, http为超文本传输协议,www.ustb.edu.cn为
主机域名,xxgl/students/和xxx97.htm分别为目
录路径和文件名。htm为HTML文件类型,
Hypertext Markup Language超文本文件标记语
言。
万维网信息资源
WWW(World-Wide Web,万维网或环球
网)是Tim Berners-Lee等人为了利用超
文本方式传递信息于20世纪90年代初期发
明的,由于其能够方便迅速地浏览和传递
分布于网络各处的文字、图像、声音和多
媒体超文本信息,90年代中期以后得到迅
速发展,Internet上WWW服务器以每年
翻几翻的速度增加,WWW信息资源已成
为Internet的主流。
万维网的结构和特点
(1)超文本与WWW
WWW就是在Internet环境下实现分布式超文本检
索 的 体 系 。 它 使 用 超 文 本 标 记 语 言 HTML
(Hypertext Markup Language)在文件中标记链
源及相应的链宿。
其中链宿恰好是用URL来描述。
在浏览文件时,链源被特殊显示,例如加下划线,
而链宿则隐藏着不予显示。用户如果对该链源所涉
及的内容感兴趣,可用鼠标点击链源,系统将自动
析取链宿URL中的信息,利用指定的应用协议、到
指定的主机地址和路径中调出指定的文件、然后予
以显示。在这一过程中,用户不知道也不必操心链
宿文件在网络上什么位置、如何去连接相关主机和
调用文件。
Web1.0、Web2.0和Web3.0
Web1.0时代,Yahoo的成功是因为他们有一群编辑,把网上的文章或
网址组合在一起,类似大杂烩,web1.0的本质是联合,网友是基本不
参与内容建设的,当然也没有什么收入;3年前,以MySpace为代表的
Web2.0来了,网友说“我的地盘我自己做主”,web2.0的本质就是互
动,它让网民更多地参与信息的生产和传播。Web 2.0代表着Internet正
在从由静态网页集合向提供软件服务载体的演进。
对于Web2.0,网络精英(如博客写手、维基百科自愿者)看到了久违
的Internet精神:平等、开放、协作共享、张扬个性、对于创造的高度
尊重。草根网民们看到的是更好的网络体验:可享受更加人性化、便
利化的“技术与观念”,更加丰富、优质、可获得的网络信息服务,
网络上的社区、互动、资源的自我组织……特别是大陆许多人有“指
点江山”的习惯。但是web2.0的缺点还是没有体现出网民劳动的价值。
Web1.0和Web2.0时代,中国没有巨型的网络公司出现。Web3.0时代,
中国一定会出现和google、yahoo等齐名的大公司。为什么这么说? 这
是由Web3.0的特点决定的:网民即使信息产品的生产者,又是信息产
品的拥有者,他们参与产品的开发维护,最后分享产品的利润。
Web1.0、Web2.0和Web3.0
Web1.0
网站是别人的
我只是看看/陌路人(精神和物质都没有的)
(代表者:Yahoo.com)
Web2.0
网站是朋友的/劳动但是没有利益的/活雷锋(精神有的,物质没有的)
(代表者:MySpace.com)
Web3.0
网站是自己的/自己生产自己得利/主人(精神和物质都有的)
(代表者:HeyHot.com)
中国热线(HeyHot.com)是全球第一家Web3.0公司,以新媒体、新门户、新
网民为定位,走国际化和专业化路线。中国热线(HeyHot.com)和网友(包括
版主和博客等等)分享利润,是能够更好地体现网民的劳动价值,并且能够
实现价值均衡分配的一种互联网方式。Web3.0跟Web2.0一样,不仅是技术
的创新,更是商业思想的创新,进而推进技术的发展和应用。
从HTML到XML
XML(eXtensible Markup Language,可
扩展标记语言),是当前最热门的网络技
术之一,被称为“第二代Web语言”、
“下一代网络应用的基石”。自它被提出
以来,几乎得到了业界所有大公司的支持,
丝毫不逊于当年HTML被提出时的热度
(不过HTML 4.0后就没有了,取而代之
的是依据XML定义的XHTML)。
HTML的缺点
只适合于人与计算机的交流,不适合计算机与计
算机的交流。
HTML是通过一大堆的标记来定义文档内容以什
么样的形式显现在我们面前,也即,HTML是一
种“显示描述”语言,它仅仅描述了Web浏览器
应该如何在页面上布置文字、图形等,并没有对
Internet上最重要的东西——信息的本身含义进
行描述。
这些通过HTML表现出来的文字、图形内容很容
易被人理解,而要计算机去理解这些标记内的文
字的含义,就很困难了。
HTML的另一个问题就是它的标记的集合
是固定的,用户不能增加自己的有意义
的标记。而且各大浏览器的规格不尽相
同,要使我们用HTML做的网页能够被所
有浏览器正常显示,我们只能够使用
W3C给我们定义好了的标记来创建网页。
在当今的网络世界里,随着电子商务的蓬勃发展
和基于Web的应用日益广泛,大量的信息需要被
快速地处理。实际上,在Internet上的大部分信息,
在最初都是被存放在结构良好的数据库里面,信
息按照它的意义被存放在相应的字段里,比如:
员工档案,名称、性别、部门等。对于“张三”
这个数据,计算机能够根据它所存放的位置,知
道它代表一个员工的姓名。但是,一旦这些数据
被调出来,经过CGI、ASP、JSP、PHP等转换成
HTML后,原本有意义的数据就变成了一些无特定
含义的HTML标记的组合。用户必须通过自己的
“头脑”才能解析这些数据,进而“手动”将它
们进行记录、处理,显然处理信息的速度会很慢。
如果我们能够将最初保存在数据库中的原
始结构的数据在计算机之间传递,那么肯
定会加快信息处理的速度。
显然利用HTML办不到,并且,由于计算
机体系、操作系统以及所使用的数据库不
同,不同的计算机之间要想互相理解对方
的数据库格式是相当困难且非常麻烦的,
为了使各种不同的计算机之间能够互相交
换信息,似乎HTML又必不可少。怎样来
解决这个难题呢?
使用XML可以解决上述的难题。
W3C对XML作了如下描述:“XML描述了一类被
称为XML文档的数据对象,并部分描述了处理它
们的计算机程序的行为。XML是SGML的一个应用
实例或一种受限形式。从结构上说,XML文档遵
从SGML文档标准。”
同HTML一样,XML也是一种基于文本的标记语言,
都是从SGML (Standard Generalize Markup
Language,标准通用标记语言,是一种老的标记
语言,最初用于出版行业,非常复杂,依据
SGML开发的应用非常昂贵,只在少数大公司和
政府部门有应用) 发展而来的,XML保留了SGML
80%的功能,降低了20%的复杂程度,这样使得
开发有关XML的应用变得很便宜,使XML能够进
入“寻常百姓家”。
XML与HTML的不同之处
XML可以让我们根据我们要表现的文档,自由地
定义标记来表现具有实际意义的文档内容。
比如:我们可以定义〈文档名称〉〈/文档名称〉
这样具有实际意义的标记(可以用中文)。
在XML中,我们只需要注意文档的内容,而文档
的表现形式则交给CSS(层叠样式表)和XSL
(eXtensible Stylesheet Language可扩展样式语
言)来完成。
如果XML文件只用于计算机与计算机之间交流信
息,仅仅需要一个XML文件即可。
如果要将XML文件中的信息以某种形式显示出来,
如通过浏览器显示,则可引用一个样式表文件来
定义浏览器怎样来显示XML文件中信息。
而且XML不像HTML那样具有固定的标记
集合,它实际上是一种定义语言的语言,
也就是说使用XML的用户可以定义无穷
的标记来描述文档中的任何数据元素,
突破了HTML固定标记集合的约束,将文
档的内容组织成丰富复杂的完整的信息
体系。
XML主要有三个要素:
Schema(模式)
Schema规定了XML文档的逻辑结构,定义了XML
文档中的元素、元素的属性以及元素和元素的属
性之间的关系,它能够帮助XML的解析器校验
XML文档标记是否合法;
XSL(eXtensible Stylesheet Language可扩展样
式语言)
XSL是用来规定XML文档表现形式的语言,同CSS
类似;
XLL(eXtensible Link Language可扩展链接语
言)。
XLL则进一步地扩展了当前Web上已有的简单链
接。
XML是一种定义语言的语言,现在已经有几
个以XML规范为主所创建的标记语言,如:
Chemical Markup Language(CML:定义怎
样描述化学分子式的结构,将它显示在网页
上);
Mathematical Markup Language(MathML:
将复杂的数学公式以网页的形式显示在浏览
器中);
Synchronized同步 Multimedia Integration合
成Language(SMIL:如何将多媒体信息展现
在WWW中)。
XML文件的解析器(一种检查XML文件是否有结
构上的错误,将XML文件中的标记剥离,读出正
确信息的工具)大多数是使用Java语言写成的,
这样,只要计算机支持Java虚拟机,都可以支持
XML(几乎所有的计算机都支持Java虚拟机)。
所以,即使是异构系统,也不用担心读不懂对方
的资料,大家都用XML文件作为传送资料的介质
即可,因为只要对方计算机上有合适的XML解析
器,就可以正确地读取信息。
现在,几大数据库厂商的数据库产品,如:
Oracle 8i、Informix、IBM DB2等都开始支持XML,
输入数据库的数据可以轻易地转化为XML,甚至
可以直接以XML的形式输入数据。有预言称:将
来的电子文档必将是XML的天下。
XML具有卓越的性能,它具有四大特点:
优良的数据存储格式、
可扩展性、
高度结构化、
方便的网络传输。
因为XML能针对特定用户的应用定义自己的
标记,这就使XML能够在多种行业的信息交换中
一显身手,根据不同行业来提供具有各自特色的
解决方案。
WWW体系结构
WWW 采用分布式客户机/服务器体系。
WWW 客户机
运行浏览器(例如 Internet Explorer和Netscape )
可以阅读HTML语言编写的超文本,激励它们包含
的用URL表示的链点,析取URL中的链宿地址、协
议、具体资源路径和名称,通过HTTP(Hypertext
Transfer Protocol)协议和TCP/IP协议向URL对应的
服务器发送调用特定资源的请求。
WWW 服务器
运行服务器软件和存储各种信息资源,而且这些
资源多用HTML语言编制成超文本文件,称为网页,
而每个服务器的第一个网页成为这个服务器的主
页。
WWW/CGI原理
WWW 服务器可利用公共网关CGI
(Common Gateway Interface)来实现
对服务器上信息资源的动态检索。
Internet上的信息资源
WWW信息资源
据统计,WWW(World-Wide Web ) 服务器数量近几年
大概每6个月增长一倍。
FTP信息资源
FTP(File Transfer Protocol)称为文件传送协议,它
允许人们通过该协议连接到Internet的一个远程主机上
读取所需的文件并下载到自己的计算机上,所传送的
文件可以是文本、图像、声音、多媒体、数据库和可
执行二进制代码文件。从某种意义上讲,FTP就相当于
在网络上两个主机间拷贝文件。是发布、传递软件和
长文件的主要方法。
http://download.com.com/
http://tile.net/ftp,检索型和目录型结合
Telnet信息资源
Telnet是Internet的远程登录协议,允许用户将自己的计算
机作为某一个Internet主机的远程终端与该主机相连,从而
使用该主机的硬件、软件和信息资源。
BBS 就 是 Telnet 远 程 登 录 服 务 的 一 种 , 全 名 叫 做 Bulletin
Board System即电子布告牌系统,是一个由网虫们组织、
建设、参与的网上交流用的系统。也可用WWW登录BBS。
公告牌(BBS)是用作特定兴趣小组的信息源和消息系统的计
算机系统。用户拨号进入BBS后,查看消息并为其他用户留
言,同时与系统上的其他用户进行通信。BBS被用作分配共
享软件,并可以提供向其他应用程序的访问通路。许多BBS
也允许用户联机聊天,发送电子邮件,下载或上载免费软
件和共享软件以及访问Internet。但是,自从出现计算机病
毒之后就需要谨慎从事了。目前,大多数BBS在将上载文件
写入主机硬盘之前要对所有的文件进行扫描,如果你发现在
某个BBS上未进行病毒检查,那么不要将它用作下载文件的
信息源,而要另找其它软件源。bbs.tsinghua.edu.cn
公告牌(BBS)是用作特定兴趣小组的信息源和消息
系统的计算机系统。用户拨号进入BBS后,查看消
息并为其他用户留言,同时与系统上的其他用户
进行通信。BBS被用作分配共享软件,并可以提供
向其他应用程序的访问通路。许多BBS也允许用户
联机聊天,发送电子邮件,下载或上载免费软件
和共享软件以及访问Internet。但是,自从出现计
算机病毒之后就需要谨慎从事了。目前,大多数
BBS在将上载文件写入主机硬盘之前要对所有的文
件进行扫描,如果你发现在某个BBS上未进行病毒
检查,那么不要将它用作下载文件的信息源,而
要另找其它软件源。
北科大BBS
bbs.tsinghua.edu.cn
博客
博客不等于个人日记;博客不等于个人网站。但博客可以
是个人媒体、个人网络导航和个人搜索引擎。
因为,Blog一词来源于“网络日志(Web Log)”,而不
是“网络日记(Web Diary)”。两者的侧重点完全不同。
日记(Diary):指个人把每日发生的事、经历和观察的
东西写下的记录。个人性、私密性,主要为自己而写。
日志(Log):航海记录,对船速、船程以及船上发生的
所有对航海有意义的事件的记载。非个人、公开性。主要
为别人而写。
因此,博客是个人性和公共性的结合体,其精髓不是主要
表达个人思想,不是主要记录个人日常经历;而是以个人
的视角,以整个互联网为视野,精选和记录自己互联网上
看到的精彩内容,为他人提供帮助,使其具有更高的共享
价值。
博客
博客精神的核心并不是自娱自乐,甚至不是个人表达自由,
相反,是体现一种利他的共享精神。为他人提供帮助。个
人日记和个人网站主要表现的还是“小我”,而博客表现
的是“大我”。也许形式上很接近,但内在有着本质的差
异。因此,所有优秀博客网站中,真正表达作者个人的内
容非常有限,最多只是点缀,而不像个人网站那样是核心!
David Weinberger说:“互联网教给我们这样一个道理:
我们既能够成为一个庞大公共群体的一部分,还能够保持
我们的个性面孔。但是这又需要我们花更多时间在公共场
所生活。在互联网上, 日记的概念已经被外化了:会有公
共的日记出现。今后可能的情况是,在真实世界中曾经有
的公众和私人自我之间的那条本来明显的界限会逐步被腐
蚀掉,一点一滴地。”他认为,未来每一个人都会拥有至
少15个崇拜者。而博客无疑是构建个人影响力的重要手段。
当然,博客是一种快速演变中的形式,而且是一种真正的
草根力量,因此理解博客不必太拘泥于形式。
关于博客的形象比喻和定义
博客如生活,扮演您自己。(博客中国人)
博客概念主要体现在三个方面:频繁更新(Frequency)、
简洁明了(Brevity)和个性化。(Personality)(Evan
Williams)
博客是每周7天,每天24时运转的言论网站,这种网站以
其率真、野性、无保留、富于思想而奇怪的方式提供无拘
无束的言论。(佩姬•努南的解释)
博客是互联网上最新的发展潮流,是继E-mail、BBS、ICQ
(IM)之后,出现的第四种网络交流方式。
博客是用带着索引的文字进行对话的咖啡屋。(Rebecca
Blood著《博客手册》。(The Weblog Handbook))
博客就是一个人未经编辑的声音(The unedited voice of
a person)。(戴夫·温纳(Dave Winer))
关于博客的形象比喻和定义
博客(Weblog)是这样一个按照时间顺序摆列的集合,集合
中的元素是被公开发布,并能够通过互联网被访问到的独立
的思想泡泡(thought bubbles),博客中的每条内容是博客
们当时在想什么的思想快照。(James Snell)
博客之于知识,就像Napster之于音乐,Linux之于软件(博
客中国)
博客代表着“新闻媒体3.0”:旧媒体(old media)→新媒体
(new media)→自媒体。(we media)(Dan Gillmor)
博客是媒体的开放源代码运动。
博客是内容的开放源代码运动。
博客——知识经济2.0。(姜奇平)
博客是一个“快捷易用的知识管理系统”。(Dylan Tweney)
博客是“个人主页2.0”。(博客中国)
“网客”新时代
博客:自由表达和记录
播客:想唱就唱,想演就演
威客:好“点子”换回真“金子”
闪客:做自己的快乐动漫
维权客:在网络上共同联合起来,拿起法律武器与损害
其利益者对簿公堂。
换客:以交换、易物、交友为目的,变废为宝,享受资
源互惠。
印客:出版印刷自己私人留存文字图片作品。
USENET/Newsgroup信息资源
USENET是Internet的一种应用软件,用于提供新
闻组(Newsgroup)服务。在这个服务体系中,有
众多的新闻组服务组,它们作为Internet主机运行
服务器(News Server)软件,接收和存储有关主
题的消息,供自己用户查阅。用户可在自己主机
上运行新闻组阅读器软件(News Reader),申请
加入某个新闻组、从服务器中阅读新闻组消息、
并将自己的意见发送到(称为“张贴”)新闻组
中。用户可查阅别人的意见并予以回复,并由此
反复而形成讨论,所以新闻组又被称为“电子论
坛”。
http://groups.google.com/
在Internet上现有上万个新闻组,并有一套命名规
则来区分各自的主题范围。常见大类包括:
biz商业类, comp计算机类, news网络新闻类, rec娱
乐类, sci科学类, soc社会类,talk辩论类, misc杂类,
alt其它类(有选择或争议的内容)
用户使用新闻组时首先要“订阅”(subscribe)感
兴趣的新闻组,选择感兴趣的消息,然后将它们调
到自己计算机上阅读,并可针对所阅读的消息进行
回复,这个回复可送给消息原始发送者或发送给新
闻组所有成员,用户还可将自己新的消息“张贴”
(post)到新闻组上。许多新闻组阅读器还允许用
户根据新闻组中关于某个具体问题的讨论线索进行
检索,例如,当看到一则感兴趣的意见后,去了解
别人在以前或以后针对这个意见还说了什么。
LISTSERV/Mailing List信息资源
在Internet上进行交流和讨论的主要工具有
三种:
USENET/Newsgroups(新闻组)
LISTSERV(电子邮件群)
Mailing List(用户邮件组)
http://www.lsoft.com/
三者的主要差别
新闻组和电子邮件群往往涉及较为广泛的内容,
对参与的用户也没有限制,但用户邮件组通常涉
及较专门、甚至有争议的议题,对参与的用户有
一定限制。
新闻组的订阅主要是在技术上连接到新闻组服务
器并予以登记,没有订阅限制,可以即时开通,
但电子邮件群和用户邮件组均要求用户履行专门
的订阅手续,用户需要在得到同意“订阅”的答
复后才能加入。
新闻组的信息存储在服务器上,用户得通过专门
客户软件(阅读器)来阅读所需信息,而另两者
直接将信息传送到用户的电子邮件地址。
新闻组和电子邮件群都是自动管理,而用户邮件
组往往由人工管理。
搜索问题
寻找某种位置不明对象的活动,称为搜索。
实现搜索目的将获得效益,进行搜索需付出
代价。
完成同一搜索任务可以有不同搜索方案,不
同方案在效益和代价上常常不同。
综合考虑效益与代价,从总体优化出发制定
最佳搜索方案,是研究搜索问题的中心任务。
搜索引擎的作用
随着搜索引擎的发展,影响力将会转移
到两类人手中:
搜索引擎引导人们所去的最有声望的机
构。
熟知如何在搜索系统中找到自己想要的
东西的网络熟手和网络天才。
有声望的机构会有更高的点击率。
而网络高手们则不会再受众多排名靠前
机构的干扰,找到想要的信息。
“搜索引擎”炙手可热-网民热衷个性化“搜索”
2005年09月14日 10:08
越来越多的人习惯输入关键字来搜索各种所需
信息,而眼下,互联网市场上炙手可热的一个
关键词无疑就是“搜索引擎”。
中国互联网络信息中心(CNNIC)于近日发布
的《中国互联网络发展状况统计报告》中数据
显示:在网民经常使用的网络服务/功能中,
搜索引擎以高达64.5%的选择比例位列第三,
仅次于电子信箱和新闻浏览。
个性化搜索成新宠
“考研”、“超级女生”、……只要输入关键
词,轻点鼠标,网上立刻就能显示海量的相关
信息,搜索引擎以其方便、快捷紧紧扣住人们
的“心弦”。而近来,除普通的页面搜索外,
图片搜索、视频搜索等分类搜索服务,以及互
动问答等新的搜索方式越来越多,让消费者感
受“迎面扑来个性化之风”。
不用输关键词,可以直接用问题搜索了。使用
新近亮相的新浪 “爱问”搜索。不管什么样的
问题,都有人回答得像模像样,很令人心怡。
在新浪“爱问”上,不仅有网页搜索,还有视频搜
索、知识搜索、地区搜索、百科搜索等。问讯者可
以直接用自然语言搜索、提问,如果问题难倒了网
友,那么24小时会有专家团查找出答案告之。据称,
这是首个中文智慧搜索互动搜索引擎,但其8月3日
与中国大百科出版社共同合作搭建的“中国大百科
在线搜索”服务也被认为是国内搜索市场中第一个
以百科全书内容为依托的知识搜索服务产品,提供
上网者一个“没有围墙的大学”。
Google、百度、搜狗等搜索引擎上发现可以直接输
入拼音等非常有特点的搜索服务。
“搜索”市场竞争愈演愈烈
有人称2005年为搜索引擎年。尤其是最近,我们看到各大
网站频频在搜索引擎市场上“出手”。8月5日上市百度以
354%的首日涨幅,刷新1999以来纳斯达克的IP0记录,与
此同时,网易等十余支在纳斯达克上市的中国概念股几乎
全线飘红:8月8日,全球排名第一的网络搜索引擎开发商
Google 经过千挑万选,选定中国最大的IT应用服务运营商
中启动力,为其在中国的首家正式授权合作伙伴:8月下旬,
又有消息说雅虎有意牵手阿里巴巴,双方已进入细节性谈
判……
为何搜索引擎会受到追捧?为何有如此多的网站涉足“搜
索”市场?据权威预测,未来4年全球搜索市场每年将以高
达35%的增长速度快速成长,到2007年全球搜索市场的整
体规模将达到70亿美元。我国的搜索引擎市场2004年达到
8.8亿元,2006年更可达24亿元。目前搜索引擎已从一种单
纯的IT技术上升为搜索力经济,有望成为继广告、无线增
值和游戏之后,互联网企业又一重要的利润增长点。
目前,国内的搜索引擎大战大有一触即发之势:
可以肯定,各大网站若想赢得竞争主动权,除了
依靠由庞大的网民数量支撑的互联网市场所提供
的基础优势外,还必须狠练“内功”,踏踏实实
开发有特色的新业务。
为何新浪自主研发的搜索引擎“爱问”推出仅仅
一个多月就赢得很多用户的喜爱?有关业务人士
指出,除了搜索引擎巨大的市场规模和增长潜力
外,目前Google、百度等搜索门户商业模式等方
面所存在的缺陷,也使新浪等门户网站看到了进
军搜索市场的机会和突破口。
不管竞争者的游戏如何进行,对消费者而言势必
会有越来越丰富的“搜索”选择。
搜索引擎的数据采集机制
自动采集是通过被称为robots(自动采集器)或
Scout(侦察兵)的软件来完成,robots搜寻页
面并建立、维护、更新索引数据库。
(1)
标引站点的所有网页
Excite, Hotbot和Northern Light采用此种方式。
(2)
标引站点的部分网页
AltaVista, Infoseek, Lycos和Webcrawler采用此
种方式。
网络信息检索工具的类型
按检索机制划分的检索型、目录型和混合型检索
工具
检索型检索工具通过用户直接输入检索词、查找
索引数据库中用检索词标引的索引记录来查找用
户所需信息资源,检索方便直接,而且可以使用
布尔逻辑检索、短语或邻近检索、模糊检索、自
然语言检索等高级检索方式,可以限制检索对象
的地区、网络范围、数据类型、时间等,可对满
足特定条件的资源准确定位。AltaVista, excite,
HotBot, Infoseek, Lycos, Opentext, Webcrawler等就
是著名的检索型检索工具。
目录型检索工具通过用户浏览层次型类别
目录来寻找符合需要的信息资源,目录按
一定的主题分类体系组织,并辅之年代、
地区等分类。用户一般采用逐层浏览目录、
逐步细化来寻找合适的类别直至具体资源。
这类检索工具的典型是
Yahoo!,Galaxy,Britannica,Internet Guide等,
常被称为directory,catalog,它们往往根据自
己资源采集范围设计详细的目录体系。也
有许多目录型检索工具采用图书馆的分类
方法。
混合型检索工具兼有检索型和目录型两
种检索方式,即可直接输入检索词查找
特定资源,又可浏览目录了解某个领域
范围的资源。
实际上现在的大多数搜索引擎都同时提
供词语检索和目录浏览,以增强自己的
检索能力和市场竞争力。
按检索内容划分的综合型、专题型和
特殊型检索工具
综合型检索工具在采集标引信息资源时不限制资
源的主题范围和数据类型,人们可利用它们检索
几乎任何方面的资源,AltaVista,excite,Yahoo!
等均属这类工具。
专题型检索工具专门采集某一主题范围的信息资
源,并用更为详细和专业的方法对信息资源进行
标引描述,且往往在检索机制中设计利用与该专
业领域密切相关的方法技术。这类工具常被称为
专业检索工具。典型的例如HealthCate, Medical
World
Search,
SOSIG-Social
Science
Information
Gateway,
EEL-Engineering
Electronic Library等。
特殊型检索工具指那些专门用来检索某一
类型信息或数据的检索工具,例如
检索电话号码的555-1212和Swichboard、
查询地图的MapBlast、
查询图像的WebSEEK、
检索FTP文件的Archie和FileZ、
检索LISTSERV的Liszt、
检索新闻组的Deja News等。
按包括检索工具数量划分的单独型和
集合型检索工具
检索工具通过自身的采集标引机制、数据组
织机制和数据检索机制提供检索服务,我们
可将它们称为单独型检索工具。
集合型检索工具是一种能够利用多个检索工
具进行网络信息查询的检索工具,它通过一
个统一用户界面帮助用户在多个检索工具中
选择和利用合适的(甚至是同时利用若干个)
检索工具来实现检索操作,又称为元检索工
具。
网络信息检索工具的检索功能
基本检索功能
布尔检索
AND关系或“+”或“match all terms” 或“MUST
contain”
OR关系或默认或“match any term”
NOT关系或“-”或“MUST NOT contain”
截词检索
右截词,又称后端截词、前端一致
中间截词
左截词,又称前端截词、后端一致
左截词比较罕见
邻近检索和短语检索
(nW)关系要求两个检索词相距不超过n个词,
而且前后顺序不能颠倒。
(nN) 关系也要求两个检索词相距不超过n个词,但
前后顺序可以颠倒。
字段检索
依据这类功能,用户可把查询万维网信息时的检
索范围限制在标题、统一资源定位地址(URL)
或超链等部分。
区分大小写检索
例如“Web”专指万维网,而“web”表示蜘蛛网。
这一检索功能尤其有助于对专有名词的查询,提
高查准率。
高级检索功能
加权检索
相当数量的网络信息检索工具采用加号和减号表
现检索词在检索提问中的分量,现已变成一种约
定俗成的做法,即用加号表示某检索词一定要在
检索结果中出现,减号则用于表示某检索词一定
不能出现在检索结果中。
由于加权检索技术在网络信息检索上应用的时间
较短,因此,检索提问往往不能获得预期的效果。
最突出的例子是如果在一个检索提问中使用了表
示加权检索的加号和减号,其余未加符号的检索
词在检索果过程中的作用将被大大减弱。
自然语言检索
这种检索的基本处理过程是:检索工具在接收到用户提问
后,首先利用一个禁用词表从提问中剔除那些没有实质主
题意义的词汇,例如各种副词、介词、代词、常用请求词
( please, help, would, may 等 ) 、 检 索 提 问 词 ( find,
search, locate, check, information, materials等),然后将
余下的词汇作为关键词进行检索。
自然语言检索的效果取决于检索工具选择关键词的效率,
而这方面仍面临许多局限。而且,用户输入词汇中往往有
一些属于“禁用词”但确实表达了实质主题意义,例如
“help me find some materials on search engines”中的
“search”、“locate departments of materials sciences”
中的“materials”,这又使自然语言检索效率受到进一步的
局限。由于现在几乎所有检索工具都支持简单关键词检索,
所有直接输入某句话中的关键词要比输入这句话本身要好
得多。
相关信息反馈检索
在检索过程中人们会发现某个结果非常符合自己需要,因
此希望能进一步检索到与该结果类似的结果,我们称之为
相关信息反馈检索。我们可以人工进行这种检索,从已检
得的信息中选取与检索提问相关的词语,作为下一轮检索
的检索词。相关信息反馈检索可由检索工具自动进行,例
如Excite的“Search for more documents like this one”检
索,以及Lycos的“More Like This”检索,利用相关信息反
馈检索,人们获得的检索结果似滚雪球一般,愈来愈多。
相关信息反馈检索的基本原理是检索工具将你所选定的结
果网页中的包含的关键词找出,通过它们在这个网页中出
现的频率和位置等来计算各自在这个网页中的相关度,然
后选出那些在该网页中最重要的词汇(相关度最高的词汇)
用作下一步检索的检索词。但由于词汇选择主要只考虑了
词汇出现的频率和位置,没有考虑用户对各个词汇重要性
的主观判断,所以其结果并不一定非常合适。
模糊检索
目前的网络信息检索工具还只能进行纠正输入错误
的模糊检索。例如,用于检索地图信息的MapBlast
可在用户输入错误的街道名情况下,仍然检索出正
确的地图信息。
概念检索
所谓概念检索,是指当用户输入一个检索词后,检
索工具不仅能检索出包含这个具体词汇的结果,还
能检索出包含那些与该词汇同属一类概念的词汇的
结果。例如,检索 “automobile” 时能找出包含
“ automobile” 、 “ car” 、 “ truck” 、 “ van” 、
“bus”等任一词汇的结果。又如,在查找“公共交
通”这一概念时,有关“公共汽车”或“地铁”的
信息也能随之检得。即考虑到了同义词、广义词和
狭义词的使用。至今为止,Excite在概念检索方面
取得了比较明显的成就。
与检索相关的功能
检索提问的修改与限制
HotBot和AltaVista在此方面一马当先,Infoseek新近也紧紧跟
上。目前,检索提问的修改与限制主要体现在三个方面:
用户输入检索提问之后,网络信息检索工具明显出对应的相
关词语,然后,用户通过对相关词语的选择(如“应纳入修
改后的检索提问中”(Include)或“不应纳入修改后的检索
提 问 中 ” (Exclude) ) , 进 行 检 索 提 问 修 改 。 AltaVista 和
Excite 等都具备这样的功能。
用户可以在键入检索提问之前或获得检索结果之后,从语种
(如英文或中文)、日期(如前一周或上个月)、地理范围
(如中国或美国纽约州)、域名范围(如.edu或.com)、信
息媒介类型(如文本信息或图像信息)等方面进行限制,以
检得更确切的信息。HotBot、AltaVista 和Infoseek等都这方
面作了有效的尝试。
网络用户在得到检索结果之后,可选择把新的一轮检索范围
限制在已检得的结果之内,以提高检索效益。如今,包括
Infoseek在内的许多网络信息检索工具都支持这种机制。
按相关度排列结果
检索与浏览相结合
检索结果的翻译和多语种检索
英文综合型网上信息检索工具
检索型检索工具
AltaVista, http://www.altavista.com
Excite, http://www.excite.com
HotBot, http://www.hotbot.com
Infoseek, http://infoseek.go.com/
Lycos, http://www.Lycos.com
OpenText
http://www.opentext.com
Webcrawler, http://www.webcrawler.com
Northern Light, http://www.northernlight.com
浏览型检索工具
eBLAST
http://www.ebig.com
Galaxy
http://www.galaxy.com
Yahoo!
http://www.yahoo.com
在互联网上,中文内容只占4%,绝大
多数是英文内容,所以只有掌握英文搜
索才能真正地深入互联网。但是,英文
搜索引擎很多,变化也很快,应该用哪
个搜索?怎样搜索呢?
将介绍几个最有代表性的英文搜索引擎。
Ask
这是一个支持自然提问的搜索引擎,它的数据库里
储存了超过1000万个问题的答案。只要你用英文直
接输入一个问题,它就会给出问题答案。如果你的
问题答案不在它的数据库中,那么它会列出一串跟
你的问题类似的问题和含有答案的链接,供你选择。
根据网友们的使用经验,当你遇到一些属于事实型、
原理型的问题时,使用Ask是最方便的。例如:“美
国历任总统中就任时最年轻的是谁?”、“阿富汗
的首都叫什么?”、“飞机是哪一年发明的?”、
“雪为什么是白的?”、“恐龙为什么灭绝?”、
“后街男孩的网站在哪里?”。你还可以问它各种
奇怪的问题,例如:“现在几点了?”、“罗马帝
国为什么崩溃?”、“圣诞老人住在哪儿?”,它
都会给你答案的。http://www.ask.com/
Google
Google 是在国外很受欢迎的搜索引擎,界面简洁,
以搜索结果的准确性著称,它的网页快照和图片搜
索也很有特色。Google也增加了图像搜索功能。
网页快照就是网页的备份,你在Google搜索的时
候,如果发现某条搜索结果点不进去,是死链接,
那么只要点击搜索结果旁边的网页快照(Cached),
就能看到Google保存的备份网页。
Google还收集了互联网上2.5亿张图片,如果你想
找偶像的照片、名胜的风景照、军事兵器图片等,
只要输入合适的英文单词,很容易找到满意的图片。
Google
Earth
北京科
技大学
Google
Earth
北京科
技大学
Google
Earth
天安门
广场
Dmoz
http://www.dmoz.org/World/Chinese_Simplified/about.html
关于开放目录专案
开放目录专案 - Open Directory Project 是互联网上最大的,
最广泛的人工目录。它是由来自世界各地的志愿者共同维护与建
设的最大的全球目录社区。
互联网的“共和国”
网站数量以一种惊人的速度进行不断地增长。自动化的搜索引擎
越来越无法满足合适的搜索需求。商业目录中较少的编辑网站的
职员已经无法满足大量的网站提交的请求,这样使得他们目录的
质量与数量受到了影响。死链接的不断出现,使他们已经无法与
互联网保持同步的增长速度。
Open Directory - 开放目录专案提供了一种以互联网自我组织与
管理的方式进行发展用来满足快速增长的网站数量。随着互联网
的增长,网民数量也随之增加。这些网民能够编辑管理一小部分
网站,并且提供负责更多的编辑工作,整理清除没有用的信息内
容,只保留最好的内容。
Dmoz
互联网的权威目录
开放目录专案效仿一些在20世纪最重要的编辑员/志愿者
项目。就像牛津英文字典通过志愿者的努力成为权威的工
具一样,Open Directory跟随着它的脚步也成为了权威的
互联网分类目录。
开放目录专案是建立在开放资源共享的理念上的,是唯一
100%免费的大型目录。提交一个网站或使用目录数据不
需要支付任何费用。开放目录专案的数据在同意遵守我们
免费使用条款的情况下,任何人都可以免费使用。
互联网的目录集合
开放目录专案是含有最广泛内容,以人工分类为主的目
录。 它的编辑人员主要来自互联网的志愿者共同为目录
提供资源。 开放目录专案为互联网上最大、最普遍的搜
索引擎和门户网站提供主要的目录服务,包括Netscape,
AOL,Google,Lycos,HotBot,DirectHit等在内的成百上
千个网站。
Dmoz
你可以使目录变得更好
正如任何一个社区一样,你可以获得你所付出的。
Open Directory提供机会给任何一个想为目录贡献的人。
申请加入是很简单的: 请选择一个你所熟悉的专题。
编辑目录就像拍快照一样。我们提供一系列各种各样的
工具帮助编辑,在几秒中内便可以学会加入,删除网站,
更新链接等。编辑了一段时间后,你就可以使目录变得
更好,从而逐渐成为你所选择专题的目录专家。
申请加入开放目录专案
寻找一个你想维护的目录。
点击申请成为编辑员 ,链接在目录页面的顶部。
请注意一些目录没有显示申请成为编辑员 的链接;你
应该找一个你所感兴趣的相对具体的,范围小的目录申
请。一旦你加入获得编辑经验后,你可以申请范围更大
的目录。
search
这是一个元搜索引擎,它收集了800多种专业搜索引
擎和数据库,分为商业金融、娱乐、健康医药、新闻
媒体、评论、计算机、游戏、国际、寻人、购物、下
载、政府、音乐、参考资料、旅行共15个大主题,每
个大主题又分许多小主题。
当你进入任何一个主题搜索的时候,它都可以同时搜
索这个主题下的多个专业搜索引擎和数据库,然后在
一个页面上显示来自不同搜索引擎的搜索结果。比如
进入大主题“新闻媒体”搜索,它把搜索结果分为头
条新闻、商业新闻、体育新闻、娱乐新闻、科技新闻、
杂志、报纸,如果再进入小主题“科技新闻”搜索,
那么它可以同时搜索CNET、TechWeb等5个著名的科
技新闻网站,足够保证你得到最全最新的科技新闻。
http://www.search.com/
好了,每个搜索引擎都有独特的优点,不
同的需要就应该使用不同的搜索引擎。如
果你搜索英文内容,那么,向大家推荐是:
上网随便逛逛就用www.dmoz.com
平时搜索就用www.google.com
有问题就问www.ask.com
要做特定的主题搜索就用www.search.com
2005年度搜索引擎奖评选结果
《2005年最终评出15个年度搜索引擎奖项,
其中百度获“用户量最高”、“最高效”、
“最佳音乐”、“最佳图片”和“最佳搜索
工具栏”奖;Google获“用户最高满意度”
和“多元化发展”奖;中国Yahoo获“最佳
娱乐”奖;中搜捧得了“技术创新”和“最
佳桌面”奖;新浪爱问获“最佳本地搜索”
和“最佳问答搜索”奖;MSN中国获“技术
进步”奖;腾讯获“最有潜力”奖;网易获
“商业进步”奖。
最佳搜索引擎大奖:Google
最佳综合搜索引擎(将各个搜索引擎的结果结合在一
起)奖:Vivisimo,http://vivisimo.com/
最佳新闻搜索奖:雅虎
最佳图片搜索奖:Google
最佳设计奖:Google
对网站管理人员最友好奖:Google
最 佳 收 费 收 录 搜 索 引 擎 奖 : Inktomi ,
http://www.inktomi.com/
最 佳 对 位 置 收 费 搜 索 引 擎 奖 : Overture
http://www.overture.com/d/home/
最佳搜索特性奖:Google的工具栏和链接缓存功能
最 佳 专 业 搜 索 引 擎 奖 : Scirus ( 学 术 搜 索 )
http://www.scirus.com/
搜索引擎名誉奖:AltaVista和开放目录
5th Annual Search Engine Watch Awards
March 31, 2005
The Search Engine Watch Awards recognize
outstanding achievements in search via the web.
The winners for accomplishments during 2004
are below:
Outstanding Search Service
Winner: Yahoo
Second Place: Google
Honorable Mention: Ask Jeeves
Best Meta Search Engine
Winner: Jux2
Second Place: Dogpile
Honorable Mention: Clusty & Mamma
5th Annual Search Engine Watch Awards
Best News Search Engine
Winner: Google News
Second Place: Yahoo News
Honorable Mention: MSN Newsbot & Topix
Best Blog/Feed Search Engine
Winner: Bloglines
Second Place: Feedster
Honorable Mention: Technorati
Best Image Search Engine
Winner: Yahoo Images
Second Place: Google Images
Honorable Mention: Ask Jeeves Pictures &
Picsearch
5th Annual Search Engine Watch Awards
Best US Shopping Search Engine
Winner: Google's Froogle
Second Place: Yahoo Shopping &
Shopping.com
Honorable Mention: PriceGrabber & Shopzilla
Most SEO/Webmaster Friendly Search
Provider
Winner: Google
Second Place: Yahoo
Honorable Mention: MSN Search
Best Search Ads Provider
Winners: Google AdWords
Second Place: Yahoo/Overture
5th Annual Search Engine Watch Awards
Best Search Feature
Honorable Mention: Clusty's Clustering, MSN's
Search Builder, Ask Jeeves Binoculars Site Preview,
Surfwax LookAhead, Pinpoint Shopping Suggestions,
A9 Search History, My Jeeves, My Yahoo Search,
Google Desktop Web History Feature, AOL Snapshots,
Ask Jeeves Smart Search, Google OneBox Results,
Yahoo Shortcuts
Best Specialty Search Engine
Honorable Mention: Google Local, Yahoo Local,
Google Scholar, Scirus, Citeseer, Librarians' Index To
The Internet
并行检索、结果综合类集合型网络检索工具
http://www.dogpile.com/index.gsp
http://www.metacrawler.com/index.html
http://www.profusion.com
http://www.savvy.com
集中罗列、单独检索类集合型网络检索工具
http://www.isleuth.com
http://www.langenberg.com
http://www.nln.com
http://www.beaucoup.com
*
专门型、专题型网上信息检索工具
查询地址、电话、电子邮件及相关信息的
网络检索工具
http://www.555-1212.com
http://people.yahoo.com
http://www.whowhere.lycos.com
http://www.switchboard.com
http://www.worldpages.com
http://www.bigbook.com
查询地图和地区信息的网络检索工具
http://www.mapblast.com/myblastd/
http://www.mapquest.com
http://www.mapsonus.com
查询图像、影像及相关信息的网络检索工具
依据文字描述进行图像检索的检索工具
http://www.hotbot.com/adv.asp
http://www.ncrtec.org/picture.htm
http://gallery.yahoo.com/
依据内容特征进行图像检索的检索工具
http://www.qbic.almaden.ibm.com
http://www.ctr.columbia.edu/webseek/
http://www.cs.bu.edu/groups/ivc/ImageR
over/Home.html
http://www.virage.com
http://www.thinker.org/
专业学科检索工具
人文与社会科学综合检索工具
加拿大,Research Resources for the Social
Sciences
http://www.socscisearch.com
英国,Social Science Information Gateway
http://sosig.esrc.bris.ac.uk
美国,Informine: Social Sciences & Humanities
http://lib-www.ucr.edu
人文与社会科学专门学科检索工具
艺术
ADAM:The Art,Design,Architecture & Media Information
Gateway, http://adam.ac.uk
历史
Argos:Limited Area Search Engine for ancient and
medieval world, http://argos.evansville.edu
经济与财经
Wall Street Research Network, http://www.wsrn.com
Hoover’s Online, http://www.hoovers.com
教育
Education World, http://www.Education-world.com
Study Web, http://www.studyweb.com
自然学科与工程技术综合检索工具
SciCentral
(http://scicentral.com/index.html)
Martindale’s Reference Desk (http://wwwsci.lib.uci.edu/HSG/Ref.html)
Infomine (http://lib-www.ucr.edu)
自然学科与工程技术专门学科检索工具
工程
EELS (http://www.ub2.lu.se/eel/eelhome.html)
EEVL (http://www.eevl.ac.uk/search.html)
数学
Math Archives
(http://archives.math.utk.edu/query.html)
物理
PhysLink (http://www.physlink.com)
化学
ChemCenter
(http://www.ChemCenter.org/search.html)
农业
AgWeb (http://www.ceregroup.com/cgi-bin/findagweb.cgi)
生物
BioTech: Biosources Database
(http://biotech.chem.indiana.edu/lib/search.html)
WWW Virtual Library: Biosciences
(http://golgi.harvard.edu/htbin/biopages)
医学和卫生
OMNI:
Organizing medical Networked Information
(http://omni.ac.uk)
Achoo (http://www.achoo.com)
网络信息检索工具的比较和评价
学习搜索的最好网站
加州伯克利分校图书馆的搜索教程
首
页
:
http://www.lib.berkeley.edu/TeachingLib/Guides
/Internet/FindInfo.html
基
本
策
略
:
http://www.lib.berkeley.edu/TeachingLib/Guides
/Internet/Strategies.html
很多著名大学图书馆都有做教搜索的主页,加州伯
克利过去几年进步很大,在网上所有免费搜索教
程中,已可稳居第一。特点是偏学术化,学生及
专业人士更适用。对搜索基本策略的把握很出色,
但对搜索引擎的了解与使用不够。
《Searcher》杂志
http://www.infotoday.com/searcher/
互联网上,最优秀的搜索者、最新最高明的
搜索经验在searcher杂志。唯一的问题是它
是收费刊物,每期只提供少量文章的全文
供免费阅读,但这已够你受用的。
Webmasterworld
http://www.webmasterworld.com/
是互联网上关于搜索引擎的最好论坛。虽然
主要讨论搜索引擎注册和排名,但它对搜
索引擎的变化反应之快,对搜索引擎的细
节挖掘之深,如云高手对搜索引擎的见解
之精,“使人们对搜索引擎的认识达到了
一种新的高度”---Pandia语。
Searchtools
http://www.searchtools.com/
互联网上最好的搜索产品研究网站,内容涉
及搜索引擎技术和产品相关的新闻、评论、
会议、调查、比较、选购、原理、源码、
背景、设计、建议。这里的“搜索产品”
定义比较广义,这里没有google或yahoo
的地位,搜索者就不用去了,留给制作者、
购买者、研究者吧。
Search Engine Conference
http://www.infonortics.com/searchengines/
搜索引擎工业界的年度盛会。如果你要了解各搜
索引擎和各大搜索引擎公司的技术动向,没有比
这更好的地方了。
Researchindex
http://citeseer.nj.nec.com/cs
收录了互联网上最丰富的搜索引擎技术论文。
Search Engine Watch
http://searchenginewatch.com/
《Search Day》
http://searchenginewatch.com/searchday/archive
s.html
是互联网上关于搜索引擎的最大网站,偏搜
索引擎新闻和注册排名。网站过去的积累
适合了解搜索引擎的过去,杰出杂志
《Search Day》适合了解搜索引擎的现在。
以上提到的都是英文网站,如果你需要中文
的,那么,有搜索论坛和中文搜索引擎指
南。
搜索论坛
http://newbbs1.sina.com.cn/
中文搜索引擎指南
http://www.search-chinese.com/
前者有最多的高手,后者有最全的资讯。
即时通讯未来六大趋势
作为互联网最具增长潜力的应用之一的即时通
讯,自然也成为了互联网企业角逐的重要阵地。
“有事儿你Q我!”曾几何时一夕之间这句话就
红遍了大江南北,成为人们临别时的标准留言。
恰恰也就是这一句简单的话,见证了即时通讯
与中国互联网共生共荣的历史。不可否认,以
快速、交互、简便为代表的即时通讯工具,已
经成为当前网络用户最喜爱的网络沟通工具。
基于即时通信平台的其他互联网增值服务,如
语音、音乐点播、信息共享等也在以前所未有
的速度改变着人们的生活方式。
2005年,随着互联网应用越来越丰富,
“互联网第三大战年”彻底爆发,作为
互联网最具增长潜力的应用之一的即时
通讯,自然也成为了互联网企业角逐的
重要阵地。
在占据即时通讯市场76.7%的腾讯QQ之
后,新浪UC、搜Q、网易泡泡、TOMSkype、微软MSN、、雅虎通、盛大圈圈
等纷纷进入市场,只要是稍有实力的公
司都在这个领域使出浑身解术争奇斗艳。
即时通讯市场的前景已经被所有人看好。
QQ
国内最时髦的即时通讯工具当数腾讯的
QQ,连到网上的一台台电脑上,屏幕上
大多跳跃着一个个各式各样“小人头
儿”———QQ上的好友来信了。它为用
户提供寻呼、聊天、新闻等信息,还有
手机上的移动QQ服务。
ICQ
ICQ(“I seek you”)是世界上最早的聊天工具,
网上寻呼机。它支持在 Internet 上聊天、发送
消息和文件等。你可以查看、查找和打印消息历
史,设置随机聊天,使用多种方式查找并添加别
的用户,获得更详细的用户信息,接收你朋友的
生日并把你自己的生日提前通知大家,创建你自
己的 ICQ 主页,利用贺卡、语音邮件等 ICQ 插
件发送贺卡和语音邮件,利用 ICQ Email 发送、
转寄和复制电子邮件,为不同的事件选择声音以
及配置打字的声音效果,把你的名单分成不同的
组,让 ICQ 提醒你将来的事件和活动,利用记
事功能把你的备忘录或记事贴到屏幕上,通过
ICQ 进行网页搜索,进行实时聊天并且可以回放
保存的聊天内容,可以在聊天中插入动作和表情。
MSN Messenger
MSN Messenger是微软公司推出的即时消
息软件,凭借该软件自身的优秀的性能,
目前在国内已经拥有了大量的用户群。使
用MSN Messenger可以与他人进行文字聊
天,语音对话,视频会议等即时交流,还
可以通过此软件来查看联系人是否联机。
MSN Messenger 界面简洁,易于使用,是
与亲人、朋友、工作伙伴保持紧密联系的
绝佳选择。
Yahoo! Messenger
雅虎通(Yahoo! Messenger):Yahoo!开发的
聊天软件,功能包括:语音聊天:聊天不必打
电话!只要你的电脑有连接麦克风和喇叭,即
可和朋友畅谈对话。多方会谈:大家一起聊!
同时和两个以上的朋友对谈聊天或传送文字信
息。好友清单:看看谁在线上。朋友上线马上
得知并可立即交谈。传送即时信息:与朋友聊
天的新方式。比电子邮件要快,比电话还便宜。
来信提醒:Yahoo!Mail的最新来信或Yahoo!
行事历中设定的约会或待办事项都可设定透过
Messenger自动提醒,再也不怕错过重要的事情!
支持防火墙:在公司防火墙内也能正常使用。
应用日趋丰富
最近几年,可以清楚地感觉到,随着即时通讯
工具本身应用越来越丰富,用户对即时通讯聊
天之外的娱乐需求正在不断增长,更加丰富化
的娱乐应用已经成为即时通讯未来重点的发展
方向。
为了满足用户日益旺盛的娱乐应用需求,许多
即时通讯服务提供商都在不断地开发基于即时
通讯平台的丰富化应用,例如:虚拟形象、魔
法表情以及虚拟宠物等新的应用层出不穷。
腾讯的产品经理表示,对于丰富化的应用
趋势,腾讯QQ在每一个版本的设计中,都
有清晰的规划,他表示“我们的期望是将
创意性元素和用户的需求紧密地捆绑起
来”。在QQ秀、QQ游戏、QQ音乐、无线
乐园、QQ交友、Q-Zone等产品成功地与
即时通讯结合之后,QQ宠物、自定义表情、
QQ高级群等许多丰富化的娱乐增值功能也
在这一两年面世,得到了网友的极大认同,
并被业内专家认为是对即时通讯产品本身
的强有力推动。
网络虚拟社区普及
分析显示,即时通讯之所以在近几年发展迅猛,
除了其本身的功能强大之外,互联网用户迅速
汇聚的人气也是重要的推动因素,据CNNIC统
计报告显示,截止到2004年6月30日,我国上
网用户总数为8700万,上网计算机达到3630万
台,即时通信服务正和电子邮件、搜索引擎、
上网浏览资讯等网络应用一样最大化地融入到
了网民的日常生活中。
跟随互联网发展和网络用户需求的脚步,由人
气会聚所带来的社区化和互动性也将成为即时
通讯的重要发展趋势。
据有关专家预测,网络虚拟生活在未来
两三年内将成为互联网应用的热点,网
络用户可以在网上进行买房、买车、养
宠物等等与真实生活相似的网络生活。
同时,一个纯粹的聊天工具,正在被赋
予新的内涵,成为一个丰富的个人空间,
这里面不仅有可以聊天的朋友,还有游
戏、新闻、社区、日记本等等。互联网
企业在网络上开办校友录,开创社区,
为网络用户提供日记撰写的平台,让用
户建立自己的blog,正是为了满足这些
网络用户对网络虚拟生活的需求。
作为国内最大、人气最旺的即时通讯服务提供商,
单腾讯QQ的注册账户数就已经突破了4亿,而同
时最高同时在线账户数也已经突破了1500万大关。
目前,腾讯QQ为网络用户推出了QQ群、校友录等
多样化沟通方式,实现了一对一、一对多、多对
多对话,其用户群稳定并且拥有很高的忠诚度。在
国内即时通讯市场上,QQ推出的Q-Zone独树一帜,
是专为QQ用户提供的新一代社区平台。在这个开
放的社区,QQ用户都可以自由发表文章,建立相
册,播放音乐,通过这个平台去认识更多的朋友。
在这个社区,用户还能把个人空间装扮得多姿多彩,
与传统博客相比,Q-Zone的进入门槛更低,而人
性化特点更多。
成为个人信息终端
作为最快捷方便的沟通工具,目前即时通
讯已经被广泛地应用到了日常的工作和学
习中,即时通讯用户每天都有大量的资料
文件在互联网上往来或被保存,因此,作
为信息传输的终端,即时通讯个人信息处
理的功能将根本上决定即时通讯产品本身
的生命力,这其中不仅包括了文字对话、
语音通话、视频交流在内的信息交互功能,
还包括了文件传输,发送图片的信息共享
功能,同时还包括了聊天记录的有效保存,
上传下载的信息管理功能。
针对这一应用趋势,腾讯不但持续进行产
品传输质量的提升,同时屏幕捕捉更是QQ
的独有功能,既可以截取当前屏幕的任何
部分作为图片发送给好友,还能截取动态
影片。为了确保用户在任何地点、任何PC
上整理信息,腾讯QQ还为用户提供32兆网
络硬盘,这些功能在QQ面板上就能全部搞
定,真正实现了随时、随地只要有QQ就可
以进行个人信息的处理。同时,腾讯QQ、
网易POPO、MSN等,都表示在推出语音与
视频之后,还将对其产品进行优化,未来
QQ的人性化特点还将更加突出。
整合无线业务
现在即时通讯的应用与互联网信息的交流已经
融为一体,用户渴望通过即时通讯在最短时间
内最方便地获得更丰富的资源。所以,整合互
联网的各种业务,满足即时通讯用户共享互联
网资源,就成了即时通讯未来发展的必然趋势。
目前,新浪UC、网易泡泡拥有门户网站的强大
网络资源,而微软也正在借助MSN强化门户的
影响力。
即时通信应用将呈现与传统门户网站、移动或
固定终端、网络应用增值服务的深度整合趋势;
在无线互联网资源的整合中,随着近两年我国
手机的应用在不断地被研究开发,人们越来越
希望摆脱有“线”的束缚,渴望无“限”的自
由。
无线上网成为网络用户宠儿,用手机登
录或接受来自internet的信息也受到用户
的青睐,尤其即时信息或消息。未来互
联网与无线网的融合是必然归宿,即时
通讯与无线网的互联互通也是必由之路。
随着3G的开通,即时通讯用户的移动需
求更高,即时通讯的移动增值服务将大
有作为。
在这一趋势的前提下,腾讯表示未来QQ的应
用将叠加包括MMS、WAP等在内的无线增值服
务;包括网络游戏在内的互动娱乐服务,以及包
括多媒体、音乐、电子杂志等在内的网络内容
服务,和包括c2c、拍卖在内的电子商务服务,
真正成为互联网业务融合的大平台。
而目前,移动QQ已经是国内无线通讯市场的
著名品牌,随着3G的开通,即时通讯的移动增
值将拥有更广阔的空间,将来也许你可以在旷
野上用手机直接和你在线的好友群聊天,互发
照片,甚至进行视频沟通。
更加安全稳定
据调查显示,用户不仅需要通过即时通
讯实现网上话音、音频、视频等功能,
而且,随着各种数据业务应用的增多,
用户对即时通讯的安全性提出了更高的
要求。ID被盗、隐私暴露、病毒入侵等
烦恼一直困扰着用户。尤其是对企业用
户来说,如果安全措施不可靠,企业将
为即时通讯漏洞付出巨大代价。毋庸置
疑,安全已经成为未来即时通讯保障基
础应用的根本之道。
由于整个行业尚未制定即时通讯安全标准,
目前流行的即时通讯软件都是明文存储,明
文传输,密码输入加密简单,故而对用户的
使用安全与隐私没有充分保障。
“为了充分保证用户信息和隐私的安全,QQ
一直在努力,从QQ2000版本开始,就采用了
先进的开放式安全体系的设计模型和128位高
强度加密算法,通过一系列的复杂握手认证
机制来保证整个体系的安全性。
未来将在现有基础上确保用户使用QQ时
的安全保护:一是进一步加强本地信息存
储和网络信息传输的加密算法;二是进一
步加强用户的密码安全;三是进一步防止
恶意链接和恶意病毒通过QQ进行传播。
由此可见,技术保障虽是安全的基础,
但保护用户安全的自觉性、主动性尤为
重要,在这方面,QQ的承诺和表现令用
户感到满意。”腾讯QQ的产品工程师详
细解释了QQ在安全方面的努力。
而从即时通讯诞生之日起,产品的稳定性就是
用户和企业最为关注的问题。尤其在目前即时
通讯应用飞速发展的情况下,稳定性才是即时
通讯保证用户应用,提高产品粘性的基本。随
着技术手段的不断突破,目前,即时通讯产品
的稳定性日趋成熟,各类即时通讯产品都能即
时传输图片、文档、歌曲等任何格式的文件,
甚至可以在短时间断开网络之后仍可以实现继
续传输信息,比如腾讯QQ的断点续传功能既
能强力保持传输文件的稳定性,也能在任何网
络环境下畅通无阻,已成为广大用户传输文件
的首选方式。
发展本地化应用
在用户通过即时通讯进行沟通已经成为一种习
惯后,人气的会聚无疑将加大即时通讯产品本
身的粘性,目前中国即时通讯用户的使用者平
均都有20-30个好友,如果失去这个沟通互动
的平台,那好友间的联系也将随之中断,因此
可以肯定的是,即时通讯在聚集了一定的人气
之后,将逐渐成为一种时尚潮流,进而成为一
种社会文化现象,群、社区和博客功能都在帮
助用户在一个可以延伸的范围内进行着观点和
看法的交流,传播正确的文化导向和价值诉求
也是即时通讯发展中面临的重要课题。
另外,随着即时通讯产品个人属性的加强和应
用范围延伸,与本地化应用的融合将成为即时
通讯产品的主要发展趋势,这种融合的趋势将
首先体现在即时通讯服务商对本地用户资源的
管理、分析,对本地文化的理解,以及基于本
地用户需求基础上,对产品应用的不断优化;其
次这种融合的趋势还在于即时通讯与本地互联
网、电信网等资源的整合,协同为用户提供更
高的价值;另外,本地化的趋势还将体现在为本
地用户提供更高质量的服务。
针对腾讯提出的即时通讯六大应用趋势,
业内专家表示用户的成熟和技术的进步
像双驾马车一样驱动着产业的发展,用
户需求正在呈现多样化、丰富化的特征,
而网络技术、信息通信技术、多媒体音
视频技术和网络海量资源也为互联网企
业、为用户创造价值开辟了条件,现在
是即时通讯向产业化、标准化发展的最
好机遇,即时通讯在2005年将真正成为
互联网产业的亮点。
聊天机器人
George: the talking digital guy
http://www.jabberwacky.com/
http:// www.icogno.com/
George, who is 39, single and
light-hearted, is looking for
friends on the Internet. He has
gifts - the ability to speak in
40 languages and with 2,000
people at the same time. And
one little quirk: he doesn't www.icogno.com/george.html
really exist.
什么是P2P技术?
P2P是peer-to-peer的缩写,peer在英
语里有“(地位、能力等)同等者”、
“同事”和“伙伴”等意义。这样一来,
P2P也就可以理解为“伙伴对伙伴”、
“点对点”的意思,或称为对等联网。
目前人们认为其在加强网络上人的交流、
文件交换、分布计算等方面大有前途。
文件交换类
eMule(电骡)是一个完全免费且开放源代码
的P2P软件。最新版的eMule集成了Kad连接,
进一步跨越了服务器的界限,与全世界超过两
百万的eMule用户共同分享资源。
eMuleVeryCD版,是在原版基础上开发的开源
软件,该版本专为国内用户设计。最新的
VeryCD版内置了VNN支持(可以让内网用户互
相传输)、根据IP显示旗帜、UPnP自动端口映
射等功能,针对实际使用优化了多个传输参数,
并采用了最公正的计分系统,让上传者得到最
大的下载机会。
文件交换类
PP点点通是一个让网络用户共享硬盘、
直接交换各种数据和文件的文件交换软
件,运用这个软件,无论是MP3、图片、
电影还是书籍、资料、软件,您都可以
直接从PP上数百万其它用户的个人电脑
下载。这个软件还有强大的即时通讯功
能,使你像QQ一样很方便的和其他网友
交流。
BT
说到P2P,就不能不提BT,这个被人戏称为“变态”的词
几乎在大多数人感觉中与P2P成了对等的一组概念,而它
也将P2P技术发展到了近乎完美的地步。
实际上BitTorrent(中文全称比特流,简称BT)原先是指
是一个多点下载的P2P软件。它不象FTP那样只有一个发
送源,BT有多个发送点,当你在下载时,同时也在上传,
使大家都处在同步传送的状态。应该说,BT是当今P2P最
为成功的一个应用。
如果解释一下的话,BT首先在上传者端把一个文件分成了
多个部分,客户端甲在服务器随机下载了第N部分,客户
端乙在服务器随机下载了第M部分。这样甲的BT就会根据
情况到乙的电脑上去拿乙已经下载好的第M部分,乙的BT
就会根据情况去到甲的电脑上去拿甲已经下载好的第N部
分。
BT
有一句话可以作为BT最为形象的解释就是:“我
为人人,人人为我”。而最初听到此概念时,有
人说,别用BT,会坏你的硬盘的!大概指的就是
前一句。现在看来,没有贡献怎么会有获取?这
大概最可以概括BT下载传输的精髓。
工具软件BTJoy,将这一技术以软件的形式完美
起来,这个诞生仅有一年的软件已经迅速热遍了
整个网络——对于BT下载的爱好者来说,120G
的硬盘都可以被迅速塞满!
有人在不长的时间里竟然用他的刻录机完成了一
百来部的电视剧的保存,拿他的话来说,可以开
一个小店面了!
文件交换类
Poco为国内用户及广大华语地区用户提
供了一个适合中文环境的文件交换平台,
完全支持中文软件及中文关键字搜索并,
并实现真正意义上的多点传输,传输效
率大大提高。使用Poco软件,不仅能够
搜索和下载海量的音乐、影视、图片、
软件、游戏等资源,更可以使用内置的
IM(即时通信)系统方便、快捷的与好
友一起分享。