从google和Facebook的趋势看图书馆发展的集成与分散-姜爱蓉

Download Report

Transcript 从google和Facebook的趋势看图书馆发展的集成与分散-姜爱蓉

从Google和Facebook的发展
看图书馆服务的集成与分布
姜爱蓉
清华大学图书馆
2011年6月
●
北京
大纲
 Google和Facebook的启示
 图书馆集成服务的发展
 图书馆分布服务的涌起
Google和Facebook的启示
互联网之战:Facebook PK Google
2010年底Hitwise发布数据显示:
Facebook访问量已超过Google(美国本土)
2010年1月~11月之间,站点访问量
– Facebook.com 排第一(占8.93%)
– Google.com 排第二(占7.19%)
– 雅虎邮箱 排第三(占3.52%)
– Yahoo.com 排第四(占3.30%)
– YouTube.com 排第五(占2.65%)
Google和Facebook的启示
2011年5月第一周,
美国互联网访问总
量前20网站。
Facebook占10.4%
Google占8%
Google和Facebook的启示
Facebook用户数:
2008年为1.3亿
2009年为3.5亿
2011年初达4亿
5月超过6亿
Facebook按人口算已是全球第三大“国家”
Google和Facebook的启示
美国搜索引擎和社交网络发展趋势
Google和Facebook的启示
2005-2010, 信息环境的变化(美国)

2.39亿互联网用户,占总人口77%,增长12%

Google占搜索引擎市场份额66%,增长84%

每月1.52亿人访问Facebook,增长1300%

每月2400万人访问Twitter,增长1100%(2007以来)

电子书销售额为3.45亿,增长1544%

能接入互联网的手机占11%,增长100%

公共馆开通无线上网服务占82%,增长116%
Google和Facebook的启示
OCLC_2003年审视报告—
自2000年之后,Google竟变得无所不在
Google的诞生是整个Web的一种升级
检索信息经历了从迟缓、不可信的过程走向你能用
它得到真实可信的东西。只要信息在网上某个地方,
Google和它灵巧的PageRank系统就会找到你要找寻的
东西—而且常常不是徒劳,信息会出现在Google头10
条结果中。
Google正在架空图书馆—这些被调查者的感受
和评价给图书馆员带来震撼与冲击!
Google和Facebook的启示
目前两种模式的网络正在成型—
以 Google 为首的信息网络(information web)
以Facebook为首的社交网络(social web)
(Twitter须渗入这两种模式并占据优势地位,才能打进主流)
Google搜索是抓取全世界的信息,并通过一套算
法帮助人们更便捷地找到有用的信息。
Facebook和Twitter则是让用户生产信息,并通过
彼此的熟人关系来获取。
Facebook不对搜索引擎开放,Twitter只是部分开
放,这让搜索引擎的处境不禁尴尬。
Google和Facebook的启示
Hitwise报告称,人们更喜欢直接登录到社交网站,
而不是通过Google搜索等传统方式上网。
对比2009年和2010年的普及率,Google访问量的
增长率为9%,而Facebook增长率为185%。
2010年8月,美国人停留在Facebook上的时间是
4100万分钟,停留在Google上(包括YouTube)是
4000万分钟。
由此可以看出,Google在互联网领域的领导地位
正受到严峻挑战。
Facebook 作为新潮的网络社交模式,似乎已经触
到Google的软肋。
Google和Facebook的启示
20分钟内Facebook将发生什么?
--100万条链接被共享
--130万张照片被标注(标签)
--150万份邀请信被发出
--160万张壁纸被共享
--180万用户状态被更新
--270万张照片被上传
--1020万条评论被发表
--460万条信息被发出
--197万条好友请求被接受
Google和Facebook的启示
经过Web2.0的洗礼,互联网正转向一种新模式
——基于人们的交流沟通方式和人们所关注的事情。
Facebook在2008年提出社交图谱(Social Graph)
的概念,旨在建立将人们和不同事物联系起来的地图,
呈现公众网络社交关系和在各个领域的应用。图谱易
用、开放并兼容其他服务。通过建立开放图谱协议,
任何网页都能轻松成为社交图谱的一部分。
Facebook正在绘出人的社交应用图谱,Yelp绘出商业
应用图谱,Pandora则是音乐领域图谱。把各种社交图
谱联结起来,将使网络更加社交和个性化,更加智能、
更类似于语义网络。
Google和Facebook的启示
社交图谱
包括用户
基本资料、
网络社交
关系信息,
以其最近
在互联网
上的活动
信息。
Google和Facebook的启示
去年4月,Facebook研发大会提出组织网络的“开放图谱”概
念。
“网络是由无固定结构的网页链接而成。“开放图谱”把人放在
网络的中心,它给网络赋予了个人和语义上的意义。”
Google和Facebook的启示
Facebook正在推出一系列易用、开放的社交插件构建开
放图谱,推动用户在任和一个网站的社交体验。
最为典型的是“Like”按钮,通过添加一行HTML代码,
就可立即加入到社交体验行列。
无论在Facebook还是在其他网站,“Like”按钮能使
用户轻松、长时间与他人分享自己感兴趣的事情和主题。
通过“Like”按钮,外部网站可利用Facebook社交插
件的优势,在各自的网站上向用户提供个性化服务。
Facebook汇集来自“Like”按钮的活动数据,从而向
世人展现一个全球互联网人群的社交分布图谱。
“Like”按钮的个性化推荐机制被视为对传统搜索引
擎的排名算法的挑战。
Google和Facebook的启示
2010年4月“Like”按钮推出之际,马克·扎克伯格宣
称:未来24小时内,整个互联网上点击“Like”(喜爱)
按钮的用户将超过10亿。其预测的基础是发布这个新
功能时已拉拢了大约30多家重磅合作伙伴。
至2011年5月,全球有250万家网站整合了“Like”按
钮,并以每天1万家的速度迅速增加。其中包括80%多
的美国前100大网站。日益成为网站们的标配。
“Like”按钮的成功已引起了
竞争对手的重视,谷歌近期
提出的“Google+1”功能,正是
对Facebook “Like” 的反击。
Google和Facebook的启示
Facebook的“野心” — 重新索引互联网
精准的信息推送
Google和Facebook的启示
虽简单但不能小看的“Like”按钮,其实是一个“
人”对“网页”的投票器。如这个人用 Facebook
ID登录了某领域网站,那么这个按钮就是“某个领
域专家”(依问答网站的数据分辨)对网页的投票
器。
Pagerank让网页来投票,而Facebook通过用户注
册的数据可让“人”,甚至“专家”来投票。实名
网络下,某些领域专家的投票给予网页很大的加权,
让网页排名更靠前。
最多“专家”投票的网页,通过Pagerank的投票
也可能加权排名在前。但通过Facebook Like和
Twitter RT的积累,远比引用要来得迅速。
在强调实时网络的今天,社交搜索得到的结果不
但可能比Pagerank更好,而且更快。
Google和Facebook的启示
目前全球至少存在着50余家百万用户量级的社交网
络,最具领先优势的Facebook是典型代表。
尽管并不是每个人都想投身毫无保留的社交网络之
中,但整个互联网模式的变迁,无形中压迫着作为信
息个体的每个人不得不响应社交网络带来的新升级。
从全球范围来看,从2009年的3.37亿用户到2011年
的6亿用户,Facebook的增速让人瞠目结舌。且关键
的是,Facebook使用者的高度参与黏度,每个网民平
均上网时间花在Facebook上占11%,花在Google和雅
虎上分别占4%。
Google和Facebook的启示
Facebook的崛起也许是互联网的一种进化。20世纪
末开始的互联网新浪潮,一直在压迫式地推动着互
联网的自我进化。
以“雅虎”作为代表的
早期互联网模式,一直在
恪守编辑者原则,由网络
管理员为主体的编辑者输
入和管理信息。
但人力无法满足互联网的机械化发展本性,于是
坚持算法优先,以计算机优越的能力来管理网络内
容的Google,成为雅虎的替代者。
Google和Facebook的启示
Google依靠独一无二的搜索算法,计算出数据网页之间
的关联性,并以此作为筛选原则,成为当之无愧的搜索
之王。
然而,面对未来网页和搜索关键点的持续爆炸性增长,
梳理数据的架构很难再依靠单纯的机器算法解决,尤其
是无法充分展现出每位用户的个性化信息。
这种大背景下,Web2.0浪潮涌起,经过2004年以来的诸
多探索,Facebook以单独行为的个体人作为信息推荐/分
类单位的模式,有望使网上信息交流和获取效率更高,
并最大限度地控制社交信息噪音。
Facebook抓住了社交网络模式的要害,将自己变成了
Web 2.0的关系入口,以开放API策略,迅速推进着平台
工具化进程。
Google和Facebook的启示
Facebook引领的社交环境,催生着各个领域社交网
络的应用如雨后春笋般涌现。
Google和Facebook的启示
2009年美国政府支持创建大型“科研脸谱网”--加
强科学家之间的联系
美国康奈尔大学和其它六家机构将利用美国国家卫
生研究院划拨的1220万美元联邦资金筹建一个脸谱
网(Facebook)风格的专业社交网络-- VIVO网,旨在
把全美各地的生物医学研究人员联系起来。新的社
交网络(VIVO)将包括各机构、学术期刊和研究人
员本人添加的信息。
通过VIVO网,科学家可以看到网络中的研究人员正在进
行的其它科学研究,更便捷地找到其他人并建立联系,
从而改进手中的研究,并与他人形成合作关系,由此可
能会导致新的发现和创新。
Google和Facebook的启示
http://vivoweb.org/
http://vivo.cornell.edu/
Google和Facebook的启示
经过大量商业性数字资源的涌现和自建数字资源的
产生,未来数字图书馆发展将聚焦:资源高度整合与
发现、个性化推送服务、语义网环境下的信息获取。
Google给图书馆带来冲击也产生影响。图书馆系统
/服务的提供商正在打造图书馆的Google — 资源发
现平台(Discovery System),提供快速、易用、全面
的数字资源发现和获取。
以Facebook为代表的社交网络迅速发展也必将给图
书馆带来新一轮的冲击和影响,目前图书馆达成共识
并孜孜不倦追求的个性化/学科化服务、语义网环境
等借助于社交网络有望迈上一个新阶段。
大纲
 Google和Facebook的启示
 图书馆集成服务的发展
 图书馆分布服务的涌起
图书馆集成服务的发展
传统图书馆主要管理几十万或几百万件的
纸本馆藏。经过几十年的发展,图书馆自动
化系统担当起馆藏揭示和管理服务的重任。
数字图书馆需要管理数以百计的数据库,
数以万计的电子期刊、数以百万计的电子图书、
数以千万乃至几个亿的学术论文。揭示和管理
这些分布、海量的数字资源对图书馆是一个严
图书馆需要一个高度整合所有类型资源并提
峻挑战,迫切需要得心应手的理想工具。
供发现服务的系统。
图书馆集成服务的发展
初级阶段:分布环境下电子资源的逐一检索
ILS
SpringerLink
ProQuest
中国知
网
读秀
实时查询和响应
图书馆集成服务的发展
中级阶段:电子资源的联邦检索
本地
索引
元
搜
索
引
擎
实时查询和响应
图书馆集成服务的发展
“高级阶段”:基于数据仓储的整合检索
发现系统—预先收割数据并建索引
图书馆集成服务的发展
发现系统的技术优势是预先对元数据及
全文建立的高品质仓储和索引,由此产生
的明显效果包括:
扩大检索范围;
提高检索效率;
提升查全率和查准率;
结果呈现的灵活多样;
纸本和电子资源的强融合、强整合。
图书馆集成服务的发展
扩大检索范围
由于联邦检索依赖计算机的处理能力实
时发送检索并获取结果,检索性能受到被
检索资源平台的数量和性能影响,往往一
次检索限制在20-30种资源内。
目前商家的预索引仓储数据量为 2-5亿
(包括10余万种期刊的上亿篇文章,上千
万的电子书,上百万的学位论文等),用
户的检索不再受资源平台和数量的限制。
图书馆集成服务的发展
提升检索效率
联邦检索的结果呈现受电子资源平台和
网络传输的制约,跨20-30个资源库检索,
首页结果呈现<3秒,但全部结果呈现有时
需要几十秒。
发现系统在预建元数据和全文索引的支
持下,大部分(80%以上)检索结果呈现<1秒。
图书馆集成服务的发展
保障查全率和查准率
发现系统在预收割并建立元数据和全文索
引过程中,对索引数据进行规范化、丰富化
处理,提高了检索结果的查全率和查准率。
预索引
仓储
图书馆集成服务的发展
结果呈现的灵活多样
检索结果可实现:

去重、排序、分面、FRBR、可视化

全文链接、个人文献管理、外部数据聚合

用户行为的挖掘、学术经验的推荐与分享
图书馆集成服务的发展
纸本和电子资源的强融合、强整合
发现系统基于对图书馆ILS数据的全面收
割和重新索引,将书目数据与电子资源数据
无缝融合在一起,在发现系统界面上重新呈
现,包括馆藏的实时在架/流通状态。
纸本和电子资源的真正融合在一起提供检
索和服务。
大纲
 Google和Facebook的启示
 图书馆集成服务的发展
 图书馆分布服务的涌起
图书馆分布服务的涌起
以Facebook为代表的社交网络也给图书馆带
来影响。在读者频繁光顾和长久停留的社交
网络(Facebook、人人网、微博等)上,许
多图书馆开始探索图书馆分布服务的途径。
图书馆分布服务的涌起
香港中文大学图书馆去年启用了Facebook上的服务
图书馆分布服务的涌起
耶鲁大学科学图书馆在Facebook上提供服务
图书馆分布服务的涌起
清华图书馆重视在读者熟悉的网络空间(社交网
络)提供服务、加强互动。
在国内社交网站人人网上建立图书馆俱乐部
——“清华大学图书馆书友会”
发布图书馆消息、构建图书馆相册、开发应用模
块,方便读者在社交网络上体验图书馆服务。
书友会成立获得了广泛的关注,已吸纳2700多名
会员,其中95%都是清华大学学生。
人人网--清华大学图书馆书友会:
http://page.renren.com/600002731
图书馆分布服务的涌起
人人网—清华大学图书馆书友会
图书馆分布服务的涌起
在新浪网建立清华图书馆微博
提供服务公告、资源使用、培训讲座等信息,分
享好的读书感受,分享好的电影,上传馆舍老照片,
分享人文新馆建设情况,转发博友的帖子等,已吸
引了近3500粉丝的关注,已发表微博近1300条。
清华大学图书馆新浪微博首页
http://www.weibo.co/index.php?m=ta&id=1891371401
在新浪网建立新闻学科博客
提供每周上架专业新书,推荐有口碑的专业图书,
探讨学科服务的新途径,等等。
清华大学图书馆学科博客首页
http://blog.sina.com.cn/s/articlelist_1645974454_5_1
.html
图书馆分布服务的涌起
新浪 — 清华图书馆的微博
图书馆分布服务的涌起
新浪—建立新闻学科博客
图书馆分布服务的涌起
开发了虚拟咨询馆员“小图”,嵌入人人网,作为
随时值班在线的虚拟咨询员,拓展了服务范围。
参考咨询:依据清华图书馆虚拟参考咨询系统的FAQ
的咨询记录为基础语料库,每天24小时不间断地为
读者提供全天候实时咨询服务;
图书搜索:搜索馆藏图书,呈现检索结果;
自我学习训练:经过在线学习训练,能够与读者进
行日常对话,聊天气,聊时事等。具有很强的交互
性,令人耳目一新。
清华图书馆虚拟咨询馆员小图
http://166.111.120.164:8081/programd/
图书馆分布服务的涌起
?
图书馆分布服务的涌起
提供23639种电子期刊的RSS订阅
图书馆分布服务的涌起
欢迎参加人人网“清华大学图书馆”俱乐部,开始体验
图书馆专题培训日程
新书通告
图书馆公告
图书搜索
智能聊天机器
图书馆分布服务的涌起
谢谢!
THANKS...