Pubmed统计分析系统

Download Report

Transcript Pubmed统计分析系统

PubMedplus
PubMed分面检索与聚类分析系统
北京唯博赛科技有限公司
销售部经理 韩永龙
什么是分面检索与聚类分析
分面检索(Faceted Search):是指事物具有多个方
面的属性。例如文献包括年代、出版语言、学科分
类等分面。分面检索就是指通过事物的这些属性不
断筛选、过滤搜索结果,让搜索结果更精确。
 聚类分析(Cluster Analysis):是根据“物以类
聚”的道理,对样品或指标进行分类,对象是大量
的样品,没有任何模式可供参考或依循,即在没有
参考的情况下进行。对文献进行聚类分析,揭示概
念与概念之间的关系 可以拓展读者的思路

PubMedPlus与PubMed的关系

Pubmedplus是北京唯博赛科技有限公司利用自身技术优势
在Pubmed文献检索系统基础上,利用文献计量学原理开发
的大型文献搜索引擎。系统采用Pubmed官方授权的接口,
提供与Pubmed同样的检索方式和检索结果。

对检索结果提供重新整合的功能,从期刊、国家、机构、作
者、疾病、基因本体等三十多个不同层面对检索到的文献加
以重新归类和分析,引导读者依据这些归类和分析结果快速
找到自己需要的信息。
PubMed分面检索与聚类分析的意义

PubMed是世界公认的权威数据库,也是生物医学工作
者使用最广泛的数据库。

对Pubmed进行分面检索可以使检索结果更精确,更符
合读者的要求;对Pubmed进行聚类分析可以揭示课题
发展的趋势、发现概念之间的关系,帮助研究人员寻
找新的研究方向和创新点。

通过文献分析能够帮助检索这发现创新点,如芝加哥
大学Swanson教授通过文献分析,猜测出“鱼油可以
治疗雷诺病”及“偏头痛与缺镁有关系”等。
Pubmedplus的原理:计量分析+语义
为保证分析数据的权威性,检索结果与pubmed实
时同步;
 在线调取pubmed的检索结果,在缓冲中形成一个
临时数据池,将文献的字段切分再按照期刊、机构
、部门、年份、作者、国家、城市、主题词等50多
项进行统计和聚类,按照出现的频率将结果展示出
来;
 每个统计项后台都对应一个语义词表,保障聚类结
果的全面、准确,如地址里只有wuhan,统计省会
和国家时就对应到湖北省—中国;

专家评定pubmedplus:
为目前国内外最强大的医学信息检索与分
析系统。该系统集资源整合、信息集成、技术融
合、知识服务于一体,采用国际最先进的信息检
索、本体语义、数据挖掘、知识发现的理念与技
术,将文献数据、引证数据、循证数据、疾病数
据、药物数据、基因数据等进行精炼过滤和聚类
分析,实现了信息检索、数据分析、定量评价、
数据挖掘、知识发现的多重功能。
Pubmedplus服务内容
1
辅助检索服务
2
课题辅助分析服务
3
期刊投稿指南
4
定制服务:馆藏整合与揭示和机构分析
一、Pubmedplus之辅助检索
帮助读者进行检索,使读者的检索准确并且全面
如:检索cancer,Pubmed是将检索式转化
为自由词+主题词实现其检索,即
"neoplasms"[MeSH Terms] OR "cancer"[All
Fields]
 优点:有主题词的文献(medline文献)查准
率很高,

并不是所有文献都有主题词
只有Medline数据有主题词标引的数据;
Medline加工中的数据:[PubMed - in process]
出版商提供的数据:[PubMed - as supplied by publisher]
OLDMEDLINE:[ PubMed - OLDMEDLINE]
PubMed :[PubMed] (都没有主题词)
 通过利用Pubmedplus的聚类分析,读者可修
正检索式,使其更为完善和全面,提高查全
率。
Cancer的同义词tumor,cancers
等都组配到检索式中,检索更全
实例演示说明:
 检索目标:非小细胞肺癌对酪氨酸激酶治
疗耐药后的进一步治疗方案。
 常规检索策略:
non-small cell lung cancer + tyrosine
kinase inhibitor + resistance + treatment
非小细胞肺癌对酪氨酸激酶治疗耐药后的进一步治疗方案
非小细胞肺癌对酪氨酸激酶治疗耐药后的进一步治疗方案
非小细胞肺癌对酪氨酸激酶治疗耐药后的进一步治疗方案
非小细胞肺癌对酪氨酸激酶治疗耐药后的进一步治疗方案
非小细胞肺癌对酪氨酸激酶治疗耐药后的进一步治疗方案
各个关键词再组配上相应的主题,最后的检索式
 ("carcinoma, non-small-cell lung"[MeSH Terms] OR
"non small cell lung cancer"[tiab] OR "nsclc"[tiab] OR
"adenocarcinoma"[tiab] OR "non small cell lung
carcinoma"[tiab] OR "adenocarcinomas"[tiab] OR "non
small cell lung cancers"[tiab] OR "squamous cell
carcinomas"[tiab]) AND ("protein-tyrosine
kinases"[MeSH Terms] OR "tyrosine kinase
inhibitor"[tiab] OR "tyrosine kinase inhibitors"[tiab] OR
"erlotinib"[tiab] OR "sorafenib"[tiab]) AND ("drug
resistance"[mesh] OR "drug-resistant"[tiab]) AND
("therapy"[Subheading] OR "therapeutics"[MeSH
Terms] OR therapy[tiab] OR "treatment"[tiab] OR
"methods"[tiab])
这样得出的结果既准确又全面

非小细胞肺癌对酪氨酸激酶治疗耐药后的进
一步治疗方案:
精炼过滤临床文献
病例报告、I期临床试验、II期临床试验、III
期临床试验、IV期临床试验、多中心研究、
Meta分析、临床实验、随机对照实验
非小细胞肺癌对酪氨酸激酶治疗耐药后的进一步治疗方案:
过滤高质量文献
二、Pubmedplus之课题辅助分析
年份聚类:
---文献发表的年代分布
---为分析趋势提供依据
机构聚类:发现高产出机构,利于机构合作
机构聚类:
---发现该领域高产出的研究机构
---有利于机构间的合作
---发现深造的研究机构
期刊聚类:查找该领域的核心期刊
期刊聚类:
---发现该领域的核心期刊
---为文献投稿选择合适期刊提供依据
作者聚类:发现该领域的高产出研究人员
作者聚类:
---发现该领域的高产出研究人员
---有利于机构的人才招聘
---选择潜在的合作者
国家聚类:发现高产出地区
国家聚类:
---发现该领域的高产出国家
---可进一步限定,深入分析
中国省份聚类:了解国内研究现状
中国省份聚类:
---发现该领域的高产出国内省份
---选择潜在的国内合作机构
主题词间聚类:发现潜在的研究热点
年份:文献发表的年代分布
期刊:检索课题的核心期刊
机构:国内外重点机构分布
科室:哪些科室的人在研究
作者相关:核心作者及联系方式
主题词:主要研究领域
副主题词搭配:主题领域与研究方向
自由词:相关联的词与词组
国家:文献国家分布
中国省份:中国文献省市分布
城市:国内外城市分布
药物:聚类文献中的化学药品
疾病:聚类文献中的疾病
治疗:治疗方法
症状:临床症状
物种:研究的物种
解剖:解剖部位
食品:聚类食品
基因本体:本体聚类
基因蛋白:蛋白聚类
按基因本体聚类,发现关于
自闭症行为的文献较多。
中草药马兜铃致癌研究 国际文献分析
中草药马兜铃致癌研究 国际文献分析
对某一年的发文进行分析
三、Pubmedplus之期刊投稿指南
---查看此期刊被哪些数据库收录
---此期刊在该学科里的排名
---标示出录用难易度和审稿周期
投稿指南
---发现该期刊主要收录文献的研究方向
---分析国内作者发表在该期刊的百分比
四、个性化定制之: 馆藏资源整合及全文揭示
馆藏过滤:读者
检索文献后,把
读者导向本馆购
买的数据库,本
馆IP内均可以查
看全文。
1原版数据库馆藏揭示
本馆购买的或免费的原版数据
库,可直接打开全文
2纸本刊的馆藏揭示
本馆购买的纸质期刊,
可提示馆藏信息
3文献没有全文链接的通过doi进行馆藏揭示
没有全文链接的期刊,
通过doi指向馆藏全文
文献评价:大量的引文数据
 Pubmedplus收录了一亿四千万条引文与参考
文献,可以帮助读者检索自己的课题。
 对引文与参考文献进行聚类分析有很多有
待挖掘的功能;如排查自引
四、定制服务之机构库文献分析
统计
全
机构库
分析
解决机构异名问题
分析
按照作者,学科,年代分析
同行
关注
与关注机构进行学科等比较
Pubmedplus对读者的用途
本机构及关注机构发表在Pubmed上的
文献“实时在线分析”,可以按学科及年份
对本机构和关注机构发文量作对比。本机构
重要作者均翻译为中文,文献数量则动态显
示。
医疗机构排名分析及实时在线跟踪
对医院在PubMed发表论文情况进行统计分析,
能为机构领导者适时调整科研策略、发展政策
等提供参考和依据, 也有助于对各学科发表论
文的情况进行管理和评价。
实时在线跟踪了解相关医院论文情况,确定位
置明确努力方向,便于调整好相关政策。
Pubmedplus个性化的定制服务
Pubmedplus个性化的服务
Pubmedplus个性化的服务
Pubmedplus个性化的服务
对机构发表在SCI上的文献进行聚类分析






基于同样的工作原理及分面语义检索,可以对
机构发表在SCI上文献进行分析;
能够查全机构在SCI上发表的全部论文,解决机
构在SCI上的异名问题;
直接展示机构的每个部门,每个作者发表的总
文献;还可以与其他机构对比;
对SCI引用文献进行作者聚类分析,解决科研部
门排查自引文献困难的问题。
对SCI文献作者名称汉化,解决作者名称不好区
分的问题。
正在与解放军总医院图书馆合作开发SCI版本
免费版本Pubmedpro.cn;任何人无需注册均可使用,还可以下载安卓手机版本。
Pubmedpro与pubmedplus均不提供全文服务

馆际互借建议使用 我们为各地资源馆搭建
的“基于pubmed的云端馆际互借系统”,
其检索方式强大,依托各馆丰富的馆藏资源
,可以高满足率的,快速的为用户提供馆际
互借服务。
Pubmedpro与pubmedplu均不提供全文服务
谢谢大家!
敬请批评指正!
韩永龙
18601241281 微信号:pubmedplus
反馈邮箱:[email protected]