20080428CDC汇报-yang

Download Report

Transcript 20080428CDC汇报-yang

国家科技基础条件平台
科学数据共享工程
医药卫生科学数据共享网
公共卫生科学数据中心
工 作 汇 报
项目负责人:中国疾病预防控制中心
项 目 编号: 2005DKA32404
王宇 杨功焕
项 目 汇 报 内 容 提 纲
一、项目基本情况简介
二、 2005、2006年度实施进展及成效
三、典型服务案例
四、主要经验与问题
五、下一步工作计划
一、项目基本情况简介
1. 项目来源:是医药卫生科学数据共享网项目的子项目;
2.项目目标:基于医药卫生科学数据共享网,建设公共卫生
科学数据中心,建设权威、精品数据库,为国内外用户提
供科学数据服务;
3.中心任务:数据资源建设、数据标准研制、数据平台建设
、共享政策研究、人才队伍培养。
4、项目执行时间:自2003年起连续获得国家科技部
基础条件平台项目的持续支持;
一、项目基本情况简介
项目背景
1、公共卫生科学数据是医药卫生科学数据的重要组成部分
2、公共卫生科学数据对医药卫生事业的发展具有重要意义
3、公共卫生科学数据建设,与医药卫生共享网保持物理上合理
分布,逻辑上高度统一;统筹规划、分步实施
4、公共卫生科学数据建设需要国家、医药卫生共享网数据标准、
管理规范的支撑
5、公共卫生科学数据汇交需要强有力的政策支持
一、项目基本情况简介
项目意义
1、以人为本,建设一支
公共卫生数据建设的队伍
3、研究数据描述技术、规
则,为数据共享利用奠
定基础
2、汇集公共卫生领域大
型数据库,为政策制定、
科学研究做支撑
4、完善公共卫生科学
数据建设体系,向医
药卫生共享网提供具
有国际竞争力的数据
一、项目基本情况简介
项目总体建设思路
统筹规划资源,明确建设目标,统一建库规范,建立数据体
系
增容设备,完善技术平台的建设,提高适应能力
研究政策,建立管理体制,完善运行机制,提高共享服务能力
为医药卫生共享网提供政府决策、卫生保健、科研教学和百姓健康关注的权
威性数据
一、项目基本情况简介
项目目标
公共卫生科学数据中心是医药卫生卫生网上的一个重要数据
中心
一、项目基本情况简介
项目目标内容
整合数据,
建设资源,
覆盖领域。
制订公卫标准,
规范化建库
搭建平台,
推进管理,
整体提高。
共享支撑科研,
完善共享机制,
促进卫生事业
发展。
项 目 汇 报 内 容 提 纲
一、项目基本情况简介
二、 2005、2006年度实施进展及成效
三、典型服务案例
四、主要经验与问题
五、下一步工作计划
二、 2005、2006年度实施进展及成效
1、技术平台建设情况
部署了web服务器、元数据注入服务器、应用服务器、数据库服务器,存储、
备份设备,建设了数据中心网络服务平台 。
二、 2005、2006年度实施进展及成效
2、数据加工与服务总体框架
医药卫生
共享网络中心
科技部
共享中心
数据服务层
数据查询
数据整合层
数据存取与建档
CDC
数据分析
数据比对
数据推送
…
…
其他共享用户
GIS
共享数据产品重组
数据
管理室
数据清理、标化与认证
数据汇交层
日常管理
数据库
疾控中心
参加共享的
数据库
外协
参加共享的
数据库
数据集
制作单位
二、 2005、2006年度实施进展及成效
3、共享系统建设进展情况
二、 2005、2006年度实施进展及成效
4、公共卫生数据中心总体框架
数据共享层
围绕“人群与健康”主题,向全社会提供广泛共享。
系
统
与
数
据
安
全
主体数据库层
共
享
政
策
标
准
慢性非传
染性疾病
传染病
公
共
数
理据
编
码
管
健康危险
因素
公共卫生基础信息
数据集层
传染病
法 结
定 核
报 病
告
传
染
病
自
然 …
疫
源
地
慢性非传
染性疾病
高 糖 心 …
血 尿 血
压 病 管
疾
病
健康危险
因素
食
品
与
营
养
吸 行
烟 为
危
险
因
素
…
公共卫生基
础信息
人 出 死 …
口
生
因
元
数
据
管
理
二、 2005、2006年度实施进展及成效
5、共享数据资源建设进展情况
2006在线服务资源
2007正在建设资源
1
人口数据集
1
中国人口死因调查数据集
2
死因主题数据集
2
全国疾病死因监测数据集
3
法定报告传染病数据集
3
法定报告传染病数据集
4
结核病监测及管理数据集
4
结核病监测与管理主题数据集
5
传染病疫源地监测数据集
5
传染病疫源地监测数据集
6
肝炎流行病学调查数据集
6
中国儿童生长发育状况监测数数据集
7
重大传染病健康教育数据集
7
中国青少年健康危险行为调查数据集
8
居民营养与健康调查数据集
8
食物中毒监测数据集
9
食物成分数据集
9
POPs类卫生杀虫剂在中国流通和使用现状调查数据集
10
职业卫生监测数据集
10
全国人体重要寄生虫病现状调查数据集
11
化学毒物数据集
11
流动工人职业卫生状况调查数据集
12
吸烟调查数据集
12
中国经济、人口和营养健康状况调查数据集
13
人群行为危险因素监测数据集
13
2002年中国居民营养与健康状况调查数据库
14
学校卫生监测数据集
14
食品抽检监测数据集
15
儿童生长发育状况监测数据集
15
公共卫生信息资源目录数据集
16
标准代码字典
16
信息资源目录数据集
17
国际疾病分类编码
17
信息指标目录数据集
二、 2005、2006年度实施进展及成效
数据资源建设单位情况
多单位,跨系统的联合共建策略。
二、 2005、2006年度实施进展及成效
6、标准、规范、管理办法建设进展情况
医药卫生共享标准、规范体系内容
二、 2005、2006年度实施进展及成效
6、标准、规范、管理办法建设进展情况
在数据共享建设过程中,在国家、医药卫生共享标准、规范的基础
上,根据公共卫生科学数据共享的特点,制定了数据共享政策和共享
数据制作规范;发布了相关的数据标准10部。
二、 2005、2006年度实施进展及成效
6、标准、规范、管理办法建设进展情况
公共卫生科学数据制作规范
用于数据资源单位加工生产、整合共享数据,
严格控制数据质量,
使数据统一规范,
实现数据的一致性表达,
形成符合科学数据共享工程要求的数据集。
二、 2005、2006年度实施进展及成效
6、标准、规范、管理办法工作进展情况
数据集加工制作流程
二、 2005、2006年度实施进展及成效
6、标准、规范、管理办法工作进展情况
原始数据说明书制作规范
《原始数据说明书制作规范》参照科学数据共享平台数据模式标准制订,其
目的在于用统一、规范的格式,说明用于共享的原始数据的内容和结构组成。
原始数据的结构分为四层,分别为主题数据库、数据集、数据库和数据表 。
原始数据结构层次示意图
二、 2005、2006年度实施进展及成效
6、标准、规范、管理办法工作进展情况
公共卫生实行数据统一管理、发布制度,数据生产 / 加工部门上传数据的流程
二、 2005、2006年度实施进展及成效
•域名:www.phsciencedata.cn
•数据集在线服务地址
二、 2005、2006年度实施进展及成效
服务内容、考核指标
任务书考核指标
完成情况
20个数据库,2000个数据项,2亿条数据
完成
3万个静态查询数据集,在线服务
完成
80个动态查询、分析数据库,在线服务
完成
新增数据的背景数据、元数据和数据元字典,在线服务
完成
提供多种级别的7*24小时的不间断的共享服务,支持3-5项课题的
科学研究、科学发现, 支持省、地、县级疾控机构数据共享需求服
务
完成
人才培养
完成
标准规范和相关制度文档
完成
二、 2005、2006年度实施进展及成效
共享系统建完成情况
二、 2005、2006年度实施进展及成效
数据资源建设完成情况
健康危险因素主体数据库
传染病主体数据库
1、食物中毒监测数据集
1、传染病监测数据集
2、全国吸烟调查数据集
2、结核病监测及管理数据集
3、人群行为危险因素监测数据集
3、传染病自然疫源地监测数据集
4、食物成分数据集
4、重大传染病健康教育数据集
5、2002年中国居民营养与健康状况调查
数据集
5、全国人体重要寄生虫病现状调查数据集
6、全国儿童生长发育状况数据集
1、全国死因监测数据集
7、化学毒物数据集
2、中国人口死因调查数据集
8、中国青少年健康危险行为调查数据
9、中国经济、人口和营养健康状况调查
数据集
基础公共卫生信息主体数据库
3、人口与经济数据集
公共信息编码数据集
10、POPs类卫生杀虫剂在中国流通和使用
现状调查数据集
1、公共卫生标准代码数据集
11、流动工人职业卫生状况调查数据集
3、公共卫生信息资源目录数据集
12、食品抽检监测数据集
2、国际疾病分类代码数据集
二、 2005、2006年度实施进展及成效
人才队伍建设完成情况
• 机制
– 人才管理培养机制:人才管理机制规划,人才培
训计划,培训组织;
– 人才培训实施:培训教材与实例准备,培训对象,
培训考核。
• 人员培训
– 科学数据收集、加工、分析人员培训100名;
– 后台数据管理、数据服务人员培训50名。
二、 2005、2006年度实施进展及成效
共享服务情况
数据服务方式
服务内容
在线服务量
元数据查询
元数据查询
33个
数据元查询
数据字段说明
75表的说明
1537个数据元说明
数据背景
数据背景说明
26个
数据下载
提供打包数据的下载
38个免费数据包
静态数据查询
以数据目录方式提供检索服务
562个静态资源
动态数据查询
以可选的动态条件组合检索数据
66个动态模型
在线数据分析
提供专业的OLAP分析,在线多维多层次的
数据分析
31个OLAP在线分析
模型
服务对象
数量
用户主要来源
网站开通以来总访问人次
约15万人次
政府机构、卫生部门、科研单位、高等院校、相关企业
在线共享数据下载总量
100GB
政府机构、卫生部门、科研单位、高等院校、相关企业
离线共享数据总量
2TB
政府机构、卫生部门、科研单位
注册用户数
1043
政府机构、卫生部门、科研单位、高等院校、相关企业
传染病主体数据库
• 传染病发病数据库
– 疫情数据库(37种传染病、覆盖全国31省)(有)
– 重点传染病数据库:结核、HIV、肝炎、
• 病原数据库
– 流脑菌群的分布和变迁
– 结核耐药菌群的分布和变迁
• 疫源地数据库
• 结合观察标志性病例,病原数据库和疫源地数据库,结合气象、
地理地貌、动物疫情数据库等,为多种传染病的预测预警研究,
如大流感全球预测提供基本共享数据。
基本公共卫生数据库:死因数据库
• 覆盖全国的有代表性的人群死因数据库(有,覆盖1000万人口,
目前包括1991-2000,进一步累加)
• 医院死因监测数据库(覆盖全国95%的县医院和70%的乡镇医院的
死亡,将进入)
• 估算全国疾病负担,确定优先控制重点,判断疾病控制效果;
死 亡 率 呈 上 升 趋 势 的 疾 病 , 1991-2000
45岁以上男性人群肺癌死亡率, 1991-2000
2000年 中 国 分 死 因 的 死 亡 人 数
150
2000年世界人口标化
105
90
75
60
45
它
其
常
200
150
100
50
15
China
USA
先
天
异
病
产
科
疾
病
系
统
疾
病
尿
泌
化
系
统
疾
病
消
吸
系
统
疾
病
呼
分
脑
心
内
及
谢
代
血
泌
管
疾
疾
患
瘤
肿
病
疾
期
生
围
感
染
性
疾
病
30
250
死亡率(1/10万)
肺癌
肝癌
乳腺癌
脑血管病
冠心病
糖尿病
交通事故
120
标化死亡率(1/10万)
1,166,766
43,883
5,596
117,781
238,249
1,530,423
2,488,266
98,454
81,969
128,696
1,412,999
135
0
1985
1990
1995
2000
2005
2010
0
1990
1992
1994
1996
1998
2000
2002
危险因素数据库、中国营养调查和儿童营养监测数据库
%
30
25
超重
肥胖
28.1
17.5
20
22.8
20.6
16
20
12.8
1992
2002
12
15
9.8
10
6.0
3.1
4
5
0
5.7
8
7.1
成人
城市
农村
2002年中国成人超重及肥胖患病情况
0
超重
肥胖
超重和肥胖患病率的变化
• 提出中国成人BMI的分类标准-以24kg/m2 为筛查超重切点,
28kg/m2为筛查肥胖的切点;同时制定了腰围(WC)切点等;
• 确定我国成人BMI及腰围与高血压、糖尿病、冠心病危险因素的
相关性及归因危险度的信息。计算成人超重和肥胖导致的高血压、
糖尿病、冠心病和脑卒中的人群归因危险。
二、 2005、2006年度实施进展及成效
注册用户所属行业类型构成
注册用户所属行业类型构成(%)
8%
16%
36%
科研机构
教育院校
企业公司
17%
23%
其它
政府机关
项 目 汇 报 内 容 提 纲
一、项目基本情况简介
二、 2005、2006年度实施进展及成效
三、典型服务案例
四、主要经验与问题
五、下一步工作计划
三、典型服务案例
1、对国家政策支撑:
<<中国儿童发展纲要(2001-2010年) >>
发育目标
提出 儿童生长
相关指标评估研究结果
基于儿童生长发育数据制定
的干预政策已经取得明显成效。
WHO低体重患病率
WHO发育迟缓患病率
三、典型服务案例
2、对科研的支持
传染病数据、传染病疫源数据对落实
<<中国应对气候变化国家方案>> ,进行气候变化对人类健康影响研究的支持。
三、典型服务案例
3、对科研支撑:
<<永久性有机污染物(POPs)斯德哥尔摩公约 >><<国家实施方案>> 提出 控制使用
POPs的战规划。
基于永久性有机污染物数据,对POPS的毒性在妇女、儿童体内蓄积水平研究,制
定的干预政策.
三、典型服务案例
4、对疾病预防控制的支撑:
传染病数据报告艾滋病数据
对落实<<人人享有预防保健>>、<<中国遏制艾滋病方案
>>,支持制定的干预政策、行动计划、科学方法研究。
三、典型服务案例
5、研究论文
疾病模式转变与中国慢性病控制策略研究、中国人群饮
食、体力活动和体质指数的现状研究 、中国人群自杀水
平的变化趋势研究、中国居民合理营养所需最低食物支
出的估计和预测、居民膳食营养状况的变迁及政策建议、
寄生虫感染及其社会因素估计和预测、工业企业流动工
人职业卫生状况和干预政策建议、中国恶性肿瘤的死亡
分布特点 等,共112篇。
项 目 汇 报 内 容 提 纲
一、项目基本情况简介
二、 2005、2006年度实施进展及成效
三、典型服务案例
四、主要经验与问题
五、下一步工作计划
四、主要经验与问题
主要经验
1、组织管理经验
•组织领导
•政策保证
•组织宣贯
四、主要经验与问题
主要经验
2、数据共享系统升级,数据标准加工流程化
在科技部元数据标准的基础上,进一步扩展元数据,建
设元数据驱动的数据共享系统
四、主要经验与问题
主要经验
3、应用支撑平台的功能化
四、主要经验与问题
主要经验
4、基础资源共用化
利用CDC的集成平台,实现科研管理系统、公共卫生监测系统、疾病监
测报告系统等的科研数据和业务数据的集成,形成有稳定数据来源的科学
数据共享机制。
四、主要经验与问题
主要经验
5、资源建设持续化
资源建设持续化,年度修订资源目录,规划8-10个共享数据库,推送到共享服务平台
编写了中国疾控中心信息资源目录
整理信息资源目录240项
指标目录7000多项
建设共享的数据资源约为数
据总量的40%
四、主要经验与问题
主要经验
6、 数据质量控制与评估制度化
四、主要经验与问题
主要经验
7、主题数据库重组研究常规化
传染病主题
健康危险因素与死亡主题
环境与肿瘤发生主题
疾病危险性评价研究
免疫规划接种效果研究
疾病负担和优先重点控制研究
四、主要经验与问题
存在的问题
• 缺少本领域对科学数据的评价标准;
• 缺少对用户的使用意见的反馈窗口。
项 目 汇 报 内 容 提 纲
一、项目基本情况简介
二、 2005、2006年度实施进展及成效
三、典型服务案例
四、主要经验与问题
五、下一步工作计划
五、下一步工作计划
1、技术平台的增容建设
(也要与时倶进提高适应能力)
五、下一步工作计划
2、数据中心共享系统升级建设
建设基于元数据驱动的共享系统,包括:标准编码系统;数据质量分析
评估系统;地理信息的应用管理系统;共享数据资源增建加工发布管理、
用户认证管理系统等。
五、下一步工作计划
3、主题数据库重组服务建设
(为不同的数据利用者,提供可选数据资
五、下一步工作计划
4、新建设数据资源(在 3个数据域的23个数据库的基础上新建25
个 数据库),资源建设持续化
五、下一步工作计划
4、2008-2010年新建设数据资源表,保证资源量的增长,实现
数据的完全共享
五、下一步工作计划
5、建立服务效果评价体系
① 服务效果评价指标
② 用户调查表
③ 服务效果评价系统
④ 评价方法、结果、指导建议
谢谢!