Transcript 基礎資料庫加值應用平台
健康資料加值應用協作中心
介紹與應用
詹士賢
衛生署統計室
2010.08.19
大綱
• 計畫目標與架構
• 基礎資料庫加值應用平台
• 成立專案辦公室
• 網路化服務
• 健康資料地理資訊系統
• 國際指標比較
行政院衛生署統計室
2
計畫目標與架構
行政院衛生署統計室
3
專案計畫目標
• 「健康資料加值應用協作中心規劃建置計畫」專案目標
-國民健康資訊建設計畫(NHIP)
1. 提昇健康資料品質與健全資料內涵
2. 持續建置健康指標與基礎資料庫
3. 持續建置健康指標與基礎資料加值應用平台
4. 規劃及建置健康資料加值應用協作中心
5. 因應未來發展與遠程規劃
行政院衛生署統計室
4
專案計畫目標(續)
提升健康資料品質與健全資料內涵
規劃及建置健康指標與基礎資料庫
1.檢視現有資料庫之ㄧ致性、正確性與完整性
2.進行資料檢誤與驗證
3.針對資料插值工作
4.建立資料庫使用手冊
1.檢討現有健康指標與基礎資料庫提出可能產製
之健康指標、應用對象及效益,並與國際比較
2.依據國際資料,建置健康指標之系統架構與定
義範圍
3.蒐集內外部指標需求
規劃及建置健康指標與基礎資料加值應
用平台(安全、自主、效率)
規劃及建置健康資料加值應用協作中
心 (可永續經營)
1.系統架構,包括提供查詢、分析服務所需之軟
硬體規劃、資訊安全機制、服務控管與審查機制
等
2.成立專案辦公室;建置獨立作業區
3.建置模擬數據檔
1.健康資料加值應用協作中心規劃及建置
2.建置具資訊安全、風險控管之服務與審查機制
3.成立健康資料加值應用委員會
因應未來發展與遠程規劃
1.建置中部與南部中心
2.建置疾病子資料庫、特殊族群子資料庫、小地區
子資料庫、...
3.規劃遠端服務方式
行政院衛生署統計室
5
現有資料庫種類(計27種)
代號
統計項目
資料提供單位
1
全民健保處方及治療明細檔-門診、住院、藥局
健保局
2
全民健保處方及治療醫令明細檔-門診、住院、藥局
健保局
3
全民健保承保檔
健保局
4
全民健保重大傷病檔
健保局
5
戶籍資料檔
內政部
6
死因檔
統計室
7
醫事機構現況檔
統計室
8
醫事機構服務量檔
統計室
9
醫療院所評鑑等級
醫事處
10
出生通報檔
國民健康局
11
癌症登記檔
國民健康局
12
家庭醫療保健消費調查檔
統計室
13
醫事機構基本檔
健保局
14
原住民檔
原住民委員會
行政院衛生署統計室
6
電腦處理個人資料保護法修正條文
99年4月27日三讀通過
第一章
總
則
第六條 有關醫療、基因、性生活、健康檢查及犯罪前科之個人資料,不得蒐
集、處理或利用。但有下列情形之一者,不在此限:
一、法律明文規定。
二、公務機關執行法定職務或非公務機關履行法定義務所必要,且有適當安全
維護措施。
三、當事人自行公開或其他已合法公開之個人資料。
四、公務機關或學術研究機構基於醫療、衛生或犯罪預防之目的,為統計或學
術研究而有必要,且經一定程序所為蒐集、處理或利用之個人資料。
前項第四款個人資料蒐集、處理或利用之範圍、程序及其他應遵行事項之辦
法,由中央目的事業主管機關會同法務部定之。
行政院衛生署統計室
7
現行計畫構想
行政院衛生署統計室
8
現行健康資料加值應用平台
資料庫
健保資料
癌症資料
臨床研究資料集:
次級資料/
資料超市
線上即時分析報表
臨床/生統指標
(BI)
連結
資料庫
生統報表資料集:
報表資料/
彙整資料集
ETL
工具
生統報表(Web)
死亡資料
SAS 介面
其它
資料查詢與維護
行政院衛生署統計室
(Office )介面
9
健康資料加值應用協作中心服務範圍
提供服務
指
標
查
詢
服務對象
提供健保與相關社
經指標,含GIS、警
示系統等
政府機關
資處
料理
串分
連析
提供場地,限時、
限地、限欄位,僅
可攜出經審核之統
計分析結果
學術研究
代處
為理
資分
料析
提供不含5單位以下
個資之統計分析結
果
產業及其他
行政院衛生署統計室
10
基礎資料庫加值應用平台
行政院衛生署統計室
11
健康指標與基礎資料庫需求之蒐集與確認
•
檢討衛生署已使用或具開發應用價值之基本資料庫,就資料庫內容與特性,
及針對97-98年專案計畫所蒐集之298件內部需求,將可能週期性產製之健康
指標概分為:
– 死因統計:各項主要死亡原因和癌症死亡原因的歷年死亡人數、粗死亡率、年齡
標準化死亡率、死亡年齡平均數、死亡年齡中位數
– 醫療機構現況及醫院服務量統計:醫療院所概況與醫院概況兩大類指標
– 全民健康保險醫療統計:以全民健康保險基礎,包括前二十大死因之死因及就醫
資料、前十五大癌症之死因及就醫資料、門、住診合計主要疾病就診率等
– 公務統計:內含括了衛生統計指標、醫政、健康促進、疾病管制、藥政和食品衛
生等指標
– 國民醫療保健支出:包括了政府部門、全民健保和民間部分支出統計、國際醫療
保健支出等
行政院衛生署統計室
12
健康指標與基礎資料庫分類與定義
將資料給予分級分類,並依據使用者之權限開放不同等級之資料庫:
1. 資料庫分級:
− 依資料檢核程序、有無加密、資料敏感度等原則分為A-F六級:
A資料檢誤程序(1~3類)、B國民身分證字號或居留證號有無加密(1~3類)、C
有無姓名(1~2類)、D有無地址(1~5類)、E出生日期(1~8類)、F資料個案數
(1~3類)
− 未來依據不同資料使用者身分給予不同分級之資料。
行政院衛生署統計室
13
健康指標與基礎資料庫分類與定義(續)
2. 次級資料庫分類:
− 次級資料庫(二級或三級資料庫)為具有不可辨識個人資訊的資料
庫
− 次級資料庫也為建構商業智慧系統(Business Intelligence System, BI)
的重要基礎工作
− 建立五個次級資料庫,包括死因統計、醫療機構現況及醫院服務量
統計、全民健康保險醫療統計、公務統計和國民醫療保健支出
行政院衛生署統計室
14
建置健康指標與基礎資料庫-資料品質改善提升機制
提出加強現有健康資料品質方法,其工作內容包括:
擬定各資料庫檔案與欄位的命名原則
編製第二優先檔案之資料庫使用手冊
− 第一優先檔案為健保資料庫相關檔案,第二優先檔為癌症登記檔、死因統計檔、
醫事機構現況檔、醫事機構服務量檔、醫療院所評鑑等級、出生通報檔
比對資料庫與新編譯碼簿之一致性
由研究議題出發,檢視資料庫品質(慢性腎臟疾病、長期照護品質、乳癌篩
檢等議題)
行政院衛生署統計室
15
建置健康指標與基礎資料庫-模擬數據檔之建置
建置模擬數據檔之目的:
提供資料使用者於實際操作前之模擬分析,預先了解資料庫之內容與分析時可
能遇到之問題,並針對問題點提出可能解決之辦法,期能使實際分析時獲得最
佳之效益並節省分析時間
有教育訓練之用途,用於培育具有分析能力之人才,或是舉辦健康資料加值應
用研討會時示範之資料庫
產出原則以無法辨識個人資料,保留資料庫的特色為主,執行方式主要使用「隨機
化」和「統計模型」。
99年下半年度預計以96年相關資料庫測試模擬數據檔建置之程式,並規劃模擬數據
檔提供之作業流程,包括模擬數據檔之產出、使用者申請和送出資料等流程。
行政院衛生署統計室
16
建置健康指標與基礎資料庫加值應用平台
• 健康資料加值應用平台系統及架構
– 資料庫系統以IBM Infosphere Warehouse為主,ETL工具(Extract
Transform Load tool)採用IBM DataStage,商業智慧系統則採用
IBM Cognos為建置基礎。
– 原始資料以文字檔格式(Text)放入資料庫中,再透過ETL工具進
行資料清理和檢誤,並新增未來所需之欄位。
– 利用IBM Cognos從資料倉儲撈取所需的資料,產生前台所需要的
資料市集(Data Mart)或資料方塊,進而建立報表系統或商業智
慧系統。
行政院衛生署統計室
17
建置健康指標與基礎資料庫加值應用平台(續)
•
健康資料加值應用平台運作機制
– 安全控管(帳號權限管理):依據功能群組、依使用者身份、使用資料夾分類
– 資料檔驗證:
− 資料量大者:採用欄位比對及總數比對的方式進行資料驗證
1. 欄位比對:每個周期的檔案匯出任五筆資料,由檔案的KEY值進行與原資料檔
的資料比對,確認匯入之資料欄位正確無誤。
2. 總數比對:針對資料檔的最後幾個欄位,確認匯入之所有資料,最後一個欄位
並未產生位移。
− 資料量一般者:採用所有資料比對
行政院衛生署統計室
18
建置健康指標與基礎資料庫加值應用平台(續)
• 健康資料加值應用平台擴充計畫
– 實務應用面規劃
− 將最新資料檔匯入平台中,並完成資料檔驗證
− 完成五大類健康指標之建置,包括死因統計、醫療機構現況及醫院服務
量統計、全民健康保險醫療統計、公務統計、國民醫療保健支出
– 持續教育訓練:內容以資料庫管理、系統工具、系統操作、系統使用、
系統管理、系統維護、ETL工具和Cognos工具的訓練課程為主
– 資料庫效能改善: 依據99年5月IBM原廠執行平台效能測試結果,分批次
進行硬體擴充工程
– 商業智慧系統應用:預計規劃設計管理階層和一般內部使用者適合的商
業智慧入口網頁
行政院衛生署統計室
19
成立專案辦公室
行政院衛生署統計室
20
成立專案辦公室
• 專案辦公室98年3月5日成立於台北火車站3樓
– 專案辦公室空間劃分為行政管理區及獨立作業區兩個部分,行政
管理區為專任助理之工作區,獨立作業區則為提供外來資料使用
者處理資料及統計分析之場所。
行政院衛生署統計室
21
成立專案辦公室(續)
行政管理區
獨立作業區
行政院衛生署統計室
22
成立專案辦公室(續)
• 軟硬體設備:
– 辦公室設備:辦公桌椅、紅外線攝影機、數位錄音筆、單槍投影
機、寄物櫃等。
– 電腦設備:伺服器、個人電腦、工作站、筆記型電腦、不斷電系
統、外接式硬碟等。
– 軟體設備:SPSS Statistic Base 17.0 教育單機版、SPSS Regression
17.0 教育單機版、SPSS Advanced Statistics 17.0 教育單機版、
ArcGIS Server9.3.1 Enterprise Stabdard、ArcGIS Server9.3.1 Single
use
行政院衛生署統計室
23
成立專案辦公室(續)
•
人員配置:
– 本計畫至目前為止,共聘任專案經理一名、系統分析師二名、碩士級專
任助理九名、學士級專任助理三名與兼任助理一名,共16名成員。
•
人員訓練:
– 實務操作訓練:給予1~3個月不等的時間,獨立完成衛生署統計室所發行
95年醫療年報前30個門診及住院的統計表格。
– 資訊安全教育訓練:資安風險管理與資安治理概論、個資法探討與隱私
資料保護、電子郵件社交工程防治、電子病例與資訊安全、2009全球資
安管理趨勢與防止資料外洩策略等。
– 教育訓練:GIS地理資訊系統、ETL操作練習等。
行政院衛生署統計室
24
成立專案辦公室(續)
• 計畫品質監控辦法:
– 工作會議:
— 工作會議每兩周召開一次,檢討專案人員所提出之工作進度。
— 98年12月24日至今已召開11次工作小組會議。
– 健康資料加值應用指導會:
— 成立健康資料加值應用指導委員會,其功能為諮詢、指導及協助協作中心運
作。
— 98年4月17日、98年9月4日、98年12月7日、99年4月2日召開健康資料加值應
用指導會。
— 委員名單:江東亮教授、藍忠孚教授、羅紀瓊教授、賴美淑教授、郭浩然教
授、邱弘毅教授、吳聰能教授、李玉春教授、鄭光甫教授、陳麗霞副教授、
陳珍信研究員、周幼珍副教授、翁崇雄教授、黃旭明主任
行政院衛生署統計室
25
現行作業方式特色
•
蒐集相關資料、檢誤/除錯/比對/插補、加密
•
資料匯入資料倉儲、建立各式次級資料集
•
編製健康指標、建置線上查詢系統
•
建立資料串連與統計分析平台
•
建置專案辦公室與獨立作業區
•
開放使用申請(限地、限時、限資料欄位)
•
依核准之申請內容,提供串連資料之必要欄位(資料二次加密後以流水號提供)
•
可比對資料(如生日、地址等)加以模糊化(分級處理)
•
資料庫與作業區採實體隔離管制
•
攜出統計結果前,須提供程式、分析標的及結果內容說明,核准後由專人Email統計結果至申請者指定信箱
行政院衛生署統計室
26
『健康資料加值應用協作中心
規劃建置計畫』研討會名稱
場次次數
現況服務量統計調查作業研討會
2
衛生統計應用研討會
7
死因統計研討會
4
醫療保健資源配置
1
死因、疾病碼等其他相關專題討論
4
註:2001年迄今。
行政院衛生署統計室
27
97-98年『健康資料加值應用協作中心規劃建置計畫』
各單位內部需求一覽表
單位
醫事處
食品衛生處
健保小組
護理及健康照護處
疾病管制局
全民健保監理委員會
全民健保費用協定委員會
國民健康局
總計
總件數
26
4
46
21
34
38
55
127
351
行政院衛生署統計室
健康指標 資料庫串連
4
4
43
18
22
38
54
115
298
22
0
3
3
12
0
1
12
53
28
『健康資料加值應用協作中心規劃建置計畫』
獨立作業區串連資料需求單位一覽表
業務
委外計畫
單位名稱
案件數
案件數
疾病管制局
9
2
國民健康局
4
醫事處
8
5
醫療品質辦公室
1
全民健保費用協定委員會
1
勞委會
1
中國醫
1
監理會
1
總計
15
18
網路化服務
行政院衛生署統計室
30
What can we learn from the past ?!
行政院衛生署統計室
31
資料協作網路化服務構想
• 目標:擴大資料蒐集範圍;增進本計畫服
務範疇;提升本計劃實施效能。
• 策略:以雲端運算之思維,構思資料協作
網路化服務系統。
• 挑戰:個資法的限制、資訊安全、資料保密、軟體的隨需可用性、
系統的可擴充性、服務的便利性及效能性、可永續經營的制度
行政院衛生署統計室
32
資料串聯分析
網路化服務構想
行政院衛生署統計室
33
系統未來發展遠景
服務項目
目前現況 1.指標查詢
2.資料串連
3.加值協作
未來遠景 1.指標查詢
2.資料串連
3.加值協作
4.客製化
5.即時化
提供方式
系統架構
1.網路申請
2.現場實作
1.資料倉儲
2.單機處理
3.瀏覽器查詢
1.雲端運算
1.網路申請
2.現場實作
3.遠端桌面
行政院衛生署統計室
(IaaS/Paas/SaaS)
2.瀏覽器操作
3.瀏覽器查詢
34
未來可發展方向
一、擴大資料蒐集範圍:含內政部、財政部、經濟
部、教育部、退輔會、勞委會、縣市政府等
二、擴大服務範圍:連結即時資料系統、建立警示
系統、指標產製系統多元化、增進指標查詢系
統之彈性、提供產業分析報告、結合顧客資料
提供服務、擴大客製化服務層面‧‧‧
三、減少直接人工:客制服務自動化、程式服務巨
集化‧‧‧
行政院衛生署統計室
35
健康資料地理資訊系統
行政院衛生署統計室
36
地理資訊系統
• 由地理學(Geographic)、
資訊(Information)、
系統(System)三者組合而成。
• 地理學:真實世界中空間組成之物件的描述
。
• 資訊:與空間物件相關的資料或訊息。
• 系統:應用電腦技術做為處理工具,支援地
理學與資訊的分析。
行政院衛生署統計室
37
規劃及開發健康資料地理資訊系統
‧ 建立中英文版網際網路地理資訊平台,整合現有之指標資料(初期包
括20大主要疾病死因、15大癌症死因、人口統計等),結合空間地理
資料,將指標資料配合空間資料在網頁上進行展繪。
‧ 提供條件查詢及統計圖表繪製等功能,讓使用者依地域、資料年份、
性別等條件進行查詢,以呈現同區域、不同時間區間內之指標變化,
或相同時間區間在不同區域內之指標比較。
行政院衛生署統計室
38
規劃及開發健康資料地理資訊系統(續)
‧目 前 已 完 成 系 統 安 裝 ( A r c G I S ) 及 部 分 指 標 上 線 測 試 ,
現有的系統功能如下:
– 圖層管理:提供圖層動態開關,可切換縣市界,鄉鎮界圖資顯示與否。
– 定位查詢:依照縣市名、鄉鎮市名等條件來查詢。
– 圖文查詢:提供圖面框選工具,顯示框選內容之屬性資料。
– 統計繪圖:依照年度、地區、疾病或癌症名稱,將統計成果繪製相關
圖表,如趨勢圖等。
行政院衛生署統計室
39
系統畫面
行政院衛生署統計室
40
系統畫面-地圖查詢
行政院衛生署統計室
41
系統畫面-地圖查詢(續)
行政院衛生署統計室
42
系統畫面-趨勢圖查詢
行政院衛生署統計室
43
國際指標比較
行政院衛生署統計室
44
國民健康指標資料庫之建置架構
社會、經濟、政治、國際環境
(Macro Environment )
健康指標
(Health Indicators)
政策評估
資源配置
(Health Policy
Evaluation)
(Health Resource
Allocation)
行政院衛生署統計室
45
國際指標資料來源
國際來源
國內來源
• OECD
• 政府網站或出版品:
• WHO
衛生署、主計處、內政部
• Eurostat等國際組織
、財政部、教育部、勞委
會、環保署等單位
• 相關期刊論文
行政院衛生署統計室
46
指標分類
OECD
健康指標12大類
WHO
國民健康狀況指標
人口學指標
死亡率與疾病負擔
醫療資源
國民健康狀況指標
病因特異性死亡率與發病率
醫療利用
醫療資源
部分傳染病
醫療費用
醫療利用
衛生服務覆蓋率
醫療財源
非醫療健康決定因子
風險因素
社會保障
經濟指標
衛生人力、基礎設施、基本藥物
醫藥市場
長期照護資源與利用
衛生費用
非醫療健康決定因子
社會保障
衛生不公平
人口學指標
醫療費用
人口和社會經濟統計
經濟指標
醫療財源
藥品市場
總體品質指標
參考OECD 、WHO 等國際組織及美國、日本、澳州、加拿大等先進國家,
發展適合台灣之健康相關指標。
行政院衛生署統計室
47
人口學指標
(Demograhic References)
國民健康狀況指標
(Health Status)
醫療資源
(Health Care Resources)
36個指標
156個指標
106個指標
主計處、教育部等
統計室、疾管局等
統計室等
1.一般人口學指標
(總人口、性別、年齡、 1.死因
依靠比、死亡、生育率)
1.衛生教育
2.人口年齡結構
2.新生兒死亡
2.一般醫療產業人員
3.勞動人口
3.生命年損失
3.醫師
4.教育程度
4.共病
4.護士或助產士
5.孩童健康
5.其他健康產業人員
(包含牙醫師及藥師)
6.自評健康
6.醫療產業人員薪資收入
7.口腔健康
7.醫院病床數
8.傳染病盛行率
8.醫師對病床比例
9.癌症
9.醫療科技
10.意外傷害
11.因生病導致之
工作天數損失
行政院衛生署統計室
48
醫療利用
(Health Care
Utilization)
非醫療健康決定因子
(Non-medical
Determinants of
Health)
經濟指標
(Economic
References)
長期照護資源及利用
(Long-term Care
Resources and
Utilization)
105個指標
196個指標
30個指標
22個指標
國健局、疾管局等
國健局、環保署等
主計處等
內政部
1.疾病預防
1.飲食攝取、食品安全
1.總體經濟指標
1.長期照護病床數
2.疾病篩檢
2.香菸、酒精使用
2.貨幣轉換指標
(PPP、匯率)
2.長期照護
服務使用者
3.諮詢
3.體重、體脂肪、
身體質量指數、腰臀
比
3.機構長期照護
服務使用者
4.住院
4.職業相關勞動、
運動習慣
4.護理之家長期
照護服務使用者
5.平均住院天數
5.環境 : 空氣品質
6.依診斷分類
之平均住院天數
7.手術程序
依ICD-CM分
8.器官移植及洗腎
行政院衛生署統計室
49
社會保障
(Social Protection)
醫療費用
(Expenditure on Health)
26個指標
整理中
統計室、內政部等
整理中
1.社會支出
1.總醫療花費
16.醫療保險及行政費用
2.醫療服務給付
2.醫療費用--經常性支出
17.預防-治療醫療服務
3.政府機構
與社會健康保險
3.醫療費用--資本門
18.長期照護
4.私人醫療保險
4.個人醫療費用支出
19.經常性支出及長期照護總費用
5.醫療服務費用支出
20.健康相關訓練及教育
6.住院費用支出
21.經常性醫療費用依供給者分
7.日間照護費用支出
22.總醫院服務費用
8.門診費用支出
23.護理及社區照護費用
9.居家照護費用支出
24.急診醫療費用
10.輔助醫療花費
25.醫療器材供給者
11.醫療商品費用支出
26.政府醫療機構服務
12.藥費及其他非耐久品
27.醫療行政服務支出
13.治療性器材及其他耐久品
28.其他醫療產業支出
14.集中式醫療費用
29.醫療費用依年齡及性別分
行政院衛生署統計室
15.預防及公共衛生
30.醫療物價指數
50
醫療財源
(Health Care Financing)
藥品市場
(Pharma-ceutical Market)
總體品質指標
(Healthcare Quality)
整理中
整理中
整理中
整理中
整理中
整理中
1.醫療財源依單位分
1.製藥產業活動指標
1.醫療品質指標
2.醫療會計帳戶(SHA)表格 2.藥品利用與濫用
2.健康風險評估
3.製藥產業銷售額
3.衛生政策成效
行政院衛生署統計室
51
指標建置方法
• 收集並分析OECD等國際組織與主要先進國家健康指標分類與明細,及
其應用情形。
• 利用我國現有健康資料庫,提出與國際同步之初步指標架構。
• 檢討我國現有主要健康指標之內容,並比較與國際常用健康指標之異
同、原因及其意涵。
• 編製國際指標比較表,從中挑選出我國有相關數據之指標製作成指標
定義表,以製作產出指標數據表。
• 委託陽明大學國民健康指標資料庫發展之研究科技計畫建構指標架構
及定義,交由健康資料加值應用協作計畫產出指標數據。
行政院衛生署統計室
52
STEP1:編製國際指標比較表
• 以我國健康指標12大類的架構為原則,將各分類的指標匯
集列表,國際資料來源為OECD、WHO等國際組織,國內資
料則參考各政府機關網頁或出版品。
• 將相同定義之指標整理合併,根據資料來源將編碼、名稱
、變數分類、定義、週期等項目列於比較表中。
• 我國特有指標如中醫、檳榔等相關指標,根據指標內容也
列於12大類的架構之下。
行政院衛生署統計室
53
國際指標比較表
行政院衛生署統計室
54
STEP2:編製指標定義表
• 從國際指標比較表中,挑選出我國有相關數據的指標。
• 以中英文對照的方式,製作成定義表。
• 我國與國際相同的指標若定義略為相異,則將我國與國際
的定義並列,方便比較。
• 方便製作每年產出的指標數據表。
• 供指標數據表比對各指標的定義跟相關欄位資訊。
行政院衛生署統計室
55
指標定義表
行政院衛生署統計室
56
STEP3:產出指標數據表
• 以定義表的內容,將各指標的數據整理成表格,方便查詢
跟對照。
• 每個指標的內容位於橫軸,以資料年為縱軸,將數據以時
間數列的方式表現。
• 指標數據表格內容目前以我國現有數據為主,如果有國際
間認為比較重要的指標,但是我國還沒有產出,可以考慮
產出,例如結核病發病率、醫藥衛生人員畢業人數等。
行政院衛生署統計室
57
指標數據表
行政院衛生署統計室
58
謝謝~
行政院衛生署統計室
59