課程講義

Download Report

Transcript 課程講義

基本文獻評讀要點
藥劑科 鄭育宛
2012.8.22
分享大綱
簡介EBM及文獻評讀
 偏誤Bias的分類
 文獻評讀之通用要點(VIP)
 CEBM sheet簡介

實證醫學基本概念


Evidence-based medicine is the integration of best
research evidence with clinical expertise and patient
values (Sackett et al., 2000)
Evidence-based medicine, EBM
Evidence-based nursing, EBN
Evidence-based Health Care, EBHC
臨床專長
研究實證 病人偏好
實證臨床照護模式(Geyman, 1998)
EBHC的核心內容
1.三大要素(3E)
(Evidence, Expertise, Expectation)
2.四大問題(4Q)
(治療、診斷、危害、預後)
3.五大步驟(5A)
(Asking, Acquire, Appraise, Apply, Assess)
4.證據及建議等級
(Level of Evidence, Grade of Recommendation)
實證醫學五步驟(5A)

提出問題(Ask: PICO)
Formulate an answerable question

搜尋證據(Acquire)
Track down the best evidence

嚴格評讀(Appraisal: VIP)
Critical appraise the evidence

恰當運用(Apply:3E)
Integrate with clinical expertise

衡量結果(Audit)
Monitoring your performance
為何需要文獻評讀?


醫療資訊爆炸且虛實難解的年代….
提供您面對文獻的一種思路及評估方式
文獻評讀 (Critical Appraisal)


Critical Appraisal為被認為較耗費精力且不容
易理解的步驟。
實際評讀文獻的過程,即是審視研究中有可能
的偏誤(Bias)。
偏誤(Bias)


定義: 在研究之設計與實施過程中,凡是會使
數據(data)或結論朝向(toward)或偏離真實
(against truth)之任何因子,稱之為偏誤
如果在研究之設計與實施過程中,忽略可預期
之偏誤因素會使此研究之內部效度降低
偏誤(Bias)之分類

選擇性偏差(selection bias):
– 必須讓所有參與研究對象都有相同機率被分派到實驗組
或控制組

評估偏差(observer bias, information bias, detection
bias):
– 實驗主持者參與研究數據之測量與結果之評估
– 主觀的評估(symptoms) vs 客觀的評估(death)

實驗過程退出偏差(withdrawal or dropout bias):
– 無論研究組或對照組若中途退出太多(> 20%),必須探討
其原因,推論統計亦應注意。
偏誤(Bias)之分類

干擾因子(Confounding factor):
– 與臨床問題無關、對所要觀察的結果有決定性的影響、
且在實驗組與控制組間分佈不平均

儀器或測量偏差(instrument or measurement bias):
– 儀器之保養與校正。
– 標本之保存與運送: 微生物培養; 血液氣體分析,etc.
– 測量標準作業流程(standard operation procedure;SOP)
偏誤(Bias)之分類

回憶性偏差(recall bias):
– Case-control study: retrospective recall bias.
– 研究組成員較對照組成員容易記起疾病相關因素: 血癌兒
童之父母較常記起住家附近有變電所或高壓電塔。

出版偏差(publication bias):
– 研究者與雜誌傾向發表治療有效、副作用較少之正面
(positive)結論。
研究的偏差來源及解決方式?
預研究的族群(Target Population)
選擇性偏差
病患樣本(patient sample)
實驗組(experimental)
控制組(control)
執行性偏差
實際接受實驗
組研究的病患
實際接受控制
組研究的病患
病患耗損性
偏差
追蹤(follow-up)
追蹤(follow-up)
檢出性偏差
結果分析
結果分析
Randomization
Blinding
ITT
評讀文章時先快速篩選以下問
題以決定要不要繼續讀下去?
Screening Questions
1.這篇研究是否問一個清楚的問題?
(與我們的PICO比較)
2.這篇的研究設計是否為回答此問題的最佳
等級?
那一類的研究設計其偏誤較少?
研究證據評讀


研究證據的價值取決於其品質及效度
評讀文獻的黃金標準中,以雙盲隨機對照臨床
試驗(RCT)得出的結果為最佳證據等級。
The evidence Pyramid
隨機控制試驗
Randomized controlled trial (level1b)


隨機控制試驗幾乎成為判斷治療是否有益的唯
一可接受方法。
研究特點
– 1.在研究中導入了實驗/處置
– 2.固定其他的條件,兩組之間只有處置不同
– 3.隨機方式使兩組的干擾因素相似,使兩組
病人能充分的相提並論(可比較性comparable)
隨機化 Randomization



研究個案有相等的機率被分配到實驗組或控制
組。
隨機分配不保證兩組的狀況一定會一樣。
若樣本數少時,誤差就會產生。
確認問題的類別,才能找尋到最佳研
究設計之證據
Type of question
Suggested best type of study
Therapy
RCT>cohort>case control>case series
Diagnosis
Prospective, blind comparison to a gold standard
Etiology/Harm
RCT>cohort>case control>case series
Prognosis
Cohort study>case control>case series
Prevention
RCT>cohort>case control>case series
Clinical Exam
Prospective, blind comparison to a gold standard
Cost
Economic analysis
Level of evidence & Grade of Recommendation
文獻評讀之通用技巧(VIP)

Validity (Reliability) 效度/信度

Can we believe it ? (研究方法的探討)
– 錯誤errors
– 偏誤bias

Importance (Impact) 重要性


We believe it ! But does it matter? (研究結
果的分析)
Practice (Applicability) 臨床適用性

If we believe it - does it apply to our
patients? (如何在臨床運用)
Critical Appraisal
Therapy Question
RCT
效度(Validity)
RAMMbo, RABO

Recruitment受試者招募
研究樣本是否具有代表性(Representative)?

Allocation試驗分組
–病人的治療是否隨機分派Random?
–隨機分配過程是否隱匿concealment?
–兩組在治療開始時的baseline是否相似?
效度(Validity)
RAMMbo, RABO


Maintenance維持
– 對照組與實驗組是否被同等對待?
– 是否所有的病人都被放到原先分派的組別中做分析?
治療意向分析(Intention-to-treat analysis, ITT)
–是否追蹤夠久和完整follow-up
Measurements結果測量
–病患、醫護人員、研究員是否對治療不知情
(blinded)?
– 測量是否客觀(objective)及標準化?
Guyatt. JAMA, 1993
文獻證據是否有效?







病患的治療分派是隨機的嗎?
R
隨機分派過程使否隱匿?
對照組與實驗組在進入試驗時是否相似?
病人的追蹤是否夠久、夠完整?
A
所有的病患都被放到原先分派的組別作分析?
病患、醫師、評估者是否對治療分派不知情? B
O
對照組與實驗組病患是否被同等對待?
Validity
病患的治療分派是隨機的嗎?

對已知有CAD病史的停經婦女,使用HRT
-可以減少CAD的風險[case control & cohort studies]
-不會減少CAD的風險[RCT]

Confounders:
-與臨床問題看似無關、對所要觀察的結果有決定性影響、
在暴露組與非暴露組間分布不平均。
-社經地位(Confounders)較高者,選擇HRT預防CAD ,
同時也較注意養生、規則追蹤,因而CAD較少發生。
Validity-R
隨機分派過程是否隱匿?

醫師(caregivers)將不知道(blind)下一個病患
將接受哪一種治療,照顧或評估病患時將會一
視同仁,而不會扭曲。

採取嚴密的措施以保證病人分組的隱匿性
分組隱匿可以預防選樣偏誤,保護在給予介入
措施之前及已施予處置整個過程的隨機化順序

Validity-R
Allocation Concealment分組隱匿
Adequate 適當方法
 3rd party central computer
randomization
 On-site computer from which
assignment can only be
determined after entering patient
data
 Sequentially-Numbered, Opaque,
Sealed Envelopes (SNOSE) 不透
光信封
 Sequentially-numbered
containers
 Pharmacy controlled
Inadequate 不恰當
• PI responsible for
generating sequence
• Non-opaque, non-sealed
& non-serially numbered
envelopes
• Known & predictable
mechanism e.g.odd or
even date of birth or
medical record number,
alternating clinic days
對照組與實驗組病患是否相似?



雖然經過隨機化,預期各組間可能的干擾因
素會平均分布,但分組後仍需確認各組在重
要參數上是否相似 [baseline characteristic]
如果不相似,可以藉由統計方法(多變數分析)
調整分析結果,減少干擾因素的影響。
通常是個案數太少,才會分布不平均。
Validity-R
追蹤夠久、夠完整?



確認追蹤夠久,方能看到重要的臨床結果?
例:如果評估使用statin的研究,只追蹤幾個
月,將看不出結果是否有益。根據目標疾病
(冠心病、中風)的特性,應該追蹤三、五年,
最好是十年以上。
在呈現臨床結果時,必須將時間因素考慮進去。
Validity-A
追蹤夠完整?



無法完成追蹤的紀錄及分析
和預後無關 vs 和預後有關。
“ 5與20“法則:失聯<5%所造成的偏差很小,
失聯>20%將嚴重威脅到研究結果的效度。
Validity-A
因原先分派的組別作分析?


爲了維持隨機化的意義,一但分配組別後就不
應變更。不論任何理由變更,一定帶有某些特
徵,將產生無法預期的結果。
即使失去追蹤,仍應依原先分派的組別進行分
析,即治療意向分析(intention to treat, ITT,
analysis),此種方式保留了隨機取樣之精神,
且其結果較可能代表在原始設計情況下,病人
接受某種治療之真正的效度。
Validity-A
治療意向分析
(intention to treat analysis)


分析資料時依照原來分組的所有病人都納入分
析,包括中途退出或有遺失數值的病人。
好處
–依治療意願分析是為了維持隨機化的意義。
achieved by randomization
–減少因遺失數值missing values所產生的偏誤,可
能造成研究結果扭曲。

壞處:
– 低估治療效果
是否對治療分派不知情?

爲了避免病患對症狀的報告或對治療的順從性影
響治療的結果,實施盲法是必要的。

Patients: placebo effect
Caregivers: performance bias
Outcome assessors: detection bias
patients: subjective (e.g. pain score, questionmaire)
researchers: subjective OR objective
Analyzers: analytical bias



Validity-B
對照組與實驗組病患是否被
同等對待?

除了實驗治療外,所有組別應被平等對待

進行盲法
使用特定、明確的治療流程來進行治療及追蹤。
定義每一個重要的預後結果,並在所有組別一體
適用。


Validity-O
文獻證據是否重要(Importance)

1.治療效果有多大?多重要?
決定研究中所描述的治療可能利益(或傷害)是否
重要?
使用統計分析比較介入處置是否有統計差異?

2.治療效果的估計有多精確?
NNT (number need to treat)
益一需治數




NNT:在研究試驗期間,我們必須使用試
驗性療法治療多少個病人,才能預防一個額
外的壞結果。
NNT=1/ARR=1/∣CER-EER∣
NNT必須為一個整數
NNH (number need to harm) =1/ARI (使
用試驗性療法治療多少個病人,才能造成一
個額外的壞結果。)
Treatment Effects

Occurrence of diabetic retinopathy at 5 years among
insulin-dependent diabetic in the DCCT trial


Usual insulin regimen (CER: control event rate): 38%
Intensive insulin regimen (EER: experimental event rate): 13%

Risk Reduction (calculation): NNT



Absolute risk reduction (ARR)
= │CER-EER│= 38%-13% = 25%
Relative risk reduction (RRR)
= │CER-EER│/CER = 25%/38% =66%
Number needed to treat (NNT)
= 1/ARR = 1/25% = 4 patients
NNT: The number of patients that need to be treated to prevent one bad
outcome or get one good outcome.
Harm

The proportion of patients with at least one episode
of symptomatic hypoglycemia


Usual insulin regimen (CER: control event rate): 23%
Intensive insulin regimen (EER: experimental event rate): 57%

Risk Increase(calculation): NNH


Absolute risk increase (ARI) =│EER - CER│ = 57%-23% = 34%
Relative risk increase (RRI) =│EER-CER│/CER = 57%-23%/ 23% = 148%

Number needed to harm (NNH) = 1/ARI = 1/0.34 = 3 patients (整數)
NNH: The number of patients that need to be treated to cause one bad
outcome (being harmed).
治療效果有多大?
事件發生率(平均追蹤五 相對危險降低度
絕對危險降低度
年)
(RRR)
(ARR)
控制組事件 實驗組事 │CER-EER│
│CER-EER│
發生率
件發生率 /CER
(CRE)
(EER)
4.3%
MRC 研究 5.7%
│5.7%-4.3%│/5.7% │5.7%-4.3%│
=25%
=1.4%
假設性的小 0.000057% 0.000043 │0.000057%│0.000057%%
案例
0.000043%│
0.000043%│=
/0.000057%=25% 0.000014%
相對危險降低度 (relative risk reduction, RRR)
相對效益增加度 (relative benefit increase, RBI)
相對風險增加度 (relative risk increase, RRI)
益-需治數
(NNT)
1/ARR
1/1.4%=
72
1/0.000014
%=
7142857




相對風險降低度。RRR不能反映沒有治療的
事件危險性,因此無法區分治療效果的大小。
要看出治療效果的大小,必須以兩組間的差
異絕對值來估計,即絕對風險降低度(ARR)。
因此,在評估治療效果時,ARR是一個比
RRR更有意義的度量方式。
文章常以RRR 來表示療效,但用NNT
(Number Needed to Treat), NNH來表達更
為直接。
一些有NNT的案例
主要症狀
舒張壓 110129 mmHg
舒張壓 90109 mmHg
無症狀的頸
動脈狹窄
輕微至嚴重
的阿茲海默
症
不規則的心
絞痛
腎機能不全
與冠狀動脈
攝影
抗高血壓藥物 Death, stroke, MI
Event rate
追蹤時間
CER EER
13 % 1.4 % 1.5 years
抗高血壓藥物 Death, stroke, MI
5.5 % 4.7 % 5.5 years
128
頸動脈內膜切
除(與內科療法
相較)
Donepezil (vs.
placebo)
Death or major
stroke
18 %
8%
2 years
10
No functional
decline
44 %
59 %
1 year
7
7 天以內的侵
入治療(與內科
療法相較)
Oral
acetylcysteine
(vs. placebo)
Death or MI
16 %
12 % 24 months
24
4%
12
醫療介入
預防事件
Contrast media12 %
induced reduction
in renal function
8 months
NNT
8
治療效果的估計有多精確?




病患樣本 vs. 病患母群體
取樣結果純粹受機率的影響有多大?
信賴區間(confidence interval)提供一個
真實值的範圍,可以量化估計值的不確定
性。
信賴區間越窄,對結果越有信心!
Practice (Applicability) 臨
床適用性
在你決定應用研究結果到你病人身上時,
應該問的問題...
Practice (Applicability) 臨床適用性





我的病人是否不同於研究的那群病人,所以結
果不能應用?病人特性是否相同?
建議的措施是否適用於我們所在的場所、診療
環境?病患及醫療提供者的配合度如何?
病人可能從治療中得到什麼好處或壞處?
對於我的病人而言,治療的益是否多於弊?
對於預期的結果或提供的治療,病患的價值觀
和期望值為何?
我們的病人是否適用該研究結果?

我們的病患是否符合納入條件(Including
criteria),而沒有在排除條件(excluding
criteria)之中。

從研究樣本的人口學和臨床特徵的描述中,比
較我們的病人和文獻中的病人是否相似。
(baseline characteristics)
Critical Appraisal
Therapy Question
Systematic Review
系統性回顧文獻評讀 (SR)



系統性回顧研究是回答治療問題最好的研究設
計。
有關治療文獻之搜尋,應從系統性回顧文獻開
始。
審慎評估依各系統性回顧文獻的優劣,還是需
要評估其中所包含的個別試驗。
SR文獻證據是否有效




這是一個RCT的系統性回顧嗎?
有關相關試驗搜尋的描述是否完整?
個別研究是否做過效度評估?
分析中是否使用個別研究的病患數據或合計數
據?
SR文獻證據是否重要

這些研究的結果是否一致?

治療效果有多大?估計有多精確?
研究的結果是否一致




治療結果是一致性的,比較能採信這樣的結果。
查看不同試驗信賴區間的重疊程度。
不可能指望所有的試驗顯示完全相同的療效,
但是若有試驗結果明顯沒有好處,甚至有明確
的壞處,則應特別判讀。
研究設計上與統計上的異質性
(heterogeneity)。
治療效果有多大?估計有多精確?

和評讀單一試驗一樣,計算出NNT或NNH 。

大多數的systematic review仍用勝算比(OR)
或相對危險來表達其結果,需自行轉換成NNT
或NNH。
SR的結果是否適用於我的病人




我的病患與研究中的病患是否不同,因此可否
適用該研究結果?
該項治療適合於我們的診療環境嗎?
可從治療中的到什麼好處或壞處?
病患如何看待我們想要預防的結果或該項治療
可能造成的傷害?
SR的結果是否適用於我的病人



評估方法和個別試驗中使用的方法一樣。
SR提供一個來自不同族群的整體平均治療結
果
SR提供次族群的精確資訊,有助於將個別化
的證據應用到我們的病人身上。
SUMMARY
Validity (Reliability) 效度/信度
RAMMbo-研究方法的探討(決定實證等級)
 Importance (Impact) 重要性/效益
研究結果的分析(此結果是否有意義)
 Practice (Applicability) 臨床適用性
研究結果能否應用於照顧的病人

文獻搜尋及評讀主要有幾個方法



一、直接應用已經評讀過的文獻資料庫(例如:
ACP journal club, Cochrane Library)
二、自行評讀文獻,也就是用簡單的評讀方式,
例如上述提到的VIP 或是PICO/RAMMbo 等概
念
第三、必要時使用評讀工具協助,如:
CATmaker 、CASP(Critical Appraisal Skills
Program) 、CEBM (center of evidence base
medicine)
CASP(Critical Appraisal
Skills Program) sheet
敬請指教