臨床論文解析 陳汶吉

Download Report

Transcript 臨床論文解析 陳汶吉

臨床論文解析
陳汶吉
前
題
 這篇論文的作者是誰?
 這篇論文登在哪一種雜誌上?
 (為什麼)要感謝誰?
實證醫學的實證等級:
I. Evidence obtained from at least one properly randomized controlled trial or a
well-conducted meta-analyses based on properly randomized controlled trials.
II-1. Evidenced obtained from well-designed controlled trials without
randomization.
II-2. Evidence obtained from well-designed cohort or case-control analytic studies,
preferably from more than one center or research group.
II-3. Evidence obtained from multiple time series with or without the intervention.
Dramatic results in uncontrolled experiments (such as the results of the
introduction of penicillin treatment in the 1940s) could also be regarded as this
type of evidence.
III. Opinions of respected authorities based on clinical experience, descriptive
studies, and case reports, or reports of expect committees.
 Modified grading of recommendations.
A.There is good evidence to support the recommendation.
B. There is fair evidence to support the recommendation.
C. There is insufficient evidence for or against, but recommendations may be
made on other grounds.
D. There is fair evidence to exclude the recommendation.
E. There is good evidence to exclude the recommendation.
 From: Friedland DJ et al: Evidence-based medicine.1998; pp228-230.
前言










在臨床上重要嗎?
有公共衛生上的重要性嗎?
這個理論吸引人嗎?(證據)
是否有參考系統性回顧?
這個證據主要來自作者的研究團隊?還是引用相當範
圍的證據,即使並不支持他的想法?
有許多臨床研究進行是因為現有證據常常相互矛盾.
有證據顯示這進退兩難的困境,並在前言中清楚地說
明嗎?
在沒有證據出現前,是不可能有答案的
這個證據不能應用於作者所考慮的情況
證據可能不齊全
證據的品質可能很差,因此不能根據它來下結論
目的
<研究目標和要檢驗的假設>
 假設(HYPOTHESIS)
 只有在研究樣本數目夠大時,我們才能相信
陰性的結果;否則有可能出現偽陰性,因此許
多研究者會預估樣本數目,以避免這種錯誤。
 陳述研究假設的傳統手法,包括使用虛無假設
(null hypothesis),再設計研究來推翻虛無假
設(disprove or refute an hypothesis)
 產生假設
 (HYPOTHESIS GENERETION)
描述性研究
 病例報告(case reports)
 病例系列(case series)
 橫斷面研究(cross-sectional studies)
 縱向研究(longitudinal studies)
分析性研究
 生態研究(ecological studies)
 兩組的橫斷性研究
 (cross-section, two-group studies)
 病例對照研究 (case-control studies)
 世代研究 (cohort studies)
介入性研究
 試驗(trials)
 隨機分組和隱匿資訊 (random allocation
and its concealment)
 安慰劑(placebos) 或往常的處置
(treatment-as-usually)
 依治療意願分析 (intention-to-treatanalysis)
母群體和樣本
 抽樣(sampling)
 方便性抽樣法(convenience samples)
 系統性抽樣法(systemic samples)
 隨機性抽樣法(random samples)
 樣本數和檢定力
 (sample size and power)

錯誤的決定-誤差的種類
(making the wrong
decision-types of error)





*第一型誤差,雖然你可能對偽陽性更加熟悉
偽陽性常見原因:1.有偏差的樣本 2.樣本數過少 3.由
多重檢定(multiple testing)所可能產生的偽陽性結果
*第二型誤差,或是偽陰性
偽陰性結果主要發生在太小的研究
*研究檢定力(power).發生第二型誤差的可能性,或是
發生為陰性的機會,就是β
Calculating the sample size
1.From Computer Program
2.From Altman Normogram
確認並定義病例
 選入標準(inclusion criteria)
 排除標準(exclusion criteria)
 中途退出(dropouts)

<losses to follow-up>
對照和比較
 正常範圍
 和過去資料比較
 研究進行的同一時段,從抽樣族群中選一組
人,在研究中同時作比較
 *對照組(control)
 干擾(confounding) <隨機抽樣>
 檢查對照組數量是否足夠
辨識資料的特性
 資料類型(types of data):

類別型(categorical)或數值型(metric)
 辨識資料的類型

(identifying data type)
 分佈的形狀
 (shapes of distributions)
 探察資料類型(spotting data types)
測量方法的特性
敏感度
 專一性
 陽性預測率(PPV)
 陰性預測率(NPV)

Sensitivity and Specificity
 Sensitivity: The sensitivity of a test is the proportion of
disease positives that are correctly identified by the test.
 The sensitivity of a test is its true-positive rate, and is
expressed as the ratio of true-positive results to all of
those with the disease [true positive/(true positive+false
negative)].
 Specificity: The specificity of a test is the proportion of
disease negatives that are correctly identified by the test.
 The specificity of a test is its true-negative rate, and is
expressed as the ratio of true-negative results to all those
without disease [true negative/(true negative+false
positive].
PPV and NPV
 Positive predictive value (PPV): When a clinician uses a
diagnostic test, he or she needs to know how likely the
test is to give the correct diagnosis.
 PPV is the ratio of a true disease positive tests to all
positive tests [true positive/(true positive+false positive)].
 Negative predictive value (NPV): The probability that a
subject who is test negative will be a true negative to all
negative tests.
 NPV is the ratio of the true disease negative to all
negative tests [true negative/(true negative +false
negative)].
 ROC curves (Receiver Operating Characteristic) show
performance of a diagnostic test over all possible medical
decision points.
 Hanley & McNeil curve comparisons to indicate best test if
visually unclear calculates area-under-curve with confidence
intervals.
 For each diagnostic test table showing sensitivity &
specificity of all possible decision points number of truepositives, false-positives, true-negatives & false-negatives at
each point.
1
Sensitivity (true positives)
0.9
0.8
0.7
0.6
No discrimination
0.5
MCV
0.4
Alternative
0.3
0.2
0.1
0
0
0.2
0.4
0.6
0.8
1 - Specificity (false positives)
1
Choice of statistical methods: Which
comparison test?
Numerical
Categorical
Normal
distribution
Non-normal
distribution
Paired t-test
Wilcoxon matched pairs signed
rank sum test
McNemar test
Repeated
measures
ANOVA
Friedman’s test
Cochran Q test
Comparing
independent
groups
Unpaired t-test
Mann-Whitney U test
Chi-squared
test, Fisher’s
exact test
2 groups
> 2 groups
One-way
ANOVA
Kruskal-Wallis (rank) ANOVA
Chi-squared
test
Comparing
paired group
2 groups
>2 groups
Ordinal
Nominal
Choice of statistical methods: Which
association test?
Variable 1
Numerical
V
a
r
i
a
b
l
e
2
Categorical
Normal
Non-normal
Regression
rank correlation
Ordinal
Nominal
rank correlation
Analysis of
variance
rank correlation
Kruskal-Wallis
test
N
u
m
er
ic
al
Norma
l
Regression
correlation
Nonnormal
Regression rank
correlation
rank correlation
C
at
e
g
or
ic
al
Ordina
l
Rank
correlation
rank correlation
rank correlation
Kruskal-Wallis
test
Nomin
al
Analysis of
variance
Kruskal-Wallis
test
Kruskal-Wallis
test
Chi-squared
test
風險和勝算
 風險(RISK)
 勝算(ODDS)
Odds Ratio (勝算比)
危險因子(果)
疾病(果)
有
無
Total
有
a
b
a+ b
無
c
d
c+ d
Total
a+ c
b+ d
N
暴露於危險因子之勝算比= (a/c)/(b/d) = ad/bc
風險和勝算的比值
風險比(相對風險)
 [risk ratio (relative risk)]

勝算比(odds ratio)
 *研究者也能用世代研究取代,並直接計算風險比





*病例對照研究總是以勝算比的方式報告研究結果
臨床試驗和<需要治療的數目>
(clinical trials and numbers needed to treat)
*需要治療的數目=100/絕對風險減少的百分比
平均 比例中和中為數的信賴區間


平均差值的信賴區間
(confidence intervals for differences in means)

*信賴區間包括零嗎?如果有,這兩個母群體可
能恰好沒有差別

比例差的信賴區間





(confidence intervals for differences in proportions)
中位數值的信賴區間
(confidence intervals for differences in medians)
單一母群體參數的信賴區間
(confidence intervals for a single population values)
比值的信賴區間
 勝算比的信賴區間


(confidence intervals for odds ratios)
*勝算比有大於1嗎?若是,這個因素可能是個
危險因子;若小於1,則它可能是有益的.若是勝
算比等於1,則這個因素對正反面都沒有影響
 風險比的信賴區間

(confidence intervals for relative risk ratios)
 危險比的信賴區間

(confidence intervals for hazard ratios)
假設檢定與P值
判定這個證據:P值
 (judging the evidence : the P value)
 如果P值小於0.05,則這個證據足以推
翻虛無假設.如果P值沒有小於0.05,則
不能推翻虛無假設.

比較假設檢定和信賴區間
(hypothesis tests and confidence intervals compared)





推論統計之目的是以樣本來推論母體,母體
可能是無限大或是假設的。
95%信賴區間是代表0.95的區間估計,表示
母數落入此區的機率,通常是一段區間範圍。
Y±1.96SE
自然對數1.28 (80%),1.44(85%),
1.645(90),1.96(95%), 2.58(99%)
六個標準差。
檢定的種類(types of test)
配對與獨立的小組(matched versus independent
groups)
彼此獨立(independent)或是配對(matched)(有時也
稱為paired)
*卡方檢定(the Chi-squared(x2)test): 檢定虛無假設
*趨勢檢定
*t-檢定(the t-test)
*其他檢定(other tests)
檢測相關性
檢測相關性(measuring association)
 散佈圖(the scatter diagram)
 相關係數(the correlation coefficient)


皮爾森相關係數(r)或是史丕曼相關係數(rs),可以是-1(代
表完全負相關)到+1(代表完全正相關)間的任意數.

兩組都是數值型資料且(大約)是常態分佈才能使用皮爾
森相關係數(r) ;不符合條件或變數是順序型資料,應使用

史丕曼相關係數(rs)
<相關性並不代表因果關係>
相似性檢定
名義型類別資料: Kappa (normal data : Kappa)
Kappa分佈在0(不相似)到1(完全相似)間
K
<0.20
0.21-0.40
0.41-0.60
0.61-0.80
0.81-1.00
相似性強度
差
尚可
中等
好
非常好
 順序型資料:加權的KAPPA
(ORDINAL DATA: WEIGHTED KAPPA)
 數值資料(MATRIC DATA):
*Bland和Altman(1986)建議使用一個
方法.對每對數值的差(縱軸)和他們的
平均(水平軸)製圖
*完全相同的點將落在通過0的水平線
上,離這條線越遠的點,相似性越差
線性迴歸

多變項分析(multivariable analysis),回歸
分析也許是其中最常使用的
回歸分析(regression analysis)
 線性迴歸(linear regression)

共變項/依變項/回應變項

Linear Regression vs Logistic Regression
比較
Multiple Regression
Logistic Regression
因變數 Y必須為連續性資料
Y必須為類別性資料(是/否)
自變數 可為連續性或類別資料
類別資料需以虛擬變數
表示(Dummy variable)
可為連續性或類別資料
類別資料需設定參考組
注意
事項
K個水準的類別資料需設
K-1個虛擬自變數
Ex:性別(0/1)
1個
血型(A/B/O/AB)
3個
x1 x2 x3
x1 x2 x3
A: ( 0 0 0 )
B: ( 1 0 0 )
O: ( 0 1 0 ) AB: ( 0 0 1 )
Odds Ratio
95% CI of Odds Ratio
P value (Wald statistic)
Accuracy of model=85.9%
Nagelkerke R2
回歸係數(the regression coefficients)


常數-保持回歸等式左右兩邊的算式平衡
在回歸模型中有顯著意義並不等於有因果關係
調整(adjustment)
 干擾因素(confounding)
 交互作用(interaction)

變異數分析(analysis of variance):
 anova 最常被用於比較兩組以上的平均值

對數回歸
存活分析
 研究者常使用Kaplan-Meier方法
來決定存活的機率和存活比例
 KAPLAN-MEIER方法:
1. 計算任何部分樣本的存活時間,和存活比例的信賴區間
2. 計算存活機率
3. 比較兩組間存活比例上的差異(和適當的信賴區間)
檢定(log-rank test)
 危險比(the hazad ratio)
 LOG-RANK
討論和結論
討論通常在簡要的總結主要研究結果
之後開始
 再和之前相似研究的發現比較,並指出
他們是否概括的同意或不同意之前的
研究
 指出研究主要的優勢和弱點
 另一個討論研究結果意義的方法,就是
尋問他們對未來應用有何影響

參考書目
 Moore DS,鄭惟厚譯:統計讓數字說話。天
下文化1998
 楊宗瀚譯:臨床論文解析,合記出版社
2005