İçsel Duyarlılık

Download Report

Transcript İçsel Duyarlılık

Sonuç Ölçümlerinde Değişime Duyarlılığın(Responsiveness) Değerlendirilmesinde Kullanılan Yöntemler

Emre Nakış A. Ü. Tıp Fakültesi Biyoistatistik Anabilim Dalı 2012

1. Tanımlar

Klinik denemelerde sonuç ölçümlerinin  Güvenilir(Reliable)  Geçerli(Valid)  Değişime Duyarlı(Responsive) olması gerekir .

Güvenirlik

 Güvenilir bir ölçme aracı, bir deneyin benzer koşullarda iki veya daha fazla kere uygulandığında aynı sonuçları üretebilmesidir.

 Güvenirlik genellikle; sınıf içi korelasyon katsayısı ya da kappa istatistiğine dayanan analizler yoluyla test tekrar test yapılarak ölçülür.

Geçerlik

  Geçerlik; bir ölçme aracının ölçmesi istenen özelliği başka özelliklerle karıştırmadan ölçebilme yeteneğidir.

Geçerlik;   Korelasyon analizi Regresyon modelleri   Duyarlılık ve seçicilik tahminleri İKE altında kalan alanın değerlendirilmesi yoluyla ölçülür.

Değişime Duyarlılık

Geçerlilik ve güvenirliğin açık tanımları olmasına rağmen, ölçme aracının değişime duyarlı olup olmadığının nasıl tanımlanacağı ve değerlendirileceği konusunda bir fikir birliğine varılamamıştır. Ancak literatürde  İçsel Duyarlılık (Internal Responsiveness)  Dışsal Duyarlık (External Responsiveness) olarak iki farklı temel bakış açısı ile değerlendirilmektedir.

İçsel Duyarlılık

   İçsel duyarlılık, belirlenen bir zaman diliminin sonunda ölçme aracının değişimi ölçebilme yeteneğidir.

İçsel duyarlılığın değerlendirilmesinde genellikle kullanılan yöntem, daha önce etkili olduğu gösterilen bir tedaviyi içeren randomize klinik bir denemede ölçümde meydana gelen değişimi hesaplamaktır.

Ölçümde meydana gelen değişim, klinik olarak anlamlı değişim olarak yorumlanır.

İçsel Duyarlılık

  İncelen ölçümde meydana gelen değişim, hastaların etkili olduğu bilinen bir tedavinin öncesi ve sonrasında değerlendirildiği tekrarlı ölçümlerde tek yönlü varyans analizi tasarımı kullanılarak da değerlendirilebilir.

Bu strateji çeşitli sağlık ölçümlerinde karşılaştırma yapmak için kullanılır.

Dışsal Duyarlılık

 Dışsal duyarlılık, belirlenen bir zaman diliminin sonunda ölçme aracında ortaya çıkan değişimin, referans bir ölçme aracındaki değişimle ilişkisinin değerlendirilmesidir. Eğer ilişki kuvvetliyse, ölçme aracı sonraki çalışmalarda referans ölçme aracının yerine kullanılabilir.

 Diğer bir yorum olarak standartla edilen göstergesi olarak değerlendirilir.

yer değiştirmesinden ziyade, standarttaki değişim bir hastanın durumunda beklenen değişimin kabul

2. Gösterimler

Çalışmadaki her bir bireyin incelenen ölçme aracı ile iki zaman noktasında değerlendirildiği varsayılsın   

X

1

ve X

2

: İlk ve ikinci değerlendirme sonuçları .

D

X

=X

2

-X

1

x

E

değişim (

X

: Zaman noktaları arası değişim 2 

X

1 ) : Başlangıç ve izlem değerlendirmeleri arasında beklenen ortalama 

SD(X) :

Birinci ve ikinci ölçüm değerleri için standart sapma tahmini (1. ve 2. ölçüm değerleri için eşit olduğu varsayılır)

SD(D

X

)

: Değişim skorlarının standart sapması 

X

ve X

:

Her bir hasta için birinci ve ikinci ölçüm yanıtlarını göstersin   .

D

Xi

= X

-X

1İ X

1

ve X

2

:

Her bir birey için ölçümler arası fark : Birinci ve ikinci yanıtların ortalaması  .

D X

: Yanıttaki ortalama değişim 

n

: Toplam birey sayısı

3. İçsel Duyarlılık

3.1 Eşleştirilmiş t-testi

 Bu test istatistiği iki zaman noktası ölçümleri üzerinden ortalama yanıtta değişim olmadığı biçiminde kurulan hipotezin testinde kullanılır.

t

0 

D X SD

(

D X

) /

n

3.1 Eşleştirilmiş t-testi

  Eşleştirilmiş t-testi, değişkenliğine bağlıdır.

ölçme aracında gözlenen değişimin istatistiksel anlamlılığı üzerinde odaklanır.

Ancak istatistiksel anlamlılık, gözlenen değişimin büyüklüğüne, örneklem genişliğine ve ölçümün Sonuç olarak yaygın olarak kullanılmasına rağmen, eşleştirilmiş t-testi duyarlılığı değerlendirmek için uygun bir yöntem değildir.

Etki Genişliği

 İlk olarak Cohen tarafından önerilen etki genişliği istatistikleri, edilir.

ölçümdeki değişimin büyüklüğü hakkında doğrudan bilgi sağlar. Bu sebepten, duyarlılığın göstergesi olarak kullanımları tavsiye

3.2 Etki Genişliği І (Standartlaştırılmış Etki Genişliği)

 İlk etki genişliği istatistiği, standartlaştırılmış etki genişliği olarak da adlandırılır:

ES

 

D X SD

(

X

)  Böylece ortalama değişim skorları ile ilişkili olarak başlangıç değişkenliğin yüksek olması küçük bir etki genişliğine sahip olacaktır.

3.2 Etki Genişliği І (Standartlaştırılmış Etki Genişliği)

 Ölçümde gözlenen değişimin klinik önemiyle ilgili kararları kolaylaştırmak için farklı kriter kullanımları önerilmiştir:    ES І ≤0.20 Düşük ES І =0.50 Orta ES І ≥0.80 Yüksek

3.3 Etki Genişliği II: (Standartlaştırılmış

Yanıt Ortalaması-SRM)

 Literatürde bu etki genişliği “Duyarlılık-Tedavi katsayısı” olarak ya da “etkinlik indeksi” olarak tanımlanır:

ES II

SRM

D X SD

(

D X

)

3.3 Etki Genişliği II: (Standartlaştırılmış

Yanıt Ortalaması-SRM)

 ES II , gözlenen değişimin değişim skorlarının değişkenliğini yansıtan standart sapmaya oranıdır.

Böylece ortalama değişim ile ilişkili olarak; değişim skorlarındaki yüksek değişkenlik, küçük bir etki genişliği değerine sahip olacaktır.

 0.20,0.50 ve 0.80 ve üzeri değerleri duyarlılığı düşük, orta ve yüksek olarak temsil etmek için öne sürülmektedir.

3.4 Etki Genişliği III

 Guyatt, etki genişliği için bir başka indeks geliştirmiştir.

ES III

 

X

/ 2 

MSE X

  

X

: Klinik olarak anlamlı kabul edilen minimum değişim MSE x : Varyans analizinden elde edilen X’in hata kareler ortalamasıdır. [Her denekten iki ölçüm (önce-sonra) alındığında, değişim skorlarının standart sapmasıdır]

3.4 Etki Genişliği III

  ES I ve ES II ’ye benzer olarak 0.20, 050, 0.80 ve üzeri değerler düşük, orta ve yüksek duyarlılığı temsil etmek için kullanılır.

Bu indeks ES I ve ES II ’ye göre daha üstün kabul edilse de, minimum klinik anlamlı değişimin bir çok ölçüm için bilinmiyor olması, bu indeksin kullanımının çok yaygın olmamasına neden olmuştur.

3.5 Etki Genişliği İstatistiklerinin Yorumlanması

 Etki genişliği istatistikleri genel olarak duyarlılığın incelenmesinde ölçümdeki değişime bağlı olarak değerlendirme yapan ve kolaylıkla hesaplanan değerlerdir.

 Literatürde yaygın olarak kullanılmaktadırlar.

 ES III hariç, ES hastanın І ve ES durumundaki II gözlenen değişime bağlı indekslerdir. Ancak ölçümde gözlemlenen değişim klinik olarak anlamlı değişmeyi yansıtmayabilir.

 Bu indekslerde hesaplamalar farklı olsa yorumlamada kullanılan kesim noktaları aynıdır.

da

4. Dışsal Duyarlılık

4.1 İKE Yöntemi

  İKE eğrileri bir ölçüm ile değişimin dışsal bir göstergesi arasındaki ilişkiye çok etkili bir bakış açısı sağlar.

İKE yönteminin belki de en büyük dezavantajı dışsal değişim skorunun iki sonuçlu hale getirilmek zorunda olmasıdır (hastalık gelişti, gelişmedi gibi).

Bu işlem dışsal kriterdeki değişim miktarından elde edilecek bilginin azalmasına neden olur.

4.2 Korelasyon

 Korelasyon katsayısı duyarlılığı değerlendirmek için çok iyi bir yaklaşım olduğu düşüncesi ile literatürde sıklıkla kullanılır. Pearson korelasyon katsayısı iki ölçümün değişiminin skorlarına dayalı olarak hesaplanır:

r xy

i n

  1 (

D x i

D x

)(

D y i

D y

) /

n

4.2 Korelasyon

 Duyarlılığın katsayısının tercih edilmesinin nedeni, bir ölçümün spesifik bir alternatif sonuca göre duyarlı olup olmadığını incelemesidir. Bir ölçümde değişimin, diğer bir ölçümde değişimi ne kadar iyi tahmin ettiğini yansıtır.

değerlendirilmesinde korelasyon

4.3 Regresyon Modelleri

  X: Yaşam kalitesiyle ilgili yeni bir sağlık ölçümü Y: Geleneksel klinik sonuç olsun.

Basit doğrusal regresyon modeli: 

D yi =a+bd xi +e i e i , (i=1,…,n) bağımsız N(0,

a: X’te değişiklik gözlemlenmediğinde Y’deki ortalama değişikliği gösterir.

σ 2 )

 b: X’te bir birimlik değişiklik meydana geldiğinde Y’deki ortalama değişim miktarını gösterir.

4.3 Regresyon Modelleri

 b’nin yüksek değerleri, X’deki değişimin Y’deki değişimle aynı yönlü olduğu anlamına gelir. b’nin istatistiksel anlamlılığının yanı sıra, aynı amaç için birden fazla ölçüm varsa, standartlaştırılmış regresyon katsayısı kullanılabilir.

 Çeşitli alternatif yöntemlerin aksine regresyon katsayısı b aracılığıyla duyarlılık için kolay yorumlanabilir bir indeks sağlar.

5. Örnek: Psoriatic Arthritis’te Duyarlılık

  Veriler Toronto Üniversitesi psoriatic arthritis kliniğinden alınmıştır.

1994ve 1996 yılları arasında yapılan araştırmaya 70 hasta (27 kadın-43 erkek) alınmıştır.

 Çalışmada sağlık durumunu değerlendirmede üç ölçek (HAQ, AIMS2, SF-36) kullanılmıştır. Bu ölçekler kullanılarak yaklaşık 1-1.5 yıl ara ile iki zaman noktasında ölçüm alınmıştır.

 Dışsal duyarlılık için hastalarda sağlıklarındaki değişimi sorgulayan, sağlık değişim indeksi referans ölçüm olarak kullanılmıştır. Hastalar iki test arasında sağlık durumlarında değişimleri 5’li likert ölçeğine göre değerlendirmişlerdir.

  1=bir yıl öncesine göre çok daha iyi 2=bir yıl öncesine göre biraz daha iyi   3=hemen hemen aynı 4=bir yıl öncesine göre biraz daha kötü  5=bir yıl öncesine göre çok daha kötü

  ES III sağlık durumlarını bir yıl öncesine göre biraz daha iyi olarak için klinik olarak minimum anlamlı değişim, değerlendirenlerin ortalama değişimi ile sağlık durumlarını aynı olarak değerlendirenler için ortalama değişim arası fark alınarak tanımlanmıştır.

Payda kısmı, sağlık durumunu değişimin standart sapmasıdır.

aynı olarak değerlendiren hastalarda fiziksel fonksiyondaki

  İKE analizi için sağlık durumlarında değişim iki kategorili olarak kodlanmıştır.

Sağlık durumlarını bir yıl öncesine göre biraz daha iyi ve çok daha iyi olarak değerlendirenler, “gelişim/iyileşme var”, sağlık durumu bir yıl öncesine göre aynı, biraz daha kötü ve çok daha kötü olarak değerlendirenler “gelişim/iyileşme yok” olarak sınıflandırılmıştır.

Psoriatic Arthritis Hastalarında HAQ, AIMS2 ve SF-36 Boyutlarının Fiziksel Fonksiyonu İçin İçsel Duyarlılık İstatistikleri

Fiziksel Fonksiyon Skorları HAQ AISM2 SF-36

İçsel Duyarlılık

Etki Genişliği І -0.055

0.05

0.086

Etki Genişliği II SRM -0.074

0.031

0.126

Etki Genişliği III Guyatt İndeksi 0.047

-0.213

0.416

İKE

sonucunda elde edilen eğri alanlar, her bir ölçek için fonksiyonellik değişim skorlarının, “iyileşen” ve altında hastalar arasında orta düzeyde

analizi

kalan fiziksel “iyileşmeyen” ayrımsama yaptığını göstermektedir.

 İKE altında kalan alan, SF-36’nın ayrımsama HAQ ortaya koymaktadır.

ve AIMS2’ye göre daha iyi yaptığını

Dışsal Duyarlılık

Fiziksel Fonksiyon Skorları İKE Altındaki Alan HAQ 0.609

AISM2 SF-36 0.647

0.751

Korelasyon analizleri de HAQ, AIMS2 ve SF-36 için fiziksel fonksiyonda değişim skorlarının sağlıkta algılanan değişimle ilişkili olduğunu ileri sürmektedir.

Hem HAQ hem de AIMS2’nin sağlıkta algılanan değişimle ilişkinin zayıf olduğunu gösterirken, SF-36 ise sağlıkta algılanan değişimle orta düzey ilişki olduğunu göstermektedir.

Fiziksel Fonksiyon Skorları HAQ AISM2 SF-36

Dışsal Duyarlılık

Pearson Korelasyon katsayısı (p değeri) 0.37 (0.002) 0.33 (0.005) -0.55 (p<0.001)

 Doğrusal regresyon analizinde bireysel regresyon katsayıları, istatistiksel olarak anlamlıdır ve ölçümün herhangi bir fiziksel fonksiyonda bir birim değişimle bağlantılı sağlıkta değişimin miktarını gösterir.

 Örneğin, bu iki testte HAQ fiziksel fonksiyon değişim skorundaki bir birimlik değişim, sağlık geçiş indeksinde ortalama olarak, bir birimlik değişime karşılık gelmektedir.

Fiziksel Fonksiyon Skorları HAQ AISM2 SF-36

Dışsal Duyarlılık

Doğrusal Regresyon Yöntemi b (Std. Hata) 1.05 (0.32)* 0.32 (0.11)* -0.03 (1.01)** R 2 0.14

0.11

0.31

    HAQ için açıklanan değişim miktarı=%14 AIMS2 için açıklanan değişim miktarı=%11 SF-36 için açıklanan değişim miktarı=%31 R 2 istatistiklerine dayanan bu bilgi, sağlık skorlarında değişim skorlarıyla sağlık durumunu ölçen araçlar arasında gösterilebilir bir ilişki var olduğunu gösterirken bu ilişkinin uygulama amaçları için yeterince iyi olmadığını gösterir. Eğer ölçüm dışsal standart için bir yer değiştirme olarak kullanılabilirse yüksek bir R 2 ’nin elde edilmesi gerekir.

6. Tartışma

 İçsel ve dışsal duyarlılık arasındaki fark önemlidir.

 Stucki, Kishner, Guyatt ve Felson klinik çalışmalarda basitliği ve etkinliğine dayanarak avantajlı olacağını ileri sürmektedirler.

duyarlılık istatistiklerinin ikiye ayrılarak tanımlanmasının  Çalışmalarda kullanılan potansiyel zorluk ES olmasıyla ilgilidir.

III duyarlılık istatistikleri genelde içsel duyarlılıktır. Bu bağlamda tek değerleri için gerekli olan ölçümde, klinik olarak değişimin nasıl tarafsız

 ES I ve ES II ’den hangisinin kullanılacağına karar vermek için ortalama farklarda uygun olana bakılır.

Bu duyarlılık istatistikleri eşleştirilmiş t-testine göre örneklem çapından bağımsızdır.

 Dışsal regresyon kullanımı duyarlılık azaltabilir.

bu istatistiklerinin modellerinin kullanımı metodolojinin kullanımında çok uygun olmaktadır. İKE ve korelasyon katsayısının da kısıtlamalarını  İçsel duyarlılık istatistikleri seviyesindeki değişiklik söz konusu olduğunda daha fazla önem kazanmaktadır.

hastanın ölçüm

KAYNAKLAR

   Deyo RA, Diehr P, Patrick DL.

Reproducibility and responsiveness of health status measures. Statistics and strategies for evaluation. Controlled Clin Trial 1991;12:142S–158S.

Guyatt G, Walter S, Norman G.

Measuring change over time: assessing the 8.

usefulness of evaluative instruments. J Chron Dis 1987;40:171 Guyatt H, Deyo RA, Charlson M, Levine MN, Mitchell A. Responsiveness and validity in health status measurement: a clarification.

J Clin Epidemiol 1989;42:403–8.

    Alpar R, Spor,Sağlık ve Eğitim Bilimlerinden Örneklerle Uygulamalı İstatistik ve Geçerlik-Güvenirlik. 1. bs., Detay Yayıncılık, 344 s., Ankara, 2010.

Liang MH, Larson MG, Cullen KE, Schwartz 1985;28:542–7.

JA.

Comparative measurement efficiency and sensitivity of five health status instruments for arthritis research. Arthritis Rheum Çelik Y, Biyoistatistik Bilimsel Araştırma Spss. 1. bs.,483s-497s., 2011.

Beckerman H,Roebroeck M, Lankhorst G, Becher J, Bezemer P, Verbeek A, Smallest Real Difference, a link between reproducibility and responsiveness. Amsterdam, 2001.

Kaynaklar

  Stucki G, Liang MH, Fossel AH, Katz JN. Relative responsiveness of condition-specific and generic health status measures in degenerative lumbar spinal stenosis. J Clin Epidemiol 1995;48:1369–78.

Husted J, Gladman D, Farewell V, Long J. Relationship of the arthritis impact measurement scales (AIMS) to changes in articular status and functional performance in patients with psoriatic arthritis (PsA). J Rheumatol 1996;23:1932–7.

T E Ş E K K Ü R L E R