Hastane Bilgi Sistemlerinde Veri Madenciliği

Download Report

Transcript Hastane Bilgi Sistemlerinde Veri Madenciliği

Hastane Bilgi Sistemlerinde
Veri Madenciliği
Pınar YILDIRIM
Çankaya Üniversitesi
Bilgisayar Mühendisliği
Ankara
Mahmut ULUDAĞ
European Bioinformatics Institute
Cambridge, UK
Abdülkadir GÖRÜR
Çankaya Üniversitesi
Bilgisayar Mühendisliği
Ankara
31.01.2008
Hastane Bilgi Sistemleri
– Sağlık ve tıp çağımızın en önemli
araştırma alanlarıdır.
– Hastane bilgi sistemleri de
araştırmalar için önemli veri
kaynaklarıdır.
Hastane Bilgi Sistemleri
– Bilgi ve iletişim sistemlerindeki gelişmeler
– Bilgi modelleme ve tanı araçlarında gelişmeler
– Elektronik ortamda saklanabilen birçok veri
• Hasta demografik bilgileri
• Hastalık ve tedavi durumları
• Yapılan tetkikler
• Faturalama ve idari işlere ait veriler
• ve diğerleri
Veri Madenciliği ve Tıp Alanında
Tarihçesi
– Veri madenciliği ve Bilgi Keşfi tanımı:
• Verilerde daha önceden bilinmeyen, anlamlı ve değerli bilgiler elde
etme işlemleridir.
– Uzman sistemler (1970 ler), yaygınlaşamama nedenleri:
• Verilerin hızlı değişmesi
• Uzmanlar arasındaki görüş ayrılıkları
– Yapay Sinir Ağları(1990 lar)
• Hastaların gelecekteki sağlık durumlarının tahmini
• Maliyet tahminleri
Veri Madenciliği Teknikleri
– Temel aşamaları:
• Veri seçimi
• Önişleme
• Dönüştürme
• Veri madenciliği algoritmalarının uygulanması
• Yorumlama/değerlendirme
Veri Madenciliği Aşamaları
Veri Madenciliği Teknikleri
– Veri seçme işlemi
• Üzerinde çalışılacak verilerin seçilmesi
– Önişleme ve dönüştürme
• Eksik veya hatalı veriler
• Kategorize etme
• Boyut azaltma
Veri Madenciliği Teknikleri
• Veri madenciliği algoritmaları
– Tahmin edici modeller
• Sınıflandırma(classification)
• Zaman serileri(Time Series)
• Regresyon(Regression)
– Tanımlayıcı modeller
• Kümeleme(clustering)
• Özetleme(summariation)
• İlişkisel kural madenciliği(association rule mining)
İleri Veri Madenciliği Teknikleri
• İlişkisel veri madenciliği
– Çoklu ilişkisel karar ağaçları(Multi-relational
decision trees)
– Çoklu ilişkisel kurallar(multi association rules)
İleri Veri Madenciliği Teknikleri
– Metin Madenciliği
• Yapısal olmayan metinlerden bilgi keşfi yapmak
amacıyla geliştirilmiştir.
• Aynı konuda yazılmış belgeler
• Birbiriyle ilişkili belgeler ve kavramlar
İleri Veri Madenciliği Teknikleri
– Metin madenciliği disiplinlerarası bir araştırma
alanıdır:
• Doğal Dil İşleme(Natural Language Processing)
• Bilişsel Bilimler(Cognitive Sciences)
• Makine Öğrenmesi(Machine Learning)
• İstatistik
Sağlık Alanında Veri Madenciliği
Uygulamaları
– Belirli bir hastalığa sahip hastaların ortak özelliklerinin
tahmin edilmesi
– Tıbbi tedavilerinin sonuçlarının tahmin edilmesi
– Hastane maliyetlerinin tahmin edilmesi
– Ölüm oranları ve salgın hastalıkların tahmin edilmesi
Sağlık Alanında Veri Madenciliği
Uygulamaları
– Hastalık Sınıflandırma Veri Seti
Örnek kurallar:
Kural 1:IF Yas = 25 THEN Hastalık = Var
Kural 2: IF Tansiyon = Normal AND Sigara Kullanımı = Bazen
THEN Hastalık = Yok
Sağlık Alanında Veri Madenciliği
Uygulamaları
• Hastalıkların Yönetimi
– Hastalıkların durumları(Karar ağaçları kullanılmış)
• Yaş
• Cinsiyet ve
• Diğer özellikler kullanılarak hastalıklara ait bilgilerin
keşfedilmesi
– Maliyet modelleme
Sağlık Alanında Veri Madenciliği
Uygulamaları
• Hastaların sürekli doktor değiştirmelerinin
nedenleri
(ilişkisel kural analizi yöntemi ile araştırılmış)
– Demografik bilgiler
– İşlemsel veriler analiz edilmiş
• Etki eden faktörler
–
–
–
–
Yaş
Cinsiyet
Kronik hastalıklar
Hastanelerin olanaklarının etkili olduğu ortaya çıkmıştır.
Sağlık Alanında Veri Madenciliği
Uygulamaları
– Hastaların hastanelerdeki kalış süreleri araştırılmış
(yapay sinir ağları kullanılmış)
– Kalış süresine etki eden faktörler
• Demografik
• Çevresel bilgiler
• Şehirlerde yaşayan hastalar
• 40 yaşından büyük hastalar
• Alkol ve sigara bağımlılığı
Sağlık Alanında Veri Madenciliği
Uygulamaları
– Hile Tespiti çalışmaları
(Genellikle kümeleme yöntemleri)
• Hasta, tetkik ve doktor bilgileri analiz edilip
anormal veriler
• Ortalama maliyetlerin üzerindeki tetkik ve tedaviler
incelenmiş
Sağlık Alanında Veri Madenciliği
Uygulamaları
– İlaçların yan etkileri
(Metin madenciliği yöntemleri kullanılmış)
– Web üzerindeki tıbbi yayınlar analiz edilerek,
daha önceden tanımlanmamış yan etkileri
araştırılmaktadır.
Tıp ve Biyoinformatik Alanlarında
Veri Madenciliği Çalışmaları
– Tıp ve sağlık alanındaki yapısal olmayan
dokümanlar için metin madenciliği
çalışmaları
• Tanı, tedavi bilgileri
• Klinik dökümanlar
• Bilimsel makaleler
Tıp ve Biyoinformatik Alanlarında
Veri Madenciliği Çalışmaları
– Avrupa Biyoenformatik Enstitüsü metin madenciliği
araştırma grubu bilimsel makalelerden bilgi keşfi
yapmak için araştırmalar yapmaktadır.
– Birçok yazılım sistemi ve aracı geliştirmiştir:
• EBIMEd
• Whatizit
Tıp ve Biyoinformatik Alanlarında
Veri Madenciliği Çalışmaları
Biyolojik araştırmalar tıbbi gelişmelere önemli katkılar sağlar.
– BIOMART
• İlişkisel veriler için geliştirilen veri madenciliği sistemidir.
– OMIM(Online Mendelian Inheritance in Man)
• National Center for Biotechnology Information(NCBI) tarafından
geliştirilmiştir
• Genetik bozukluklarla ilgili bilinen hastalıkların saklandığı
veritabanıdır.
Tıp ve Biyoinformatik Alanlarında
Veri Madenciliği Çalışmaları
• İnsan Genom projesinin tamamlanması ile
birlikte genom bilgileri ile klinik bilgiler arasında
bağ kurabilmek için projeler ve veritabanları
geliştirildi:
– HapMap Projesi
– DECIPHER Projesi
Hacettepe Üniversitesi
Hastanelerinde Yapılacak Çalışma
• Radyoloji Bilgi Sisteminde
– Hastalar
– Tetkikler
– İşakışları ile ilgili bilgiler
– Ve diğer bilgiler saklanmaktadır.
Hacettepe Üniversitesi
Hastanelerinde Yapılacak Çalışma
– Kaynakların doğru planlanması
– Gelecek planlarının yapılabilmesi
– Tıbbi açıdan yapılan çalışmalara katkı
sağlanması için Radyoloji veritabanı üzerinde
ilişkisel veri madenciliği çalışmaları yapılacak
ve değerli bilgiler keşfedilmeye çalışılacaktır.
Teşekkürler
Pınar YILDIRIM
Çankaya Üniversitesi
Bilgisayar Mühendisliği
Ankara
Mahmut ULUDAĞ
European Bioinformatics Institute
Cambridge, UK
Abdülkadir GÖRÜR
Çankaya Üniversitesi
Bilgisayar Mühendisliği
Ankara
31.01.2008