BİYOİNFORMATİK

Download Report

Transcript BİYOİNFORMATİK

BİYOİNFORMATİK
İçerik
•
•
•
•
•
•
•
Biyoinformatik nedir
Tarihçe
Önemi
Amaçları
Uygulama alanları
Veritabanları ve programları
Biyoinformatik merkezleri
Biyoinformatik Nedir?
Tanım
•
•
•
•
•
•
•
•
Bilgisayarların moleküler biyolojide kullanımı
Moleküllerin üç boyutlu grafik temsili
Moleküler dizilimler
Üç boyutlu yapı moleküler veritabanları
Kısa sürede yüksek miktarda veri üretilmesi
Protein-protein ilişkileri
Biyolojik olarak aktif moleküllerin araştırılması
Bakteri, maya, insan, hayvan, bitki genom
projelerinden elde edilen bilgiler
Biyoinformatik
İstatistik
Matematik
Biyoinformatik
Biyoloji
Bilgisayar
Bilimleri
Biyoinformatik Araçları
•
•
•
•
Veri bankası
Mevcut veriler 1986’da 3939 iken
1999’da 80.000’e çıkmış
2004 yılında kayıtlara göre
yaklaşık 160.000 veriye
ulaşmıştır.
• Günümüzde yaklaşık 300.000’i
geçmiştir.
• 10 yıldır Biyoinformatik dalı ayrı
bir bilim dalı olarak tanınıyor.
Biyoinformatik Araçlarının
Kullanıldığı Metodolojik Çalışmalar
• DNA sıra ve dizilimi araştırmaları
• Protein sıra ve dizilimi araştırmaları
• Makromoleküler yapıların üç boyutlu dizilim araştırmaları
• Küçük moleküllerin ligandlarıyla etkileşiminin araştırılması
• Heterojen biyolojik veritabanlarının entegrasyonu
• Biyolojik enformasyon paylaşımının kolaylaştırılması
• Bilgisayar ile otomize edilmiş veri analizi ve iletimi
• Etkileşimde bulunan gen ürünleri için bilgi ağları oluşturulması
• Kimyasal reaksiyonlardan hücrelerarası iletişime kadar pek çok
biyolojik faaliyet sürecinin simülasyonu
• Büyük çaplı biyolojik deneylerden (GENOM projeleri gibi) çıkan
sonuçların analizi
Biyoinformatik Araçlarının
Kullanıldığı Biyolojik Çalışmalar
• Protein yapı ve fonksiyonunun
belirlenmesi
• Her hangi bir biyolojik fonksiyonu
artıran veya azaltan moleküllerin
tasarlanması
• Karmaşık genetik fonksiyon veya
regülasyonun tanımlanması
• Tıbbi ya da endüstriyel amaçlı yeni
makro moleküller üretmek
• Genetik faktörlerin hastalık yatkınlığına
etkilerinin ortaya çıkarmak
Kapsamı
1. Biyolojik bilgiler ile ilgili veritabanı
oluşturulup yönetilmesi
2. Genom ve dizi analizleri
3. İşlevsel genomik ve ilgili veri
analizi
4. Birincil protein dizisinden protein
3 boyutlu tahmini
5. Hücresel olayların modellenip
insliko gerçekleştirilmesi
Veri Tabanları
Veri Tabanı Programları
1. Tablolar
2. Formlar
3. Sorgular
4. Raporlar
Biyolojik Çeşitlilik
Bacteria
Yeast
Fruit Fly
Human
Biyoloji Veritabanları
• GenBank
(Gen Bankası; ABD-Maryland-Bethesda)
http://www.ncbi.nlm.nih.gov/Genbank/
• EMBL
(Avrupa Moleküler Biyoloji Laboratuvarı;
İngiltere-Hinxton)
http://www.ebi.ac.uk/embl/
• DDJB
(DNA Japonya Veritabanı; Japonya-Mishima)
http://www.ddbj.nig.ac.jp/
Gen ekspresyonu = Protein üretimi
DNA
Gen ekspresyonu = Protein üretimi
Nucleotides sequence
Protein
DNA
Protein dizi verileri ile ilgili başlıca
hizmet sağlayıcılar
1. GenBank
2. EMBL
3. PIR International
4. Swiss-Prot
Sık Kullanılan Veritabanları
Sınıf
Nükleik Asit Dizilişleri (DNA)
Protein Dizilişleri (Protein)
3 Boyutlu Yapılar
Diziliş Motifleri
Enzimler ve Bileşikler
Protein Etkileşimleri
Biyokimyasal Yollar
Gen Katalogları
Genetik Hastalıklar
Protein Mutasyonları
Amino acid indices
Protein/peptid Literatürü
Veri Tabanları
EMBL
GenBank
PDBSTR
Swiss-Prot
PIR
PRF
PDB
EPD
TRANSFAC
PROSITE
LIGAND
BRITE
PATHWAY
GENES
OMIM
PMD
AAindex
LITDB
Protein Dizisinden Yapısına
APRKFFVGGNWKMNGDKK
SLGELIHTLNGAKLSADT
EVVCGAPSIYLDFARQKL
DAKIGVAAQNCYKVPKGA
FTGEISPAMIKDIGAAWV
ILGHSERRHVFGESDELI
GQKVAHALAEGLGVIACI
GEKLDEREAGITEKVVFE
QTKAIADNVKDWSKVVLA
YEPVWAIGTGKTATPQQA
QEVHEKLRGWLKSHVSDA
VAQSTRIIYGGSVTGGNC
KELASQHDVDGFLVGGAS
LKPEFVDIINAKH
Pockets in Ribonuclease A
Dizi karşılaştırma
1: MYTAILORISRICH
2: MONTAILLEURESTRICHE
1: MY-TAIL--ORIS-RICH¦x ¦¦¦¦ x¦x¦ ¦¦¦¦
2: MONTAILLEURESTRICHE
1:
2:
TAILO
¦¦¦¦x
TAILL
RICH
¦¦¦¦
RICHE
Global Alignment
Two Local Alignments
¦ = Identity
x = Mismatch
- = Insertion / Deletion
HBA_CHICK
HBAD_CHICK
HBPI_CHICK
HBB_CHICK
HBE_CHICK
HBRH_CHICK
MYG_CHICK
VL-SAADKNNVKGIFTKIAGHAEEYGAETLERMFTTYPPTKTYFPHF-DL
ML-TAEDKKLIQQAWEKAASHQEEFGAEALTRMFTTYPQTKTYFPHF-DL
AL-TQAEKAAVTTIWAKVATQIESIGLESLERLFASYPQTKTYFPHF-DV
VHWTAEEKQLITGLWGKV--NVAECGAEALARLLIVYPWTQRFFASFGNL
VHWSAEEKQLITSVWSKV--NVEECGAEALARLLIVYPWTQRFFASFGNL
VHWSAEEKQLITSVWSKV--NVEECGAEALARLLIVYPWTQRFFDNFGNL
GL-SDQEWQQVLTIWGKVEADIAGHGHEVLMRLFHDHPETLDRFDKFKGL
....
.
..*
. .. * * * *.. .* *
* * ..
48
48
48
48
48
48
49
HBA_CHICK
HBAD_CHICK
HBPI_CHICK
HBB_CHICK
HBE_CHICK
HBRH_CHICK
MYG_CHICK
SH-----GSAQIKGHGKKVVAALIEAANHIDDIAGTLSKLSDLHAHKLRV
SP-----GSDQVRGHGKKVLGALGNAVKNVDNLSQAMAELSNLHAYNLRV
SQ-----GSVQLRGHGSKVLNAIGEAVKNIDDIRGALAKLSELHAYILRV
SSPTAILGNPMVRAHGKKVLTSFGDAVKNLDNIKNTFSQLSELHCDKLHV
SSPTAIMGNPRVRAHGKKVLSSFGEAVKNLDNIKNTYAKLSELHCDKLHV
SSPTAIIGNPKVRAHGKKVLSSFGEAVKNLDNIKNTYAKLSELHCEKLHV
KTPDQMKGSEDLKKHGATVLTQLGKILKQKGNHESELKPLAQTHATKHKI
.
*. .. ** .*.. . . .. ..
.
*.. *
..
93
93
93
98
98
98
99
HBA_CHICK
HBAD_CHICK
HBPI_CHICK
HBB_CHICK
HBE_CHICK
HBRH_CHICK
MYG_CHICK
DPVNFKLLGQCFLVVVAIHHPAALTPEVHASLDKFLCAVGTVLTAKYR-DPVNFKLLSQCIQVVLAVHMGKDYTPEVHAAFDKFLSAVSAVLAEKYR-DPVNFKLLSHCILCSVAARYPSDFTPEVHAEWDKFLSSISSVLTEKYR-DPENFRLLGDILIIVLAAHFSKDFTPECQAAWQKLVRVVAHALARKYH-DPENFRLLGDILIIVLASHFARDFTPACQFAWQKLVNVVAHALARKYH-DPENFRLLGNILIIVLAAHFTKDFTPTCQAVWQKLVSVVAHALAYKYH-PVKYLEFISEVIIKVIAEKHAADFGADSQAAMKKALELFRNDMASKYKEF
. .... .
.* .
. ... .
.* .
.. **.
141
141
141
146
146
146
149
HBA_CHICK
HBAD_CHICK
HBPI_CHICK
HBB_CHICK
HBE_CHICK
HBRH_CHICK
MYG_CHICK
------------------GFQG
141
141
141
146
146
146
153
Multiple
Sequence
Alignment
(MSA)
Programlar:
• CLUSTALW
• T_COFFEE
• MULTALIGN
Consensus length: 154; Identity : 19 ( 12.3%); Similarity: 51 ( 33.1%)
Character to show that a position in the alignment is perfectly conserved: '*'
Character to show that a position is well conserved: '.'
Tıp ve Farmakoloji Uygulamaları
• Biyoinformatiğin önemli bir fonksiyonu, biyolojik olayların
moleküler düzeyde açıklanmasına yardımcı olmasıdır.
• Patojen enzimleri veya mutasyona uğratılmış doğal enzimler,
homoloji sayesinde modellenebilir ve bu modeller moleküler
biyolojik olarak belirlenen etkilerin açıklanmasında kullanılabilir.
• Gen ekspresyon analizleri ile farklı hastalıklardan etkilenen
hücrelerin ekspresyonları derlenerek, sağlıklı hücrelerinki ile
kıyaslanmakta ve aradaki farklılıklardan hastalık teşhisi ve hedef
ilaç dizaynında yararlanılmaktadır.
• Kişilerin gelecekteki sağlık durumları hakkında tahminde
bulunmaya olanak verebilecektir.
Tıp ve Farmakoloji Uygulamaları
•
•
•
•
Düzeltilmiş mutasyon analizleri (CMA) zincir çiftlerindeki kovarisyasyonları bularak protein katlanma probleminin çözümünde
kullanılabileceğini düşünmüşlerdir.
Biyoinformatik sayesinde hastalıkların önlenmesinde önemli
gelişmeler sağlanacaktır.
Nükleotid dizilerinden translasyon yazılımı kullanılarak mümkün
olan aminoasit dizileri belirlenebilir. Daha sonra model
organizmalarda dizilim arama teknikleri yardımı ile homolog
bölgeler belirlenir ve dizi benzerliklerinden yararlanılarak deneysel
olarak karakterize edilmiş olan yapılar üzerinden insan
proteinleri modellendirilebilir.
Algoritma ile model yapıya bağlanabilen, gerçek proteinde
biyolojik aktivitenin test edilebildiği molekülle ilaçlar tasarlanır.
Sonuç