[презентация]

Download Report

Transcript [презентация]

Блок 3. Семейства белков
I. Множественное выравнивание
Первый курс, весна 2008, А.Б.Рахманинова
Построить выравнивание?
Написать последовательности друг под другом, вставляя гэпы,
так, чтобы
последовательности имели одинаковую длину,
а вес выравнивания был максимально возможным.
1. P1
P2
DFRLLA
EYL-LA
2. P1
P2
DFRLLA
E-YLLA
3. P1
P2
4....??
DFRLLA
EYLL-A
P1
P2
DFRLLA
EY-LLA
Первый курс, весна 2008, А.Б.Рахманинова
Что мы можем узнать нового?
Попарное выравнивание:
*
20
XYLR_ECOLI : GYPSLQYFYSVFKKAYDTTPKEYR : 24
XYLR_HAEIN : GYPSIQYFYSVFKKEFEMTPKEFR : 24
Множественное выравнивание:
*
20
APPY_ECOLI : GYNSTSYFICAFKDYYGVTPSHYF
CELD_ECOLI : GYSSPSLFIKTFKKLTSFTPKSYR
CFAD_ECOLI : GISSASYFIRVFNKHYGVTPKQFF
ENVY_ECOLI : GYSSTSYFISVFKAFYGLTPLNYL
FAPR_ECOLI : GYTSVSYFIKTFKEYYGVTPKKFE
MELR_ECOLI : GFRSSSRFYSTFGKYVGMSPQQYR
RHAS_ECOLI : GFSDSNHFSTLFRREFNWSPRDIR
ROB_ECOLI : RFDSQQTFTRAFKKQFAQTPALYR
TETD_ECOLI : QFDSQQSFTRRFKYIFKVTPSYYR
XYLR_ECOLI : GYPSLQYFYSVFKKAYDTTPKEYR
XYLR_HAEIN : GYPSIQYFYSVFKKEFEMTPKEFR
g s
F
Fk
tP
:
:
:
:
:
:
:
:
:
:
:
24
24
24
24
24
24
24
24
24
24
24
Множественное выравнивание, весна 2008
Для чего строят множественные выравнивания?
APPY_ECOLI
CELD_ECOLI
CFAD_ECOLI
ENVY_ECOLI
FAPR_ECOLI
MELR_ECOLI
RHAS_ECOLI
ROB_ECOLI
TETD_ECOLI
XYLR_ECOLI
XYLR_HAEIN
:
:
:
:
:
:
:
:
:
:
:
*
20
GYNSTSYFICAFKDYYGVTPSHYF
GYSSPSLFIKTFKKLTSFTPKSYR
GISSASYFIRVFNKHYGVTPKQFF
GYSSTSYFISVFKAFYGLTPLNYL
GYTSVSYFIKTFKEYYGVTPKKFE
GFRSSSRFYSTFGKYVGMSPQQYR
GFSDSNHFSTLFRREFNWSPRDIR
RFDSQQTFTRAFKKQFAQTPALYR
QFDSQQSFTRRFKYIFKVTPSYYR
GYPSLQYFYSVFKKAYDTTPKEYR
GYPSIQYFYSVFKKEFEMTPKEFR
g s
F
Fk
tP
:
:
:
:
:
:
:
:
:
:
:
24
24
24
24
24
24
24
24
24
24
24
Это модель
позволяет найти общее
позволяет оценить эволюционные отношения
мотивы, паттерны, профили
поиск
активного
центра
предсказание
3D-структуры
реконструкция
эволюции
Построение множественных выравниваний — необходимый
этап решения многих задач молекулярной биологии
Множественное выравнивание, весна 2008
Попарное и множественное выравнивание
1. Любое множественное выравнивание порождает набор
попарных не обязательно оптимальных выравниваний
2. Не любой набор попарных выравниваний можно просто
"сложить" во множественное выравнивание.
Пример:
P1
P2
+
P1
P3
+
P2
P3
ALGTEEI-C
ALGT--IAC
AL-GTEEI-C
ALVGTE-IAC

P1 AL-GTEEI-C
P2 AL-GT--IAC
P3 ALVGTE-IAC
AL-GT-IAC
ALVGTEIAC
Множественное выравнивание, весна 2008
Змей-Горыныч биоинформатики
Биологическая задача 
поставить друг под другом
гомологичные позиции
Математическая задача 
найти способ количественного
сравнения качества
выравниваний.
Программирование  создание
эффективного алгоритма и
его реализация
APPY_ECOLI
CELD_ECOLI
CFAD_ECOLI
ENVY_ECOLI
FAPR_ECOLI
MELR_ECOLI
RHAS_ECOLI
ROB_ECOLI
TETD_ECOLI
XYLR_ECOLI
XYLR_HAEIN
:
:
:
:
:
:
:
:
:
:
:
*
20
GYNSTSYFICAFKDYYGVTPSHYF
GYSSPSLFIKTFKKLTSFTPKSYR
GISSASYFIRVFNKHYGVTPKQFF
GYSSTSYFISVFKAFYGLTPLNYL
GYTSVSYFIKTFKEYYGVTPKKFE
GFRSSSRFYSTFGKYVGMSPQQYR
GFSDSNHFSTLFRREFNWSPRDIR
RFDSQQTFTRAFKKQFAQTPALYR
QFDSQQSFTRRFKYIFKVTPSYYR
GYPSLQYFYSVFKKAYDTTPKEYR
GYPSIQYFYSVFKKEFEMTPKEFR
g s
F
Fk
tP
:
:
:
:
:
:
:
:
:
:
:
24
24
24
24
24
24
24
24
24
24
24
Множественное выравнивание, весна 2008
Можно ли построить
единственное оптимальное множественное
выравнивание?
Построение парного выравнивания по алгоритму Нидельмана-Вунша
(пример из упр. студента ФББ)
Можно найти самое лучшее выравнивание за время t
seq1: MA-RR
seq2: CADRQ
при условии,что
вес совпадения: 2
вес замены: -1
штраф за делецию: -2
Да, можно, но за
t
N
=L
!!!
Программа MSA строит оптимальное выравнивание в
соответствии c матрицами замен.
Множественное выравнивание, весна 2008
Алгоритм ClustalW – пример эвристического
прогрессивного алгоритма
Руководящее
дерево
Очевидные недостатки :
• результат зависит от порядка выравниваний;
• «один раз гэп – всегда гэп»
Muscle или как исправить ClustalW
Множественное выравнивание, весна 2008
Наиболее известные программы
множественного выравнивания:
1. MSA => оптимальное выравнивание, если дождаться
результата
2. ClustalW (реализации  ClustalX, emma из EMBOSS) 
до сих пор самый популярный алгоритм, в сложных
случаях может ошибиться.
3. Muscle  итеративный прогрессивный алгоритм,
точнее и быстрее ClustalW
4. Т-COFFEE – немного точнее, но существенно медленнее
5. HMMER – часто ошибается, но хорошо строит профили
6. .........
Множественное выравнивание, весна 2008
Как сравнивают разные программы
множественного выравнивания?
Эталонные выравнивания:
BALIBASE (3D!): http://bips.u-strasbg.fr/en/Products/Databases/BAliBASE2/
BLOCKS: http://blocks.fhcrc.org/
Pfam: http://www.sanger.ac.uk/Software/Pfam/
SMART: http://smart.embl-heidelberg.de/
....
Множественное выравнивание, весна 2008