Transcript [презентация]
Биоинформатика
Факультет биоинженерии и биоинформатики МГУ имени М.В.Ломоносова 2013 год
Занятие 1. Вводное.
Что такое биоинформатика?
Преподаватели 1 курса
Дарья Владимировна ДИБРОВА Сергей Игоревич МИТРОФАНОВ Андрей Владимирович АЛЕКСЕЕВСКИЙ Сергей Александрович СПИРИН
1
Администраторы комп.класса
Лидия Куртовна СМИРЕНИНА Даниил Андреевич АЛЕКСЕЕВСКИЙ
История одного открытия…
…CRISPR
2
С чего иногда начинается открытие?
• Статья Yoshizumi Ishino с соавторами (1987), была посвящена
секвенированию
(т.е. узнаванию последовательности, от англ. sequence) и описанию одного из многих генов кишечной палочки (
Escherichia coli
)
(в то время последовательность каждого гена получалась в ходе кропотливой работы)
3
• В самом конце статьи в 6 (!) предложениях описывалась случайно обнаруженная рядом с этим геном необычная последовательность ДНК (Ishino
et al.
,
Journal of Bacteriology
,
1987
)
Неожиданное наблюдение
4 ???
Последовательность
>2875647-2876590|U00096|Escherichia_coli_str.K12_substr.MG1655
TGAAAATGGGAGCTGGGAGTTCTACCGCAGAGGCGGGGGAACTCCAAGTGATATCCATCA TCGCATCCAGTGCGCCCGGTTTATCCCCGCTGATGCGGGGAACACCAGCGTCAGGCGTGA AATCTCACCGTCGTTGCCGGTTTATCCCTGCTGGCGCGGGGAACTCTCGGTTCAGGCGTT GCAAACCTGGCTACCGGGCGGTTTATCCCCGCTAACGCGGGGAACTCGTAGTCCATCATT CCACCTATGTCTGAACTCCCGGTTTATCCCCGCTGGCGCGGGGAACTCCCGGGGGATAAT GTTTACGGTCATGCGCCCCCCGGTTTATCCCCGCTGGCGCGGGGAACTCTGGGCGGCTTG CCTTGCAGCCAGCTCCAGCAGCGGTTTATCCCCGCTGGCGCGGGGAACTCAAGCTGGCTG GCAATCTCTTTCGGGGTGAGTCCGGTTTATCCCCGCTGGCGCGGGGAACTCTAGTTTCCG TATCTCCGGATTTATAAAGCTGACGGTTTATCCCCGCTGGCGCGGGGAACTCGCAGGCGG CGACGCGCAGGGTATGCGCGATTCGCGGTTTATCCCCGCTGGCGCGGGGAACTCGCGACC GCTCAGAAATTCCAGACCCGATCCAAACGGTTTATCCCCGCTGGCGCGGGGAACTCTCAA CATTATCAATTACAACCGACAGGGAGCCCGGTTTATCCCCGCTGGCGCGGGGAACTCAGC GTGTTCGGCATCACCTTTGGCTTCGGCTGCGGTTTATCCCCGCTGGCGCGGGGAACTCTG CGTGAGCGTATCGCCGCGCGTCTGCGAAAGCGGTTTATCCCCGCTGGCGCGGGGAACTCT CTAAAAGTATACATTTGTTCTTAAAGCATTTTTTCCCATAAAAACAACCCACCAACCTTA ATGTAACATTTCCTTATTATTAAAGATCAGCTAATTCTTTGTTT
5
Clustered Regularly Interspaced Short Palindromic Repeats 6
TGAAAATGGGAGCT
G GG AG T TCTA CCG CA GA G GCGGGG G A ACT
C AGCGTCAGGCGTGATCGCATCCAGTGCGCC
CGGTTTATCCCCGCTG AT GCGGGGAAC A C
C CGGTTCAGGCGTTAATCTCACCGTCGTTGC
CGGTTTATCCC T GCTGGCGCGGGGAACTC
T TAGTCCATCATTGCAAACCTGGCTACCGGG
CGGTTTATCCCCGCT AA CGCGGGGAACTC
G CGGGGGATAATCCACCTATGTCTGAACTCC
CGGTTTATCCCCGCTGGCGCGGGGAACTC
C GGGCGGCTTGGTTTACGGTCATGCGCCCCC
CGGTTTATCCCCGCTGGCGCGGGGAACTC
T AGCTGGCTGCCTTGCAGCCAGCTCCAGCAG
CGGTTTATCCCCGCTGGCGCGGGGAACTC
A AGTTTCCGGCAATCTCTTTCGGGGTGAGTC
CGGTTTATCCCCGCTGGCGCGGGGAACTC
T CAGGCGGTATCTCCGGATTTATAAAGCTGA
CGGTTTATCCCCGCTGGCGCGGGGAACTC
G CGACCCGACGCGCAGGGTATGCGCGATTCG
CGGTTTATCCCCGCTGGCGCGGGGAACTC
G CAAGCTCAGAAATTCCAGACCCGATCCAAA
CGGTTTATCCCCGCTGGCGCGGGGAACTC
T GCCATTATCAATTACAACCGACAGGGAGCC
CGGTTTATCCCCGCTGGCGCGGGGAACTC
A GGTGTTCGGCATCACCTTTGGCTTCGGCTG
CGGTTTATCCCCGCTGGCGCGGGGAACTC
T CGTGAGCGTATCGCCGCGCGTCTGCGAAAG
CGGTTTATCCCCGCTGGCGCGGGGAACTC
T CTAAAAGTATACATTTGTTCTTAAAGCATTTTTTCCCATAAAAACAACCCACCAACCTTA ATGTAACATTTCCTTATTATTAAAGATCAGCTAATTCTTTGTTT
Накопление знаний, гипотезы
7
CRISPR впервые замечены у кишечной палочки (
Escherichia coli
) CRISPR найдены у туберкулёзной палочки (
Mycobacterium tuberculosis
) CRISPR найдены у галофильных архей CRISPR найдены у самых разных прокариот и даже в митохондриях
!
CRISPR встречается в геномах рядом с набором генов, кодирующих белки CAS (CRISPR-Associated Proteins)
1987 1992 1993 1995 2000 2002
…возможно, CRISPR участвуют в расхождении ДНК при делении клетки
(Hermans
et al.
,
Journal of Bacteriology
,
1992
) (Groenen
et al.
,
Molecular Microbiology
,
1993
) (Mojica
et al.
,
Molecular Microbiology
,
1995
) (Mojica
et al.
,
Molecular Microbiology
,
2000
) (Jansen
et al.
,
Molecular Microbiology
,
2002
)
…что бы ни делали CRISPR , вероятно, этот механизм широко применяется прокариотами …некоторые белки CAS похожи на белки, которые расплетают и разрезают ДНК. Возможно, они отвечают за создание повторов CRISPR
Система CRISPR/CAS в геноме
8
гены белков CAS ...
TGAAAATGGGAGCTGGGAGTTCTACCGCAGAGGCGGGGGAACTC AGCGTCAGGCGTGATCGCATCCAGTGCGCC
CGGTTTATCCCCGCTGATGCGGGGAACAC
C
CGGTTCAGGCGTTAATCTCACCGTCGTTGC CGGTTTATCCCTGCTGGCGCGGGGAACTC
T
TAGTCCATCATTGCAAACCTGGCTACCGGG CGGTTTATCCCCGCTAACGCGGGGAACTC
G
CGGGGGATAATCCACCTATGTCTGAACTCC CGGTTTATCCCCGCTGGCGCGGGGAACTC
C
GGGCGGCTTGGTTTACGGTCATGCGCCCCC CGGTTTATCCCCGCTGGCGCGGGGAACTC
T ...
CRISPR и бактериофаги?!
9
В 2005 году путем сравнения последовательностей было обнаружено, что в неповторяющихся фрагментах CRISPR находятся последовательности из ДНК
бактериофагов
(Pourcel
et al.
,
Microbiology
,
2005
) (Mojica
et al.
,
J. Mol. Evol.
,
2005
) (Bolotin
et al.
,
Microbiology
,
2005
) (Makarova
et al.
,
Biology Direct
,
2006
) Система CRISPR/CAS участвует в защите прокариот от их вирусов – бактериофагов www.wikipedia.org
Экспериментальное подтверждение
Гипотеза, сделанная на основании сравнения последовательностей (
in silico
):
10 система CRISPR/CAS – это система приобретенного иммунитета бактерий против бактериофагов
Да, наличие в CRISPR-кассете последовательности из генома определенного фага отличает устойчивый к данному фагу штамм от восприимчивого Да, в колониях бактерий под действием бактериофага отбираются те клетки, которые смогли встроить кусочки генома этого фага в свой геном (Barangou
et al.
,
Science
,
2007
)
Иммунный ответ которая одному из фрагментов : уничтожение ДНК, комплементарна CRISPR кассеты 11 Обучение кассету : встраивание фрагмента чужеродной ДНК в CRISPR Приспособление вируса : мутация
(Deveau
et al.
,
Annu. Rev. Microbiol.
,
2010
)
Большое спасибо бактериям за
12
защиту от фагов!
1) Система рестрикции-модификации (Нобелевская премия по медицине в 1978 г.)
Рестриктаза ДНК («разрезаза», от англ. restriction) Метилаза ДНК Короткий участок ДНК (4-6 нуклеотидов)
Werner Arber Daniel Nathans
!
CH 3 CH 3 CH 3 CH 3 CH 3 CH 3
Hamilton O. Smith
www.wikipedia.org
Большое спасибо бактериям за
13
защиту от фагов!
1) Система рестрикции-модификации (Нобелевская премия по медицине в 1978 г.) Чрезвычайно широко применяется в генной инженерии для конструирования нужных молекул ДНК
Проблема!
• При работе с эукариотами мало просто дать плазмиду; надо
встроить ДНК в геном в определенное место
• Сделать это с помощью рестриктаз
нельзя
– в настоящем геноме очень много их сайтов
Плазмида Бактерия
Большое спасибо бактериям за
14
защиту от фагов!
2) Система CRISPR/CAS (открыта в 2007 г.)
• В 2012 году на основе белка Cas9, который режет чужеродную ДНК, комплементарную фрагменту РНК бактериофага, создана система, которая
в пробирке разрезает ДНК в нужном месте
(Jinek
et al.
,
Science
,
2012
) Система состоит из Cas9 и соответствующей РНК.
• В 2013 году опубликовано более 30 работ об успешном применении этой системы для изменений геномов в культурах клеток человека, растений, червяков и др. организмов (ни одной работы в 2012 году и ранее!) (Richter
et al.
,
Int. J. Mol. Sci
, июль
2013
, обзор) • Ожидается, что такая система в недалеком будущем может быть использована в генной терапии человека (Carroll,
Molecular Therapy
, 2012)
Компоненты системы CRISPR/CAS для генной инженерии эукариот
15 ЯДРО ДНК РНК РНК комплементарная последовательности, которую нужно разрезать в геноме Cas9 Плазмида, кодирующая белок Cas9, к которому исскуствено добавлен сигнал локализации в ядре (NLS)
(Richter
et al.
,
Int. J. Mol. Sci
,
2013
)
Чем будем заниматься мы?
…1 семестр
16
Анализ численных результатов экспериментов
Графики:
Объект биоинформатики
17 Исходные данные
: линейные гетерополимерные биологические молекулы (
ДНК
,
РНК
,
белки
) (Fasano
et al.
,
PNAS
,
1982
)
Данные об экспрессии генов:
http://www.illumina.com
Последовательности Структуры
18
линейные гетерополимерные биологические молекулы (
ДНК
,
РНК
,
белки
)
Био
информатика
Цель исследования
: изучение устройства ДНК, РНК и белков для (лучшего) понимания
биологических функций
конкретных макромолекул
Био
информатика
Цель исследования
: разработка поддержание
методов
исследования биологических макромолекул, применимых в самых разных случаях;
баз данных Больше математики Больше программирования …Меньше биологии
Устройство семестра
19
• В семестре несколько
блоков
• Блок состоит из нескольких
практических занятий
• Практическое занятие состоит из
вводной части контрольные
и времени
начала
(!)
выполнения
задания по этому занятию (практикума) в компьютерном классе. Иногда на занятии проводятся
мини-
• Форма отчета по большинству практикумов –
протокол работы
. Он оценивается по
балльной системе
, которая является
сквозной
для всех лет обучения • За каждый блок нужно получить проводились) контрольных
промежуточный зачет
, который ставится при зачете всех сданных практикумов и (если они Зачет за семестр ставится при обязательном наличии зачетов за все блоки и по результатам сдачи устного зачета
Устройство 1 семестра
Каждый студент получает индивидуальный белок и бактерию для последующего анализа
20 Блок №1
: Знакомство с геномами прокариот
Блок №2
: Основы программирования. Анализ некоторых свойств генома выданной бактерии с помощью простейших средств программирования
Блок №3
: Средства табличных редакторов (MS Excel, LO Calc) и HTML для обработки и представления данных