Prezentace aplikace PowerPoint

Download Report

Transcript Prezentace aplikace PowerPoint

MOLEKULÁRNÍ TAXONOMIE
Náplň kurzu
 Co je to molekulární taxonomie
 Zvláštnosti molekulárních
znaků
 Metody získávání
experimentálních dat
 Metody zpracovávání dat
 Biologická interpretace
 Vaše dotazy a moje odpovědi
MOLEKULÁRNÍ TAXONOMIE
Rozpis přednášek (9:50-11:20)
21. 2. - Zahájení kurzu, taxonomie a molekulárně biologické znaky, metody sekvenace DNA
27. 2. (16:30) - Alignment sekvencí + Databáze sekvencí a vyhledávání v nich (Marián Novotný)
7. 3. - Získávání nesekvenčních molekulárních dat - multilokusové metody (RAPD, RFPL aj.),
mikrosatelity, minisatelity, izoenzymová a alozymová analýza, imunologické metody
14. 3. - SNP, evoluce sekvencí, odhad evoluční vzálenosti
21. 3. - Fylogenetické stromy I. - Proteinové distance, konstrukce fylogenetických stromů z
matice distancí, anatomie stromů
28. 3. - Fylogenetické stromy II. Rate heterogeneity, prohledávání prostoru stromů, maximální
parsimonie
4. 4. - Fylogenetické stromy III. - Metoda maximum likelihood, Bayéská metoda
 Praktikum 7. 4.: Získávání sekvencí z veřejných databází (Karnkowska)
 Biologický čtvrtek 10. 4.: Čtení stromu života z genomových sekvencí
18 .4. - Fylogenetické stromy IV. - Multigenové analýzy, určení věrohodnosti větvení stromů,
nalezení kořene, testy topologie, datování pomocí molekulárních hodin
25. 4. - Speciace a hybridizace, kryptické druhy, příklady (Radka Reifová)
 Praktikum 28. 4.: Tvorba alignmentu, tvorba stromů ze sekvencí DNA
2. 5. - Identifikace jedinců, určování rodičovství, DNA barcoding
 Praktikum 5. 5.: Tvorba stromů ze sekvencí proteinů
9. 5. Vnitrodruhová fylogeneze, struktura populace a genový tok, fylogeografie, příklady –
odevzdání nepovinného eseje
 Praktikum 12. 5.: multigenové analýzy, testy, distanční data, analýza migrace
23. 5. - Prezentace studentů
MOLEKULÁRNÍ TAXONOMIE
Zkouška
Součásti zkoušky:
Písemná část (5 příkladů) – maximální zisk 10 bodů
Ústní část – maximální zisk 10 bodů
Nepovinný esej (2-3 strany) a jeho prezentace
(10 min.) – 4 body
Hodnocení:
11-13 bodů – dobře
14-17 bodů – velmi dobře
18 a více - výborně
MOLEKULÁRNÍ TAXONOMIE
Materiály ke studiu
WEB (Hampl): http://web.natur.cuni.cz/~vlada/moltax/
Moodle: klíč k zápisu „moltax“
WEB (Flegr): http://web.natur.cuni.cz/~flegr/moltaxmater.php
KNIHY
• Flegr J. Evoluční biologie, Academia 2005.
Kapitoly: IX.Evoluce sekvence DNA a XXIV. Molekulární fylogenetika
• Avise J.C. Molecular markers, natural history and evolution. Sinauer Associates,
Inc., 2004
• Felsenstein J. Inferring phylogenies. Sinauer Associates, Inc., 2004
• Lindell Bromham Reading the story of the DNA. Oxford University press 2008.
• Higgs P. a Attwood T.K. Bioinformatics and molecular evolution. Blackwell
publishing 2005.
• Sapp: The new foundation of evolution. Oxford university press 2009
• Yang: Computational Molecular Evolution. Oxford university press 2006
• Hillis a kol.: Molecular Systematics (2nd edition). Sinauer Associates 1996
• Wiley a Lieberman: Phylogenetics (2nd edition). Wiley-Blackwell 2011
MOLEKULÁRNÍ TAXONOMIE
Co to je za obor?
Taxonomie (systematika) využívající molekulárně biologické znaky.
Taxonomie
(systematika) = Snaží se
katalogizovat biodiverzitu
a uspořádat ji do systému
obvykle hierarchicky
řazených skupin.
Rozdíly v sekvenci DNA
(potažmo proteinů).
Nepatří sem znaky na jiným
molekulách (lipidy,
polysacharidy,
proteoglykany, terciární
struktury proteinů aj.)
TAXONOMIE
Podle většinového názoru taxonomů je
nejlepším přirozeným systémem organizmů
ten, který odráží průběh jejich fylogeneze.
Fylogenetika – zabývá se vznikem a
vývojem linií organizmů. Rekonstruje
průběh kladogeneze (větvení), ale
všímá si i anageneze vývoje vlastností
organizmů v rámci linie.
TAXONOMIE
Existují různé názory na použitelnost znaků pro rekonstrukci fylogeneze:
Fenetika (podobnost) –
používá všechny znaky
Kladistika (důraz na příbuznost) –
používá výhradně synapomorfie
x1 y1 z1
x1, y1, z1 = plesiomofie
x2 = synapomorfie pro BCD
y2 = autapomorfie pro B
z2 = homoplázie (konvergence) pro ED
TAXONOMIE
Numerická taxonomie (60. minuleho století) – první pokus o
objektivizaci taxonomie. Kladli důraz na použití velkého množství
dat a vyvinuli matematické postupy, jak z nich vypočítat celkovou
podobnost (nebo naopak odlišnost - distanci) mezi taxony. Je to
tzv. fenetický přístup.
Kritizováni kladisty za to, že jim nevadí homoplázie.
Metody konstrukce stromů označované jako fenetické (založené
na distancích) byly nebo jsou kladisty neprávem zavrhovány.
Kladistické metody (maximální parsimonie) se v praxi dostávají
do podobných obtíží, nemají vodítko, jak rozeznat homoplázie a
konflikty mezi znaky řeší nakonec podobně jako „fenetické“
metody.
TAXONOMIE
Základním požadavkem na přirozený taxon je jeho monofyletičnost.
Monofyletický taxon je
•takový, jehož členové si jsou vzájemně příbuzní více, než je kdokoli z nich příbuzný
druhu mimo
• jinak řečeno, takový, který zahrnuje všechny potomky jednoho předka
Monofyletický
Parafyletický
(přípustný pro evoluční
taxonomy i kladisty)
(přípustný pro evoluční
taxonomy)
Polyfyletický
(nepřípustný)
TAXONOMIE
Na základě znalosti fylogeneze lze určit, které taxony vytvářet nesmíme,
není však možné určit, které taxony vytvářet máme nebo musíme.
HOMOLOGIE
Homologie jsou podobnosti mezi komplexními strukturami nebo
vzory, které jsou způsobeny kontinuitou biologické informace.
(Riedl a Hazsprunar)
Synapomorfie a symplesionorfie =
homologie
Homoplásie ≠ homologie, je to analogie,
ale někdy záleží na úrovni pohledu (křídlo
ptáka, netopýra a pretodactyla).
HOMOLOGIE
Homologický vztah indikuje:
• Odpovídající poloha
ACCTGGATGC
ACTTGAATGC
ACTTCGATGG
ACTTCAAGGG
Alignment sekvencí
•Podobnost v detailech
ACCTGGATGC
ACTTGAATGC
ACTTCGATGG
ACTTCAAGGG
HOMOLOGIE
Homologický vztah vyvrací:
• Přítomnost obou struktur u jednoho
druhu
• Inkongruence s mnoha jinými znaky
MOLEKULÁRNÍ TAXONOMIE
Co to je za obor?
Taxonomie (systematika) využívající molekulárně biologické znaky.
Taxonomie
(systematika) = Snaží se
katalogizovat biodiverzitu
a uspořádat ji do systému
obvykle hierarchicky
řazených skupin.
Rozdíly v sekvenci DNA
(potažmo proteinů).
Nepatří sem znaky na jiným
molekulách (lipidy,
polysacharidy,
proteoglykany, terciární
struktury proteinů aj.)
PŘEKVAPIVÉ MNOŽSTVÍ POLYMORFISMU
Liší se asi ve 3
miliónech nukleotidů
Kdyby tyto různé alely genů měnily fitness, byly by přírodním
výběrem rychle eliminovány nebo naopak fixovány a žádný
polymorfismus bychom v daných místech nepozorovali.
NEUTRÁLNÍ TEORIE EVOLUCE
Liší se asi ve 3
miliónech nukleotidů
Naprostá většina substitucí na úrovni DNA je selekčně neutrální
neutrálních, mutanti mají stejnou fitness. Tyto mutace jsou pro
selekci neviditelné a jejich fixaci či eliminaci způsobuje genetický
drift (posun). Ten je u velkých populací pomalý, obě alely tam
přetrvávají dlouho dobu a my je detekujeme jako polymorfismy.
GENETICKÝ DRIFT
NEUTRÁLNÍ TEORIE EVOLUCE
Aby bylo jasno:
• Neutrální teorie netvrdí, že většina genů je postradatelná, ale tvrdí,
že většina forem (alel) téhož genu je funkčně stejně dobrá.
• Neutrální teorie netvrdí, že nejsou mutace se škodlivým efektem,
které jsou eliminovány přírodním výběrem, ale tvrdí že takových
mutací je menšina.
• Neutrální teorie nezavrhuje darwinistickou adaptivní evoluci
poháněnou přírodním výběrem, ale tvrdí, že většina mutací je pro
přírodní výběr „neviditelná“ a k adaptivní evoluci nepřispívá.
Neutrální teorie nejlépe vysvětluje, kde se bere tolik polymorfismu
(rozdílů) v DNA.
VÝHODY MOLEKULÁRNÍCH ZNAKŮ
1. Jsou genetické
Víme jak se dědí, nezávisí na prostředí
ani genetickém pozadí. Je to právě ta
úroveň kde vznikají evoluční novinky –
mutace v DNA.
2. Je jich obrovské množství:
Velikost genomů se pohybuje od
0,5*106 – 600*109. Lidský genom
obsahuje přes 3 miliardy párů bazí.
Odhaduje se, že lidé se mezi sebou liší
v 0,1% tj 3 miliónech bazí.
VÝHODY MOLEKULÁRNÍCH ZNAKŮ
3. Jsou selekčně neutrální
Podle nich snadněji rozlišíme homologii a homoplázii
Sup africký
Kondor
Supandský
africký
VÝHODY MOLEKULÁRNÍCH ZNAKŮ
4. Jsou použitelné od těch nejvzdálenějších srovnání …
ACCTGGATGC
ACTTGAATGC
ACTTCGATGG
ACTTCAAGGG
VÝHODY MOLEKULÁRNÍCH ZNAKŮ
4. … až po porovnávání jedinců téhož druhu
VÝHODY MOLEKULÁRNÍCH ZNAKŮ
ACCTGGATGC
5. Dají se jednoznačně popsat ACTTGAATGC
ACTTCGATGG
ACTTCAAGGG
2
1
6. Jsou nezávislé
7. Jsou lépe vážitelné
8. Lépe se kvantifikuje stupeň nejistoty
VÝHODY MOLEKULÁRNÍCH ZNAKŮ
• Molekulární hodiny
• Informace o populaci
NEVÝHODY MOLEKULÁRNÍCH ZNAKŮ
• Neposkytují informaci
o anagenezi
• Cena
• Někdy destruktivní charakter
HISTORIE – 60. LÉTA
Linus Pauling, Emile Zuckerkandl
(Molecules as Documents of Evolutionary History, 1964)
Robert Sokal, Peter Sneath
(Numerical taxonomy, 1963)
Willi Henning
(Phylogenetic systematics, 1966)
Luigi Cavalli-Sforza, Anthony Edwards
(metody maximální parsimonie a maximum likelihood, 1963-1966)
HISTORIE – 60. – 90. LÉTA
Margaret Dayhoff
(Atlas of protein sequence and structure, 1965)
Motoo Kimura
(Neutral theory of evolution, 1968)
Masatoshi Nei
(substituční modely, 80. léta)
Joe Felsenstein
(PHYLIP - Phylogeny Inference Package, 1995, artefakty
fylogenetických metod – long branch attraction)
(David Swofford – PAUP
)
ZÁVĚR
• Pro tvorbu přirozeného systému je nezbytné znát
fylogenezi organizmů
• Je dovoleno vytvářet jen monofyletické případně
parafyletické taxony
• Molekulární znaky mají spoustu důležitých výhod
• Molekulární znaky jsou vhodné pro studium studium
kladogeneze nikoli anageneze
• Molekulární znaky vznikají převážně neutrální evolucí a
k jejich fixací přispívá genetický drift
SEKVENACE DNA
Cyklus 1
PCR
Cyklická reakce zahrnující denaturaci
templátu, nasednutí primeru a polymeraci.
• Jednostranně ohraničené řetězce vznikají
pouze z původní DNA templátu.
• Oboustranně ohraničené řetězce jsou samy
sobě templátem, jejich počet roste
geometrickou řadou a po 30 – 40 cyklech
zcela převáží nad ostatní DNA ve vzorku.
Cyklus 2
SANGEROVA METODA - I
PCR Amplifikace
Vložení do plazmidu
Sekvenace
SANGEROVA METODA - II
G
G
G
G
Kapilární elektroforéza
NEXT GENERATION SEQUENCING
Díky masivní paralelizaci (najednou sekvenují milióny templátů )
dokáží v krátkém čase vygenerovat obrovské množství sekvencí.
Cena za 1 bázi podstatně klesá.
454 – EMULZNÍ PCR
454 – DESTIČKA
454 - CHEMIE
454 - VÝSTUP
ION TORRENT
ILLUMINA – VAZBA NA SKLÍČKO
ILLUMINA - AMPLIFIKACE
ILLUMINA - ČTENÍ
ILLUMINA - ČTENÍ
REAL TIME SEQUENCING
•Pacific biosciences
ZÁVĚR
Porovnání některých parametrů technologií sekvenace DNA
Technologie
Délka čtení
Množství na jeden
běh
Sanger
1000 bp
36 Kb
454
700 bp
0,7 Gb
Ion Torrent
400 bp
2 Gb
Illumina
300 bp (125 bp)
15 GB (1000 Gb)
Pacbio RS
8500 bp
375 Mb
Metody jsou různě vhodné k různým účelům. Na „de novo“
sekvenování je nejvhodnější Sanger a 454 a Pacbio RS.
Illumina je lepší na re-sekvenování. Někdy je dobré metody
kombinovat.