Transcript 9. lekcija

Filoģenēze. Klāsteru un kladistiskās metodes filoģenētisko koku rekonstruēšanā

N.p.k. 1.

2.

3.

4.

5.

6.

7.

8 9 10.

11.

12.

13.

14.

15.

Lekciju saraksts

Datums Lekcijas temats 15.09.2011

Ievadlekcija. Prasības kursa apgūšanai un literatūras avoti. Bioinformātikas jēdziens. Kas ir bioinformātika un kāpēc tā biologiem vajadzīga? Bioloģija, statistika, informācijas tehnoloģijas un programmēšana kā bioinformātikas pamatelementi 22.09.2011 Bioloģiskās informācijas veidi un apjoms. Genomu organizācija. Modernās genomu analīzes metodes 29.09.2011 Genomu evolūcija. Salīdzinošā genomika 06.10.2011 Bioloģiskās informācijas datubāzes. Informācijas meklēšanas un iegūšanas sistēmas 13.10.2011 Dažādu bioloģiskās informācijas datubāžu izmantošanas piemēri 20.10.2011

Nukleīnskābju un proteīnu sekvenču līdzības pamatprincipi. Nukleīnskābju un proteīnu sekvenču pāru salīdzināšana. BLAST veidi 27.10.2011

03.11.2011

10.11.2011

Nukleīnskābju un proteīnu sekvenču līdzības pamatprincipi. Nukleīnskābju un proteīnu sekvenču pāru salīdzināšana. BLAST veidi Nukleīnskābju un proteīnu daudzkārtējās salīdzināšanas metodes, to priekšrocības un pielietošanas nosacījumi. Datorprogrammas nukleīnskābju un proteīnu sekvenču daudzkārtējai salīdzināšanai Filoģenētika. Klāsteru un kladistiskās metodes filoģenētisko koku rekonstruēšanā Datorprogrammas nukleīnskābju un proteīnu sekvenču filoģenētiskajai analīzei 17.11.2011

24.11.2011

Seminārs un uzdevumu pārbaude par tēmām, kas saistītas ar informācijas meklēšanu datu bāzēs un sekvenču homoloģijas meklēšanu Makromolekulu telpiskā struktūra un tās paredzēšana. DNS topoloģija. Proteīnu struktūras paredzēšana, modelēšana un pielietojums farmakoloģijā 01.12.2011

Genoma ekspresijas analīze. Transkriptomika. DNS čipi genomu polimorfisma analīzē. Gēnu ekspresijas ģenētika 08.12.2011 Proteomika un sistēmu bioloģija. Tīklveida struktūras kā bioloģisko sistēmu dabiska sastāvdaļa.

Seminārs un uzdevumu pārbaude par tēmām, kas saistītas ar filoģenētisko analīzi un proteīnu 15.12.2011

sekundārās struktūras paredzēšanu. Bioinformātikas perspektīvas. Bioinformātika kā priekšnosacījums modernās bioloģijas apgūšanai katedra 2 22.12.2011 Eksāmens

2011. gada 10. novembris katedra 3

Meredith et al. (2011) Science, 334: 521 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 4

Filoģenētiskā analīze

Pamatā pieņēmums, ka dzīvajiem organismiem ir kopīga izcelsme • • • Filoģenētiskās analīzes uzdevums – rekonstruēt taksonomisko vienību savstarpējo radniecību Homoloģija Līdzība Klasteri 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 5

Dendrogrammas

• • • • Dendrogrammas topoloģija – norāda taksonomisko vienību radniecību Zaru garumi – norāda evolucionāro attālumu vai laiku kopš taksonomiskās vienības nodalījās. Dendrogrammas mezgli (node) – norāda kopējo priekšteci Molekulārais pulkstenis – atkarīgs no mutāciju ātruma. To kalibrē izmantojot fosīliju datus 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 6

Filoģenētisko koku veidošana

• • Dendrogrammas var veidot (rekonstruēt taksonomisko vienību evolūciju) izmantojot dažādas pazīmes – morfoloģiskas, valodnieciskas, bioķīmiskas, molekulārās sekvences Problēmas būtība ir tāda, ka evolūcijas rekonstruēšanai mums jāiztiek ar novērojumiem par mūsdienu organismiem (atsevišķi izņēmumu – fosīlā DNS) 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 7

Evolūcijas trīs ‘ziloņi’

• • • Iedzimtība Mainība (Dabiskā) izlase 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 8

Molekulārā evolūcija

• • • • • Viens no pretrunīgākajiem filoģenēzes jautājumiem - vai iespējams izmantot molekulāros datus evolūcijas ātruma noteikšanai Mutāciju ātrums, neitrālas, kaitīgas un izdevīgas mutācijas Dažādās līnijās evolūcijas ātrums var atšķirties Molekulārās evolūcijas neitrālā teorija (Neutral theory of molecular evolution) – Motoo Kimura Izlase darbojas uz organismiem un populācijām, bet mutācijas DNS un proteīnu molekulās ir tās, kas piešķir organismam priekšrocības, tādējādi izlase netieši iedarbojas uz DNS molekulu 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 9

Molekulārās evolūcijas neitrālā teorija

Apgalvo, ka lielākā daļa mutāciju ir selektīvi neitrālas vai gandrīz neitrālas un to frekvences populācijā ir atkarīgas no stohastiskiem procesiem, tai skaitā ģenētiskā dreifa 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 10

Molekulārās evolūcijas neitrālā teorija

• • • Ja lielākā daļa mutāciju ir neitrālas vai gandrīz neitrālas, tad to nostiprināšanās populācijā notiks ar aptuveni vienādu ātrumu -> tās var izmantot kā molekulāro pulksteni Populācijā var būt augsts polimorfisma līmenis, ja mutācijas ir gandrīz neitrālas Neitrāla mutācija nenozīmē, ka tā neietekmē gēna funkciju, bet gan to, ka dabiskās izlases darbība uz organismiem ar šo mutāciju ir vāja 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 11

Filoģenēzes rekonstrukcija

• Divi galvenie filoģenētisko koku rekonstrukcijas veidi: 1. fenētiskā (klasteru) pieeja – netiek izdarīti pieņēmumi par taksonomisko vienību evolūciju un vēsturi. Nosaka attālumu starp sugām un konstruē koku izmantojot hierahisko klasterēšanu 2. kladistiskā pieeja – novērtē iespējamos evolūcijas ceļus, nosaka priekšteču īpašības, piemēram, DNS secības katrā mezglā un izvēlas optimālo koku balstoties uz izvēlēto evolūcijas modeli 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 12

Klasteru pieeja Kladistiskā pieeja 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 13

Klasteru metodes filoģenēzē

• • Nosaka līdzības pakāpi starp visiem taksonomisko vienību pāriem, piemēram, visiem DNS sekvenču pāriem no daudzkārtēja sekvenču salīdzinājuma Atrod visradniecīgāko pāri un tam pamatā izveido pirmo mezglu (kopējo priekšteci), tad turpina salīdzinājumu ar nākamo līdzīgāko vienību u.t.t. ATCC ATGC TTCG TCGG 2011. gada 10. novembris

ATCC ATGC TTCG TCGG ATCC ATGC TTCG TCGG

0 1 0 2 3 0 4 3 2 0 Mikrobioloģijas un biotehnoloģijas katedra ATCC ATGC 14

ATCC ATGC TTCG TCGG ATCC ATGC TTCG TCGG

0 1 0 2 3 0 2 0 4 3

(ATCC, ATGC) TTCG TCGG (ATCC, ATGC)

0

TTCG TCGG

1/2(2+3)=2.5 1/2(4+3)=3.5

0 2 0 TTCG TCGG 2011. gada 10. novembris

0.5

ATCC

1.5

0.5

ATGC Mikrobioloģijas un biotehnoloģijas katedra

1.5

1

TTCG

1

TCGG 15

Klasteru metodes

• • UPGMA (Unweighted Pair Group Method with Arithmetic mean) – zaru garumi ir līdzvērtīgi pusei no attāluma starp taksonomiskajām vienībām NJ (Neighbour Joining) – UPGMA modifikācija, kas ņem vērā nevienādu evolūcijas ātrumu dažādos koka zaros NJ tiek pielietota, piemēram, Clustal programmā, lai izveidotu koku pēc kura vadoties veido daudzkārtēju sekvenču salīdzinājumu 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 16

Kladistiskās metodes filoģenētiskajā analīzē

• • • Izvērtē taksonomisko vienību iespējamo radniecību izvēloties optimālo filoģenētiskos koku balstoties uz noteiktu evolūcijas modeli Populārākās kladistiskās metodes ir maksimālās taupības (maximum parsimony) un maksimālās varbūtības (maximum likelihood) metodes (saīsināti MP un ML) Atšķirībā no fenētiskajām metodēm balstās uz DNS un aminoskābju sekvenču datiem 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 17

MP metode

TTCC

T->A

ATCC ATCC

C->G

ATGC

C->G

TTCG TTCG

T->C

TCCG TTCC

T->A C->G

ATGC ATCC

C->G A->T

TTCG 2011. gada 10. novembris

G->C T->A

Mikrobioloģijas un biotehnoloģijas katedra

C->G

TTCG ATCC

T->C

TCCG 18

Atšķirīgs evolūcijas ātrums dažādos dendrogrammas zaros

A B C D A B 0 3 0 C D 3 3 2 0 2 1 0 A B C D A B 0 3 0 C D 3 20 2 20 0 20 0

A B C D

2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra

A B C D

19

MP metode

• • • • • Optimālais filoģenētiskais koks ir tas, kura rekonstruēšanai nepieciešams vismazāk mutāciju MP metode rekonstruē ne tikai koka topoloģiju, bet arī priekšteču sekvences katrā mezglā Zaru garums atbilst attālumam starp taksonomiskajām vienībām Iespējama situācija, kad pastāv vairāki vienādi varbūtīgi filoģenētiskie koki Molekulāro sekvenču salīdzinājumā pastāv informatīvi (parsimony informative) un neinformatīvi (parsimony non- informative) saiti (nukleotīdu vai aminoskābju pozīcijas) 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 20

*

C (cilvēks) C (šimpanze) C (gorilla) T (orangutans) T (gibons) 2011. gada 10. novembris C (cilvēks) C (šimpanze) C (gorilla) C (orangutans) T (gibons) Mikrobioloģijas un biotehnoloģijas katedra 21

ML metode

• • • ML ne tikai saskaita mutācijas, kas nepieciešamas koka rekonstrukcijai, bet arī nosaka šo mutāciju kvantitatīvo varbūtību ML metode rekonstruē ne tikai koka topoloģiju, bet arī priekšteču sekvences katrā mezglā Zaru garums atbilst evolucionārajam attālumam starp taksonomiskajām vienībām 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 22

Filoģenētisko koku novērtējums

• • • • Vai dažādi gēni (molekulārie marķieri) ļauj rekonstruēt līdzīgus filoģenētiskos kokus? Vai mums vispār ir svarīgs filoģenētiskais koks kā evolūcijas procesa reprezentācija? Varbūt mūs vienkārši interesē cik radniecīgas ir molekulārās sekvences no dažādām organismu grupām Bieži vien koka forma neļauj adekvāti atspoguļot radniecības attiecības starp taksonomiskajām vienībām. Piemēram, mūsdienu labības šķirņes ir veidotas no neliela skaita vecākaugu krustojot tos dažādās kombinācijās 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 23

Filoģenētisko koku novērtējums

• Statistiskie testi filoģenētisko koku novērtējumam Jackknifing – nejauši izvēlēta sākotnējo datu daļa tiek analizēta līdzīgā veidā. Ja daļa datu dod līdzīgu koku kā viss datu kopums, filoģenētiskajam kokam var ticēt Bootstrapping – sākotnējie dati tiek randomizēti un no tiem tiek izveidots jauns līdzīga izmēra datu fails, ko analizē ar to pašu metodi. Parasti analizē vismaz 100 randomizētas datu kopas katrai izveidojot savu filoģenētisko koku. No tiem izveido konsensus koku 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 24

Filoģenētiskās analīzes programmas

http://evolution.genetics.washington.edu/phylip/software.html

2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 25

Filoģenētiskās analīzes programmas

• • • PHYLIP http://evolution.gs.washington.edu/phylip.html

PHYLIP interneta variants http://bioweb2.pasteur.fr/gensoft/phylogeny/pa rsimony.html

Felsenstein, J. (1989) PHYLIP - Phylogeny Inference Package (Version 3.2). Cladistics, 5: 164-166 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 26

Filoģenētisko koku apskates programmas

2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 27

Filoģenētisko koku apskates programmas

TreeView http://taxonomy.zoology.gla.ac.uk/rod/treeview.hml

 Page RDM (1996) TREEVIEW: An application to display phylogenetic trees on personal computers. Computer Applications in the Biosciences, 12: 357 358 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 28

Alfa globīnu gēnu filoģenēze

• • • Cilvēka un dzīvnieku hemoglobīnu veido divas alfa un divas beta globīna subvienības ( a 2 b 2 ) Filoģenētiskai analīzei nepieciešams sekvenču daudzkārtējs salīdzinājums Salīdzināsim MP un ML metodes filoģenēzes rekonstrukcijā 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 29

2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 30

2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 31

2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 32

2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 33

PROTPARS

• Rezultāti parādās 2 failos: outfile – satur informāciju par filoģenētisko analīzi outtree – satur filoģenētisko koku (šajā gadījumā 3 dažādus vienādi parsimoniskus kokus) 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 34

2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 35

2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 36

PROML

• ML programma aminoskābju sekvenču analīzei 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 37

2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 38

2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 39

2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 40

Bootstrapping

• • • • Izmanto to pašu alfa globīnu aminoskābju sekvenču salīdzinājumu Izmanto programmu seqboot no PHYLIP paketes, lai veiktu bootstrapping izveidojot 100 datu kopas Analizē 100 datu kopas ar protpars programmu, iegūstot filoģenētiskos kokus visām 100 datu kopām Izmanto programmu consense, lai iegūtu konsensus filoģenētisko koku 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 41

2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 3 1 2 42

2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 43

2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 44

2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 45

2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 46

Filoģenētiskās analīzes programmas

• • • MEGA (Molecular Evolutionary Genetics Analysis) (http://www.megasoftware.net/) Tamura K, Dudley J, Nei M, Kumar S (2007) MEGA4: Molecular Evolutionary Genetics Analysis (MEGA) software version 4.0. Molecular Biology and Evolution 24: 1596-1599 Kumar S, Tamura K, Nei M (2004) MEGA3: Integrated Software for Molecular Evolutionary Genetics Analysis and Sequence Alignment Briefings in Bioinformatics 5:150-163 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 47

2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 48

Seminārs 17.11.2011.

Seminārs

• • • Uzdevumu risinājumi - prezentācija, kurā parādās risinājums soli pa solim Diskusija par metodēm un iegūtajiem rezultātiem Konsultācija - ? 2011. gada 10. novembris Mikrobioloģijas un biotehnoloģijas katedra 50