Transcript Arabidopsis

• • • • • • • • •

Molekulární genetika rostlin

Rostlinný genom Chromatin a metylace DNA RNA interference Mimojaderné genetické elementy Transpozóny, viry a viroidy Klasické genetické mapování Transgenoze a reverzní genetika Genomika Transkriptomika a proteomika

Členění rostlinného genomu • jaderný genom =

genom sensu stricto

• plastidy -

plastom

• mitochondrie -

chondriom

Velikost rostlinného genomu

54 Mbp – Cardamine amara 124 852 Mbp - Fritillaria 149 000 Mbp - Paris japonica

-

momentálně největší známý genom

(mnohobuněčný)

http://data.kew.org/cvalues/

C-value

• velikost nereplikovaného genomu v gametě genome size (bp) = (0.910 x 10 9 ) x DNA content (pg) DNA content (pg) = genome size (bp) / (0.910 x 10 9 ) 1 pg = cca 910 Mbp; MW (1 bp) = cca 660 Da

Velikosti rostlinných genomů

10 Mb

Ostreococcus

(jednobuněčná řasa) 54 Mb

Cardamine amara

64 Mb

Genlisea aurea

125 Mb

Arabidopsis

500 Mb

Oryza

5 000 Mb

Hordeum

17 000 Mb

Triticum

84 000 Mb

Fritillaria (největší diploidní)

143 000 Mb

Paris (oktaploidní)

poměr objemu koulí 3000x u krytosemenných rostlin rozdíly ve velikosti téměř 3 000 x u nahosemenných velké genomy často kolem 10 000 Mb rozdíly v počtu genů menší (cca 20 – 200 tis.?)

Velikosti rostlinného genomu

Co lze vyčíst?

- genomy v evoluci rostou (původnější jsou menší genomy) průměrný nárůst velikosti genomu je vyšší u jednoděložných

C-value paradox

• neexistuje korelace mezi komplexitou organismu a velikostí jeho genomu • i genomy fylogeneticky blízkých organismů se často výrazně liší velikostí genomu

Příčiny:

duplikace úseků rostlinné DNA či celých genomů (polyploidizace) množení invazní DNA (transpozóny) ale i redukce velikosti rekombinací a delecemi (př. 2n bavlníky)!

Typy sekvencí v jaderném genomu

(členění není zcela jednoznačné) • Jedinečné sekvence – geny i nekódující DNA • Středně repetitivní DNA – – – -

Tandemové repetice rRNA, tRNA a histonových genů

( jejichž produkty jsou potřeba ve větším množství)

Mnohočetné genové rodiny

(jen při vysokém % identity nukleotidových sekvencí – jinak unikátní)

Pohyblivé genetické elementy (transpozóny)

i vysoké počty repetic (někdy spadají pod vysoce repetitivní) • Sekvence s nízkou komplexitou ( vysoce repetitivní ) – –

Tandemově uspořádané krátké sekvence (SSR) Centromery

(180 bp repeat

Arabidopsis

)

a telomery

(TTTAGGG)n - mohou se chovat jako satelitní DNA (micro-, mini-)

odbočka:

sekvenční komplexita

(~ množství nesené informace) Repetitivní: AAAAAAAAAAAAAAAAAAAAA komplexita 1 (21xA) ATCATCATCATCATCATCATC komplexita 3 (7xATC) (množství informace u kódující sekvence?) Unikátní: ATCGTATCGCGATTTTAACGT komplexita 21 (1xAT…) -

repetitivnost/unikátnost záleží na velikosti posuzovaného „okna“ (= velikosti analyzovaných fragmentů DNA)

Sekvenční komplexita rostlinných genomů

vysoce repetitivní sekvence středně repetitivní sekvence jedinečné sekvence Sekvenční komplexita

Ukázka zastoupení repetitivní DNA u soji a silenky (klastry sekvenčně příbuzných repetic) Silene latifolia

LTR/Gypsy, Copia = rodiny retrotranspozónů clDNA = chloroplastová DNA (částečně i integrována v jádře)

Reasociační kinetika

měření komplexity genomu (analýzy genomů nejen v předsekvenační době) • DNA fragmentována na 300 - 500 bp fragmenty a denaturována • průběh reasociace sledován v čase (chromatografické oddělení ss a ds DNA) • analýzou kinetiky (C o t křivek) lze zjistit podíl jedinečných a opakovaných sekvencí: princip : vzácné sekvence reasociují pomaleji než hojné (nižší pravděpodobnost setkání)

Reasocia ční kinetika

- vliv komplexity DNA

Eukaryotické genomy zpravidla obsahují tři frakce sekvencí lišící se komplexitou vysoce repetitivní = nízká komplexita středně repetitivní unikátní sekvence = vysoká komplexita

Reasocia ční kinetika malých a velkých genomů

jedinečné sekvence středně repetitivní sekvence vysoce repetitivní sekvence (Westhoff: Molecular plant development, 1998)

Rozdíly v uspořádání velkých a malých genomů

velké genomy:

geny přítomné v

„gene-rich“ ostrovech

mezi dlouhými úseky nekódující, zpravidla repetitivní DNA

Rekonstrukce postupné kumulace mobilních elementů v několika lokusech genomu kukuřice Ve sledovaném úseku u prosa nejsou žádné transpozóny (TE), u kukuřice tvoří 60 % délky

Repetitivní sekvence lze detekovat in situ (FISH)

(dnes i unikátní sekvence) Centromerové 180 bp A.th.

telomer. rep. žita (TTTAGGG)n subtelomer. rep. žita 45S rDNA Crocus (Heslop-Harrison, Plant Cell 12:617, 2000)

Sekvenování rostlinných genomů

http://genomevolution.org/wiki/index.php/Sequenced_plant_genomes

Stav k 4/13 – (šedivě méně kompletní genomy)

Sekvenování velkých genomů

-

sekvenování po částech (chromozómech) sekvenování nemetylované DNA (= transkripčně aktivní) sekvenování ESTs

odbočka – definice pojmů: Expressed Sequence Tags (ESTs) krátké sekvenované úseky cDNA (300-600 nt) úseky transkribovaných genů (primárně z mRNA) alternativní zdroj kódujících sekvencí u velkých genomů (rychlé a levné) velmi redundantní, ale současně neúplné

Příprava EST knihovny

- mRNA - RT s oligoT primerem – cDNA štěpení heteroduplexu RNázouH syntéza 2. vlákna cDNA štěpení restriktázou ligace adaptorů klonování sekvenace

Problémy (slabiny) EST knihoven:

(v porovnání s genomovou knihovnou) často jen fragmenty genů (někdy lze poskládat celé) různé hladiny transkriptů (redundance x absence) genová exprese regulována orgánově, časově, vývojově, environmentálně, … chybí regulační sekvence (promotory, introny,...) Výhody: jen transkribované (=aktivní) geny, bez intronů (kombinací s genomovou – identifikace reg. sekvencí), …

Odbočka:

Arabidopsis thaliana

životní cyklus modelové rostliny

1 týden 3 týdny 4 týdny 6 týdnů

Genom

Arabidopsis

: 125 Mbp

geny ESTs TE geny ESTs TE geny ESTs TE = transposible elements geny ESTs TE vysoká hustota nízká hustota geny ESTs TE

Predikce počtu genů v genomu

Genom

Arabidopsis

- statistika

Feature DNA molecule Length (bp) Top arm (bp) Bottom arm (bp) Base composition (%GC) Overall Coding Non-coding Number of genes Gene density (kb per gene ) Average gene Length (bp) Average peptide Length (bp) Exons Number Total length (bp) Average per gene Average size (bp) Number of genes With ESTs (%) Number of ESTs

Chr.1

29,105,111 14,449,213 14,655,898 33.4

44.0

32.4

6,543 4.0

2,078 446

Chr.2

19,646,945 3,607,091 16,039,854 35.5

44.0

32.9

4,036 4.9

1,949 421 Value

Chr.3

23,172,617 13,590,268 9,582,349

Chr.4

17,549,867 3,052,108 14,497,759 35.4

44.3

33.0

5,220 4.5

1,925 424 35.5

44.1

32.8

3,825 4.6

2,138 448

Chr.5

25,53,409 11,132,192 14,803,217 34.5

44.1

32.5

5,874 4.4

1,974 429

SUM

115,409,949 25,498

27,206

protein cod.

+ MIR, …

35,482 8,772,559 5.4

247 60.8

30,522 19,631 5,100,288 4.9

259 56.9

14,989 26,570 6,654,507 5.1

250 59.8

20,732 20,073 5,150,883 5.2

256 61.4

16,605 31,226 7,571,013 5.3

242 61.4

22,885 132,982 33,249,250 105,773

Většina rostlinných genů tvoří genové rodiny

Počet členů rodiny (paralogů)

• genové rodiny jsou často tandemově uspořádané, ale i rozptýlené po genomu • duplikovány jsou celé úseky chromozómů

Arabidopsis

(odráží dávné duplikace) • tandemové repetice z blízkých i vzdálených paralogů (rekombinací)

Homologie - orthology vs. paralogy

Orthologní geny = geny u různých organismů, které jsou přímými potomky genu přítomného u společného předka těchto organismů Species A Gene A” Ancestral Species Gene A Species B Gene A’ Paralogní geny = geny, které se duplikovali u daného druhu Species A Gene A” Gene A’” Ancestral Species Gene A Paralogous genes Species B Gene A’

Mechanismy zmnožení genů (zvýšení počtu paralogů) • tandemové duplikace • transpozice • segmentální duplikace • celogenomové duplikace

Jak se liší geny v genomech různých druhů?

Geny Genové rodiny

Arabidopsis

x

Populus

– značný překryv (cca 1,5 x více paralogů u topolu)

(Arabidopsis

+

Populus)

x

Oryza

– mnoho genů specifických pro jednoděložné

Arabidopsis

je dávný polyploid

(jako zřejmě většina rostlin) Duplikované úseky chromosómů tvoří 60 % genomu (67.9 Mb)

Polyploidie

polyploidizace výrazně zvyšuje plasticitu genomu významná role v evoluci (nejen rostlin) paleopolyploidie neopolyploidie – nedošlo k významné diploidizaci allopolyploidie x autopolyploidie (triploidní most) Výhody polyploidie : vyšší plasticita, neofuncionalizace (hlízkové baktérie, dužnaté plody, ….)

n = x = 4 Zmnožení chromozomálních sad polyploidizace n = x = 4 n = x = 4 n = x = 7 x x 2n = 4x = 16 splynutím neredukovaných gamet „triploidní most“ (neredukované gamety triploida) spontánní zdvojení (endoreduplikace) 2n = 4x = 22 autopolyploidie allopolyploidie Podobná frekvence obou typů u polyploidních rostlinných druhů

Zdvojení chromozómů je nutné pro meiózu (nejsou li druhy blízce příbuzné se stejným počtem chromozómů) species A species B X sterile Genome duplication fertile Přednostní párování homologních chromozómů Mohou párovat i homeologní = příbuzné, ale pocházející od různých rodičů (u vzdálených hybridů)

Příklad allopolyploidních genomů

Brassica sp.

Druh

Brassica rapa B. nigra

Česky

Brukev řepák

B. oleracea

B. zelná

Karyotyp

2n = 2x = 20 2n = 2x = 18

Genom

A B. černohořčice 2n = 2x = 16 B C BB CC BB

Brassica nigra

AA BB

Brassica carinata

allopolyploidi

Brassica juncea B. juncea B. napus

B. sítinovitá B. řepka 2n = 4x = 36 2n = 4x = 38 AB AC CC AA CC AA

B. carinata

B. kýlnatá 2n = 4x = 34 BC

Brassica olarecea Brassica napus Brassica rapa

Polyploidizace v evoluci rostlin

Datování celogenomových duplikací dle počtu synonymních mutací na synonymní místo - Ks Ks=3/2,66 Phe Leu Met Val UUU CUA AUG GUU UUC UUG AUG GUU 0 0 1/3 1/3 0 1 0 0 0 0 0 1 Počet genů

Porovnání dvojic paralogních genů

Peaky indikují celogenomové duplikace Ks Fawcet

et al.

2013

Polyploidizace v evoluci rostlin • mnoho druhů neopolyploidních, zřejmě všechny paleopolyploidní • aneuploidní varianty - po allopolyploidizaci časté, př. pšenice hexaploid : stabilní linie s chybějícím raménkem chromozómu • většina rostlin (všechny semenné) opakovaně v evoluci polyploidních: Proč?

Jaké jsou výhody?

Osudy zmnožených genů se liší

– teorie genové rovnováhy (gene dosage balance) • geny jejichž produkty přímo interagují (signální dráhy, podjednotky komplexů,.. tzv. „connected genes“) se snáze udrží po celogenomových duplikacích ztráta či dílčí zmnožení jedné z komponent vyvolá genovou nerovnováhu (v hladinách produktů!), která snižuje fitness celý zmnožený komplex pak může být funkčně specializován a zvyšovat komplexitu organismu (neofunctionalization, subfunctionalization) sekundární funkce zřejmě již přítomna u předka, duplikace umožní adaptivní evoluci obou funkcí bez selekčních zábran (nutnosti zachování primární funkce) Escape from adaptive conflict - EAC model •

u ostatních

dílčím zmnožení genů je tomu naopak – tyto geny se snáze ztratí po celogenomových duplikacích a lépe se udrží po případném

- po celogenomové duplikaci se postupně velká část duplikovaných genů ztrácí (viz teorie genové rovnováhy) - ztráta často nebývá takto (↑) rovnoměrná na obou kopiích - zřejmě často epigenetické označení jedné z kopií (metylace - řepka) - přednostní ztráty genů a mutageneze u metylované kopie - ale někdy probíhá i genová konverze a homogenizace - (oprava dle jiné kopie genu!)

de novo

kříženci (~ řepka olejka) – přestavby přednostně v

homeologních

úsecích chromozómů, ale bez preference rodičovského genomu (homeologní = homologní, přítomné v jednom genomu, ale původem od různých rodičů)

Změny bezprostředně po vzniku allopolyploida:

- změny v metylaci DNA - ztráty částí či celých chromozómů (aneuploidie – problémy s fertilitou) - často dochází k aktivaci TE - exprese homeologních genů zpravidla není v hybridu aditivní - redukce může být asymetrická (vzhledem k rodičům) - transkriptom bývá celkově redukován více než genom - orgánové rozrůznění exprese (vzhledem k rodičovskému původu) - nová místa exprese - nová regulace - „divergent resolution“ - speciace (ztráty různých kopií duplikovaných genů u různých jedinců - letalita v F2 generaci (1/16) u esenciálních g.

– může být základem reprodukční bariéry, sympatr. sp.

Tvorba haploidních rostlin

přeprogramováním vývoje buněk samčího či samičího gametofytu

in vitro

– netvoří se gamety, ale dochází k procesu analogickému embryogenezi (ale ne ze zygoty) -

-

zpravidla z prašníkových kultur (nezralých mikrospor) = androgeneze možno i ze samičího gametofytu =

gynogeneze

haploidní rostliny jsou sterilní spontánně či kolchicinem lze navodit endoreduplikaci (replikaci bez mitózy) - vznikají

dihaploidní

kompletně homozygotní jedinci

androgeneze (pylová embryogeneze) u řepky

Počet chromozómů – význam?

jiné vazbové skupiny (možná výhoda?)

(rekombinovatelnost genů)

omezení fertility hybridů, …

• Velikosti chromozómů u rostlin 2,4 Mb 30 Mb 800 Mb

Genlisea Arabidopsis Triticum

Počty chromozómů

• Extrémy: – –

Haplopappus gracilis

: 2n = 4

Sedum suaveolens

: 2n = cca 640 • Vnitrorodové rozdíly:

Luzula sp

. (bika): – 2n = 6 až 66 – holocentrické chromozómy – průměrná velikost chromozómu se mezi druhy liší až 60x

L. pilosa L. elegans

(Cullis, 2004)

B chromozómy u rostlin

nepárové chromozómy u některých druhů (asi 1500, např. kukuřice) nenesou zpravidla geny kódující proteiny zpravidla negativně ovlivňují fitness rostliny (fertilitu) nejsou přítomny u všech jedinců v populaci parazitická DNA (?)

Počet chromozómů a velikost genomu

1n chromosome number

Genomy rostlin se podobají

(i přes rozdílné počty chromozómů) Paterson et al., Plant Cell 12: 1523-1539, 2000

Termín „syntenie“ se občas mylně užívá pro označení kolinearity

Syntenie = přítomnost orthologních lokusů u dvou druhů na stejném chromozómu Species A A’ C’ B’ Ancestral Species A B C Species B C” B” A” Kolinearita = skupina lokusů je u dvou druhů přítomna ve stejném pořadí Species A A’ B’ C’ Ancestral Species A B C Species B A” B” C”

Makro-kolinearita vs. mikro-kolinearita

t A u B v w x C A’ t u B’ v w x C’ Makro- i mikrokolinearita: In the 2 organisms being compared on the left, not only are the genes A, B, and C syntenic, but all the genes in between are as well.

Zachována pouze makrokolinearita: In the 2 organisms being compared on the right, although genes A, B, and C appear syntenic, other genes in between are not. t A u B v w x C A’ k n B’ g o q C’ • kolinearita (daná společným původem) se v průběhu evoluce postupně vytrácí

Mikro-kolinearita v NOD lokusu mezi vzdálenými druhy bez zřejmé makro-kolinearity At – Arabidopsis, Pt – Populus, Lj – Lotus, Mt – Medicago, Os - Oryza

Studium kolinearity

Významné pro: analýzy původu genů a fylogeneze velkých skupin analýzy historických změn velikosti a uspořádání genomů (polyploidizace) identifikace genů odolných vůči eliminaci po duplikaci (zvyšování komplexity, plasticity) hledání konkrétních genů v genomech nesekvenovaných rostlin rekonstrukce podoby ancestrálních genomů -

Příčiny odlišností příbuzných genomů:

přeskupování mobilními elementy a rekombinací inverze, delece, duplikace, ….

eliminace a mutageneze duplikovaných sekvencí

Porovnání genetické mapy rajčete a lilku

Kolineární úseky u různých druhů se liší především zastoupením repetitivní DNA

Kolinearita (syntenie) genomů lipnicovitých

Shrnutí

• současnou podobu rostlinného genomu utvářejí opakované cykly celkových (dílčích) duplikací a následných redukcí a modifikací (funkční diverzifikací duplikovaného) → zvyšování komplexity a plasticity • není genomů bez redundance • rostlinné genomy jsou dodnes velice dynamické • obrovský podíl tvoří repetitivní DNA

Allopolyploidní tabáky – změny v obsahu DNA