Transcript 6.geni e organizzazione genoma File - Progetto e
6. geni e organizzazione del genoma
contiene materiale protetto da copyright, ad esclusivo uso personale; non è consentita diffusione ed utilizzo di tipo commerciale
quan1 geni ci sono in un ba5erio? quan1 nella cellula di un essere umano? come sono organizza1 i geni uno rispe5o all’altro?
1
Figura 5.1 L’Albero della Vita è suddiviso in tre raggruppamen1 principali: Eucario1, Ba5eri e Archeoba5eri.
Figura 5.2 Distribuzione delle dimensioni dei genomi di 526 specie di ba5eri.
2
Tabella 5.1 Dimensioni e numero di geni di alcuni genomi procario1ci.
Figura 5.3 Distribuzione della composizione in GC% dei genomi di 878 specie di euba5eri e 66 archeoba5eri.
3
Figura 5.5 Gamma delle dimensioni dei genomi virali, procario1ci ed eucario1ci.
Paradosso del valore C:
4
NON RIPETITIVE
MODERATAMENTE RIPETITIVE
RIPETITIVE
5
La percentuale di DNA ripe77vo nei genomi dei singoli organismi varia mol7ssimo:
– i procario/ contengono solo DNA non ripe//vo – negli eucario/ inferiori il DNA ripe//vo è 20% – nelle cellule animali,
fino a metà del DNA
è ripe//vo – nelle piante e negli anfibi il DNA ripe//vo può rappresentare fino all’
80% del totale
.
Come si iden1ficano i geni:
Gli esoni sono iden*fica* in base alle ORF e alle sequenze fiancheggian*
In una regione contenente un gene la cui
funzione è conservata
in più specie la sequenza deve : 1. avere Modulo di leMura (ORF) aperto 2. esistere, in altre specie, una sequenza correlata 6
Il
numero minimo di geni
necessari a un organismo aumenta con la sua complessità Nei baMeri il n dei geni è correlato alla grandezza del genoma 7
Qual’è la funzione dei vari geni?
Genoma Drosophila
• 2.500 enzimi; • ≈750 fa5ori di trascrizione; • ≈700 proteine con funzione di trasporto oppure canali transmembrana per gli ioni; • ≈700 proteine con funzione di trasduzione del segnale; contenuto del genoma umano
• 20-‐30-‐40.000 geni ?? • ≈60 % maturato in maniera alterna/va. • proteoma ≈ 50.000-‐60.000 • 1% esoni Mediamente un gene ≈ 27 Kb 9 esoni 8
In che modo i geni e le altre sequenze geniche sono distribui1 nel genoma? Quan1 1pi di geni diversi esistono? Numero di 1pi di geni = numero di geni unici + numero famiglie geniche
9
Durante l’evoluzione si è avuta l’aggiunta di geni con nuove funzioni
10
Le proteine comuni a tu_ gli eucario1 sono coinvolte in funzioni cellulari essenziali (1300 funzioni comuni) La complessità si associa a funzioni extracellulari o transmembrana
é Complessità eucario/ é Proteine transmembrana ed extracellulari 11
Quan1 sono i geni essenziali?
Nel lievito < del 20 %
Com’è possibile?
RIDONDANZA: I geni coinvol/ sono presen/ in copie mul/ple
L’analisi sistema7ca della perdita di funzione condoDa sui geni di C.elegans mostra che solo nel 10 % dei casi si hanno effeI rilevabili sul feno7po
12
Negli eucario1 geni sono espressi a livelli diversi
Il
TRASCRITTOMA
misura l’insieme degli RNA presen/ e la sua complessità dipende dagli mRNA Per
ABBONDANZA di un mRN
A si intende il suo numero medio di molecole per cellula
mRNA abbondante
: gruppo ridoMo di specie di mRNA ma presen/ in grande copia
mRNA scarso
(mRNA complesso): molte specie di mRNA con poche copie per cellula I
geni housekeeping
sono quelli espressi (in teoria) in ogni cellula perchè forniscono le funzioni di base necessarie al sostentamento di tub I /pi cellulari I
luxury genes
invece sono quelli che codificano per funzioni specializzate e sinte/zza/ per lo più in par/colari /pi cellulari Un
GENE
è un segmento di
DNA
che codifica per un polipep/de specifico. 13
25%
del genoma è cos/tuito da
DNA genico
, per circa 800 Mbp (30.000 geni x 27 kbp/gene)
75%
del genoma cos/tuisce il
DNA extragenico
(o intergenico)
1,5%
del genoma va a formare il
DNA codificante
per circa 45 Mbp (30.000 geni x 1,5 kbp/gene).
98.5%
del genoma umano è composto di sequenze non codifican/. Tali regioni di DNA
erano
indicate con il termine di
junk DNA
o
DNA spazzatura
. 14
I geni eucario1ci sono interro_ • Esoni
sequenze presen/ nell’RNA maturo
• Introni
rimossi dal trascriMo primario 15
Alcune sequenze di DNA codificano per più proteine
In mol/ casi una sequenza di DNA codifica per una sola proteina. Ci sono però casi in cui la stessa sequenza di DNA codifica per più di una proteina.
Geni sovrappos1
quando un gene è parte di un altro gene.
• I due prodo> proteici sono omologhi
.
Geni sovrappos1
leggendo la sequenza del DNA in due ≠ moduli di leDura
(
reading frame
): 16
Splicing alterna1vo
Un singolo /po di trascriMo può essere giuntato (spliced) in maniera alterna/va.
In alcuni casi, un esone viene sos7tuito con un altro [ex. varian7 α e β della troponina T]
17
I geni espressi con modalità alterna*ve sono il 15% negli inse>, ma
> 50%
nell’uomo
Come si sono evolu1 i geni interro_? 2 teorie Origine precoce degli introni:
Introni sono sempre sta/ parte integrante del gene e persi, nei procario/, durante l’evoluzione
Origine tardiva degli introni:
Introni si sono inseri/ all’interno delle sequenze codifican/ in un secondo tempo 18
G
LI
INTRONI
OFFRONO
DUE
VANTAGGI
:
1) generare mol7 trascriI e proteine differen7 a par7re da un unico gene. 2) creare nuovi geni aDraverso il rimescolamento degli esoni (exon shuffling)
exon shuffling mediante crossing over illegi_mo
19
Origine di nuove proteine mediante exon shuffling.
ex.
faMori di coagulazione del sangue
famiglie geniche
(L, pep/de leader; g, dominio Gla; EGF, dominio EGF-‐like; K, dominio kringle; pan, dominio Pan; fnI, dominio della fibronec/na di /po I; fnII, dominio della fibronec/na di /po II; P, dominio proteasico).
Famiglia di geni: gruppo di geni che codificano per proteine correlate
20
Famiglia di geni
GENI DELLE GLOBINE: α e β globine
-‐ Ex. Topo: -‐ Introne 2
α
globina: 150 bp TOT gene: 850 bp Introne 2 β-‐globina: 585 bp TOT gene: 1382 bp
NB variazione nella lunghezza dei geni è molto + grande variazione lunghezza mRNA (α-‐globina=585 basi, β-‐globina=620 basi).
Famiglia di geni
forma ancestrale comune delle proteine legan7 eme
separa 2 esoni che in toto codificano la porzione codificata dall’esone centrale nelle globine.
21
Geni omologhi differiscono nella stru5ura: evoluzione del gene dell’ insulina
Gene ancestrale
PSEUDOGENI
possiedono sequenze correlate a geni funzionan1 ma non possono essere trado_ in proteina funzionante
22
PSEUDOGENI
non processa7
il gene inabvo è duplicato dal gene funzionale e con/ene la /pica struMura in esoni ed introni.
processa7
privi di introni in quanto derivano dalla retrotrasposizione di mRNA (retropseudogeni).
Pseudogeni non processa1 : convenzionali ed espressi
riconosciu/ a livello di sequenza da: a) presenza di
codoni di stop
nella regione corrispondente alla porzione codificante del gene funzionale b) presenza di
mutazioni
ognuna della quali originerebbe una molecola mutante. 23
Derivano da duplicazione genica e accumulo progressivo di mutazioni
Pseudogeni processa1:
24
A
LCUNE
DEFINIZIONI
Genoma
è l’insieme completo dei geni di un organismo. Pra/camente, è
definito dalla
sequenza completa
del suo
DNA
TrascriDoma
è l’insieme completo dei geni espressi in par/colari condizioni. In pra/ca, è definito dall’
insieme delle molecole di mRNA
.
NB alcuni geni sinte7zzano più di una molecola di mRNA, il trascriDoma di un organismo è più grande del suo genoma (ci sono più specie di mRNA che geni)
Proteoma
è l’insieme completo delle
proteine
.
NB Le proteine possono funzionare indipendentemente come parte di un complesso mul7proteico. Bisogna conoscere le interazioni proteina-‐proteina per definire il numero totale di unità funzionali indipenden7.
25
ESERCIZIO
Hai due files sul computer, uno la sequenza genomica completa dell’E.Coli (baMerica) e l'altro contenente la sequenza completa di Drosophila melanogaster (moscerino della fruMa). Un nuovo studente in laboratorio ha faMo un errore e rinominato i due files come "A" e " B”. TuMavia, sai che il file A è 1125 kilobyte , mentre il file B è 30,5 megabyte. Senza aprire il file ed esaminare la sequenza, si può prevedere quela file è più probabile che contenga la sequenza genomica per E. coli e quale file con/ene la sequenza genomica di Drosophila ? Spiega.
ESERCIZIO
Sei in laboratorio ed hai due tubi. Il tubo 1 con/ene il DNA che codifica il genoma di un essere umano e il tubo 2 con/ene il DNA che codifica il genoma di un Archea che vive adiacente a delle sorgen/ idrotermali dove la temperatura media è di 115 ° C. Un nuovo studente in laboratorio perde l'e/cheMa sui tubi. TuMavia un collega chimico è in grado grado di determinare i rappor/ percentuali molari di A e T in ques/ tubi, e trova che il DNA nella proveMa 1 è composto da 59 % A e T , mentre nel DNA nel tubo 2 è composto da 48 % A e T. Quale tubo con/ene il DNA umano e quale il tubo contenente il DNA dell’ Archae ? Spiega. 26
MAPPARE I GENOMI
sequenza di una lunga molecola di DNA deve essere ricostruita da una serie di sequenze piu corte
.
DNA frammenti CAATGCCATTA…..
…...GCAGCCAATGC
sequenze sovrapposizione corretta
MAPPARE I GENOMI
Per la costruzione di una qualsiasi mappa sono necessari dei (ovvero degli elemen/ facilmente riconoscibili)
marcatori
-‐ gene
-‐ specifica sequenza -‐ mutazione pun1forme
.
N.B.
Una
sequenza ripetuta
NON
è un buon marcatore genomico
in quanto è riscontrabile in pun/ diversi del genoma 27
Metodi per o5enere una mappa genica si dividono in 2 categorie Mappaggio Fisico
determinazione
della distanza fisica tra i geni
(espressa in bp) usando tecniche citogene/che e molecolari.
Mappaggio Gene1co
ordinamento di geni sui cromosomi in accordo con la
frequenza di ricombinazione fra loci
iden7fica7 aDraverso marcatori
(analisi di linkage)
La
frequenza di ricombinazione
pari a 0,01 (1%) è detta Unità di Mappa Genetica (u.m.g.) o Centimorgan (cM). FR 1% = 1cM
28
Sequenze di DNA come marcatori
polimorfismo
esistenza di forme diverse
varian/ alleliche
con frequenza > 1%
RFLP (Restric1on Fragment Length Polymorphism) SNP (Single Nucleo1de Polymorphism)
RFLP
29
RFLP: Gel di Ele5roforesi
Direzione di Migratione
Costruzione di una mappa di restrizione
1.
il DNA viene digerito con due diversi enzimi di restrizione
separatamente 2. doppia restrizione 3.
i frammen/ prodob vengono analizza/
I frammenti più grandi migrano più lentamente rispetto a quelli più corti
30
Effe_ di una delezione
31