6.geni e organizzazione genoma File - Progetto e

Download Report

Transcript 6.geni e organizzazione genoma File - Progetto e

6.  geni  e  organizzazione  del  genoma  

contiene materiale protetto da copyright, ad esclusivo uso personale; non è consentita diffusione ed utilizzo di tipo commerciale

quan1  geni  ci  sono  in  un  ba5erio?       quan1  nella  cellula  di  un  essere  umano?   come  sono  organizza1  i  geni  uno  rispe5o  all’altro?  

1  

Figura  5.1  L’Albero  della  Vita  è  suddiviso  in  tre  raggruppamen1  principali:  Eucario1,  Ba5eri  e  Archeoba5eri.

   

Figura  5.2  Distribuzione  delle  dimensioni  dei  genomi  di  526  specie  di  ba5eri.

    2  

Tabella  5.1  Dimensioni  e  numero  di  geni  di  alcuni  genomi  procario1ci.  

 

Figura  5.3  Distribuzione  della  composizione  in  GC%  dei  genomi  di  878  specie  di  euba5eri  e  66  archeoba5eri.

    3  

Figura  5.5  Gamma  delle  dimensioni  dei  genomi  virali,  procario1ci  ed  eucario1ci.

 

Paradosso  del  valore  C:  

4  

NON  RIPETITIVE  

 

MODERATAMENTE  RIPETITIVE    

 

RIPETITIVE  

5  

La  percentuale  di  DNA  ripe77vo  nei  genomi  dei   singoli  organismi  varia  mol7ssimo:  

  –  i  procario/  contengono  solo  DNA  non  ripe//vo     –  negli  eucario/  inferiori  il  DNA  ripe//vo  è  20%     –  nelle  cellule  animali,

 fino  a  metà  del  DNA  

è  ripe//vo     –  nelle  piante  e  negli  anfibi  il  DNA  ripe//vo  può   rappresentare  fino  all’

80%  del  totale

.  

Come  si  iden1ficano  i  geni:  

Gli  esoni  sono  iden*fica*  in  base  alle  ORF  e  alle  sequenze  fiancheggian*  

In  una  regione  contenente  un  gene  la  cui  

funzione  è  conservata  

in  più  specie  la   sequenza  deve  :    1.  avere  Modulo  di  leMura  (ORF)  aperto          2.  esistere,  in  altre  specie,  una  sequenza  correlata   6  

Il  

numero  minimo  di  geni  

necessari  a  un   organismo  aumenta  con  la  sua  complessità     Nei  baMeri  il  n  dei  geni  è  correlato   alla  grandezza  del  genoma   7  

Qual’è  la  funzione  dei  vari  geni?  

Genoma  Drosophila  

•  2.500  enzimi;   •  ≈750  fa5ori  di  trascrizione;   •  ≈700  proteine  con  funzione  di  trasporto    oppure  canali  transmembrana  per  gli    ioni;   •  ≈700  proteine  con  funzione  di    trasduzione    del  segnale;   contenuto  del  genoma  umano  

•  20-­‐30-­‐40.000  geni  ??   •  ≈60  %  maturato  in  maniera  alterna/va.     •  proteoma  ≈  50.000-­‐60.000     •  1%  esoni     Mediamente   un  gene  ≈  27  Kb        9  esoni   8  

In  che  modo  i  geni  e  le  altre  sequenze  geniche  sono  distribui1  nel  genoma?   Quan1  1pi  di  geni  diversi  esistono?   Numero  di  1pi  di  geni     =    numero  di  geni  unici   +     numero  famiglie  geniche  

9  

Durante  l’evoluzione  si  è  avuta  l’aggiunta  di  geni  con  nuove  funzioni  

10  

Le  proteine  comuni  a  tu_  gli  eucario1  sono  coinvolte  in   funzioni  cellulari  essenziali  (1300  funzioni  comuni)   La  complessità  si  associa  a  funzioni  extracellulari  o  transmembrana  

é   Complessità  eucario/   é   Proteine  transmembrana      ed  extracellulari   11  

Quan1  sono  i  geni  essenziali?  

Nel  lievito  <  del  20  %  

Com’è  possibile?  

    RIDONDANZA:  I  geni  coinvol/  sono  presen/  in  copie  mul/ple  

L’analisi  sistema7ca  della   perdita  di  funzione   condoDa  sui  geni  di   C.elegans  mostra  che   solo  nel  10  %  dei  casi  si   hanno  effeI  rilevabili  sul   feno7po  

12  

Negli  eucario1  geni  sono  espressi  a  livelli  diversi  

  Il  

TRASCRITTOMA

 misura  l’insieme  degli  RNA  presen/  e  la  sua  complessità  dipende  dagli  mRNA       Per  

ABBONDANZA  di  un  mRN

A  si  intende  il  suo  numero  medio  di  molecole  per  cellula    

mRNA  abbondante

:  gruppo  ridoMo  di  specie  di  mRNA  ma  presen/  in  grande  copia    

mRNA  scarso  

(mRNA  complesso):  molte  specie  di  mRNA  con  poche  copie  per  cellula    I  

geni  housekeeping  

sono  quelli  espressi  (in  teoria)  in  ogni  cellula  perchè  forniscono  le   funzioni  di  base  necessarie  al  sostentamento  di  tub  I  /pi  cellulari     I  

luxury  genes  

invece  sono  quelli  che  codificano  per  funzioni  specializzate  e  sinte/zza/  per   lo  più  in  par/colari  /pi  cellulari     Un  

GENE

 è  un  segmento  di  

DNA

 che  codifica  per  un  polipep/de  specifico.     13  

25%

 del  genoma  è  cos/tuito  da  

DNA  genico

,  per  circa  800   Mbp    (30.000  geni  x  27  kbp/gene)  

75%

 del  genoma  cos/tuisce  il  

DNA  extragenico

                     (o  intergenico)    

1,5%  

del  genoma  va  a  formare  il  

DNA  codificante

 per  circa  45   Mbp  (30.000  geni  x  1,5  kbp/gene).    

98.5%  

del  genoma  umano  è  composto  di  sequenze  non   codifican/.       Tali  regioni  di  DNA  

erano

 indicate  con  il  termine  di    

junk  DNA

 o  

DNA  spazzatura

.   14  

I  geni  eucario1ci  sono  interro_   •  Esoni  

sequenze  presen/  nell’RNA  maturo    

•  Introni  

rimossi  dal  trascriMo  primario   15  

Alcune  sequenze  di  DNA   codificano  per  più   proteine  

In  mol/  casi  una  sequenza  di  DNA  codifica  per  una  sola   proteina.  Ci  sono  però  casi  in  cui  la  stessa  sequenza  di   DNA  codifica  per  più  di  una  proteina.  

Geni  sovrappos1    

 

 

quando  un  gene  è  parte  di  un  altro  gene.  

 

•  I  due  prodo>  proteici  sono  omologhi

.  

Geni  sovrappos1  

 

leggendo  la  sequenza  del  DNA  in  due  ≠  moduli  di  leDura  

(

reading  frame

):   16  

 

Splicing  alterna1vo    

 Un  singolo  /po  di  trascriMo   può  essere  giuntato   (spliced)  in  maniera   alterna/va.  

In  alcuni  casi,  un  esone  viene  sos7tuito  con  un  altro   [ex.  varian7  α  e  β  della  troponina  T]  

17  

I  geni  espressi  con  modalità  alterna*ve  sono     il  15%  negli  inse>,       ma  

>  50%  

nell’uomo    

Come  si  sono  evolu1  i  geni  interro_?   2  teorie     Origine  precoce  degli  introni:  

      Introni  sono  sempre  sta/  parte  integrante  del  gene  e  persi,  nei  procario/,  durante   l’evoluzione  

Origine  tardiva  degli  introni:  

  Introni  si  sono  inseri/  all’interno  delle  sequenze  codifican/  in  un  secondo  tempo   18  

G

LI

 

INTRONI

 

OFFRONO

 

DUE

 

VANTAGGI

:  

1)   generare  mol7  trascriI  e  proteine   differen7  a  par7re  da  un  unico  gene.     2)  creare  nuovi  geni  aDraverso  il   rimescolamento  degli  esoni     (exon  shuffling)  

exon  shuffling     mediante   crossing  over  illegi_mo    

19  

Origine  di  nuove  proteine  mediante  exon  shuffling.    

ex.

 faMori  di  coagulazione  del  sangue  

famiglie  geniche

  (L,  pep/de  leader;  g,  dominio  Gla;  EGF,  dominio  EGF-­‐like;  K,  dominio  kringle;  pan,  dominio  Pan;  fnI,  dominio  della   fibronec/na  di  /po  I;  fnII,  dominio  della  fibronec/na  di  /po  II;  P,  dominio  proteasico).  

Famiglia  di  geni:     gruppo  di  geni  che  codificano  per  proteine  correlate  

20  

Famiglia  di  geni

 

GENI  DELLE  GLOBINE:  α  e  β  globine  

-­‐ Ex.  Topo:   -­‐    Introne  2

 α

 globina:  150  bp    TOT  gene:  850  bp        Introne  2  β-­‐globina:  585  bp  TOT  gene:  1382  bp  

NB  variazione  nella  lunghezza  dei  geni  è  molto  +  grande  variazione  lunghezza  mRNA   (α-­‐globina=585  basi,  β-­‐globina=620  basi).  

Famiglia  di  geni

 

forma  ancestrale  comune  delle  proteine  legan7  eme  

separa  2  esoni  che  in  toto  codificano   la  porzione  codificata  dall’esone   centrale  nelle  globine.  

21  

Geni  omologhi  differiscono  nella  stru5ura:  evoluzione  del  gene  dell’  insulina    

Gene  ancestrale  

PSEUDOGENI

 

possiedono  sequenze  correlate  a  geni   funzionan1  ma  non  possono  essere   trado_  in  proteina  funzionante  

22  

PSEUDOGENI

 

non  processa7  

 

il  gene  inabvo  è  duplicato   dal  gene  funzionale  e   con/ene  la  /pica   struMura  in  esoni  ed  introni.  

processa7  

 

privi  di  introni  in  quanto   derivano  dalla   retrotrasposizione  di   mRNA  (retropseudogeni).        

Pseudogeni  non  processa1  :  convenzionali  ed  espressi  

      riconosciu/  a    livello  di  sequenza  da:      a)  presenza  di  

codoni  di  stop  

nella  regione  corrispondente  alla      porzione  codificante  del  gene  funzionale    b)  presenza  di  

mutazioni  

ognuna  della  quali  originerebbe  una    molecola  mutante.   23  

Derivano  da  duplicazione  genica   e  accumulo  progressivo  di   mutazioni

 

Pseudogeni  processa1:  

24  

A

LCUNE

 

DEFINIZIONI

 

Genoma

 è  l’insieme  completo  dei  geni  di  un  organismo.  Pra/camente,  è  

 

definito  dalla  

sequenza  completa  

del  suo  

DNA  

 

TrascriDoma

  è  l’insieme  completo  dei  geni  espressi  in  par/colari  condizioni.   In  pra/ca,  è  definito  dall’

insieme  delle  molecole  di  mRNA

.    

NB  alcuni  geni  sinte7zzano  più  di  una  molecola  di  mRNA, il  trascriDoma  di  un  organismo  è  più  grande  del  suo  genoma     (ci  sono  più  specie  di  mRNA  che  geni)      

 

 

Proteoma

 è  l’insieme  completo  delle  

proteine

.    

 

NB  Le  proteine  possono  funzionare  indipendentemente  come  parte  di  un   complesso  mul7proteico.  Bisogna  conoscere  le  interazioni  proteina-­‐proteina  per   definire  il  numero  totale  di  unità  funzionali  indipenden7.  

25  

ESERCIZIO  

Hai  due  files  sul  computer,  uno  la  sequenza  genomica  completa   dell’E.Coli  (baMerica)  e  l'altro  contenente  la  sequenza  completa   di  Drosophila  melanogaster  (moscerino  della  fruMa).  Un  nuovo   studente   in   laboratorio   ha   faMo   un   errore   e   rinominato   i   due   files  come    "A"  e  "  B”.       TuMavia,  sai  che  il  file  A  è  1125  kilobyte  ,  mentre  il  file  B  è  30,5   megabyte.       Senza  aprire  il  file  ed  esaminare  la  sequenza,  si  può  prevedere   quela  file  è  più  probabile  che  contenga  la  sequenza  genomica   per   E.   coli   e   quale   file   con/ene   la   sequenza   genomica   di   Drosophila  ?       Spiega.  

ESERCIZIO  

Sei  in  laboratorio  ed  hai  due  tubi.  Il  tubo  1  con/ene  il  DNA   che  codifica  il  genoma  di  un  essere  umano  e  il  tubo  2  con/ene   il  DNA  che  codifica  il  genoma  di  un  Archea  che  vive  adiacente   a  delle  sorgen/  idrotermali  dove  la  temperatura  media  è  di   115  °  C.     Un  nuovo  studente  in  laboratorio  perde  l'e/cheMa  sui  tubi.       TuMavia  un  collega  chimico  è  in  grado  grado  di  determinare  i   rappor/  percentuali  molari  di  A  e  T  in  ques/  tubi,  e  trova  che   il  DNA  nella  proveMa  1  è  composto  da  59  %    A  e  T  ,  mentre  nel   DNA  nel  tubo  2  è  composto  da  48  %    A  e  T.     Quale  tubo  con/ene  il  DNA  umano  e  quale  il  tubo  contenente   il  DNA  dell’  Archae  ?       Spiega.   26  

MAPPARE  I  GENOMI  

sequenza  di  una  lunga  molecola  di  DNA  deve  essere   ricostruita  da  una  serie  di  sequenze  piu  corte

.  

DNA frammenti CAATGCCATTA…..

…...GCAGCCAATGC

sequenze sovrapposizione corretta

MAPPARE  I  GENOMI  

Per  la  costruzione  di  una  qualsiasi  mappa  sono  necessari  dei   (ovvero  degli  elemen/  facilmente  riconoscibili)  

marcatori  

 

-­‐  gene

 

-­‐  specifica  sequenza   -­‐  mutazione  pun1forme

.      

N.B.    

Una  

sequenza  ripetuta  

NON

 è  un  buon  marcatore  genomico  

in  quanto  è   riscontrabile  in  pun/  diversi  del  genoma   27  

Metodi  per  o5enere  una  mappa  genica  si  dividono  in  2  categorie   Mappaggio  Fisico    

determinazione  

della  distanza  fisica  tra  i  geni  

(espressa  in  bp)  usando   tecniche  citogene/che  e  molecolari.    

  Mappaggio  Gene1co    

ordinamento  di  geni  sui  cromosomi  in  accordo  con  la  

frequenza  di   ricombinazione  fra  loci  

iden7fica7  aDraverso  marcatori  

(analisi  di  linkage)

  La  

frequenza  di  ricombinazione  

pari  a  0,01  (1%)     è  detta  Unità  di  Mappa  Genetica  (u.m.g.)  o  Centimorgan  (cM).     FR  1%  =  1cM  

  28  

  Sequenze  di  DNA  come  marcatori  

polimorfismo  

esistenza  di  forme  diverse  

varian/  alleliche  

con  frequenza  >  1%  

RFLP  (Restric1on  Fragment  Length  Polymorphism)     SNP  (Single  Nucleo1de  Polymorphism)  

RFLP  

29  

RFLP:  Gel  di  Ele5roforesi  

Direzione   di  Migratione  

Costruzione  di  una  mappa  di  restrizione    

1.    

  il  DNA  viene  digerito  con  due   diversi  enzimi  di  restrizione  

separatamente   2.   doppia  restrizione   3.  

i  frammen/  prodob  vengono  analizza/  

I  frammenti   più  grandi   migrano  più   lentamente   rispetto  a   quelli  più  corti  

30  

Effe_  di  una  delezione  

31