Transcript Terapia genica
Terapia genica
• Inibizione mirata dell’espressione genica per bloccare un processo patologico • Distruzione mirata geneticamente di specifiche cellule • Supplementazione: fornire una copia funzionante del gene difettoso • Sostituzione: sostituire il gene mutante con una copia funzionante in situ
Supplementazione: fornire una copia funzionante del gene difettoso • ex vivo
: trasferire i geni clonati in cellule in coltura, selezionare le cellule, espanderle in vitro e poi immetterle nel paziente
• in vivo
: trasferire direttamente i geni nel tessuto bersaglio o in circolo, facendo in modo che poi arrivi al tessuto bersaglio
ex vivo
Vettori non virali per la terapia genica
• Liposomi: vescicole sintetiche che si formano quando alcuni lipidi sono in soluzione acquosa. Possono essere anionici e circondano il DNA o cationici e legano il DNA all’esterno • iniezione diretta di plasmidi o bombardamento del tessuto del DNA attaccato a pellets di metallo (biolistico). Il trasferimento è molto basso e il DNA non è integrato.
Liposomi
Virus per la terapia genica
• Retrovirus
: sono ad RNA e sintetizzano cDNA che integrano casualmente nel genoma dell’ospite quando si dissolve la membrana nucleare (divisione cellulare)
• Adenovirus
: sono a DNA e capaci di trasdurre ad alti titoli tutte le cellule, ma in forma episomale. E’ molto forte la reazione immunitaria. Morte di Jesse Gelsinger nel 1999
• Adeno-associati (AAV)
ospitare fino a 4.5kb
• Lentivirus
termine.
hanno DNA a singola elica e si potrebbero integrare sul cromosoma 19q13 grazie al gene rep. Ma il 96% del genoma è deleto. Possono : sono retrovirus specializzati che infettano anche le cellule non in divisione. Sono più complessi dei retrovirus e sono capaci di un’espressione a lungo
Vettori virali per la terapia genica
AAV Adeno Retro Lenti HSV Genoma Dna Dna Rna Rna Dna Stato Capacità Integrato Episomal Episomal 4.7 kb < 36 kb Integrato Integrato 8 kb 8 kb Episomal >50kb Target D/ND D/ND D D/ND D/ND
Virus Adeno-associato
Famiglia: Parvoviride Genere : Dependovirus Genoma : DNAss 4.7kb
Bersaglio: Cellule in divisione e cellule non in divisione Stato : episomale/integrazione sito specifica su 19q13.3 Sierotipi : 10 AAV1-10 AAV2 ITR Rep78 Rep68 Rep Rep52 Rep40 VP1 Cap VP2 VP3 ITR
AAV RICOMBINANTI
ITR p5 p19 REP p40 ITR ITR Plasmide Cis TRANSGENE TERAPEUTICO MAX 4.5kb
ITR
Produzione di vettori rAAV
ITR2 Pro Transgene
Cis
ITR2 pA pro
rep2 cap Trans E2A E4
Adeno Helper
VAI
Tripla trasfezione HEK 293 cells (E1) rAAV
rAAV Pseudotipizzati
AAV2/1 (6) ITR 2 ITR 2 AAV2/2 ITR 2 AAV2/3 ITR 2 AAV2/4 ITR 2 AAV2/5 ITR 2 AAV2/7 ITR 2 AAV2/8 gene terapeutico ITR 2 ITR 2 ITR 2 ITR 2 ITR 2 ITR 2 ITR 2 Rep 2 Cap 1 Rep 2 Rep 2 Rep 2 Rep 2 Rep 2 Rep 2 Cap 2 Cap 3 Cap 4 Cap 5 Cap 7 Cap 8
DIFFERENZE TRA SIEROTIPI AAV 1-8
PROTEINE CAPSIDE
ANTIGENICITA’
TROPISMO
AAV1 Muscolo,retina
AAV2 Muscolo,fegato
AAV4 Cervello
AAV5 Cervello,polm.
AAV6 Muscolo,retina
AAV7 Muscolo,fegato
AAV8 Fegato
RECETTORI
AAV2 FGFR1,EPARINA
AAV4
Ac.SIALICO
AAV5
PDGFR, Ac.SIALICO
Vantaggi
•
Non patogeni
•
Espressione genica efficiente e a lungo termine
•
Pochi effetti immunologici
•
Ampia varietà di cellule ospiti
•
Infezione di cellule in divisione e non in divisione
Svantaggi
•
Dimensioni dell’inserto non superiori alle 4.5kb
•Produzione di anticorpi anti-AAV
AAV2 No risomministrazione del vettore virale
Analisi di linkage
Vincenzo Nigro Dipartimento di Patologia Generale Seconda Università degli Studi di Napoli Telethon Institute of Genetics and Medicine (TIGEM)
un genitore
A a aa
trasmissione autosomica dominante
entrambi i genitori
A a A a A allele patologico dominante a allele normale recessivo A a A a aa aa
50% dei figli manifestano il carattere senza preferenza di sesso
AA A a A a aa
75% dei figli manifestano il carattere senza preferenza di sesso
A a a a Genotipi: 1/2 Aa, 1/2 aa Fenotipi: 1/2 affetti, 1/2 non affetti A a A a Genotipi: 1/4 AA, 1/2 Aa, 1/4 aa Fenotipi: 3/4 affetti, 1/4 non affetti
Espressività
•
Espressività
:
grado con il quale la malattia è espressa in un individuo
•al livello di popolazione un fenotipo presenta espressivita’ variabile quando all’interno dell’insieme di soggetti sicuramente portatori il fenotipo presenta gravita’ e/o complessita’ diversa •anche all’interno della famiglia ci puo’ essere espressivita’ variabile •importanza di un accurato esame clinico esteso ai consanguinei di un affetto, anche apparentemente sani •Il tipo e la gravità delle manifestazioni cliniche non sono sempre sovrapponibili negli individui affetti dalla stessa patologia autosomica dominante
mutazioni eterozigoti di PAX3 Waardenburg
• sordità (o deficit uditivo di vario livello) bilaterale, • modifiche nella pigmentazione, sia dei capelli (albinismo • anomalie nello sviluppo dei tessuti derivati dalla cresta • lateralizzazione del canto mediale • parziale, in genere piebaldismo) che della neurale
diverso colore degli occhi ( marrone e l'altro blu eterocromia
pelle ,
), di solito uno
Espressivita’ variabile
SINDROME DI WAARDENBURG Sindrome completa: sordita’ + occhi di colore diverso + ciuffo di capelli bianchi sulla fronte + precoce incanutimento
1 sordità 2 sordità+ occhi di colore diverso 3 sordità+ occhi di colore diverso + ciuffo di capelli bianchi sulla fronte 4 ciuffo di capelli bianchi sulla fronte + precoce incanutimento
esordio variabile
• il fenotipo puo’ comparire in età avanzata • il fenotipo non è congenito pur essendo ereditario • dal punto di vista genetico raramente questi fenotipi sono dovuti a nuove mutazioni • a livello di popolazione l’allele mutato puo’ essere frequente, purché l’ insorgenza si verifichi dopo l’inizio dell’età riproduttiva e non limiti la fitness (capacita’ di riprodursi)
penetranza
proporzione di individui portatori del gene patologico che hanno segni clinici della malattia può dipendere: – accuratezza diagnostica (esami clinici e di laboratorio mirati - es. porfiria acuta) – età (esordio variabile - es. Corea di Huntington) – meccanismo d’azione del gene (retinoblastoma, teoria dei 2 hits di Knudson)
Penetranza 100 % Penetranza 50 %
tratti autosomici dominanti penetranza
penetranza
la penetranza è un concetto che si riferisce alla popolazione A livello del singolo individuo il carattere ha solo due possibilità 1.
2.
si manifesta non si manifesta è presa in considerazione più frequentemente nei caratteri dominanti Sapere che un gene puo’ non essere completamente penetrante, e’ critico per studiarne la genetica o fornire consulenza genetica: un certo soggetto che non manifesta il carattere puo’ essere portatore del gene.
Età di insorgenza della Corea di Huntington
a) b) Probabilità che un individuo portatore del gene mutato abbia sviluppato i sintomi ad una data età Rischio che il figlio sano di un soggetto affetto sia portatore del gene mutato ad una determinata età.
Penetranza ed espressivita’
La penetranza ridotta non e’ da confondere con l’espressivita’ variabile L’espressivita’ e’ il grado di gravita’con cui fra gli individui che presentano il fenotipo questo si esprime: puo’ costituire un sottoinsieme degli individui “penetranti” Es. Neurofibromatosi: presenza di tumori lungo i nervi periferici e regioni di pigmentazione scura (“macchie di caffelatte”)Tutti i portatori presentano almeno uno dei segni, ma la essere diversa anche gravita’ puo’ all’interno della stessa famiglia: un genitore con macchie e piccoli tumori cutanei benigni che presenta tumori estesi e maligni. ( puo’ avere un figlio
questa differenza non e’ prevedibile si puo’ solo quantizzare il rischio di ereditare l’allele non il fenotipo
)
ipotesi sul rischio di ricorrenza
1.
2.
3.
4.
5.
La malattia non è genetica La malattia è dovuta a nuova mutazione dominante: rischi di ricorrenza trascurabili nella prole della coppia La trasmissione è autosomica recessiva: rischio di ricorrenza di 1 su 4 per la futura prole indipendentemente dal sesso La malattia è legata all’X recessiva e la madre può essere o meno portatrice: rischio di ricorrenza di 1 su 2 maschi se la madre è portatrice La malattia è poligenica o cromosomica: rischio di ricorrenza ben definito dipendente dal tipo di malattia
mappaggio genico
serve ad identificare la posizione cromosomica di un locus genico
possono essere “mappati”: – marcatori genetici anonimi, quali brevi sequenze di DNA (dette STS), DNA microsatelliti, ecc.
– geni – loci associati a malattie con trasmissione mendeliana – loci associati a predisposizione a malattie con trasmissione nonmendeliana
a cosa serve il mappaggio in genetica medica?
– per identificare la localizzazione dei geni malattia – per fare diagnosi indiretta in una famiglia in cui la mutazione responsabile di una malattia genetica mendeliana non è stata ancora identificata – per identificare i geni responsabili della suscettibilità a malattie non mendeliane
per localizzare e identificare geni malattia
Linkage mapping
per fare diagnosi indiretta in una famiglia in cui la mutazione responsabile di una malattia genetica mendeliana non è stata ancora identificata
per identificare i geni associati ad una suscettibilità a malattie non mendeliane
Segregazione e crossing-over
un figlio riceve un cromosoma da ciascun genitore che è il prodotto finale della ricombinazione meiotica Non è possibile ricevere un cromosoma che non abbia effettuato crossing-over
principi generali del mappaggio
• si segue la segregazione della patologia nei pedigrees utilizzando marcatori genetici a posizione nota • si correla la segregazione della patologia e dei marcatori in più famiglie • quanto più spesso la patologia e un marcatore co-segregano tanto più sono vicini * * * * * *
c’è bisogno di famiglie abbastanza grandi in cui si osserva la trasmissione della patologia
i membri della famiglia devono essere genotipizzati usando marcatori polimorfici
marcatori polimorfici sono noti per ogni cromosoma e di ciascuno si conosce esattamente la posizione cromosomica i marcatori più informativi sono quelli che presentano un elevato grado di eterozigosità, perché questo consente di distinguere l’allele paterno dall’allele materno La nomenclatura D20S906 indica che un marcatore di DNA è singolo nel genoma ed è localizzato sul cromosoma 20; purtroppo il numero 906 non ha alcun rapporto con la posizione
Marcatori polimorfici
A partire dagli anni ‘80
RFLP
: restriction fragment length polymorphisms Nella accezione attuale, il DNA purificato è amplificato con la PCR.
Il prodotto della PCR è quindi tagliato in frammenti di restrizione mediante enzimi di restrizione detti endonucleasi, che attuano il taglio unicamente in corrispondenza di particolari sequenze nucleotidiche, specifiche per ogni enzima.
I frammenti di restrizione sono separati per lunghezza mediante elettroforesi su gel d'agarosio
RFLP
l’enzima di restrizione SmaI taglia l’esanucleotide CCCGGG. La sequenza CC G GGG rende non digeribile il DNA in quella posizione a CCCGGG GGGCCC Allele 1 b CC G GGG GG C CCC Allele 2 c
c b a
STR
•
A partire dal 1990
STR
: short-tandem repeats or microsatellites –e.g. (CA n ) – gttatcttagggctcagt
cacacacacacacacacacaca
tccaggtattggatcaac Quello che varia tra gli alleli è il numero di ripetizioni dell’elemento. E’ molto più frequente riscontrare individui eterozigoti, con un numero di ripetizioni differente nei due alleli
Figura 12, microsatelliti
Tandem repeat Allele 1 Allele 2 Allele 3 Allele 4 1 2 3 4 (1,4) (1,3) (3,4) (2,3) (1,4) (1,3) (2,4) (1,4) (1,2) (1,2) (2,3)
SNPs single nucleotide polymorphisms
•
Variazioni puntiformi della sequenza tra due copie del genoma
•
Per un SNP un individuo può essere
– –
Omozigote Eterozigote T T / T /C o C/C
ACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATA GCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTC CGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGC Variazioni della sequenza del DNA AGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTA GCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACA CACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCG CACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCT G ACCTGACACGTGCTAGCTAGCTCCT CTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACCGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGAT ATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGAACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGC TCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGAC GTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGC GCTCCCTGAAACAGC T CCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGA CCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGG CTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCC TGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGAC CTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCG ATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCAC ACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTC GAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATAT ATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCT CGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGA GACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGA C ACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATAT AGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACA CCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGT G CTAGCTAGCTCCTCTCG AGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATA TAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTC GAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGT AGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGACGAGA CGTAGGGCTCTCGATATAGCTCGCGACA C ACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAG CGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAG ACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGG GCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCC CTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCG CTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGATAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCT AGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCT AGCTAGCTCCTCTCGACGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTC GCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACC GCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACC GCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGACGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTC GAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGA AACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGA AACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGACGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGAC CTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTTAGC T AGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGAC ACACACAGATATTATAGCTCGCGACACACACAGATATATAGCGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGACGAG ACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATA GCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGA G ACCTGACCTGACA CGTGCTAGCTAGCTCCTCTCGAGACGTTATAGCTCGCGACACACACAGATATATAGCGTAGGGCTCTCG A TATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTA GCTCCTCTCGACGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGAC ACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCG AGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGC ACACCGCTCGAGATAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCT CGATATAGCTCGCGACACACACAGATATATAGCGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGACGAGACGTAGGGC TCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCT GAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCT C CCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGC TAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGC TAGCTCCTCTCGACGAGACGTAGGGCTCTCGATATAGCTCGCCTCGCGACACACACAGATATATAGCGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACAC GTGCTAGCTAGCTCCTCTCGACGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACAC AGCTCGCACACCG C TCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTA GCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACA CACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCG CACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCT CTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGATATATAGCGCTCCCTGAAACAGCTCCGACACAGCTCGCACACCGCTCGAGACCTGACCTGACACGTGCTAGCTAGCTCCTCTCGAGACGTAGGGCTCTCGATATAGCTCGCGACACACACAGA
SNPs nel genoma umano
http://www.ncbi.nlm.nih.gov/SNP/ DB SNP built 128 (23 Oct 2007) Totale Totale codificanti Codificanti sinonimi Codificanti nonsinonimi 11.751.216 111.003
46.621
64.382
Aploblocchi sul sito http://www.hapmap.org
DNA recombination
2 (22 + 1) ♁
A A - T T - A G - C C - G T - A T - A T - A A - T A - T G - C C - G G - C A - T B T - A G - C T - A A - T C - G C - G
♂
C - G A - T A - T A - T T - A G - C C - G T - A - A T - A T - A A - T A - T G - C C - G G - C A - T T - A G - C T - A A - T C - G - B
chr1
C - G
♁
C - G A - T A - T A T - A G - C C - G T - A T - A T - A A - T A - T G - C C - G G - C B A - T T - A G - C T - A A - T C - G A - T A - T T - A G - C C - G - A T - A T - A T - A A - T A - T G - C C - G G - C A - T T - A G - C - B T - A A - T C - G
chr1 2 (22 + 1) ( ♂ ) ( ♁ )
C - G A - T A - T T - A G - C C - G T - A T - A T - A A - T A - T G - C C - G G - C A - T T - A G - C T - A A - T C - G C - G A - T A - T T - A G - C C - G T - A T - A T - A A - T A - T G - C C - G G - C A - T T - A G - C T - A A - T C - G C - G A - T A - T T - A G - C C - G T - A T - A T - A A - T A - T G - C C - G G - C A - T T - A G - C T - A A - T C - G C - G A - T A - T T - A G - C C - G T - A T - A T - A A - T A - T G - C C - G G - C A - T T - A G - C T - A A - T C - G
chr1 chr1 Meiosis Diploid gamete precursor cell 22 + 1 22 + 1 ( ♂ )
A C - G A - T A - T T - A G - C C - G T - A T - A T - A A - T A - T G - C C - G G - C B A - T T - A G - C T - A A - T C - G C - G A - T A - T T - A G - C C - G - A T - A T - A T - A A - T A - T G - C C - G G - C A - T T - A G - C T - A A - T - B C - G
chr1
A C - G A - T A - T T - A G - C C - G T - A T - A T - A A - T A - T G - C C - G G - C A - T B T - A G - C T - A A - T C - G
chr1 NR
C - G A - T A - T T - A G - C C - G T - A - A T - A T - A A - T A - T G - C C - G G - C A - T T - A G - C T - A - B A - T C - G
chr1 R ( ♁ )
A B C - G A - T A - T T - A G - C C - G T - A T - A T - A A - T A - T G - C C - G G - C A - T T - A G - C T - A A - T C - G C - G A - T A - T T - A G - C C - G - A T - A T - A T - A A - T A - T G - C C - G G - C A - T T - A G - C T - A A - T - B C - G
chr1 Haploid gamete precursors
A B C - G A - T A - T T - A G - C C - G T - A T - A T - A A - T A - T G - C C - G G - C A - T T - A G - C T - A A - T C - G
chr1 R
C - G A - T A - T T - A G - C C - G - A T - A T - A T - A A - T A - T G - C C - G G - C A - T T - A G - C T - A A - T - B C - G
NR chr1 Hap. gametes
ricombinanti
R
e non ricombinanti
NR
il 50% deve essere R e il 50% NR se i loci sono posti su cromosomi differenti, mentre i NR sono >50% se i loci sono sintenici.
L’analisi della frazione di ricombinazione è alla base del mappaggio
• la frazione di ricombinazione tra due loci, q , è compresa tra 0 e 0.5
• Il valore di q non può mai essere maggiore di 0.5, il che indica che i loci sono posizionati molto lontani o su cromosomi differenti • se q è significativamente minore di 0.5 i loci sono “linked” • più piccolo è q più vicini sono i loci
l’unità di misura della distanza genetica è il centiMorgan cM
La distanza genetica tra due loci è il numero atteso di crossovers per meiosi
l l l l le distanze piccole sono accurate mentre le grandi sono sottostimate perché un doppio crossover può far pensare a un non ricombinante per valutare distanze grandi occorre sommare distanze piccole per q <10% la correlazione tra q e cM è 1:1 mediamente 1 cM corrisponde a circa 850.000 bp, ma tale valore è inversamente proporzionale alla frequenza di ricombinazione
Le meiosi si visualizzano con MLH1 che è parte del macchinario di ricombinazione Nella meiosi maschile che avviene nei testicoli ci sono circa 51 chiasmi e quindi considerando 50cM per chiasma, il genoma è di 2550 cM Nella meiosi femminile che è più difficile da studiare perché avviene a 16-24 settimane di vita fetale ci sono almeno 70 chiasmi (3500 cM), ma si stimano 4280cM Dal momento che la frequenza di ricombinazione è differente si usa un valore medio tra i due sessi
Il mappaggio per linkage è basato sull’analisi della ricombinazione
= affetto = non affetto Locus malattia Marker d d 2 5 D d 1 1 D d 1 2 d d 3 4 D = allele patologico d = allele wild-type D d D d d d D d d d D d 1 3 1 3 2 4 1 4 2 4 2 3
1 ° obiettivo - stabilire la fase
Doppio eterozigote d d 2 5 D d 1 1 D d 1 2 d d 3 4 D d D d d d D d d d D d 1 3 1 3 2 4 1 4 2 4 2 3
2 ° obiettivo – contare i ricombinanti
d d 2 5 D d 1 1 D d 1 2 d d 3 4 D d D d d d D d d d D d 1 3 1 3 2 4 1 4 2 4 2 3 NR NR NR NR NR R recombinanti q = 1/5
lod-score
• Il lod-score misura le probabilità a favore del linkage • Compara la probabilità ad un certo valore di q e la probabilità nel caso non vi sia alcun linkage e quindi che q sia uguale a 0.5
LOD = log of the odds
[L(
q
)/L(0.5)] Z(
q
) = log 10
d d 2 5
3 ° obiettivo – calcolare il LOD score
D d 1 1 D d 1 2 d d 3 4 D d D d d d D d d d D d 1 3 1 3 2 4 1 4 2 4 2 3 NR NR NR NR NR R
LOD SCORE (LOD)
Z = log 10 q R ( 1 q ) NR 0.5 (R+NR) = log 10 q ( 1 0.5 6 q ) 5
Il metodo
• La probabilità L( q ) è calcolata per i differenti valori di q tra 0 e 0.5
• Un rapporto tra le probabilità è calcolato LR( q ) = L( q )/L(0.50) • Il lod-score è il logaritmo in base 10 (
log10
) del rapporto tra le probabilità Z( q ) = log10[L( q )/L(0.50)] • La migliore stima della frazione di ricombinazione è il valore di q a cui Z( q ) è massimo (MLS)
Per le patologie a trasmissione mendeliana
Z(
q
) >> 3
si accetta il linkage per un carattere autosomico Z(
q
) >>2
si accetta il linkage per un carattere X-linked Z(
q
) < -2
si respinge definitivamente l’ipotesi di linkage per un particolare valore di
q
Z(
q
) > -2 ma < 3
occorrono ulteriori studi
linked, no recombination