Cartographie et clonage positionnel

Download Report

Transcript Cartographie et clonage positionnel

Consultez le site de Nicolas BERTRAND, vous y trouverez les articles que vous devrez présenter en trinome le 27 février avec Françoise MUSCATELLI

M1 Génétique des Mammifères 2006 - LUMINY

CARTOGRAPHIE PHYSIQUE CLONAGE POSITIONNEL

1 Laurent VILLARD Inserm Unité 491 Faculté de Médecine de La Timone http://www.team3-u491.net

CARTES PHYSIQUES

Etablir la carte physique d’un génome consiste à localiser les gènes, les marqueurs génétiques, le centromère etc… le long des chromosomes à leur position correcte.

Il existe différentes résolutions pour une carte physique :

29

Basse Chromosome Hybrides d’irradiation Contig de YACs Contig de cosmides Sequence Haute

CARTES PHYSIQUES - HYBRIDATION IN SITU

FISH (Fluorescent In Situ Hybridization) Un fragment d’ADN (gène, marqueur etc…) est marqué avec une molécule fluorescente.

Cette sonde est hybridée directement sur une préparation de noyau où les chromosomes sont en métaphase (et donc reconnaissables).

Précision obtenue : environ 5 Mb (i.e. basse résolution)

30

Il existe une technique de FISH sur fibre de chromatine étirée où la précision peut atteindre 10 kb mais on ne peut plus reconnaître le chromosome (cette technique est utilisée pour positionner les sondes les unes par rapport aux autres dans une région déjà cartographiée à basse résolution).

Caryotype humain standard

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 19 20 21 22 16 17 18 X Y

31

Caryotype « spectral » - SKY (Spectral KarYotyping) 32

Exemple de FISH utilisant deux sondes : 1 2 centromère du chromosome X (Xcen) gène STS (Xp22.3)

33

CARTES PHYSIQUES - HYBRIDES SOMATIQUES Hybrides somatiques (SCH, Somatic Cell Hybrids)

C’est le résultat de la fusion cellule humaine / cellule de rongeur.

Certains chromosomes humains sont retenus par l’hybride.

34 Fusion + Cellule humaine Cellule de rongeur Cellule de rongeur + chromosome(s) humains

Le contenu chromosomique des hybrides est déterminé et ils sont ensuite utilisés pour localiser un gène, un marqueur… L’information obtenue est de l’ordre de la région chromosomique.

CARTES PHYSIQUES - HYBRIDES SOMATIQUES 35

Exemple d’utilisation d’un « panel » de localisation Hybride #1 Hybride #2 Hybride #3 Hybride #4 Hybride #5 Hybride #6 Chromosomes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 X Y + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + Le gène testé par PCR sur l’ADN des hybrides donne un signal positif dans les hybrides 1 et 4. Tous les autres hybrides sont négatifs.

Quel est le chromosome sur lequel est situé ce gène ?

CARTES PHYSIQUES - HYBRIDES SOMATIQUES 36

Exemple d’utilisation d’un « panel » de localisation Hybride #1 Hybride #2 Hybride #3 Hybride #4 Hybride #5 Hybride #6 Chromosomes 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 X Y + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + Le gène testé par PCR sur l’ADN des hybrides donne un signal positif dans les hybrides 1 et 4. Tous les autres hybrides sont négatifs.

Quel est le chromosome sur lequel est situé ce gène ?

Chr.18

37 CARTES PHYSIQUES - HYBRIDES d’IRRADIATON

Une précision supérieure peut être obtenue en utilisant des cellules cellules humaines lourdement irradiées et fusionnées à des cellules de hamster (hybrides d’irradiation).

Rayons X Fusion + Cellule humaine Cellule de rongeur Cellule de rongeur + Fragment(s) de chromosome(s) humains

Deux marqueurs initialement localisés à proximité l'un de l'autre ont plus de chance d'être simultanément retrouvés dans les mêmes hybrides que deux marqueurs éloignés. Les distances se mesurent en centiray (cR).

CARTES PHYSIQUES - HYBRIDES d’IRRADIATON

Il existe des hybrides d’irradiation pour plusieurs espèces : Homme ,vache, souris, rat, cochon, poisson zèbre, chien, cheval.

38

La dose d'irradiation (rayons X) appliquée aux cellules humaines va conditionner la résolution de la carte : plus la dose de rayons est forte, plus les fragments générés sont petits et donc plus la résolution sera grande.

Les doses varient de 3.000 à 50.000 rads, c’est-à-dire une taille moyenne des fragments allant de 10 Mb à 800 kb.

Ces outils sont disponibles dans le commerce.

Comparaison entre carte des hybrides d’irradiation et carte génétique (basse résolution) du chromosome 13 humain.

La carte des hybrides d’irradiation est plus proche de la carte physique que de la carte génétique.

39

CARTES PHYSIQUES - Les Contigs de Clones

On utilise des clones afin d’isoler la région du génome qui nous intéresse et de disposer de l’ADN correspondant de manière illimitée (facile d’accès, reproductible).

43

Un contig de clones est une série de fragments d’ADN clonés dont chacun chevauche son voisin dans l’ordre correct le long des chromosomes.

Types de clones utilisés : Plasmides Phages Cosmides PACs BACs YACs E. Coli - 10 kb E. Coli - 20 kb E. Coli - 40 kb E. Coli - 100 kb (80-150 kb) E. Coli - 150 kb (100-300 kb) S. cerevisiae - 1.000 kb (1 Mb) (0,5 - 2 Mb) -- -- ++ +++ +++

CARTES PHYSIQUES - Marqueurs STS & EST

STSs (Sequence Tagged Sites)

!

Loci spécifiques pour lesquels suffisamment d’information de séquence est disponible pour faire des amorces PCR et amplifier le locus correspondant (quelques centaines de pb). La seule information nécessaire pour définir un STS est la séquence des amorces PCR.

ESTs (Expressed Sequence Tag)

!

Etiquettes spécifiques de chacun de gènes. Ils proviennent des informations de séquence des ADNc et donc représentent des séquences transcrites.

Ils peuvent provenir du 3’, du 5’ d’un ADNc ou des deux côtés.

Il existe plusieurs ESTs pour chaque gène.

47

48

CARTES PHYSIQUES - La Séquence Du Génome 53

CARTES INTÉGRÉES 54

CARTES PHYSIQUES - La Séquence Du Génome

• Le génome humain est composé de 3.272 millions de nucléotides.

55

• La taille moyenne d’un gène est de 3000 bases, mais la taille varie beaucoup (ex : le gène de la dystrophine a une taille de 2,4 millions de bases).

• Le nombre total de gène se situe entre 25.000 et 30.000.

• 99.9% des nucléotides sont identiques entre deux personnes. Il existe donc 0,1% de différences (soit environ 3,5 millions de différences par génome).

• Plus de 50% des gènes ont une fonction inconnue.

CARTES PHYSIQUES - La Séquence Du Génome

• Les régions riches en gènes sont également les régions riches en nucléotides G/C • Les régions pauvres en gènes sont riches en A/T. Ces différentes régions peuvent généralement être visualisées comme des bandes claires ou sombres des chromosomes métaphasiques.

• Le chromosome 1 contient le plus grand nombre de gènes estimés (environ 3000) tandis que le chromosome Y en a le moins (231).

• Moins de 2% de l’ADN code pour des protéines.

• Les séquences répétées composent environ 50% de la totalité du génome.

56

Cytogénétique Points de cassure chromosomique STS Couverture basse resolution YACs Couverture Haute resolution Autres clones génomiques Contigs Cosmides Pathologies localisées Gènes clonés Marqueurs génétiques Marqueurs murins homologues Régions de synténie 57

www.ensembl.org

58

D7S1790 59

60

CLONAGE POSITIONNEL

IDENTIFICATION DE GÈNES DE PATHOLOGIE

- Clonage Fonctionnel

- Clonage Positionnel

- Approche gène candidat position-indépendant - Approche gène candidat positionnel

61

62 Gène non identifié de la maladie Localisation sous chromosomique connue Bases biochimiques de la pathologie connues CLONAGE POSITIONNEL Produit du gène Essai fonctionnel Idée générale de la pathogenèse moléculaire Pathogenèse moléculaire connues pour des pathologies similaires (chez l ’Homme ou l ’animal) CLONAGE FONCTIONNEL APPROCHE GENE CANDIDAT INDEPENDANT DE LA POSITION APPROCHE GENE CANDIDAT POSITIONNEL

Clonage Fonctionnel (exemples)

- Hémophilie A

Obtention de la séquence protéique du facteur VIII de porc.

Obtention d ’oligonucléotides susceptibles de coder pour une partie de la séquence criblage d ’une banque d ’ADNc humaine avec des oligonucléotides

- Phénylcétonurie

L’enzyme responsable de la pathologie était connue (phénylalanine hydroxylase). L ’enzyme a été purifiée et des anticorps spécifiques ont été produits. Les anticorps ont servi à immunoprécipiter des polysomes contenant l ’ARN d ’intérêt.

63

- Anémie de Fanconi groupe C

Complémentation fonctionnelle par transformation de cellules déficientes avec des fragments d ’ADN générés au hasard jusqu ’à sauver le phénotype mutant.

Les étapes d’un clonage positionnel

1- disposer de la localisation sous-chromosomique du locus morbide

2- réaliser une carte physique de la région identifiée en utilisant des clones génomiques et des nouveaux marqueurs 3- identifier tous les gènes présents dans la région 4- rechercher des mutations dans ces gènes et identifier le gène responsable

64

Obtenir une localisation sous-chromosomique

Analyse de liaison génétique

Permet d’identifier un marqueur donnant un lod score supérieur à 3 dans des études familiales. C’est la plus utilisée des méthodes de localisation génétique.

65 A3 B3 C7 D9 A1 B2 C4 D8 gène muté A B2 C4 Gène muté D A1 B3 C7 A3 B2 C7 D8 A1 B2 C4 Gène muté D9 Marqueur A B C D lod score (

Z

) à

q

= 0 -

0.45

0.87

Obtenir une localisation sous-chromosomique

Mise en évidence d’un

déséquilibre de liaison

Il s’agit de l’association non aléatoire d’allèles pris à des loci différents.

Les patients atteints d’une maladie ont hérité, d’un ancêtre commun, un segment de chromosome contenant le gène pathologique et les marqueurs qui lui sont liés sous leur forme allélique spécifique (ceux-ci sont donc en déséquilibre de liaison).

66 A1 B2 C6 D1 A3 B4 C2 D7 Apparition d’une mutation Sur l’haplotype A3-B4-C2-D7 A1 B2 C6 Les allèles proches de la mutation (ex. B4 et C2) peuvent être transmis en même temps que la mutation et donc se retrouver en déséquilibre de liaison chez les individus atteints.

D1 A3 B4 C2 Mutation D7

Obtenir une localisation sous-chromosomique

Mise en évidence d’une

perte d’hétérozygotie

(LHO - Loss of heterozygosity)

Permet d ’identifier une région chromosomique délétée par analyse familiale de la transmission de marqueurs polymorphes.

67

Obtenir une localisation sous-chromosomique

Mise en évidence d’une

anomalie chromosomique

Permet de déterminer la région du génome impliquée dans une maladie. Les anomalies peuvent être de plusieurs types : inversions, translocations, délétions, duplications.

68 TRANSLOCATION RÉCIPROQUE chromatide centromère

p q

chromosome

a t(a;b) b

Obtenir une localisation sous-chromosomique

Cartographie d'exclusion

QuickTime™ et un décompresseur Sorenson Video 3 sont requis pour visionner cette image.

Les étapes d’un clonage positionnel

1- disposer de la localisation sous-chromosomique du locus morbide

69 2- réaliser une carte physique de la région identifiée en utilisant des clones génomiques et des nouveaux marqueurs

3- identifier tous les gènes présents dans la région 4- rechercher des mutations dans ces gènes et identifier le gène responsable

Les étapes d’un clonage positionnel

1- disposer de la localisation sous-chromosomique du locus morbide

70

2- réaliser une carte physique de la région identifiée en utilisant des clones génomiques et des nouveaux marqueurs

3- identifier tous les gènes présents dans la région

4- rechercher des mutations dans ces gènes et identifier le gène responsable

Identifier les gènes dans la région d’intéret

1- Cartographie des îlots CpG 2- Sélection directe d’adn complémentaire 3- Recherche de séquences conservées au cours de l’évolution 4- Piégeage d’exons 5- Utilisation de méthodes bioinformatiques

71

Identifier les gènes dans la région d’intéret

1- Cartographie des îlots CpG 2- Sélection directe d’adn complémentaire 3- Recherche de séquences conservées au cours de l’évolution 4- Piégeage d’exons 5- Utilisation de méthodes bioinformatiques

72

www.ensembl.org

73

http://www.hgmp.mrc.ac.uk/Registered/Webapp/nix/

Les étapes d’un clonage positionnel

1- disposer de la localisation sous-chromosomique du locus morbide

74

2- réaliser une carte physique de la région identifiée en utilisant des clones génomiques et des nouveaux marqueurs 3- identifier tous les gènes dans la région d’intérêt

4- rechercher des mutations dans ces gènes et identifier le gène responsable

Types d’anomalies moléculaires a l’origine d’une pathologie 75

Anomalies structurelles délétions - insertions - expansions de triplet duplications translocations

?

absence d’expression expression bi-allélique anormale Mutations ponctuelles mutations faux-sens mutations non-sens mutations d’épissage

Comment savoir si une mutation est pathogène ?

- cette mutation modifie-t-elle la protéine produite ?

- cette mutation est-elle absente chez les individus normaux ?

80

- une inactivation chez un animal modèle reproduit-elle le phénotype humain ?

- peut-on complémenter le phénotype avec une copie normale du gène ?

Le clonage d’un gène de pathologie permet

- Conseil génétique risque de récurrence diagnostic prénatal - Corrélations génotype / phénotype - Analyse de la fonction normale et pathologique du produit du gène - Analyse de la protéine et de ses interacteurs potentiels - A terme, éventuellement, thérapie génique / pharmacologique

81

Adresses électroniques utiles

Chromosomes humains (cartographie) http://www.ornl.gov/hgmis/launchpad/ http://www.hgmp.mrc.ac.uk/GenomeWeb/human-gen-db-chromosomes.html

Maladies génétiques http://www.ncbi.nlm.nih.gov/Omim/searchomim.html

http://bisance.citi2.fr/GENATLAS/ http://orphanet.infobiogen.fr/ http://www.icondata.com/health/pedbase/pedlynx.htm

http://gdbwww.org/ Cartographie du génome humain - Marqueurs polymorphes http://www.ncbi.nlm.nih.gov/genome/seq/ http://genome.ucsc.edu/index.html

http://www.ensembl.org/ http://www.chlc/org/ http://www.genethon.fr/ http://www.cephb.fr/ceph-genethon-map.html

Bases de données de séquences http://www.ebi.ac.uk/embl/index.html

http://www.ncbi.nlm.nih.gov/Entrez/

82

EXEMPLE 1 : MUCOVISCIDOSE (1989)

La mucoviscidose (CF = cystic fibrosis) est la maladie génétique autosomique récessive mortelle la plus fréquente chez les caucasiens.

La prévalence est de 1/2.000 nouveaux-nés.

1 adulte sur 22 est porteur de l'allèle mutant !

Le gène CF a été le troisième gène isolé grâce au clonage positionnel (après celui de la granulomatose chronique et celui de la myopathie de Duchenne).

EXEMPLE 1 : MUCOVISCIDOSE (1989)

Il n'y avait aucun remaniement chromosomique disponible pour localiser le gène, et il n'existait pas de carte très précise du génome à l'époque (ni génétique, ni physique).

Le gène CFTR a été localisé initialement en 7q21 parce qu'il co-ségrégeait avec deux marqueurs RFLP (les seuls disponibles à l'époque).

Ces marqueurs ont été utilisés comme points de départ pour isoler des clones d'ADN de la région concernée et pour reconstruire la carte physique de la région.

Le gène a été identifié en utilisant différentes méthodes (zoo blots, northern blots et criblage de banques d'ADNc fabriquées à partir de patients CF).

EXEMPLE 1 : MUCOVISCIDOSE (1989)

EXEMPLE 1 : MUCOVISCIDOSE (1989)

Le gène CFTR (cystic fibrosis conductance regulator) code pour une protéine ayant la fonction de canal chlore.

Cette protéine est responsable du transport de chlore à travers la membrane plasmique des cellules épithéliales qui bordent les voies respiratoires.

Il y a un co-transport chlore-eau qui permet la sécrétion d'eau et donc la dilution du mucus des voies respiratoires.

Chez les patients atteints de mucoviscidose, cette sécrétion d'eau se fait mal et le mucus s'accumule dans les voies respiratoires créant des difficultés respiratoires.

L'espérance de vie des patients est fortement diminuée (d'autres signes cliniques son présents).

EXEMPLE 1 : MUCOVISCIDOSE (1989)

EXEMPLE 1 : MUCOVISCIDOSE (1989)

EXEMPLE 1 : MUCOVISCIDOSE (1989)

Le gène CFTR (cystic fibrosis conductance regulator) code pour une protéine ayant la fonction de canal chlore.

On pense que les personnes conductrices d'un allèle mutant CF pourraient avoir un avantage sélectif dans les populations où la diarrhée de l'enfant suite à des infections intestinales est commune.

Les hétérozygotes auraient un fonction de CFTR réduite et perdraient ainsi moins d'eau (et seraient donc moins sujets à la déshydratation) que ceux qui ont deux allèles fonctionnels.

Cela expliquerait le fort taux d'hétérozygotes dans certaines populations.

90% des hétérozygotes sont porteurs de l'allèle D F508 (effet fondateur)

EXEMPLE 2 : MYOPATHIE CENTRONUCLÉAIRE (2005)

EXEMPLE 2 : MYOPATHIE CENTRONUCLÉAIRE (2005)

Analyse de liaison sur tout le génome avec des microsatellites en utilisant deux grandes familles de myopathie centronucléaire (6 et 8 individus atteints).

3 marqueurs ont donné des lods scores positifs : D19S884, D19S865 et D19S226. D'autres petites familles de CNM ont été génotypé pour ces marqueurs et les évènements de recombinaison ont permi de définir un intervalle critique en 19p13.2 d'une taille de 11 Mb.

EXEMPLE 2 : MYOPATHIE CENTRONUCLÉAIRE (2005)

EXEMPLE 2 : MYOPATHIE CENTRONUCLÉAIRE (2005) Dans la région minimale critique se trouve le gène de la dynamine, impliquée dans la cohésion des centrosomes.

EXEMPLE 2 : MYOPATHIE CENTRONUCLÉAIRE (2005)

EXEMPLE 3 : TEST DE PATERNITÉ

Article 312 du Code Civil "L'enfant conçu pendant le mariage a pour père le mari".

Depuis 1972, cet article a un second alinéa : "Néanmoins, celui-ci pourra désavouer l'enfant en justice, s'il justifie de faits propres à démontrer qu'il ne peut en être le père".

Ce test consiste à calculer la probabilité que l'enfant et son père présumé portent un allèle commun par hasard et non par filiation.

On utilise le génotypage à plusieurs microsatellites : - plusieurs marqueurs - marqueurs très informatifs Le taux d'erreur est d'environ 1 / 1.000.000.000

Le taux d'erreur est de 0 si l'enfant et le père n'ont pas les mêmes allèles Cellules utilisées : cellules jugales Interdit en France sauf dans le cadre d'une procédure judiciaire.

EXEMPLE 4 : POLICE SCIENTIFIQUE

Le principe est le même.

On cherche ici à calculer la probabilité que le suspect d'un crime et l'ADN retrouvé sur les lieux soient identiques par hasard et non parce qu'ils appartient au même individu.

On utilise le génotypage à plusieurs microsatellites : - plusieurs marqueurs - marqueurs très informatifs Problème ici : plusieurs suspects apparentés peuvent avoir les mêmes allèles… Le travail est donc plus complexe que dans le cas d'un test de paternité.

EXEMPLE 5 : LE FNAEG

Fichier National Automatisé des Empreintes Génétiques Créé en 1998, commun à la Police et à la Gendarmerie.

Date de la loi Champ d'application .

17-06-1998 Infractions de nature sexuelle Conservation des empreintes seulement pour les personnes condamnées Refus de prélèvement possible 15-11-2001 Extension aux crimes d'atteinte grave aux personnes (homicides, violences criminelles…) Conservation des empreintes seulement pour les personnes condamnées Sanction en cas de refus de prélèvement 18-03-2003 Extension à tous les délits (vols simples, recel…) Conservation du profil des personnes mises en examen et pas uniquement des coupables Sanction en cas de refus, y compris pour les personnes mises en cause