Apport de la Génomique fonctionnelle chez la Drosophile

Download Report

Transcript Apport de la Génomique fonctionnelle chez la Drosophile

Apport de la Génomique fonctionnelle chez la Drosophile
Etude de gènes humains impliqués dans des maladies.
What is Functional Genomics?
Functional genomics refers to the development and application of
global (genome-wide or system-wide) experimental approaches to
assess gene function by making use of the information and reagents
provided by structural genomics. It is characterized by high-throughput
or large-scale experimental methodologies combined with statistical or
computational analysis of the results (Hieter and Boguski 1997)
Functional genomics as a means of assessing phenotype differs
from more classical approaches primarily with respect to the scale and
automation of biological investigations. A classical investigation of
gene expression might examine how the expression of a single gene
varies with the development of an organism in vivo. Modern
functional genomics approaches, however, would examine how
1,000 to 10,000 genes are expressed as a function of development.
(UCDavis Genome Center)
Completion of genome sequence projects marks the start of
genome-based biology
How can genome information be exploited ?
Genes
Genome data
Genome structure
Biochemical
Function
What genes do
Biological
How genes work
together
Understanding expression
and function in development
and differentiation
Understanding expression
and function in disease
How genes can
be used
Diagnostics
Therapeutics
Genome based approaches to function - Functional Genomics
*DNA Microarrays - genome wide expression analysis of genes - Transcriptome
*Proteomics - defining proteins, their functions and interactions - Proteome
*Gene inactivation - defining function through gene silencing
*Phenotype analysis - defining function through gene mutagenesis - Phenome
Le système biologique
Drosophila melanogaster
La mouche « a ventre noir » « qui aime la rosée »
Les avantages du système:
- Cycle de vie court
- Développement externe
- Création et Entretien des stocks
peu onéreux
- Génome séquencé
- Séquence du génome de 6
autres espèces :
Agencourt Bioscience project (2004) :
D. ananassae, D. erecta, D.grimshawi,
D. mojavensis and D. virilis.
TIGR (2004) : D. willistoni
- Génétiquement manipulable
- Génétiquement modifiable
Le génome de Drosophila melanogaster
180Mb dont 120Mb d’ euchromatine
4 Chromosomes
Génomes comparés
Caractéristiques des génomes de levure, nématode, drosophile et de l'homme :
Levure
S. cerevisiae
Nématode
C.elegans
Drosophile
Homme
13
100
180
3.000
6.200
19.100
13.600
~30.000
1,4
2,7
3
28
2
4,8 / 6
9
~100
teneur en [G+C]
38%
36%
nd
41%
fraction codante
68%
27%
13%
1,4%
nombre moyen d'exons par
gène
1,04
5,5
4,6
8,7
taille moyenne des exons (pb)
1.450
218
150
145
taille moyenne des introns (pb)
500
267
487
~3.300
taille physique (Mb)
nombre de gènes
taille des gènes (kb)
fréquence des gènes (par kb)
Annotation du génome : Identifier tous les gènes dans un génome
Mise au point de programmes automatiques :
• Approche conceptuelle basée sur des études linguistiques des séquences d’ADN
• On connait (partiellement) la syntaxe et la grammaire:
utilisation de modèles de Markov cachés qui, après apprentissage sur un
organisme donné, vont différencier les régions géniques des régions intergéniques
Programmes adaptés aux génomes procaryotes et donnant de
bon résultats pour les génomes eucaryotes possédant très peu
d’introns (Levure)
Programmes adaptés aux génomes eucaryotes
présentant une forte proportion d’introns
GeneMark,
GLIMMER
GeneMark.hmm, HMMgene,
Eugene, GENIE, etc...
Utilisés en conjonction avec des algorithmes neuronaux déterminant
le départ de transcription (qui n’est pas toujours un ATG)
les sites d’épissage
Netgene2, SpliceNet, etc...
Netstart
Annotation du génome
Efficacité de ces programmes automatiques :
excellente chez les procaryotes (rendement de 98-99%)
chez les eucaryotes complexes :
Les règles régissant la structure et l’organisation des gènes
eucaryotes sont plus complexe!
• Mauvaise identification des gènes annotés :
gènes interprétés comme deux gènes voisins
 deux gènes voisins interprétés comme un seul gène
• Une étude et exhaustive de réannotation manuelle du génome de la
drosophile révèle aussi une mauvaise identification des gènes (Janvier
2003)
Annotation du génome
Janvier 2003 : réannotation manuelle du génome de la drosophile………..
Nombre de gènes: quasi inchangé : 13601 (en 2000)-> 13676 (en 2003)
727 gènes trouvés par l’ancien programme GENIE erronés ont disparus
802 gènes trouvés par nouveau progamme GenScan ajoutés
Structure de 85% des gènes modifiée:
1531 gènes initialement indépendants sont fusionnés en 602 nouveaux
gènes
322 gènes morcelès en 675 nouveaux gènes
93 gènes réinterprétés complètement avec des mélanges de fusion et
morcellement
Le nombre total de gènes identifiés ne reflète pas le niveau de complexité
des organismes étudiés
Estimation du Nombre de protéines codées par un gène ?
Promoteurs Alternatifs:
Nématode :
Drosophile :
4 gènes codent 4 myosines différentes
1 seul gène code les 7 myosines connues
Promoteur alternatif 13% des gènes (estimation Janvier 2003)
Epissage Alternatif détermine une très grande partie de la diversité du protéome
Drosophile : DSCAM (connection neuronale) / 1 orthologue chez l’homme
95
exons alternatifs
38016
protéines potentielles
48 / 50
clones cDNA identifiés sont différents
Homme:
85% du protéome humain est déterminé par l’épissage alternatif
Chrom 19 : 544 genes
1859 mRNAs
en moy. 3.2 variant/gene
Nématode:
9516 genes
12816 mRNAs
en moy 1.34 variant /gene
Polyadénylation alternative 6% des gènes de Drosophile (Janvier 2003)
La diversité du protéome est le reflet la complexité d’un organisme.
Le nombre total de gènes identifiés ne reflète pas le
niveau de complexité des organismes étudiés
….. on ne sait pas estimer l’état d’expression d’un gène :
Information essentielle chez les organismes complexes où l’évolution
se fait par la modulation de l’expression plus que par l'augmentation du
nombre de gènes
Les jeux de protéines synthétisées vont être très différents d'un tissu à
l'autre d’un instant t à un autre.
Comparaison des génomes eucaryotes séquencés
The Biological Core or Core Proteome
Human
35000
10000
Core proteome = nombre de familles de protéines distinctes codées par le génome d’un
organisme donné. Les gènes paralogues (gènes équivalents dans une même espèce) sont
comptés comme 1 Unité.
Core proteome de la Drosophile est seulement 2 fois plus grand que celui de la Levure.
Core proteome de la Drosophile et du Nématode de taille similaire malgré de grandes
différences en terme de développement et morphologie.
Le Core proteome est constitué de gènes jouant un rôle essentiel dans tous les
aspects du fonctionnement cellulaire.
Il semble que la majorité sinon tous les gènes du Core Protéome humain existent chez
la drosophile.
Comparaison protéomes prédits :
Homme , Drosophile, Nématode et Levure
Nombre de groupes de protéines :
Homme
Fly
Worm
Yeast
3129
1445
1503
1441
Fonctions cellulaires de base :
Métabolisme, traduction,
Réplication –réparation de l’ADN
-1308 groupes de protéines contenant au moins 1 orthologue prédit dans chaque
organisme (plusieurs groupes contiennent des paralogues)
- 504/1308 groupes de protéines contenant 1 orthologue prédit dans chaque
organisme et 0 paralogues:
Classement par catégories fonctionnelles
Fonctions Clés
n’ayant pas subit de
duplication
ni d’élaboration dans les
différents lignages
Ex :
enzyme chaine respiratoire
biosynthèse nucléotides
Levure (unicellulaire):
0 dans cell communication
0 dans défense immunity
Comparaison protéomes prédits :
Drosophile, Nématode et Levure
Core protéome : Drosophile 8065 , Nématode: 9453 , Levure 4383
Comparaison par alignement de séquences:
BLAST P
et
alignement d’au moins 80% de la longueur de la protéine de drosophile avec une
autre séquence >>>sous estimation !!!
-20% des protéines de drosophile ont un orthologue putatif chez le nématode et la
levure
Protéines impliquées dans des processus communs aux eucaryotes:
réplication, transcription, traduction, division cellulaire…
- 35% des gènes de drosophile ont un orthologue putatif chez le nématode
-Développement des organismes pluricellulaires
-Interactions cellule- cellule / cellule substrat
-Protéines à homéodomaines,
-Molécules d ’adhérence cellulaire…...
- certaines familles de protéines sont présentes seulement chez la drosophile
-Protéines impliquées dans la réponse immunitaire
système immunitaire inné primitif similaire à celui des vertébrés
-Protéines transmembranaires de fonctions inconnues
-Protéines spécifiques (ex : cuticule)
Comparaison protéomes prédits :Homme , Drosophile, Nématode et Levure
Génome humain :
3200 Mb, ~30 000 gènes prédits
2 duplications successives d ’un génome élémentaire non redondant (drosophile)
Conservation au niveau moléculaire
des produits de gènes entre Drosophile et Homme
67% homologie avec protéome de drosophile
des produits de gènes entre Drosophile et nematode et levure
43% homologie avec protéome du nématode et de la levure
46% homologie avec protéome de la levure
Gènes absents chez la drosophile/ homme:
reflète différences physiologiques entre homme et drosophile:
hémoglobines (thalassémies)
réarrangement des gènes d’immunoglobuline (système immunitaire acquis)
‘The fly is an extremely useful model system for studying genes
associated with disease in humans.’
The Berkeley Drosophila Genome Project (BDGP):
> 60% (177/289) de gènes humains impliqués dans des
pathologies humaines ont des homologues évidents chez la
drosophile.
‘The fly is an extremely useful model system for studying genes associated with disease in humans.’
289 human proteins used as queries to search a database consisting of the sum total
of gene products (38,860) found in the complete genomes of fly, worm, and yeast.
BLASTP searches
TBLASTN searches : control for potential frameshift errors in the Drosophila genome sequence.
Only two cases were manually corrected.
Results are scaled according to various levels of statistical significance,
Refelect the level of confidence in either evolutionary homology or functional similarity.
<
no or weak sequence similarity
E values >1 X 10–6
<
<
highest degree of sequence conservation.
E values < 1 x 10-100
« + » : likely functional equivalent of the human protein (biological evidence)
«-»
unable to identify a likely functional equivalent of the human protein.
BDGP
BDGP
‘The fly is an extremely useful model system for studying genes associated with
disease in humans.’
E. Bier. University of California San Diego :
714 Human genes from OMIM (Online Mendelian Inheritance in Man)
versus Drosophila genome
BLASTP , E value of 10-10
~76%(548/714) of the human disease genes had homologues in the fly
« Homophila is an ongoing project whose ultimate goal is to
facilitate communication between fly and human researchers. »
E. Fortini .University of Pennsylvania School of Medicine :
287 other Human genes from OMIM (Online Mendelian Inheritance in Man)
62 % (178/287) of the human disease genes had homologues in the fly
Analyse de la fonction de gènes humains dans le système modèle drosophile
Transgenèse : élément transposable P , sytème UAS –GAL4
Expression dirigée d’une protéine humaine in vivo chez la drosophile
grâce au système UAS-GAL4:
- Interactions entre protéine humaine et protéine(s) endogène(s)
- Perturbation d’une (de) voie(s) biologiques «normales
- Apparition d’un phénotype
Analyse du phénotype :
Microscopie, Microscopie Electronique, Immunodétection, Transcriptome
Recherche de modificateurs (interaction)
Crible génétique pour des mutations second-site
ou
Utilisation résultats du transcriptome
(« random »)
(« targeted »)
TRANSGENESE
Utilisation d ’un élément transposable (élément P), pour introduire
de façon stable et héritable un transgène dans le génome.
cDNA X
miniwhite
Plasmid sequences
Pieds (5’et 3’) de l’élément P
Promoteur minimum transposase
Gène X
Gène marqueur de la transgénèse: mini w
Origine de réplication
Clonage
Gène de résistance (i.e. AmpR)
TRANSGENESE
Generation of transgenic fruit flies by Pelement transformation.
The P element, a mobile genetic element, can move from one
place in the genome to another. This movement (transposition)
is catalyzed by transposase, which is encoded by the P
element; the 3′ and 5′ ends of the P element are recognized by
transposase and are required for transposition to occur. To
produce transgenic fruit flies by this method, the functionally
different regions of the P element are incorporated into two
different bacterial plasmids. The donor plasmid contains three
necessary elements: the transgene (orange); a marker gene
(green) used to indicate flies in which the plasmid DNA is
transposed to a recipient chromosome; and both ends of the P
element (dark purple) — 3′ P and 5′ P — flanking the other two
genes. It does not contain transposase. In this example, the
marker is the dominant w+ allele, which confers red eye color.
The red bracket indicates the segment of the donor plasmid that
can transpose into the fly genome. The other plasmid carries
the P element (encoding transposase) with mutations in one
end, which prevent it from transposing. The two plasmids are
co-injected into blastoderm embryos homozygous for the
recessive w− allele, which confers white eye color. Transposase
synthesized from the gene on the P-element plasmid catalyzes
transposition of the donor plasmid DNA into the fly genome.
Because transposition occurs only in germ-line cells (not in
somatic cells), all the G0 adults that develop from injected
embryos have white eyes. Mating of these flies with white-eyed
flies will yield some G1 red-eyed progeny carrying the transgene
and the marker allele (w+) in all cells.
Système UAS GAL4 : expression conditionnelle et tissu-spécifique
Gal4
ARNm Gal4
Protéine Gal4
Gène X
mRNA X
Protéine X
DRIVER-GAL4 :
Embryo , Larva, Adult
Eye
Wing
Muscles
Nervous System
Ovary, testis………..
Activating line
Responder line:
DRIVER-GAL4
UAS- GeneX
UAS-GENE X (UAS-cDNA)
Drosophila
heterologous : human
OVEREXPRESSION
DRIVER-GAL4
UAS-GeneX
UAS-dsRNA RNA interference
LOSS OF FUNCTION
Analyse de la fonction de gènes humains dans le système modèle drosophile
Sur-expression de gènes homologues à des gènes humains dans les disques
imaginaux précusseurs de l’aile
Exemple de gènes humains impliqués dans des maladies neurodégénératives :
préséniline (Maladie d’ALZHEIMER)
Ye & Forte, 1999. J.Cell. Biol. 146:1351
Sur-expression de gènes homologues à des gènes humains dans les disques
imaginaux précusseurs de l’œil
Exemple de gènes humains impliqués dans des maladies neurodégénératives :
ataxine 3 Maladie de Machado-Joseph ; Ataxie spinale-cérébelleuse type 3
-Expression d’une protéine normale (27 glutamines) et mutante (78 glutamines)
-Phénotype: Oeil rugueux , Défauts de pigmentation, Inclusions nucléaires
- Recherche de modificateur :
Phénotype corrigé par la sur-expression de hsp70 (chaperone)
N.M Bonini, Parkinsonism and Related Disorders 7 (2000) 171-175
)
Mais l’existence de l’homologue drosophile du gène humain n’est
pas forcément requise….
Sur-expression d’un gène humain impliqué dans une maladie
neurodégénérative et ne possédant pas d’homologue drosophile
dans le système nerveux de la mouche
Exemple: gène a-synucléine
Maladie de Parkinson
(N.M Bonini / Parkinsonism and related disorders 7 (2001) 171-175)
-Expression d’ a-synucléine sauvage et mutantes
- Phénotype : défaut de locomotion
Aggravation du phénotype avec l’âge
Présence de Corps de Lewy (neurones DOPA)
Mais l’existence de l’homologue drosophile du gène humain n’est pas forcément requise….
IBDML- Michel Piovant
Study of genes involved in cardiomyopathies :
Mais l’existence de l’homologue drosophile du gène humain n’est pas forcément requise….
Study of genes involved in hypertrophic cardiomyopathies :
t gène MYBPC3 cardiac Myosin Binding Protein C
Myosin binding
Actin binding
C0
C1
C2
Ig
C3
Myosin/Titin binding
C4
Fn
C5
C6
C7
C8
C9
C10
MyBPC motif and phosphorylation site
No c MyBP-C drosophila homolog
cMyBP-C
6x
Projectin
Drosophila model to approach
human gene function
AIM:
Identify the primary events associated with human
mutated proteins.
l Remodelling gene expression programs
HOW:
t
Create transgenic flies allowing gene
overexpression or inactivation in a specific tissue:
t
l
t
Indirect Flight Muscles, dorsal vessel
Analyze the global changes in
profiles using DNA microarrays:
l
Manufacture cDNA Nylon microarrays,
l
Evaluate transcriptome variations,
l
l
Provide a biological explanation,
In vivo validation.
gene
expression
1. Create transgenic flies expressing cMyBP-C in Indirect Flight Muscles
Actin
Activating line
IFM : SG29.1-GAL4
SG29.1-GAL4
Myosin
Myosin/Titin
WTt
M6t
C0
C1
C2
C3
C4
C5
C6
C7
C8
C9
C0
C1
C2
C3
C4
C5
C6
C7
C8
C9
M0t
C0
C1
C2
C3
C4
Responder lines
UAS-cMyBPC
UAS-cMyBPC
Human protein expression site : Indirect Flight Muscles (IFM)
Fly vs vertebrate striated muscles
t Development and structure highly conserved
t Organization of the Sarcomere conserved
IFM and vertebrate cardiac muscle:
t Asynchronous muscles
t Stretch activation response
C10
EFFECTS OF HUMAN PROTEIN EXPRESSION IN DROSOPHILA IFM:
Transgenic cMyBP-C protein incorporates the Z-I region of the IFM sarcomere.
Z I
M
I Z
Z
Z
cMyBP-C
Z
Kettin
merge
cMyBP-C
Structural abnormalities of Transgenic IFM vs WT IFM sarcomere
t Reduction of sarcomere length ( -10% )
t Fragilization fibers at the level of the Z band
SG29.1 -GAL4
M0t cMyBPC
Expression of cMyBP-C in IFM leads to an age and dose dependent flightless phenotype
100
90
% flightless
80
70
60
6
8
13
50
40
4 copies M0t
2 copies M0t
1 copy M0t
30
20
10
0
1
3
5
7
9
11
13
15
17
19
21
23
25
27 days
2. Analyze the global changes in gene expression profiles using DNA microarrays
Manufactured Drosophila cDNA nylon microarrays
3600 genes
PROBES
PCR amplification products
COMPLEX TARGET
6000 cDNA clones (0,15 - 8,0 kb; 42%
0.5 -1µg total RNA
genome; Drosophila genome : 13 666 predicted genes)
reverse transcription (oligo dT primed)
« 3574 Nylon microarray »
33P
labelling
Spotting onto Nylon
Hybridization:
GMS 427 arrayer
1. Oligo-vector
- Reproducibility of microarrays
- Oligovector correction:
Intra-membrane comparison
cDNA
2.
Oligo-vector 20 mers
Complex Target
- WT IFM total RNA
- MO cMyBP-C IFM total RNA
3 hybridizations / complex target
2. Analyze the global changes in gene expression profiles using DNA microarrays
M0t cMyBP-C IFM versus non transgenic control IFM
8 day old adult flies.
97 genes are transcriptionally deregulated:
DOWN
64 genes (46 known).
UP
33 genes (21 known).
What are the biological processes affected by the
expression of human cMyBPC in the Drosophila flight
muscle?
Example of genes differentially expressed in 8-day-old M0t transgenic IFM versus non transgenic IFM.
Muscle fiber
Actin Binding
Tropomyosin binding
Chaperones
Genome
13
105
3
37
« 3574 Filter »
5
29
3
12
DOWN
5
3
3
4
UP
0
0
0
0
Example of genes differentially expressed in 8-day-old M0 transgenic IFM versus non transgenic IFM.
3. Genetic evaluation of candidate modifiers : Calmodulin
in vivo validation
Lowering Calmodulin expression in transgenic flies expressing cMyBP-C induced an age
dependant suppression of the flightless phenotype .
100
90
80
70
% flightless
60
50
40
30
2 copies M6t
2 copies M6t; Camk04243/+
2 copies M6t; Cam03909/+
20
10
0
1
3
5
7
9
11
13
15
17
19
21
23
25days
Interprétation des variations d’expression
Création d’un outil bioinformatique
Fly Genome Explorer
Thien Phong Vu Manh, Michel Piovant and Laurence Röder
Collaboration with DESS trainees
Magalie Celton (Evry)
Benoît Chauvin (Strasbourg)
http://www.fruitfly.org/
Quick search :
tsh teashirt
tin tinman
wg wingless
ace
Format with images
Basic search:
Format with images
Ex : Body part
all genes