Support de cours condensé (phylogenie)

Download Report

Transcript Support de cours condensé (phylogenie)

Analyses phylogénétiques
Inférer et étudier l'histoire évolutive des gènes
Jean-François Dufayard (CIRAD, équipe ID)
Phylogénie des espèces, phylogénie moléculaire
Histoire évolutive des espèces
Phylogénie
des espèces
Phylogénie des espèces, phylogénie moléculaire
Histoire évolutive des espèces
Phylogénie
des espèces
Histoire évolutive des molécules
Phylogénie
moléculaire
Phylogénie des espèces, phylogénie moléculaire
Histoire évolutive des espèces
Phylogénie
des espèces
Modélisation (arbres)
Histoire évolutive des molécules
Phylogénie
moléculaire
Modélisation (séquences, arbres)
Phylogénie des espèces, phylogénie moléculaire
Blé
Séquence 1 (Blé)
Riz
Tomate
Séquence 2 (Riz)
Séquence 3 (Tomate)
Inférer l'histoire évolutive des gènes...
Inférer l'histoire évolutive des espèces ?
Quel signal porté par les séquences ?
La spéciation est-il le seul évènement influent ?
Phylogénie des espèces, phylogénie moléculaire
Blé
Riz
Tomate
Duplication
Séquence 1 (Blé)
Séquence 2 (Riz)
Séquence 3 (Tomate)
Séquence 4 (Blé)
Séquence 5 (Riz)
Séquence 6 (Tomate)
Phylogénie des espèces, phylogénie moléculaire
Blé
Riz
Tomate
Pertes
Séquence 1 (Blé)
Perte (Riz)
Séquence 3 (Tomate)
Perte (Blé)
Séquence 5 (Riz)
Perte (Tomate)
Phylogénie des espèces, phylogénie moléculaire
Blé
Riz
Tomate
Pertes
Séquence 1 (Blé)
Séquence 3 (Tomate)
Séquence 5 (Riz)
Phylogénie des espèces, phylogénie moléculaire
Blé
Riz
Tomate
Réconciliation d'arbres
Séquence 1 (Blé)
Séquence 1 (Blé)
Perte (Riz)
Séquence 3 (Tomate)
Séquence 3 (Tomate)
Perte (Blé)
Séquence 5 (Riz)
Perte (Tomate)
Séquence 5 (Riz)
Définitions
Séquence 1 (Blé)
Séquence 2 (Riz)
Séquence 3 (Tomate)
Séquence 4 (Blé)
Séquence 5 (Riz)
Séquence 6 (Tomate)
In silico
Similarité: mesure mathématique de proximité entre deux séquences (notion quantitative).
Couverture: longueur relative ou absolue le long de laquelle deux séquences sont comparables.
In vivo
Homologie: deux molécules sont homologues si elles ont dérivé d’une molécule ancestrale commune (notion qualitative).
Gènes orthologues : gènes qui dérivent d’un ancêtre commun et qui ont divergé suite à un événement de spéciation, ils
appartiennent à des espèces différentes.
Gènes paralogues : gènes qui dérivent d’un ancêtre commun et qui sont issus d’un évènement de duplication.
Données de départ
4 séquences Oryza sativa issues du transcriptome de référence
1 séquence consensus issues du mapping, pour chaque individu (10 riz cultivés et 1
riz sauvage).
Os2g25612
RC1
RC2
RC3
...
RS7
Os3g52163
Os4g66669
Démarche générale
Transcriptome Oryza sativa:
Séquence1_SATIVA
Séquence2_SATIVA
...
Consensus Oryza glaberima / Oryza
barthii:
Séquence1_RC1
Séquence2_RS1
...
Clustering:
Regrouper par familles d'homologues les séquences consensus
et de référence.
Repérer les paralogies antérieures à la divergence Oryza sativa
/ Oryza glaberima.
Alignement et nettoyage:
Mettre en correspondance les parties similaires des séquences, et sélectionner des blocs conservés pour appuyer
l'hypothèse d'homologie.
Reconstruction phylogénétique:
Trouver un arbre vraisemblable pour expliquer l'alignement selon un modèle d'évolution donné.
Interspécifique / inter-genre
Analyse:
Affichage, enracinement, réconciliation
Intraspécifique / intra-genre
Démarche générale
Transcriptome Oryza sativa:
Séquence1_SATIVA
Séquence2_SATIVA
...
Séquences similaires chez des
espèces plus éloignées:
Séquence1_MAIZE
Séquence2_SORBI
...
Consensus Oryza glaberima / Oryza
barthii:
Séquence1_RC1
Séquence2_RS1
...
BLAST sur banques publiques:
Clustering:
Rechercher des gènes homologues chez différentes autre
espèces
Regrouper par familles d'homologues les séquences consensus
et de référence.
Préciser davantage les dates relatives des duplications
Repérer les paralogies antérieures à la divergence Oryza sativa
/ Oryza glaberima.
Alignement et nettoyage:
Mettre en correspondance les parties similaires des séquences, et sélectionner des blocs conservés pour appuyer
l'hypothèse d'homologie.
Reconstruction phylogénétique:
Trouver un arbre vraisemblable pour expliquer l'alignement selon un modèle d'évolution donné.
Interspécifique / inter-genre
Analyse:
Affichage, enracinement, réconciliation
Intraspécifique / intra-genre
Recherche d'homologues
BLAST :
BLASTN
BLASTX
BLASTP
TBLASTX
TBLASTN
Séquence de départ
QUERY
Séquences cibles
SBJCT
nucléique
nucléique traduit
protéique
nucléique traduit
protéique
nucléique
protéique
protéique
nucléique traduit
nucléique traduit