Session1_Genoscreen

Download Report

Transcript Session1_Genoscreen

Evolution des recherches en microbiologie
Naissance de GenoScreen
1er symposium en
écologie microbienne
1er manuel en
écologie microbienne
1er journal scientifique en
écologie microbienne
Appl Environ Microbiol. &
Microbiol. Ecol.
‘omic période’
1st ISME
1957
1966
1970
1974-76
temps
1980
1990
De nos jours
1998
Étude des individus
Etude des populations
Etude des communautés
Etude des métacommunuatés
Développement de milieu de culture
2-D gel
electrophoresis
Mass
Bio
PCR Spectrometry informatic Genomic
Developpement de la biochimie et
biologie moléculaire
DNA-SIP
Metagenomic
Extraction
d’acides
nucléiques
de
matrices environnementales (sols, eaux,
…)
Metaproteomic/Metabolomic
Extraction
et
caractérisation
des
protéines de matrices environnementales
(sols, eaux, …)
(Maron, Ranjard, Mougel Lemanceau 2007, Mic Ecol)
 SAS localisée sur le campus de l’Institut Pasteur à Lille
 13 ans d’existence
 35 Collaborateurs: Docteurs, Ingénieurs, Techniciens, Consultants Scientifiques
 350 Laboratoires clients
 30 Pays
 40% Exportation
NOS ACTIVITES
PRESTATIONS DE SERVICES
GENOMIC ANALYSIS
BIOINFORMATIC ANALYSIS
FORMATIONS
MOLECULAR
MICROBIOLOGY
DEVELOPPEMENTS et INNOVATION
R&D PROGRAMS
LES NOUVELLES TECHNOLOGIES DE SEQUENCAGE DE MASSE
Gs-FLX ou Gs Junior
450-500pb
750-850pb
HiSeq2500-MiSeq
Ion Proton - Ion Torrent
2*125pb
350-400pb
2*250pb
2*300pb
Chimie Avalanche???
RESSOURCES MICROBIENNES
DESCRIPTIVE
DIVERSITE TAXONOMIQUE
METAGENOMIQUE
FONCTIONNELLE
DIVERSITE DES GENES
METATRANSCRIPTOMIQUE
ECOLOGIE MICROBIENNE
VALORISATION
OUTILS STANDARDISES
+
BIONDICATEURS
ENVIRONNEMENT
SANTE
AGRO-ALIMENTAIRE
PHARMACIE/BIOT
ECH
SOLUTIONS STANDARDISEES APPLIQUEES A LA SANTE ET
L’ENVIRONNEMENT
Extraction Acides
nucléiques
Préparation des
librairies
Acquisition de données
en haut-débit
Expertise bioinformatique
Résultats
Sanger
NGS
qPCR
Biopuces
Kits d’extraction
Kits de préparation
Génotypage, qPCR, Biopuces,
Analyses de fragments,
Séquençage Sanger/de masse
Traitements
et pipelines d’analyse
LES NOUVELLES TECHNOLOGIES DE SEQUENCAGE DE MASSE
Gs-FLX ou Gs Junior
450-500pb
750-850pb
HiSeq2500-MiSeq
Ion Proton - Ion Torrent
2*125pb
350-400pb
2*250pb
Chimie Avalanche???
2*300pb
Développements de KITS de Préparation des librairies pour analyses
de métagénomique
NOS SOLUTIONS MOLECULAIRES
OPTIMISEES ET STANDARDISEES
1- Metabiote® Kit
2- Metabiote® OnLine
3- Metabiote® MiSeq 192-Plex
MetaBiote®
Extraction ADN
Les Solutions MetaBiote®
MICROBIOTES
HUMAINS
Amplification
PCR ciblée
KIT MetaBiote®
Purification
Mélange
ADNr 16S
Séquençage
Analyses
bioinformatiques
V6
MetaBiote® OnLine
MetaBiote®
La solution MetaBiote®
Fiabilité et reproductibilité des Kits
V6
 Confrontation aux données de biodiversité
bactérienne des microbiotes humains pour
optimiser représentativité
BLAST
Bases différentes
TCAG
INDEX SIM
 Encadrement des régions hypervariables
V3-V4 de l’ADNr 16S
 Eviter homopolymères entre Clef-SIM et
SIM-primer
NNNNNNNNNNN

CLE
INDEX
PRIMER
Observation des structures SIM-amorce
prédites afin d’éliminer structures en épingle
à cheveu
Design primers spécifiques + design des SIMs
La solution MetaBiote®
Fiabilité et reproductibilité des Kits
100
Protocole 1
Protocole 2
Protocole 3
90
Relative Abondance (%)
80
100
100
100
80
80
60
60
70
80
60
60
50
40
40
40
40
20
30
20
20
0
20
0
0
10
0
MID001
Acidobacteria
Gemmatimonadetes
Chlamydiae
MID002
MID011
Associated
IndexesMID009
(MID) to a unique
soil
(LUSIGNAN)
Proteobacteria
Firmicutes
Actinobacteria
Verrucomicrobia
Nitrospira
BRC1
TM7
OD1
WS3
Unknown
Planctomycetes
MID023
Bacteroidetes
Chloroflexi
MetaBiote®
La solution MetaBiote®
Fiabilité et reproductibilité des Kits
16000,00
MoyenneMIDs
SIMs
Moyennes
Moyenne
Amorces
Moyennes
Amorces
Nombre de séquences
14000,00
12000,00
10000,00
8000,00
6000,00
4000,00
2000,00
0,00
SIMs
SIMs éliminés
Fiabilité des SIMs (Samples Identifiers for MetaBiote®):
44 SIMs testés pour n’en retenir que 27 donnant des
résultats de séquençage homogènes
MetaBiote®
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%
SIM1
SIM2
SIM3
SIM4
SIM5
SIM6
SIM7
SIM8
SIM9
SIM10
SIM11
SIM12
SIM13
SIM14
SNS
SIM15
SIM16
SIM17
SIM18
SIM19
SIM20
SIM21
SIM22
SIM23
SIM24
SIM25
SIM26
SIM27
Abondance relative des taxons identifiés
La solution MetaBiote®
Fiabilité et reproductibilité
Victivallis
uncultured Treponema sp.
uncultured Succinivibrio sp.
uncultured Ruminococcaceae bacterium
uncultured Prevotellaceae bacterium
uncultured Porphyromonadaceae bacterium
uncultured Desulfovibrio sp.
uncultured Clostridales Family XIII bacterium
uncultured candidate division TM7 bacterium
uncultured Bacteroidales bacterium
unclassified Lachnospiraceae
Treponema succinifaciens DSM 2489
Treponema porcinum
Treponema
Succinivibrionaceae
Succinivibrio
Subdoligranulum
Streptococcus gallolyticus subsp. gallolyticus
Streptococcus gallolyticus
Streptococcus
Streptococcaceae
Sporobacter
Spirochaetales
Spirochaetaceae
Spirochaeta
Ruminococcus flavefaciens
Ruminococcus bromii
Ruminococcus
Ruminococcaceae bacterium D16
Ruminococcaceae
Rubrobacter
Validation de la reproductibilité de la diversité
taxonomique observée d’un même échantillon
indexé avec 27 SIMs différents
MetaBiote®
La solution MetaBiote®
Contrôle ABC (Artificial Bacterial Community)
 Liste des ADNg bactériens contrôles
MetaBiote®
La solution MetaBiote®
Un contrôle interne
Artificial Bacterial Community
Pseudomonas aeruginosa
100%
Pseudomonas
90%
Escherichia
Escherichia coli
80%
Helicobacter
Helicobacter pylori
70%
Neisseria
Neisseria meningitidis
60%
Clostridium
Clostridium beijerinckii
Streptococcus
Streptococcus mutans
50%
Lactobacillus
40%
Lactobacillus gasseri
Enterococcus
Enterococcus faecelis
30%
Bacillus
20%
Propionibacterium
10%
Actinomyces
0%
Moyenne ABC Control
Genre
Bacillus cereus
Propionibacterium acnes
Actinomyces odontolyticus
Candida albicans
MetaBiote®
La solution MetaBiote®
Contenu et conditionnement des Kits
Mix PCR 1
Pour la diversité
ADNr16S - V3V4
ABC Control (Artificial
Bacterial Community)
Pour la validation
Mix PCR 2
Pour l’ajout des SIM (Sample Identifiers
for MetaBiote) et adaptateurs Gs-Junior
SIM pour l’indentification de chaque
échantillon et du contrôle ABC
Kits disponibles en format:
 8 échantillons (1 run GS-Junior)
 40 échantillons (5 runs GS-Junior)
NOS SOLUTIONS MOLECULAIRES OPTIMISEES ET
STANDARDISEES
1- Metabiote® Kit
2- Metabiote® OnLine
3- Metabiote® MiSeq 192-Plex
MetaBiote®
Extraction ADN
La Solution MetaBiote® ONLINE
MICROBIOTES
HUMAINS
Amplification
PCR ciblée
KIT MetaBiote®
Purification
Mélange
ADNr 16S
Séquençage
Analyses
bioinformatiques
V6
MetaBiote® OnLine
MetaBiote®
La solution MetaBiote®
L’analyse bioinformatique: MetaBiote® OnLine
Pipeline Analytique GenoScreen
Tri des
séquences
Pré-Processing
et Clustering
Comparaison
avec une base
de données
filtrées et mises
à jour
Définition de la
taxonomie
Transformation
des résultats en
figures
Interface: MetaBiote® OnLine
Client
Envoi de fichiers bruts (.sff)
en sortie de séquenceur
Réception de résultats directement
interprétables: histogrammes, camemberts,
courbes de raréfaction, HeatMap
MetaBiote®
HeatMap
La solution MetaBiote®
L’analyse bioinformatique: MetaBiote® OnLine
Pies
(représentation des taxons en fonction
de chaque échantillon)
Histogrammes
(abondance relative des bactéries
en fonction des échantillons)
Diversité de présentation des résultats, directement publiables
NOS SOLUTIONS MOLECULAIRES OPTIMISEES ET
STANDARDISEES
1- Metabiote® Kit
2- Metabiote® OnLine
3- Metabiote® MiSeq 192-Plex
Metabiote® version MiSeq 2*300pb
POURQUOI?
1- Arrêt en 2016 de la technologie 454-Roche
2- Lancement de la chimie 2*300pb sur MiSeq fin 2013
3- Capacité importante du MiSeq, intérêt en profondeur de
séquençage (échantillons environnementaux complexes)
LIMITATIONS?
1- Multiplexage limité (96 Indexes - librairies Nextera)
2- Chimie plus sensible aux librairies de faible complexité
(applications en métagénomique)
OBJECTIFS?
Metabiote® version MiSeq 2*300pb
Développer une solution optimisée de préparation des librairies
amplicon pour Séquençage MiSeq 2*300pb
Augmenter la puissance d’indexage à 192 puis 384
Optimiser les conditions de séquençage pour les librairies de basse
complexité
Développer une étape automatisée de ré-assemblage et tri qualité
des séquences
1 échantillon unique d’ADNg extrait à partir de sol
Metabiote® version MiSeq 2*300pb
RESULTATS BRUTS
Cluster
Density
(K/mm²)
Theorical
PhiX
(V/V)
15%
30%
Cluster
Passing Filter
(%)
15%
30%
Reads
(M)
15%
30%
Reads
Passing Filter
(M)
% >= Q30
15%
15%
30%
15%
30%
15%
30%
88.6
94.0
9.8
45.5
0.87
1.13
87.1
58.9
-
-
-
-
71.1
81.1
9.8
44.8
1.16
1.38
30%
Read 1
Index
699a
700a
92.52a
94.74a
19.14a
Read 2
a
b
17.43a
17.65a
16.52a
same values were obtained for Read 1, Index and Read 2
Percentage of bases with a Phred score above 30 corresponding to a base calling accuracy of 99.9%
b
Aligned PhiX
(%)
Error rate
(%)
ASSEMBLAGE DES READS
Metabiote® version MiSeq 2*300pb
Three methods were tested to manage mismatch between reads in the overlap region and compare their potential
impact on final taxonomy definition.
METHOD1: Search and trimming of specific primers. Assembly with PANDAseq without preliminary quality trimming
with a minimum overlapping of 30 or 60 bases. In case of a mismatch, the base with the best Phred quality score is
kept.
METHOD2: Bases trimming at Q25 or Q30 with PRINSeq. Assembly with FLASH starting with trimmed read1 and 2, a
minimum of 30 bases overlapping was required with a 97% homology between reads. Trimming of specific primers
with Cutadapt
METHOD3: Bases trimming at Q25 or Q30 with PRINSeq. Assembly with FLASH starting with trimmed read1 and 2, a
minimum of 30 bases overlapping was required with a 100% homology between reads. Trimming of specific primers
with Cutadapt
TAXONOMICAL ASSIGNMENTS: After reads assembly, sequences were processed with the GnS-PIPE developped by
GenoSol platform (Terrat et al. 2013 doi.1111/j.1751-7915.2011.00307.x)
Metabiote® version MiSeq 2*300pb
RESULTATS
Metabiote® version MiSeq 2*300pb
Distribution des OTUs dont l’abondance relative >1%
100%
Asaia
Thermomonas
90%
Defluviicoccus
Terrimonas
80%
Roseiflexus
Rhodoplanes
70%
Flexibacter
Bacillus
60%
Gaiella
Bellilinea
50%
Sandaracinus
Enhydrobacter
40%
Solirubrobacter
Phycisphaera
30%
Pseudomonas
Holophaga
20%
Kribbella
Iamia
10%
Unknown
I1
I7
I13
I19
I25
I31
I37
I43
I49
I55
I61
I67
I73
I79
I85
I91
I97
I103
I109
I115
I121
I127
I133
I139
I145
I151
I157
I163
I169
I175
I181
I187
0%
RELATIVE ABUNDANCE (%)
0,000006
0,000038
0,0001
0,0006
0,0025
0,0100
0,025
0,09
9,0
PhiX15%
PhiX30%
Metabiote® version MiSeq 2*300pb
Metabiote® version MiSeq 2*300pb
SUITES ?
1- Qq optimisations sur la partie séquençage
2- Analyses de données de 500 échantillons de Sols
(Comparaison GsFLX et MiSeq)
3- Autres échantillons environnementaux (eaux…)
4- Prestations de Service avant fin d’année 2014
AUTRES DEVELOPEMENTS
1- Analyse des gènes du cycle de l’Azote
en cours
2- Statistiques en métagénomique
en cours
3- Validation de biomarqueurs microbiens dans le cadre
de pollutions aux composés organiques halogénés
volatiles (COVH)
projet en soumission pour financement
Merci de votre attention
[email protected]
Follow us !
Genoscreen
1, rue du Professeur Calmette 59000 LILLE
Tel : +33 (0)3 20 87 71 53 - Fax : +33 (0)3 3 20 87 72 64
www.genoscreen.com - [email protected]