Xenómica estructural en rodaballo (Scophthalmus maximus): Aplicación á mellora productiva e á análise evolutiva mediante mapeo comparativo
Download ReportTranscript Xenómica estructural en rodaballo (Scophthalmus maximus): Aplicación á mellora productiva e á análise evolutiva mediante mapeo comparativo
GENÓMICA ESTRUCTURAL EN RODABALLO (Scophthalmus maximus): APLICACIÓN A LA MEJORA PRODUCTIVA Y ANÁLISIS EVOLUTIVO MEDIANTE MAPEO COMPARATIVO
Carmen Bouza Fernández.
A bioinformática como ponte entre a xenética e as súas aplicacións industriais e biomédicas. Cursos de Verán 2009_USC; Santiago de Compostela, 14 de Xullo de 2009
Introducción
PRINCIPALES PROBLEMAS CULTIVO DE RODABALLO
Reducida viabilidad larvaria
2 años hasta alcanzar la talla comercial
Dispersión de tallas/desdoblamiento de tanques
Crecimiento superior hembras que machos
Patologías (Aeromonas, Philasterides, VHSV )
Caracteres diana para la mejora genética en Acuicultura / importancia evolutiva
Resistencia enfermedades Crecimiento Determinación sexo Tolerancia temperatura Tolerancia salinidad etc....
Mecanismos de control y funciones génicas desconocidas
NUEVAS APROXIMACIONES EXPERIMENTALES: LA ERA DE LA GENÓMICA
GENÓMICA ESTRUCTURAL
Cartografía genómica Mapas genéticos y físicos.
Secuenciación.
GENÓMICA FUNCIONAL
Análisis expresión génica.
Transcriptómica.
Proteómica.
ANÁLISIS GENÓMICO INTEGRADO BIOINFORMÁTICA
Manejo, depósito y análisis de ingentes cantidades de datos genómicos.
GENÓMICA-BIOINFORMÁTICA EN ACUICULTURA
http://www.animalgenome.org/
ESTRATEGIAS GENÓMICAS PARA LA MEJORA DEL CULTIVO DE RODABALLO
1.
Construcción de un mapa genético con marcadores informativos identificación de genes o regiones genómicas relacionadas con caracteres productivos 2.
Caracterización de genes relacionados con la respuesta inmune construcción de un microarray identificación de genes y rutas génicas de resistencia a patologías 3. Combinación de las estrategias de genómica funcional y estructural para incrementar el potencial del análisis 4. Aplicación industrial: i) control del sexo, ii) evaluación recursos genéticos, ii) obtención de reproductores con mayor tasa de crecimiento y resistentes a patologías
GENOMA NUCLEAR
Scophthalmus maximus
0,65 pg; ~ 800 Mb 2n=44 cromosomas 22 grupos de ligamiento Ausencia heteromorfismos / sexo Bouza et al.
Marine Biology
, 1994; Pardo et al.
Heredity
, 2001; Cuñado et al
. Genome
, 2001
GENÓMICA ESTRUCTURAL EN RODABALLO: CONSTRUCCIÓN DE UN MAPA GENÉTICO PARA LA IDENTIFICACIÓN DE REGIONES GENÓMICAS DE INTERÉS PRODUCTIVO
1. GENÓMICA ESTRUCTURAL: DE LOS MAPAS GENÉTICOS A LOS PROYECTOS GENOMA
Distancia entre genes Frec. Recombinación (FR) Mapas de ligamiento (Sturtervant 1913; 1 um = 1cM = 1 % FR)
Asignación de grupos de ligamiento a cromosomas: hibridación
in situ
DMRTY Medaka
Marcadores genéticos
Genes Marcadores moleculares
Ensayo de detección Razón múltiple Reproducibilidad RFLPs
lento/rápido 1 alta
Tipo de marcador Información sobre la secuencia
codominante no/sí
Microsatélites
rápido 1 alta codominante sí
Polimorfismo
bajo alto
RAPDs
rápido 5-20 baja dominante no medio
AFLPs
rápido
SNPs
rápido 60-100 1 alta codominante/ dominante no alta codominante sí medio bajo
Elaboración de mapas genéticos
Análisis recombinacional de cruzamientos controlados / familias: Cosegregación entre pares de marcadores (FR) a partir de meiosis informativas Evidencia ligamiento y estima de distancia. Método puntuaciones LOD (Z, Morton 1955; 1995) Z x = Probabilidad del resultado observado FR = x Probabilidad del resultado observado FR = 1/2 LOD FR = x = log 10 Z x
Integración de mapas genéticos y físicos Proyectos Genoma
Secuenciación jerarquizada
2. GENÓMICA ESTRUCTURAL EN RODABALLO: CONSTRUCCIÓN DE UN MAPA GENÉTICO PARA LA IDENTIFICACIÓN DE REGIONES GENÓMICAS DE INTERÉS PRODUCTIVO
FASES EN LA CONSTRUCCIÓN DEL MAPA GENÉTICO DE RODABALLO
1) Obtención de marcadores genéticos informativos 2) Desarrollo de una herramienta bioinformática para el procesado de secuencias 3) Constitución de las familias de referencia: ginogenéticos haploides, diploides y “F 2 ” con fase de ligamiento conocida 4) Genotipado de marcadores utilizando familias de referencia y construcción del mapa con programas específicos (JOINMAP) 5) Obtención del mapa genético: consenso, vía macho y vía hembra, y posicionamiento de centrómeros 6) Análisis comparado con otros mapas genéticos de peces
2.1. OBTENCIÓN DE MARCADORES GENÉTICOS INFORMATIVOS Y DESARROLLO DE UNA HERRAMIENTA BIOINFORMÁTICA PARA EL PROCESADO DE SECUENCIAS
Genotecas Secuenciación Edición De Secuencias Amplificación Polimorfismo Genotipado Mapa Herramientas Bioinformática Eliminación Vector Y Adaptador Identificar Microsatélites Redundancia Diseño De Primers Base De Datos
OBTENCIÓN DE LIBRERÍAS ENRIQUECIDAS EN MOTIVOS CORTOS DE REPETICION
(FIASCO; Zane et al. 2002)
Edición de secuencias microsatélite
( CA )n ( T G)n
Análisis de redundancia. Alineamiento de secuencias y búsqueda de homologías (CLUSTAL)
Archivo de secuencias para diseño de primers (PRIMER 3.0)
3 T7-AC1-A10-AC1-8.10.04-A08-02.
TCACACACACACACACACACAGTTTAGTGTGTCATCTGACGGCCC
CCTCCCATGTATTTCTGTGG
GATAGGTATCAACACACAAATACAC AAGCACACATACACACACACACACACACACAACACACACACACTTGTGTGCTTTTTTTCAAAGCTTACACACTACTATCCTTTCACCCTAC TGCCACCAGATAATCCATTTTATAGCCAGGGATCA
AACACTGAGCCCTCTGGCTA
TGTGCTACTGTAACGCGCACGCACTCACTCACTC ACTCACACACAA
191 4 T7--AC1--C7_AC1.8.10.04_C05_05.
GTGTGTGTGTGTGTGTRWGTGTGTGTGTGWGARTGTGTGTCTGTGAGAATGGGTGTGATTTGTGTATGAATGGTTGATACCGACTGT GGGAAAAAAAAGAAAAAAAAAAGGTCATCCGCTGGTGTCTAGAAGCTGGCGACATCGCTGTTTCATCCCTCCTCGCTCCCTCTCTTTC TGATGAGTCCTGAGTAATATACTGGGATATAACAATGT
GAGACGCATTAGGCAGCATT
ATGTTATGTTCTTTCTTACATAAAGAGAGA GAGAGAGAGTGTGTGTGTGTGTGTGTGTGTGTGTCAAACAGCAAGGGTCCTCCTCCTCCTCCCAGTAGCTGTGTGTTGCCCACTGTA CACGATGCTCTCARCTT
TCGTCAGTTGTCCTTGATGG
ATTACTCAGGACTA
174 7
. > 1_T7--AC1--F11_AC1.8.10.04_F09_11.
TGATGAGTCCTGAGTAACGTTGAGTCAGTGT
GCGTATGGAGAGTGCCTCAT
ATGAACGTGTGTGCGTCATGTGTGTGTGTGTGTGTGT GTGTGTGTGTGTGTGAGC
CTTGACTCTCACTGCCCACA
GGTTGGTCACACTTGTGCTCTTGTGTGAGACATCAAAGCGAGAAATGACA GAGATGGAGGGAGAATTCAACAAATGCGGGCGGGCGGTCTACTGCTCTGTGTGTACATATGTGATGTGTGTGTGTGTGCGTTTGTGTT TGTGTACTAAAAGAGAGAGCGCACATCTGTGTGGCGGTCTGGAAGCGGTCCATCTCAATGCTGTGGGCAGATAGCATCGTCACACATG ACTGCAACCCACAGCCAGACTGACAGATATAAACATATAGCTTTCCGCAGACGAGAAAGACACGGCTACAGGGCGCAAAAGACGGAAC GTACAAAAGATAGGCGGTATAAATCAACTCTCTCCAACCCTTTTTTCTATTTACAGCTAAATATACTTTTTGTTCTCCTGTAGACTAAAAM CACGGAACACTGTTTTACTCANGACTCATC
101
PUESTA A PUNTO DE 356 MARCADORES MICROSATÉLITES Locus Sma-USC38 Sma-USC39 Sma-USC40 Sma-USC41 Sma-USC42 Sma-USC43 Sma-USC44 Sma-USC45 Número de acceso a Genbank DQ810838 DQ810839 DQ810840 DQ810841 DQ810842 DQ810843 DQ810844 DQ810845 Secuencia cebadores (5'-3') F: CAGTGTGCGTATGGAGAGTG R: TGTGGGCAGTGAGAGTCAAG F: CCTGGAGTGTCGAGCTACAA R: GGTAGAGGACAATCGGTGGAG F: GGTGTAGTGGGAGTGTGG R: GCACTAGTGATTGGCGG F: ATCCAGGAGAGCAGAGAC R: GCCACACCTCACTGTAAA F: GCCCCTGATTTTAGATAGTAA R: TGCTGAACAAGATGATGGAT F: GCTCTGTTGTCATTGGTTTGA R: CTCAGAGGAGCAAAGAAAGG F: AAGGAAGCCATTGTGTGTGT R: CCCTGTGAATTTGTCCATCC F: GGGCTGGAGGTTTGCTAAT R: CCCTGCTCTGTCTCTGCTTT Motivo de repetición (TG)17 (CT)18 (AC)14 (CA)24 (CA)5+18 (CT)10 (TG)8+13 (GT)16 Tamaño (pb) 099-107 160-164 66-86 176-194 322-352 141-145 150-160 189-203 T a 54 58 56 54 54 50 54 58 A 3 2 6 6 7 3 4 5 H E 0.318
0.545
0.848
0.894
0.909
0.545
0.712
0.788
F IS * -0.047
1.000* -0.179
0.441
0.084
-0.224
0.063
0.154
Pardo et al. Mol.Ecol.Notes 2005; Aquaculture Research 2006; Genome 2007.
http://mathgene.usc.es/turbot2/
Turbot EST DATABASE Secuencias Tipo M ANÁLISIS GENÓMICO
S. maximus
L ibrería enriquecida en motivos cortos de repetición dispuestos en tándem (Microsatélites o STRs-single tandem repeats-) Objetivo: I dentificar una serie de loci microsatélite, que sirvan de marcadores a lo largo del genoma de rodaballo.
Secuencias Tipo E L ibrerías de Expresión de cDNA a partir de ARNm de tejidos linfoides Objetivo: Análisis de expresión génica a lo largo del proceso infectivo con patógenos seleccionados ( Aeromonas salmonicida Philasterides dicentrarchi, …), e identific ación de genes candidatos relacionados con la resistencia a dichas patologías.
Todas son parte del genoma de la especie, con características comunes: Parte de la misma BD, y reali zación sobre ellas de los mismos procesos de análisis automático.
2.2. CONSTITUCIÓN DE LAS FAMILIAS DE REFERENCIA Y GENOTIPADO DE MARCADORES PARA LA CONSTRUCCIÓN DEL MAPA GENÉTICO
FAMILIAS DE REFERENCIA: ANÁLISIS DE LIGAMIENTO
FAMILIAS GINOGENÉTICAS HAPLOIDE Y DIPLOIDE FAMILIA BIPARENTAL DIPLOIDE ( DF )
UV
Óvulo (n)
x
Destrucción por UV del núcleo espermático (n) S1 X S2 S2 X S2
X
X HÍBRIDO 1ª G on .
S2
X
CP2 (n) EMBRIONES HAPLOIDES (n) Piferrer
et al.
(2004)
(HF)
EMBRIONES DIPLOIDES (2n)
(DGF) Mapa consenso: HF y DF (Bouza et al. 2007) Mapa centrómeros: DGF (Martínez et al., en prensa)
Software utilizado para la construcción de mapas genéticos en distintas especies acuícolas Paquetes informáticos a Especies Referencia software (web) CRI-MAP JOINMAP LINKMFEX
Dicenthrarchus labrax
1
Sparus aurata
2 Green et al. 1990 (http://bimas.dcrt.nih.gov/sw.htlm#crimap)
Salmo salar
3 Oreochromis spp.
4
Haliotis spp.
5
Scophthalmus maximus 16 Oncorhynchus mykiss
6
Salvelinus alpinus
7
Salmo trutta
8
Lates calacarifer
9 Danzman 2000 (http://www.uoguelph.ca/
rdanzman/software) Danzman 2000 (http://www.uoguelph.ca/
rdanzman/software) MAPMAKER
Danio rerio
10
Cassostrea gigas
11
Litopenaeus vannamei
12
Takifugu rubripes
13
Scophthalmus maximus 16
Lander et al. 1987 (http://www.genome.wi.mit.edu/ftp/distribution/software) MAP MANAGER
Paralychtys olivaceous 14
Seriola spp.
15 Manly y Olson 1999 (http://mapmgr.roswellpark.org/mapmgr.htlm)
Bouza y Martínez, en prensa.
a Información adicional sobre recursos informáticos de análisis de ligamiento: http://linkage.rockefeller.edu/ 1 Chistiakov
et al.
2005; 2 Franch
et al.
Hara 2007 ; 10 Shimoda 6 Sakamoto
et al.
1999; 11
et al.
2000; 7 Woran
et al.
2004; Hubert y Hedgecock 2004; 12 8 Gharbi Zhang
et al.
et al.
2006; 2006; 13 9 Wang Kai
et al.
et al.
2007; 2005 ; 14 Coimbra
et al.
2003; 15 Ohara
et al.
2006 ; 2005 ; 3 Moen 16 Bouza
et al et al.
2004; 4 Lee
et al.
. datos no publicados.
2005; 5 Sekino y
ANÁLISIS DE LIGAMIENTO JOINMAP 3.0
A A1 B1 A3 B5 A1 B1 A2 B2 A2 B2 A5 B7
Progenie ginogenéticos haploides
…100
A1 B1 A2 B2 A1 B2 A2 B1
FR A-B = Recombinantes (A 1 B 2 y A 2 B 1 ) / Total = 20/100 = 0.20
Distancia A B (función de mapa de Kosambi) = 21cM B
SmaUSC254 21cM SmaUSC265
(De Bouza y Martínez.
En
Genética y Genómica en Acuicultura. En prensa).
2.3. MAPA GENÉTICO DE RODABALLO: MARCADORES MICROSATÉLITES ANÓNIMOS CONSENSO, VÍA MACHO Y HEMBRA POSICIONAMIENTO DE CENTRÓMEROS
MAPA GENÉTICO RODABALLO. LG1-12.
MAPA GENÉTICO RODABALLO. LG13-26.
Bouza et al. Genetics, 2007; Martínez et al. Aquaculture, 2008
VARIACIÓN EN FRECUENCIA DE RECOMBINACIÓN (FR)
60 50 40 30 20 10 0 0 (13.3 ± 2.5
vs
. 8.3 ± 2.0; P<0.05) Ratio F:M 1.6:1 10 20 30 40
Paternal genetic distance (cM)
50 60 60 50 40 30 20 10 0 0 (20.6 ± 4.1
vs
. 21.0 ± 3.9; P>0.05). 10 20 30 40
Genetic distance in DF fem ale
50 60
MAPAS GENÉTICOS EN ACUICULTURA Especie GL n Marcadores
Danio rerio 1 Oreochromis spp.
2
25 24 25 22 2000m 521m, 21g, Sx, P 162m, 2g
Dicentrarchus labrax 3
25
Sparus aurata 4 Hippoglossus hippoglossus
5 26 24 Scophthalmus maximus 6 26 24 24 24 22 204m 258m,356A 248m Longitud (~ cM) Densidad (~ cM) ~ Mb/cM ~ Ratio FR F:M 2300 1311 1762 1242 1510 1346 1.2
2.4
5.0
9.7
4.3
5.6 0.74
0.84
0.47
0.81
0.53
0.53
2.7:1 1:1 1.5:1 1.2:1 2:1 1.6:1
1 Shimoda
et al.
1999 ; 2 Lee
et al.
2005 ; 3 Chistiakov 2006 ; 5 Reid et al. 2007 ; Bouza
et al.
2007
et al.
2005 ;4 Franch
et al.
2.4. ANÁLISIS DE SECUENCIAS RESPECTO A GENOMAS DE PECES MODELO: MAPEO COMPARATIVO
Análisis de secuencia comparado con genomas de peces modelo 219 secuencias flanqueantes de microsatélites de rodaballo NCBI-BLASTn
(e<10 -5 , mayoría e<10 -10 )
Database
tetraodron tetraodron tetraodron danio danio fugu fugu
Turbot Micro sequence
M-V-T7-AC32-B12-24.1.05( M-L-SP6-AG2-G7-22.11.04( M-S-puc19-AC0-A2-1.11.04( M-L-T7-AG2-D3-14.10.04
M-L-T7-AG2-D3-14.10.04( M-V-K-AC5.1-H7-2.3.05( M-L-K-AC3-C11-25.10.04
R414 ) RD179 R190 (R15 R15 R607 ) ) ) ) ) (R623-subseq1 )
Contig number/LG
11 12 15 Zv6_scaffold3458.5
24 scaffold_40 scaffold_180
HitSignif
9,00E-09 9,00E-22 6,00E-14 2,00E-19 2,00E-19 8,00E-07 5,00E-36
\%ID
95,12 90,11 86,44 82,1 82,1 87,93 92,17
eValue
9,00E-09 9,00E-22 6,00E-14 2,00E-19 2,00E-19 8,00E-07 5,00E-36
length
41 91 118 162 162 58 115
Hit string
aggcaccttgcaacagctggtctgaattatccgtggggggg aaacatggcggcggccatggagctgagatgctgggggggaggctggggtttgccctctgtccacgcagagtctctggtagttctggtaacg agttttgatttacctctgtgctgcgctgcagtaattggat-gtgacaccattctgcgcgccctctctgggggatagaacaggaatctgactattatggccccagtcgtgaatatgtca agcttggcgtaatcatggtca-tagctgtttcctgtgtgaaattg-ttatccgctcacaattccacac-aacat-acgagccggaa-gcat-aaagtgtaaagcct-ggggtgccta-atgagtgagctaactcacattaattgcgttgccgctcactgccc agcttggcgtaatcatggtca-tagctgtttcctgtgtgaaattg-ttatccgctcacaattccacac-aacat-acgagccggaa-gcat-aaagtgtaaagcct-ggggtgccta-atgagtgagctaactcacattaattgcgttgccgctcactgccc tagtaccatctggatttccagtcaatgtgactgctgaggctgtgggttccaccaagat cctcttgcagttgctgcttccattagcttccagtatgataaaagagacggcaccagctgacaccaccacaatgactcaccatggataaaagaatgagatgtcccctctagtagct
Análisis de secuencia comparado con genomas de peces modelo
Turbot – Sintenic spp.
Linked-Linked Linked-Unlinked Unlinked-Linked Total Non unique matching
Tetraodon
40 11 2 24.2% 5/55 (9.1%)
Takifugu
59 0 4 28.8% 6/64 (9.4%)
Danio
17 1 1 8.7% 7/19 (36.8%) The T. nigroviridis genome (ver. 7.0) was downloaded from ftp://ftp.ensembl.org/pub/current_tetraodon_nigroviridis/data/fasta .
The T. rubripes genome (ver. 4.0) was downloaded from ftp://ftp.ensembl.org/pub/current_takifugu_rubripes/data/fasta . Genomic sequences of D. rerio were obtained from ftp://ftp.ensembl.org/pub/current_danio_rerio/data/fasta
1 1 2 3 4 5 6 7 8 9 18 19 20 21 U N 10 11 12 13 14 15 16 17 1 1 1 2 1 3 3 1 3 1 Mapeo comparativo: Sintenias Rodaballo - Tetraodon 4 5 3 6 7 1 8 9 10 11 12 Rodaballo 13 14 15 16 17 18 19 20 21 22 23 1 1 1 24 25 26 N L 1 3 2 2 1 3 3 1 1 1 1 1 3 1 1 1 1 1 1 1 2 2 1 1
ERC pb average (range ) Homology 102 pb (29-327) 81-100%
MAPEO COMPARATIVO
Rodaballo –
Tetraodon – Fugu Danio
T-LG5 F-S14 T-LG1 F-S25 T-LG12 F-S4 D-LG5
3. CARACTERIZACIÓN DE GENES RELACIONADOS CON LA RESPUESTA INMUNE CONSTRUCCIÓN DE UN MICROARRAY PARA LA IDENTIFICACIÓN DE GENES Y RUTAS GÉNICAS DE RESISTENCIA A PATOLOGÍAS (PRESENTACIÓN P. MARTÍNEZ)
CONSTRUCCIÓN DE LIBRERIAS de ADNc
Extracción y evaluación
Homogenizado de pooles (N2 líquido)
calidad ARN
(Trizol) 28S 18S 5S Figura cDNA synthesis kit (Stratagene)
Librerías de ADNc
(ZAP-cDNA Library Construction kit)
Purificación ARNm
(Dynabeads Oligo dT 25 )
SECUENCIACIÓN 12.000 ESTs
Picado de colonias Glicerinados, conservación a -80ºC 4.000 secuencias control 4.000 secuencias Aeromonas 4.000 secuencias Philasterid Extracción de plásmido y secueciación ESTs
3.1. CONSTRUCCIÓN DE LA BASE DE DATOS DE ESTs
CARACTERÍSTICAS BASE DE DATOS RODABALLO
1) 16.514 secuencias de calidad (>100pb; PHRED>20) 2) Librerías de cDNA de infecciones con Aeromonas (4.000), Philasterides (4.000), Nodavirus (3.000), Enteromyxum (2.000), controles (6.000) + librerías enriquecidas microsatélites (1.400) 3) Procedentes órganos linfoides: hígado, riñón, bazo, timo y ciegos pilóricos 4) Secuenciadas desde 3 ´ mayoritariamente 5) 6.170 secuencias únicas: 1.827 contigs + 4.343 singletons
BASE DE DATOS ESTs Y MICROARRAYS Librerías cDNA
Tejidos RNA
Control Aeromonas Philasterides
salmonicida dicentrarchi
mRNA Librerías cDNA
ANÁLISIS FUNCIONAL DE RESISTENCIA A PATOLOGÍAS Datos de expresión
Código de punt microar.
Código de secuenca Nivel de expresión
Datos de secuencias
Sec. bruta, código, calidad, edición…..
Clustering
Código del grupo Secuencias constituy.
Alineamiento Secuencia consenso Secuencias Evaluación de calidad Limpieza y edición Agrupamiento Contigs y singletons
Búsqueda homología Homología data BLAST
E-value Score Alineamiento
Código secuencia
Hibridaciones Construcción Microarray
Anotación sistemática
Términos GO, COGG Rutas KEGG
TURBOT DATABASE V2.0
(Pardo et al., BMC Vet. Res., 2008) Portal entrada Base Datos Visión paginada de contigs y singletons Portal diseño de oligos Menú de búsqueda
MEJORAS EN LA BASE DE DATOS. 2: BLAST LOCAL
Incorpora genomas de 5 especies modelo.
Takifugu rubripes Tetraodon nigroviridis Danio rerio Gasterosteus aculeatus Oryzias latipes
HERRAMIENTA DE LA BD TURBOT-ESTs AUTOMATIZAR LA BÚSQUEDA DE MARCADORES GÉNICOS
113 132 141 169 178 186 188
ID
3 9 18 44 103 112
INFORMACIÓN
Putative N-acetyltransferase Proteína ribosomal L36 ribosomal protein S30 Proteína ribosomal S18C Eukaryotic translation initiation factor 2, subunit 3 type I keratin S8 Clon cDNA Platichthys flesus Elastasa 2 precursor Clon cDNA Gasterosteus aculeatus Clon cDNA Haplochromis chilotes Muscle-specific beta 1 integrin binding protein 2 microglobulin beta 2 Clon cDNA Gasterosteus aculeatus
MOTIVO
GA GA GA GA GAG AC CAC TG TG GA AGG CCA TA
Nº REP
10 49 25 12 9 11 6 12 18 17 6 6 9 (Microsatélites SPUTNIK, otros… , SNPs QualitySNP pipeline )
IDENTIFICACIÓN DE MARCADORES GÉNICOS MICROSATÉLITES Y SNPs
MARCADORES GÉNICOS: SNPs Reacción de SNaPshot: Primer a una base del SNP
MARCADORES GÉNICOS: SNPs Testado del polimorfismo de SNPs: Marcador USC-SNP_18 G/ A
CATÁLOGO DE MARCADORES GÉNICOS BASE DE DATOS 1.0 (GENOTECAS cDNA: AE, PH, C) MICROSATÉLITES:
○ ~ 650 microsatélites en ~ 530 secuencias únicas (“SPUTNIK”) ○ Selección de 191 micros (>8 di, >6 tri, >5 tetra y penta)
Pardo et al. (2008)
;
Bouza et al. (2008)
SNPs:
○ ~ 1200 SNPs filtrados en ~ 250 contigs (“true SNPs”; QualitySNP pipeline; Pardo et al. 2008)
MARCADORES GÉNICOS Y MAPEO GENÉTICO
Indiv M197 F61-1 P3-A35 P3-A47 P3-A49 P3-A51 P3-A55 P3-A56 P3-A57
Genotipado de la familia de referencia Mapeo integrado de los loci EST microsatélite en el mapa consenso de rodaballo (JOINMAP)
Sexo M F M M F M F M F RE466 369369 369374 369374 369369 369369 369369 369374 369374 369374 RE774 160163 160157 157163 157163 157160 160163 157163 160160 160160 RE823 342332 342338 332342 342342 332342 342342 338342 342342 332342 RE876 154156 154156 156156 154154 154156 156156 156156 154156 154154 RE928 374388 374372 374374 374374 374374 374374 374374 374374 372388 RE937 344361 348372 361372 344372 344348 344372 344348 344348 361372 RE2708 207223 207219 219223 207219 207207 219223 207223 219223 207223
MARCADORES GÉNICOS Y MAPEO GENÉTICO Locus SmaUSC E1 SmaUSC E2 SmaUSC E3 SmaUSC E4 SmaUSC E5 Microsatellite characteristics 1 Primer sequences (5´
3´) Ta Repeat motif Mg A Population análisis Range pb He 2
P
LG 4 Linkage análisis 3 Closest marker Distance 5 cM CGCTGCTCTTCTTCCTCTGT 60 (CAG) 9 7 114 138 0.791
0.06
5 17 SmaUSC14 2 CTCTCTCTGGAGCCTCGTCA 1.5
GGAGATCGCAACCTACAGGA 58 (AC) 11 2 446 448 0.040
1.00
0 9 4 SmaUSC57 CGGGCTTCTCTTTGGACATA 1.5
CTTGGTACAGCATTCACGATG 58 (TG) 12 4 218 224 0.584
0.01
0 4 SmaUSC7 AGAGCAATGTAAGCGCCTTT 1.5
CCCAGCTCTGTGTCTCCACT 58 (CCA) 6 3 69-75 0.520
0.53
5 TCCAATGTGACGTTCCCTCT 1.5
GGAGGAGTTCAGGGAGCAG 60 (AGC) 7 4 369 386 0.568
0.16
7 9 F12-ITG16 CAGCATCACTGGGTTGAAAG 1.5
Table 1. Characteristics of 43 EST derived microsatélites in turbot 4.6
1.2
[3.7] 0.2
EST-derived microsatellites SmaUSC-E1 SmaUSC-E2 SmaUSC-E3 SmaUSC-E4 SmaUSC-E5 Closest identity 1 eukaryotic translation initiation factor 2 subunit 3 gamma [Danio rerio] keratin K10 [Polypterus senegalus] elastase 2 precursor [Paralichthys olivaceus] Scophthalmus maximus clone sbc1 microglobulin beta 2 mRNA. complete gastrula specific embryonic protein 1 [Epinephelus coioides] Accesion no. AAH55248.1
CAL99128.1 BAA82368.1 DQ848854.1 AAN02166.1 E-value 3.00E-15 5.00E-22 2.00E-59 3.00E-75 3.00E-07 SmaUSC-E7 Predicted: fibroblast growth factor receptor substrate 2 isoform 3 [Pan troglodytes] XP_522464.2
Table 2. Functional annotation of 20 turbot EST derived microsatélites 6.00E-09
Pardo et al. BMC Vet Res 2008; Bouza et al. Animal Genet 2008
EXTENSIÓN DEL MAPA GENÉTICO: MAPEO GÉNICO ADH-iron containing Elastase 2 Precursor Prot. Disulfure Isomerase Pancreatic Helicase KeratinS8
Figure 1. Genetic mapping of 33 turbot EST-derived microsatellites into the turbot consensus map based on 242 anonymous microsatellites (Bouza
et al
. Animal Genet 2008)
SELECCIÓN MARCADORES: DISTRIBUCIÓN HOMOGÉNEA EN GENOMA DE RODABALLO - 99 marcadores genotipados en familias AS y AP - 13 de los cuales de EST (RE)
MAPA GENÉTICO Y RASTREO GENÓMICO
1) Aplicación del mapa de referencia en un panel de familias de referencia segregantes para los caracteres de interés: Sexo, Crecimiento y resistencia a procesos infectivos (A. salmonicida, P. dicentrarchi, otros parásitos y virus).
2) Identificación de QTLs / regiones genómicas asociadas a crecimiento, resistencia patologías y determinación del sexo en rodaballo
F3P_4 F3M_19&16&17 F3P_5 F3M_3 F3P_6 F3M_1 R367
R247
R267 P9
R270
P17 R687
0,0 4,4 21,5 31,7 39,4 42,4 42,8 0,0 6,5
R367 P18
0,0
Sib-Pair Regression
0,0 0,0 13,7 0,0
(Haseman & Elston)
12,6
R267
23,6
RD66
29,3
P9 P17
R697 37,3 38,0 10,3
R687 P18 RD66
R178
R38 R95 R544
R235 0,9 4,5 5,0 0,0 0,0
F3M_20 R38
R311[R697,37.49cM] R809 R12 33,9 23,1 14,4 28,3 34,7 R185
R95 R544
P5
F3P_3
R736
R152 R16
R360 0,0
F3M_14
0,0 1,7 R236
R152
16,2
R16[R736,39.62cM] R548 R825
R953 40,3 42,7 50,3 0,0 6,4 R675
R548 R825[R12,31.42cM;R235,41.42cM]
SexP
43,9
LG 21
SexM 63,7 77,5
LG 5
GENES DETERMINANTES DEL SEXO
Sequ.
turbot112 turbot112 turbot2754 turbot2754 turbot3027 turbot3027
%ID
84,3 83,86 80,37 81,51 87,65 80,95
MAPEO COMPARATIVO: CONSERVACIÓN DE ORDEN HERRAMIENTA BIOINFORMÁTICA eValue
7,00E-39 2,00E-36 4,00E-12 1,00E-09 2,00E-42 5,00E-09
HSP_length
223 223 163 119 170 126
query_ start
40 40 28 30 320 78
query_ end
262 262 190 148 489 203
hit_start
5132911 5126492 8148100 1051999 1140524 1140342
hit_end
5133132 5126713 8148262 1052117 1140693 1140467
Tetraodon nigroviridis
LG18 Sib-Pair Regression Interval Mapping (Haseman & Elston)
1.1
SmaUSC3027-Helicase
hit_ length
223 223 163 119 170 126
q-Res
5.1
SmaUSC112-KeratinS8 8.1
SmaUSC2754-DS_Isomerase
10105158 pb (10 Mb)
Análisis de QTLs asistidos por marcadores en especies de importancia en Acuicultura
Trucha arcoirís
Tolerancia temperatura Tiempo freza Resistencia enfermedades Virales (IPN, IHN) Parasitarias
Salmón atlántico
Resistencia enfermedades Anemia infecciosa
Platija japonesa
Resistencia enfermedades Víricas (LCD)
Tilapia (Oerochromis spp)
Tolerancia salinidad / Tª Determinación sexo
Ostra (C. virginica)
Resistencia enfermedades
Barramundi (L. calcarifer)
Crecimiento Jackson et al. 1998, Danzman et al. 1999 Sakamoto et al. 1999 Ozaki et al. 2001; Khoo et al. 2000 Bartholomew et al. 2003 Moen et al. 2003 Fuji et al., 2002; Jackson 1998; Agresti et al. 2000; Cnaani et al. 2003 Shirak et al., 2006 Yu y Guo 2006 Wang et al. 2006, 2007
SELECCIÓN ASISTIDA POR MARCADORES
A B
Variantes alélicas de un gen mayor relacionado con un carácter productivo de interés
Integración de mapas genéticos y físicos Caracterización molecular de regiones genómicas
Secuenciación jerarquizada
HERRAMIENTAS DE INTEGRACIÓN GENÓMICA: GENOTECA EN VECTORES DE ALTA CAPACIDAD Genoteca genómica de BACs de rodaballo (REGABA) Clones grandes ordenados
Integración de mapas genéticos y físicos
M5 R2 M7 M9 R9 M2
Genotecas cDNA ESTs rodaballo A T CCC G AA C AAA C TT G T A GGG C TT G TTT G AA C Mapa citogenético
M5 M6 M3 M8 M1 M6
Mapa genético (cM) Identificación QTLs/ regiones interés Vector alta capacidad (BAC) Subclones ordenados Desarrollo Genoteca BACs rodaballo C TT GG T A C A G C A TT C A C G AA CC A T G T C G T AA G T G Marcador de secuencia STS ó EST (anónima o expresada)
MAPEO FINO Y CLONAJE POSICIONAL
MEDAKA (O. latipes) MUTANTE MELANINA (b)
LG12 BAC 171M23 Subclonación Cósmido C27 Secuenciación shotgun (36.3 kb) Genes candidatos
Fukamachi et al. Nature Genetics, 2001.
ANÁLISIS GENÓMICO INTEGRADO
•
Colecciones de marcadores moleculares (microsatélites, ESTs, micros-ESTs,….)
•
Base genética de caracteres cualitativos
•
Disección de caracteres complejos
•
Identificación de genes candidatos y rutas génicas / localización QTLs / colocalización de ESTs-QTLs
•
Selección asistida por marcadores (mapas/arrays)
•
Mapeo comparativo y genómica evolutiva
•
Toxicogenómica ….
Mejora genética Recursos genéticos
GENÓMICA POBLACIONAL
Marcadores Anónimos vs. Génicos. Detección huellas de selección Evaluación de recursos genéticos
BAJA ESTRUCTURACIÓN POBLACIONAL (5%) CON MARCADORES ANÓNIMOS NEUTROS, PERO ¿EXISTEN DIFERENCIAS ADAPTATIVAS?
GRUPOS Y EMPRESAS COLABORADORES
Universidad de Santiago de Compostela
GG USC1: Grupo de Genética -
Paulino Martínez
GP USC: Grupo de Parasitología -
Manuel Sanmartín
GIP USC: Grupo de Ictiopatología -
Carlos Dopazo y Manuel Lemos
GMA USC: Grupo de Matemática Aplicada -
J. Antonio A. Dios, Antonio G. Tato y Manuel Calaza
GAP USC: Grupo de Anatomía Patológica-
Maribel Quiroga, José M. Nieto
Universidad de Vigo
GG V1: Grupo de Genética GG V2: Grupo de Genética -
Pablo Presa Andrés Sanjuán
GG GC: Grupo Genética Cua ntitativa
Miguel P. Enciso
(
Univ. Autónoma de Barcelona
)
Miguel Toro Jesús Fernández
(
INIA
)
Instituto Ciencias Mar Barcelona (CSIC)
Francesc Piferrer (Univ. Complutense de Madrid)
y
Instituto Español de Oceanografía-Vigo
Rosa M. Cal
CETGA
-Cluster Acuicultura
Santiago Cabaleiro
Institituto Acuicultura Torre la Sal (CSIC)
Grupo de Parasitología –
Pilar Álvarez
Empresas y Administraciones Públicas
CLUSTER DE ACUICULTURA CETGA, INSUIÑA S.A.-PESCANOVA, STOLT SEA FARM S.A., ISIDRO DE LA CAL S.A., ALROGAL S.A., CONEI OVERSEAS, CULMAREX S.A.
XUNTA DE GALICIA, MINISTERIO EDUCACIÓN Y CIENCIA
Consolider 2007
CSD 2007-00002
, Mejora de la producción en acuicultura mediante biotecnología (AQUAGENOMICS)
Investigador Coordinador
: Antonio Figueras Huerta
Centro:
CSIC Instituto de Investigaciones Marinas de Vigo
Resto de centros que participan
: Instituto de Acuicultura de Torre de la Sal (CSIC), Instituto de Ciencias Marinas de Andalucía (CSIC), Instituto Nacional de Investigación y Tecnología Agraria y Alimentaria, Centro de Investigación en Sanidad Animal (Universidad Autónoma de Barcelona), Universidad Complutense Madrid, Instituto Nacional de Bioinformática, Universidad de Barcelona, Universidad de Cádiz, Universidad de Granada, Universidad Miguel Hernández de Elche, Universidad de Murcia, Universidad de Santiago de Compostela.
Financiado con:
5.000.000 €
Entidad gestora
: Consejo Superior de Investigaciones Científicas
PROYECTO AQUAGENOMICS
http://aquagenomics.es