Xenómica estructural en rodaballo (Scophthalmus maximus): Aplicación á mellora productiva e á análise evolutiva mediante mapeo comparativo

Download Report

Transcript Xenómica estructural en rodaballo (Scophthalmus maximus): Aplicación á mellora productiva e á análise evolutiva mediante mapeo comparativo

GENÓMICA ESTRUCTURAL EN RODABALLO (Scophthalmus maximus): APLICACIÓN A LA MEJORA PRODUCTIVA Y ANÁLISIS EVOLUTIVO MEDIANTE MAPEO COMPARATIVO

Carmen Bouza Fernández.

A bioinformática como ponte entre a xenética e as súas aplicacións industriais e biomédicas. Cursos de Verán 2009_USC; Santiago de Compostela, 14 de Xullo de 2009

Introducción

PRINCIPALES PROBLEMAS CULTIVO DE RODABALLO

Reducida viabilidad larvaria

2 años hasta alcanzar la talla comercial

Dispersión de tallas/desdoblamiento de tanques

Crecimiento superior hembras que machos

Patologías (Aeromonas, Philasterides, VHSV )

Caracteres diana para la mejora genética en Acuicultura / importancia evolutiva

Resistencia enfermedades Crecimiento Determinación sexo Tolerancia temperatura Tolerancia salinidad etc....

Mecanismos de control y funciones génicas desconocidas

NUEVAS APROXIMACIONES EXPERIMENTALES: LA ERA DE LA GENÓMICA

GENÓMICA ESTRUCTURAL

Cartografía genómica Mapas genéticos y físicos.

Secuenciación.

GENÓMICA FUNCIONAL

Análisis expresión génica.

Transcriptómica.

Proteómica.

ANÁLISIS GENÓMICO INTEGRADO BIOINFORMÁTICA

Manejo, depósito y análisis de ingentes cantidades de datos genómicos.

GENÓMICA-BIOINFORMÁTICA EN ACUICULTURA

http://www.animalgenome.org/

ESTRATEGIAS GENÓMICAS PARA LA MEJORA DEL CULTIVO DE RODABALLO

1.

Construcción de un mapa genético con marcadores informativos  identificación de genes o regiones genómicas relacionadas con caracteres productivos 2.

Caracterización de genes relacionados con la respuesta inmune  construcción de un microarray  identificación de genes y rutas génicas de resistencia a patologías 3. Combinación de las estrategias de genómica funcional y estructural para incrementar el potencial del análisis 4. Aplicación industrial: i) control del sexo, ii) evaluación recursos genéticos, ii) obtención de reproductores con mayor tasa de crecimiento y resistentes a patologías

GENOMA NUCLEAR

Scophthalmus maximus

0,65 pg; ~ 800 Mb 2n=44 cromosomas 22 grupos de ligamiento Ausencia heteromorfismos / sexo Bouza et al.

Marine Biology

, 1994; Pardo et al.

Heredity

, 2001; Cuñado et al

. Genome

, 2001

GENÓMICA ESTRUCTURAL EN RODABALLO: CONSTRUCCIÓN DE UN MAPA GENÉTICO PARA LA IDENTIFICACIÓN DE REGIONES GENÓMICAS DE INTERÉS PRODUCTIVO

1. GENÓMICA ESTRUCTURAL: DE LOS MAPAS GENÉTICOS A LOS PROYECTOS GENOMA

Distancia entre genes  Frec. Recombinación (FR) Mapas de ligamiento (Sturtervant 1913; 1 um = 1cM = 1 % FR)

Asignación de grupos de ligamiento a cromosomas: hibridación

in situ

DMRTY Medaka

Marcadores genéticos

 Genes  Marcadores moleculares

Ensayo de detección Razón múltiple Reproducibilidad RFLPs

lento/rápido 1 alta

Tipo de marcador Información sobre la secuencia

codominante no/sí

Microsatélites

rápido 1 alta codominante sí

Polimorfismo

bajo alto

RAPDs

rápido 5-20 baja dominante no medio

AFLPs

rápido

SNPs

rápido 60-100 1 alta codominante/ dominante no alta codominante sí medio bajo

Elaboración de mapas genéticos

Análisis recombinacional de cruzamientos controlados / familias: Cosegregación entre pares de marcadores (FR) a partir de meiosis informativas Evidencia ligamiento y estima de distancia. Método puntuaciones LOD (Z, Morton 1955; 1995) Z x = Probabilidad del resultado observado FR = x Probabilidad del resultado observado FR = 1/2 LOD FR = x = log 10 Z x

Integración de mapas genéticos y físicos Proyectos Genoma

Secuenciación jerarquizada

2. GENÓMICA ESTRUCTURAL EN RODABALLO: CONSTRUCCIÓN DE UN MAPA GENÉTICO PARA LA IDENTIFICACIÓN DE REGIONES GENÓMICAS DE INTERÉS PRODUCTIVO

FASES EN LA CONSTRUCCIÓN DEL MAPA GENÉTICO DE RODABALLO

1) Obtención de marcadores genéticos informativos 2) Desarrollo de una herramienta bioinformática para el procesado de secuencias 3) Constitución de las familias de referencia: ginogenéticos haploides, diploides y “F 2 ” con fase de ligamiento conocida 4) Genotipado de marcadores utilizando familias de referencia y construcción del mapa con programas específicos (JOINMAP) 5) Obtención del mapa genético: consenso, vía macho y vía hembra, y posicionamiento de centrómeros 6) Análisis comparado con otros mapas genéticos de peces

2.1. OBTENCIÓN DE MARCADORES GENÉTICOS INFORMATIVOS Y DESARROLLO DE UNA HERRAMIENTA BIOINFORMÁTICA PARA EL PROCESADO DE SECUENCIAS

Genotecas Secuenciación Edición De Secuencias Amplificación Polimorfismo Genotipado Mapa Herramientas Bioinformática Eliminación Vector Y Adaptador Identificar Microsatélites Redundancia Diseño De Primers Base De Datos

OBTENCIÓN DE LIBRERÍAS ENRIQUECIDAS EN MOTIVOS CORTOS DE REPETICION

(FIASCO; Zane et al. 2002)

Edición de secuencias microsatélite

( CA )n ( T G)n

Análisis de redundancia. Alineamiento de secuencias y búsqueda de homologías (CLUSTAL)

Archivo de secuencias para diseño de primers (PRIMER 3.0)

3 T7-AC1-A10-AC1-8.10.04-A08-02.

TCACACACACACACACACACAGTTTAGTGTGTCATCTGACGGCCC

CCTCCCATGTATTTCTGTGG

GATAGGTATCAACACACAAATACAC AAGCACACATACACACACACACACACACACAACACACACACACTTGTGTGCTTTTTTTCAAAGCTTACACACTACTATCCTTTCACCCTAC TGCCACCAGATAATCCATTTTATAGCCAGGGATCA

AACACTGAGCCCTCTGGCTA

TGTGCTACTGTAACGCGCACGCACTCACTCACTC ACTCACACACAA

191 4 T7--AC1--C7_AC1.8.10.04_C05_05.

GTGTGTGTGTGTGTGTRWGTGTGTGTGTGWGARTGTGTGTCTGTGAGAATGGGTGTGATTTGTGTATGAATGGTTGATACCGACTGT GGGAAAAAAAAGAAAAAAAAAAGGTCATCCGCTGGTGTCTAGAAGCTGGCGACATCGCTGTTTCATCCCTCCTCGCTCCCTCTCTTTC TGATGAGTCCTGAGTAATATACTGGGATATAACAATGT

GAGACGCATTAGGCAGCATT

ATGTTATGTTCTTTCTTACATAAAGAGAGA GAGAGAGAGTGTGTGTGTGTGTGTGTGTGTGTGTCAAACAGCAAGGGTCCTCCTCCTCCTCCCAGTAGCTGTGTGTTGCCCACTGTA CACGATGCTCTCARCTT

TCGTCAGTTGTCCTTGATGG

ATTACTCAGGACTA

174 7

. > 1_T7--AC1--F11_AC1.8.10.04_F09_11.

TGATGAGTCCTGAGTAACGTTGAGTCAGTGT

GCGTATGGAGAGTGCCTCAT

ATGAACGTGTGTGCGTCATGTGTGTGTGTGTGTGTGT GTGTGTGTGTGTGTGAGC

CTTGACTCTCACTGCCCACA

GGTTGGTCACACTTGTGCTCTTGTGTGAGACATCAAAGCGAGAAATGACA GAGATGGAGGGAGAATTCAACAAATGCGGGCGGGCGGTCTACTGCTCTGTGTGTACATATGTGATGTGTGTGTGTGTGCGTTTGTGTT TGTGTACTAAAAGAGAGAGCGCACATCTGTGTGGCGGTCTGGAAGCGGTCCATCTCAATGCTGTGGGCAGATAGCATCGTCACACATG ACTGCAACCCACAGCCAGACTGACAGATATAAACATATAGCTTTCCGCAGACGAGAAAGACACGGCTACAGGGCGCAAAAGACGGAAC GTACAAAAGATAGGCGGTATAAATCAACTCTCTCCAACCCTTTTTTCTATTTACAGCTAAATATACTTTTTGTTCTCCTGTAGACTAAAAM CACGGAACACTGTTTTACTCANGACTCATC

101

PUESTA A PUNTO DE 356 MARCADORES MICROSATÉLITES Locus Sma-USC38 Sma-USC39 Sma-USC40 Sma-USC41 Sma-USC42 Sma-USC43 Sma-USC44 Sma-USC45 Número de acceso a Genbank DQ810838 DQ810839 DQ810840 DQ810841 DQ810842 DQ810843 DQ810844 DQ810845 Secuencia cebadores (5'-3') F: CAGTGTGCGTATGGAGAGTG R: TGTGGGCAGTGAGAGTCAAG F: CCTGGAGTGTCGAGCTACAA R: GGTAGAGGACAATCGGTGGAG F: GGTGTAGTGGGAGTGTGG R: GCACTAGTGATTGGCGG F: ATCCAGGAGAGCAGAGAC R: GCCACACCTCACTGTAAA F: GCCCCTGATTTTAGATAGTAA R: TGCTGAACAAGATGATGGAT F: GCTCTGTTGTCATTGGTTTGA R: CTCAGAGGAGCAAAGAAAGG F: AAGGAAGCCATTGTGTGTGT R: CCCTGTGAATTTGTCCATCC F: GGGCTGGAGGTTTGCTAAT R: CCCTGCTCTGTCTCTGCTTT Motivo de repetición (TG)17 (CT)18 (AC)14 (CA)24 (CA)5+18 (CT)10 (TG)8+13 (GT)16 Tamaño (pb) 099-107 160-164 66-86 176-194 322-352 141-145 150-160 189-203 T a 54 58 56 54 54 50 54 58 A 3 2 6 6 7 3 4 5 H E 0.318

0.545

0.848

0.894

0.909

0.545

0.712

0.788

F IS * -0.047

1.000* -0.179

0.441

0.084

-0.224

0.063

0.154

Pardo et al. Mol.Ecol.Notes 2005; Aquaculture Research 2006; Genome 2007.

http://mathgene.usc.es/turbot2/

Turbot EST DATABASE Secuencias Tipo M ANÁLISIS GENÓMICO

S. maximus

L ibrería enriquecida en motivos cortos de repetición dispuestos en tándem (Microsatélites o STRs-single tandem repeats-) Objetivo: I dentificar una serie de loci microsatélite, que sirvan de marcadores a lo largo del genoma de rodaballo.

Secuencias Tipo E L ibrerías de Expresión de cDNA a partir de ARNm de tejidos linfoides Objetivo: Análisis de expresión génica a lo largo del proceso infectivo con patógenos seleccionados ( Aeromonas salmonicida Philasterides dicentrarchi, …), e identific ación de genes candidatos relacionados con la resistencia a dichas patologías.

Todas son parte del genoma de la especie, con características comunes: Parte de la misma BD, y reali zación sobre ellas de los mismos procesos de análisis automático.

2.2. CONSTITUCIÓN DE LAS FAMILIAS DE REFERENCIA Y GENOTIPADO DE MARCADORES PARA LA CONSTRUCCIÓN DEL MAPA GENÉTICO

FAMILIAS DE REFERENCIA: ANÁLISIS DE LIGAMIENTO

FAMILIAS GINOGENÉTICAS HAPLOIDE Y DIPLOIDE FAMILIA BIPARENTAL DIPLOIDE ( DF )

UV

Óvulo (n)

x

Destrucción por UV del núcleo espermático (n) S1 X S2 S2 X S2

X

X HÍBRIDO 1ª G on .

S2

X

CP2 (n) EMBRIONES HAPLOIDES (n) Piferrer

et al.

(2004)

(HF)

EMBRIONES DIPLOIDES (2n)

(DGF) Mapa consenso: HF y DF (Bouza et al. 2007) Mapa centrómeros: DGF (Martínez et al., en prensa)

Software utilizado para la construcción de mapas genéticos en distintas especies acuícolas Paquetes informáticos a Especies Referencia software (web) CRI-MAP JOINMAP LINKMFEX

Dicenthrarchus labrax

1

Sparus aurata

2 Green et al. 1990 (http://bimas.dcrt.nih.gov/sw.htlm#crimap)

Salmo salar

3 Oreochromis spp.

4

Haliotis spp.

5

Scophthalmus maximus 16 Oncorhynchus mykiss

6

Salvelinus alpinus

7

Salmo trutta

8

Lates calacarifer

9 Danzman 2000 (http://www.uoguelph.ca/

rdanzman/software) Danzman 2000 (http://www.uoguelph.ca/

rdanzman/software) MAPMAKER

Danio rerio

10

Cassostrea gigas

11

Litopenaeus vannamei

12

Takifugu rubripes

13

Scophthalmus maximus 16

Lander et al. 1987 (http://www.genome.wi.mit.edu/ftp/distribution/software) MAP MANAGER

Paralychtys olivaceous 14

Seriola spp.

15 Manly y Olson 1999 (http://mapmgr.roswellpark.org/mapmgr.htlm)

Bouza y Martínez, en prensa.

a Información adicional sobre recursos informáticos de análisis de ligamiento: http://linkage.rockefeller.edu/ 1 Chistiakov

et al.

2005; 2 Franch

et al.

Hara 2007 ; 10 Shimoda 6 Sakamoto

et al.

1999; 11

et al.

2000; 7 Woran

et al.

2004; Hubert y Hedgecock 2004; 12 8 Gharbi Zhang

et al.

et al.

2006; 2006; 13 9 Wang Kai

et al.

et al.

2007; 2005 ; 14 Coimbra

et al.

2003; 15 Ohara

et al.

2006 ; 2005 ; 3 Moen 16 Bouza

et al et al.

2004; 4 Lee

et al.

. datos no publicados.

2005; 5 Sekino y

ANÁLISIS DE LIGAMIENTO JOINMAP 3.0

A A1 B1 A3 B5 A1 B1 A2 B2 A2 B2 A5 B7

Progenie ginogenéticos haploides

…100

A1 B1 A2 B2 A1 B2 A2 B1

FR A-B = Recombinantes (A 1 B 2 y A 2 B 1 ) / Total = 20/100 = 0.20

Distancia A B (función de mapa de Kosambi) = 21cM B

SmaUSC254 21cM SmaUSC265

(De Bouza y Martínez.

En

Genética y Genómica en Acuicultura. En prensa).

2.3. MAPA GENÉTICO DE RODABALLO: MARCADORES MICROSATÉLITES ANÓNIMOS CONSENSO, VÍA MACHO Y HEMBRA POSICIONAMIENTO DE CENTRÓMEROS

MAPA GENÉTICO RODABALLO. LG1-12.

MAPA GENÉTICO RODABALLO. LG13-26.

Bouza et al. Genetics, 2007; Martínez et al. Aquaculture, 2008

VARIACIÓN EN FRECUENCIA DE RECOMBINACIÓN (FR)

60 50 40 30 20 10 0 0 (13.3 ± 2.5

vs

. 8.3 ± 2.0; P<0.05) Ratio F:M  1.6:1 10 20 30 40

Paternal genetic distance (cM)

50 60 60 50 40 30 20 10 0 0 (20.6 ± 4.1

vs

. 21.0 ± 3.9; P>0.05). 10 20 30 40

Genetic distance in DF fem ale

50 60

FR: mapeo fino /clonaje posicional

MAPAS GENÉTICOS EN ACUICULTURA Especie GL n Marcadores

Danio rerio 1 Oreochromis spp.

2

25 24 25 22 2000m 521m, 21g, Sx, P 162m, 2g

Dicentrarchus labrax 3

25

Sparus aurata 4 Hippoglossus hippoglossus

5 26 24 Scophthalmus maximus 6 26 24 24 24 22 204m 258m,356A 248m Longitud (~ cM) Densidad (~ cM) ~ Mb/cM ~ Ratio FR F:M 2300 1311 1762 1242 1510 1346 1.2

2.4

5.0

9.7

4.3

5.6 0.74

0.84

0.47

0.81

0.53

0.53

2.7:1 1:1 1.5:1 1.2:1 2:1 1.6:1

1 Shimoda

et al.

1999 ; 2 Lee

et al.

2005 ; 3 Chistiakov 2006 ; 5 Reid et al. 2007 ; Bouza

et al.

2007

et al.

2005 ;4 Franch

et al.

2.4. ANÁLISIS DE SECUENCIAS RESPECTO A GENOMAS DE PECES MODELO: MAPEO COMPARATIVO

Análisis de secuencia comparado con genomas de peces modelo 219 secuencias flanqueantes de microsatélites de rodaballo NCBI-BLASTn

(e<10 -5 , mayoría e<10 -10 )

Database

tetraodron tetraodron tetraodron danio danio fugu fugu

Turbot Micro sequence

M-V-T7-AC32-B12-24.1.05( M-L-SP6-AG2-G7-22.11.04( M-S-puc19-AC0-A2-1.11.04( M-L-T7-AG2-D3-14.10.04

M-L-T7-AG2-D3-14.10.04( M-V-K-AC5.1-H7-2.3.05( M-L-K-AC3-C11-25.10.04

R414 ) RD179 R190 (R15 R15 R607 ) ) ) ) ) (R623-subseq1 )

Contig number/LG

11 12 15 Zv6_scaffold3458.5

24 scaffold_40 scaffold_180

HitSignif

9,00E-09 9,00E-22 6,00E-14 2,00E-19 2,00E-19 8,00E-07 5,00E-36

\%ID

95,12 90,11 86,44 82,1 82,1 87,93 92,17

eValue

9,00E-09 9,00E-22 6,00E-14 2,00E-19 2,00E-19 8,00E-07 5,00E-36

length

41 91 118 162 162 58 115

Hit string

aggcaccttgcaacagctggtctgaattatccgtggggggg aaacatggcggcggccatggagctgagatgctgggggggaggctggggtttgccctctgtccacgcagagtctctggtagttctggtaacg agttttgatttacctctgtgctgcgctgcagtaattggat-gtgacaccattctgcgcgccctctctgggggatagaacaggaatctgactattatggccccagtcgtgaatatgtca agcttggcgtaatcatggtca-tagctgtttcctgtgtgaaattg-ttatccgctcacaattccacac-aacat-acgagccggaa-gcat-aaagtgtaaagcct-ggggtgccta-atgagtgagctaactcacattaattgcgttgccgctcactgccc agcttggcgtaatcatggtca-tagctgtttcctgtgtgaaattg-ttatccgctcacaattccacac-aacat-acgagccggaa-gcat-aaagtgtaaagcct-ggggtgccta-atgagtgagctaactcacattaattgcgttgccgctcactgccc tagtaccatctggatttccagtcaatgtgactgctgaggctgtgggttccaccaagat cctcttgcagttgctgcttccattagcttccagtatgataaaagagacggcaccagctgacaccaccacaatgactcaccatggataaaagaatgagatgtcccctctagtagct

Análisis de secuencia comparado con genomas de peces modelo

Turbot – Sintenic spp.

Linked-Linked Linked-Unlinked Unlinked-Linked Total Non unique matching

Tetraodon

40 11 2 24.2% 5/55 (9.1%)

Takifugu

59 0 4 28.8% 6/64 (9.4%)

Danio

17 1 1 8.7% 7/19 (36.8%) The T. nigroviridis genome (ver. 7.0) was downloaded from ftp://ftp.ensembl.org/pub/current_tetraodon_nigroviridis/data/fasta .

The T. rubripes genome (ver. 4.0) was downloaded from ftp://ftp.ensembl.org/pub/current_takifugu_rubripes/data/fasta . Genomic sequences of D. rerio were obtained from ftp://ftp.ensembl.org/pub/current_danio_rerio/data/fasta

1 1 2 3 4 5 6 7 8 9 18 19 20 21 U N 10 11 12 13 14 15 16 17 1 1 1 2 1 3 3 1 3 1 Mapeo comparativo: Sintenias Rodaballo - Tetraodon 4 5 3 6 7 1 8 9 10 11 12 Rodaballo 13 14 15 16 17 18 19 20 21 22 23 1 1 1 24 25 26 N L 1 3 2 2 1 3 3 1 1 1 1 1 3 1 1 1 1 1 1 1 2 2 1 1

ERC pb average (range ) Homology 102 pb (29-327) 81-100%

MAPEO COMPARATIVO

Rodaballo –

Tetraodon – Fugu Danio

T-LG5 F-S14 T-LG1 F-S25 T-LG12 F-S4 D-LG5

3. CARACTERIZACIÓN DE GENES RELACIONADOS CON LA RESPUESTA INMUNE CONSTRUCCIÓN DE UN MICROARRAY PARA LA IDENTIFICACIÓN DE GENES Y RUTAS GÉNICAS DE RESISTENCIA A PATOLOGÍAS (PRESENTACIÓN P. MARTÍNEZ)

CONSTRUCCIÓN DE LIBRERIAS de ADNc

Extracción y evaluación

Homogenizado de pooles (N2 líquido)

calidad ARN

(Trizol) 28S 18S 5S Figura cDNA synthesis kit (Stratagene)

Librerías de ADNc

(ZAP-cDNA Library Construction kit)

Purificación ARNm

(Dynabeads Oligo dT 25 )

SECUENCIACIÓN 12.000 ESTs

Picado de colonias Glicerinados, conservación a -80ºC 4.000 secuencias control 4.000 secuencias Aeromonas 4.000 secuencias Philasterid Extracción de plásmido y secueciación ESTs

3.1. CONSTRUCCIÓN DE LA BASE DE DATOS DE ESTs

CARACTERÍSTICAS BASE DE DATOS RODABALLO

1) 16.514 secuencias de calidad (>100pb; PHRED>20) 2) Librerías de cDNA de infecciones con Aeromonas (4.000), Philasterides (4.000), Nodavirus (3.000), Enteromyxum (2.000), controles (6.000) + librerías enriquecidas microsatélites (1.400) 3) Procedentes órganos linfoides: hígado, riñón, bazo, timo y ciegos pilóricos 4) Secuenciadas desde 3 ´ mayoritariamente 5) 6.170 secuencias únicas: 1.827 contigs + 4.343 singletons

BASE DE DATOS ESTs Y MICROARRAYS Librerías cDNA

Tejidos RNA

Control Aeromonas Philasterides

salmonicida dicentrarchi

mRNA Librerías cDNA

ANÁLISIS FUNCIONAL DE RESISTENCIA A PATOLOGÍAS Datos de expresión

Código de punt microar.

Código de secuenca Nivel de expresión

Datos de secuencias

Sec. bruta, código, calidad, edición…..

Clustering

Código del grupo Secuencias constituy.

Alineamiento Secuencia consenso Secuencias Evaluación de calidad Limpieza y edición Agrupamiento Contigs y singletons

Búsqueda homología Homología data BLAST

E-value Score Alineamiento

Código secuencia

Hibridaciones Construcción Microarray

Anotación sistemática

Términos GO, COGG Rutas KEGG

TURBOT DATABASE V2.0

(Pardo et al., BMC Vet. Res., 2008) Portal entrada Base Datos Visión paginada de contigs y singletons Portal diseño de oligos Menú de búsqueda

MEJORAS EN LA BASE DE DATOS. 2: BLAST LOCAL

Incorpora genomas de 5 especies modelo.

Takifugu rubripes Tetraodon nigroviridis Danio rerio Gasterosteus aculeatus Oryzias latipes

HERRAMIENTA DE LA BD TURBOT-ESTs AUTOMATIZAR LA BÚSQUEDA DE MARCADORES GÉNICOS

113 132 141 169 178 186 188

ID

3 9 18 44 103 112

INFORMACIÓN

Putative N-acetyltransferase Proteína ribosomal L36 ribosomal protein S30 Proteína ribosomal S18C Eukaryotic translation initiation factor 2, subunit 3 type I keratin S8 Clon cDNA Platichthys flesus Elastasa 2 precursor Clon cDNA Gasterosteus aculeatus Clon cDNA Haplochromis chilotes Muscle-specific beta 1 integrin binding protein 2 microglobulin beta 2 Clon cDNA Gasterosteus aculeatus

MOTIVO

GA GA GA GA GAG AC CAC TG TG GA AGG CCA TA

Nº REP

10 49 25 12 9 11 6 12 18 17 6 6 9 (Microsatélites SPUTNIK, otros… , SNPs QualitySNP pipeline )

IDENTIFICACIÓN DE MARCADORES GÉNICOS MICROSATÉLITES Y SNPs

MARCADORES GÉNICOS: SNPs Reacción de SNaPshot: Primer a una base del SNP

MARCADORES GÉNICOS: SNPs Testado del polimorfismo de SNPs: Marcador USC-SNP_18 G/ A

CATÁLOGO DE MARCADORES GÉNICOS BASE DE DATOS 1.0 (GENOTECAS cDNA: AE, PH, C) MICROSATÉLITES:

○ ~ 650 microsatélites en ~ 530 secuencias únicas (“SPUTNIK”) ○ Selección de 191 micros (>8 di, >6 tri, >5 tetra y penta)

Pardo et al. (2008)

;

Bouza et al. (2008)

SNPs:

○ ~ 1200 SNPs filtrados en ~ 250 contigs (“true SNPs”; QualitySNP pipeline; Pardo et al. 2008)

MARCADORES GÉNICOS Y MAPEO GENÉTICO

Indiv M197 F61-1 P3-A35 P3-A47 P3-A49 P3-A51 P3-A55 P3-A56 P3-A57

Genotipado de la familia de referencia Mapeo integrado de los loci EST microsatélite en el mapa consenso de rodaballo (JOINMAP)

Sexo M F M M F M F M F RE466 369369 369374 369374 369369 369369 369369 369374 369374 369374 RE774 160163 160157 157163 157163 157160 160163 157163 160160 160160 RE823 342332 342338 332342 342342 332342 342342 338342 342342 332342 RE876 154156 154156 156156 154154 154156 156156 156156 154156 154154 RE928 374388 374372 374374 374374 374374 374374 374374 374374 372388 RE937 344361 348372 361372 344372 344348 344372 344348 344348 361372 RE2708 207223 207219 219223 207219 207207 219223 207223 219223 207223

MARCADORES GÉNICOS Y MAPEO GENÉTICO Locus SmaUSC E1 SmaUSC E2 SmaUSC E3 SmaUSC E4 SmaUSC E5 Microsatellite characteristics 1 Primer sequences (5´

3´) Ta Repeat motif Mg A Population análisis Range pb He 2

P

LG 4 Linkage análisis 3 Closest marker Distance 5 cM CGCTGCTCTTCTTCCTCTGT 60 (CAG) 9 7 114 138 0.791

0.06

5 17 SmaUSC14 2 CTCTCTCTGGAGCCTCGTCA 1.5

GGAGATCGCAACCTACAGGA 58 (AC) 11 2 446 448 0.040

1.00

0 9 4 SmaUSC57 CGGGCTTCTCTTTGGACATA 1.5

CTTGGTACAGCATTCACGATG 58 (TG) 12 4 218 224 0.584

0.01

0 4 SmaUSC7 AGAGCAATGTAAGCGCCTTT 1.5

CCCAGCTCTGTGTCTCCACT 58 (CCA) 6 3 69-75 0.520

0.53

5 TCCAATGTGACGTTCCCTCT 1.5

GGAGGAGTTCAGGGAGCAG 60 (AGC) 7 4 369 386 0.568

0.16

7 9 F12-ITG16 CAGCATCACTGGGTTGAAAG 1.5

Table 1. Characteristics of 43 EST derived microsatélites in turbot 4.6

1.2

[3.7] 0.2

EST-derived microsatellites SmaUSC-E1 SmaUSC-E2 SmaUSC-E3 SmaUSC-E4 SmaUSC-E5 Closest identity 1 eukaryotic translation initiation factor 2 subunit 3 gamma [Danio rerio] keratin K10 [Polypterus senegalus] elastase 2 precursor [Paralichthys olivaceus] Scophthalmus maximus clone sbc1 microglobulin beta 2 mRNA. complete gastrula specific embryonic protein 1 [Epinephelus coioides] Accesion no. AAH55248.1

CAL99128.1 BAA82368.1 DQ848854.1 AAN02166.1 E-value 3.00E-15 5.00E-22 2.00E-59 3.00E-75 3.00E-07 SmaUSC-E7 Predicted: fibroblast growth factor receptor substrate 2 isoform 3 [Pan troglodytes] XP_522464.2

Table 2. Functional annotation of 20 turbot EST derived microsatélites 6.00E-09

Pardo et al. BMC Vet Res 2008; Bouza et al. Animal Genet 2008

EXTENSIÓN DEL MAPA GENÉTICO: MAPEO GÉNICO ADH-iron containing Elastase 2 Precursor Prot. Disulfure Isomerase Pancreatic Helicase KeratinS8

Figure 1. Genetic mapping of 33 turbot EST-derived microsatellites into the turbot consensus map based on 242 anonymous microsatellites (Bouza

et al

. Animal Genet 2008)

SELECCIÓN MARCADORES: DISTRIBUCIÓN HOMOGÉNEA EN GENOMA DE RODABALLO - 99 marcadores genotipados en familias AS y AP - 13 de los cuales de EST (RE)

MAPA GENÉTICO Y RASTREO GENÓMICO

1) Aplicación del mapa de referencia en un panel de familias de referencia segregantes para los caracteres de interés: Sexo, Crecimiento y resistencia a procesos infectivos (A. salmonicida, P. dicentrarchi, otros parásitos y virus).

2) Identificación de QTLs / regiones genómicas asociadas a crecimiento, resistencia patologías y determinación del sexo en rodaballo

F3P_4 F3M_19&16&17 F3P_5 F3M_3 F3P_6 F3M_1 R367

R247

R267 P9

R270

P17 R687

0,0 4,4 21,5 31,7 39,4 42,4 42,8 0,0 6,5

R367 P18

0,0

Sib-Pair Regression

0,0 0,0 13,7 0,0

(Haseman & Elston)

12,6

R267

23,6

RD66

29,3

P9 P17

R697 37,3 38,0 10,3

R687 P18 RD66

R178

R38 R95 R544

R235 0,9 4,5 5,0 0,0 0,0

F3M_20 R38

R311[R697,37.49cM] R809 R12 33,9 23,1 14,4 28,3 34,7 R185

R95 R544

P5

F3P_3

R736

R152 R16

R360 0,0

F3M_14

0,0 1,7 R236

R152

16,2

R16[R736,39.62cM] R548 R825

R953 40,3 42,7 50,3 0,0 6,4 R675

R548 R825[R12,31.42cM;R235,41.42cM]

SexP

43,9

LG 21

SexM 63,7 77,5

LG 5

GENES DETERMINANTES DEL SEXO

Sequ.

turbot112 turbot112 turbot2754 turbot2754 turbot3027 turbot3027

%ID

84,3 83,86 80,37 81,51 87,65 80,95

MAPEO COMPARATIVO: CONSERVACIÓN DE ORDEN HERRAMIENTA BIOINFORMÁTICA eValue

7,00E-39 2,00E-36 4,00E-12 1,00E-09 2,00E-42 5,00E-09

HSP_length

223 223 163 119 170 126

query_ start

40 40 28 30 320 78

query_ end

262 262 190 148 489 203

hit_start

5132911 5126492 8148100 1051999 1140524 1140342

hit_end

5133132 5126713 8148262 1052117 1140693 1140467

Tetraodon nigroviridis

LG18 Sib-Pair Regression Interval Mapping (Haseman & Elston)

1.1

SmaUSC3027-Helicase

hit_ length

223 223 163 119 170 126

q-Res

5.1

SmaUSC112-KeratinS8 8.1

SmaUSC2754-DS_Isomerase

10105158 pb (10 Mb)

Análisis de QTLs asistidos por marcadores en especies de importancia en Acuicultura

Trucha arcoirís

Tolerancia temperatura Tiempo freza Resistencia enfermedades Virales (IPN, IHN) Parasitarias

Salmón atlántico

Resistencia enfermedades Anemia infecciosa

Platija japonesa

Resistencia enfermedades Víricas (LCD)

Tilapia (Oerochromis spp)

Tolerancia salinidad / Tª Determinación sexo

Ostra (C. virginica)

Resistencia enfermedades

Barramundi (L. calcarifer)

Crecimiento Jackson et al. 1998, Danzman et al. 1999 Sakamoto et al. 1999 Ozaki et al. 2001; Khoo et al. 2000 Bartholomew et al. 2003 Moen et al. 2003 Fuji et al., 2002; Jackson 1998; Agresti et al. 2000; Cnaani et al. 2003 Shirak et al., 2006 Yu y Guo 2006 Wang et al. 2006, 2007

SELECCIÓN ASISTIDA POR MARCADORES

A B

Variantes alélicas de un gen mayor relacionado con un carácter productivo de interés

Integración de mapas genéticos y físicos Caracterización molecular de regiones genómicas

Secuenciación jerarquizada

HERRAMIENTAS DE INTEGRACIÓN GENÓMICA: GENOTECA EN VECTORES DE ALTA CAPACIDAD Genoteca genómica de BACs de rodaballo (REGABA) Clones grandes ordenados

Integración de mapas genéticos y físicos

M5 R2 M7 M9 R9 M2

Genotecas cDNA ESTs rodaballo A T CCC G AA C AAA C TT G T A GGG C TT G TTT G AA C Mapa citogenético

M5 M6 M3 M8 M1 M6

Mapa genético (cM) Identificación QTLs/ regiones interés Vector alta capacidad (BAC) Subclones ordenados Desarrollo Genoteca BACs rodaballo C TT GG T A C A G C A TT C A C G AA CC A T G T C G T AA G T G Marcador de secuencia STS ó EST (anónima o expresada)

MAPEO FINO Y CLONAJE POSICIONAL

MEDAKA (O. latipes) MUTANTE MELANINA (b)

LG12 BAC 171M23 Subclonación Cósmido C27 Secuenciación shotgun (36.3 kb) Genes candidatos

Fukamachi et al. Nature Genetics, 2001.

ANÁLISIS GENÓMICO INTEGRADO

Colecciones de marcadores moleculares (microsatélites, ESTs, micros-ESTs,….)

Base genética de caracteres cualitativos

Disección de caracteres complejos

Identificación de genes candidatos y rutas génicas / localización QTLs / colocalización de ESTs-QTLs

Selección asistida por marcadores (mapas/arrays)

Mapeo comparativo y genómica evolutiva

Toxicogenómica ….

Mejora genética Recursos genéticos

GENÓMICA POBLACIONAL

Marcadores Anónimos vs. Génicos. Detección huellas de selección Evaluación de recursos genéticos

BAJA ESTRUCTURACIÓN POBLACIONAL (5%) CON MARCADORES ANÓNIMOS NEUTROS, PERO ¿EXISTEN DIFERENCIAS ADAPTATIVAS?

GRUPOS Y EMPRESAS COLABORADORES

Universidad de Santiago de Compostela

GG USC1: Grupo de Genética -

Paulino Martínez

GP USC: Grupo de Parasitología -

Manuel Sanmartín

GIP USC: Grupo de Ictiopatología -

Carlos Dopazo y Manuel Lemos

GMA USC: Grupo de Matemática Aplicada -

J. Antonio A. Dios, Antonio G. Tato y Manuel Calaza

GAP USC: Grupo de Anatomía Patológica-

Maribel Quiroga, José M. Nieto

Universidad de Vigo

GG V1: Grupo de Genética GG V2: Grupo de Genética -

Pablo Presa Andrés Sanjuán

GG GC: Grupo Genética Cua ntitativa

Miguel P. Enciso

(

Univ. Autónoma de Barcelona

)

Miguel Toro Jesús Fernández

(

INIA

)

Instituto Ciencias Mar Barcelona (CSIC)

Francesc Piferrer (Univ. Complutense de Madrid)

y

Instituto Español de Oceanografía-Vigo

Rosa M. Cal

CETGA

-Cluster Acuicultura

Santiago Cabaleiro

Institituto Acuicultura Torre la Sal (CSIC)

Grupo de Parasitología –

Pilar Álvarez

Empresas y Administraciones Públicas

CLUSTER DE ACUICULTURA CETGA, INSUIÑA S.A.-PESCANOVA, STOLT SEA FARM S.A., ISIDRO DE LA CAL S.A., ALROGAL S.A., CONEI OVERSEAS, CULMAREX S.A.

XUNTA DE GALICIA, MINISTERIO EDUCACIÓN Y CIENCIA

Consolider 2007

CSD 2007-00002

, Mejora de la producción en acuicultura mediante biotecnología (AQUAGENOMICS)

Investigador Coordinador

: Antonio Figueras Huerta

Centro:

CSIC Instituto de Investigaciones Marinas de Vigo

Resto de centros que participan

: Instituto de Acuicultura de Torre de la Sal (CSIC), Instituto de Ciencias Marinas de Andalucía (CSIC), Instituto Nacional de Investigación y Tecnología Agraria y Alimentaria, Centro de Investigación en Sanidad Animal (Universidad Autónoma de Barcelona), Universidad Complutense Madrid, Instituto Nacional de Bioinformática, Universidad de Barcelona, Universidad de Cádiz, Universidad de Granada, Universidad Miguel Hernández de Elche, Universidad de Murcia, Universidad de Santiago de Compostela.

Financiado con:

5.000.000 €

Entidad gestora

: Consejo Superior de Investigaciones Científicas

PROYECTO AQUAGENOMICS

http://aquagenomics.es