Bioinformática

Download Report

Transcript Bioinformática

El papel dominante de la bioinformática en la investigación postgenómica
El papel dominante de la
bioinformática en la investigación
postgenómica
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
El proyecto de secuenciación del Genoma humano
ha transformado radicalmente
•la práctica de la biología molecular
•Desarrollos de tecnología de alto rendimiento
(high-throughput) obtención datos a gran escala
•Desarrollos recursos computacionales potentes
y robustos (adquisición, almacenamiento, análisis,
integración, representación y modelado de la
información biológica)
•Grandes equipos -> Multidisciplinariedad
y complementariedad
BIG
SCIENCE
•la conceptualización de la biología
Mensaje codificado ...CCTTAACTTTG...
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Consorcio internacional proyecto secuenciación
genoma humano
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Consorcio internacional proyecto secuenciación genoma humano
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Consorcio internacional proyecto ENCODE
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Consecuencia sobre la conceptualización de la
Biología molecular - >
Biología como una ciencia informacional
•Análisis de los sistemas biológicos en términos
de almacenamiento, transmisión y transformación
de la información ->
Biología de sistemas
Bioinformática
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Bioinformática
Bioinformática: síntesis de la revolución de la biología
molecular y de la informática
Definición:
La disciplina científica que engloba todos los aspectos de la
adquisición, procesamiento, distribución, análisis,
interpretación e integración de la información biológica
Biología molecular
Fundamentos de redes
Bases de datos
Aplicaciones bioinformáticas
© 2007 Antonio Barbadilla
Bioinformática
El papel dominante de la bioinformática en la investigación postgenómica
1953 Estructura del DNA
Hitos
de la
Bioinformática
1951
Primera proteína secuenciada
1977
Secuenciación del DNA
1982
GenBank, EMBL, DDBJ
1986
Secuenciación automatizada de DNA
1990
Algoritmos FASTA y BLAST
1991
WWW
1995
Primer genoma completo
2000
Primer cromosoma humano
2001
Borrador Genoma Humano
2003
Genoma Humano completo
2005
HapMap, Genoma chimpancé,
2007
Proyecto Encode, 669 genomas
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Genomas
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
GATTGCCTCTCATTTTCTCTCCCATATTATAGGGTGAAATATGATCGCGTATGCGAGAGTAGTGCCAACATATTGTGATCTTCGATTT
TTTGGCAACCCAAAATGGAGGCGGACGAACGAGATGATAATGATAAGATGATTCAAAAAGACAATGCACGACAGAGAGAGCAGAA
AAGATAATTAAATTGCCCCTCATTTTCTCTGGCAAATTGTAGGGTGAATTATGATCGCGTATGCGAGAGTGGTGCCAACATATTGTG
CTCTTCGATTTTTTGGCAACCCAAAATGGAGGCGGATGAACGAGATGATAATATTTTCAAGTTGCCGCTAATCAAAAATAAATTCCT
TGCAACATAAAATAAAGCACAAAATGCCCGCTCAAAAAAAGGCATGAATATATAAGCTCGAACATAGAACATAGGCTTGAACATATAA
TGACTGCCTTTCATTCTCTATCTTATATTACCGCAAACACAAAATGACAATGCACGACATAGAGAGAAAGAGAGATATTCAGATTGC
CTCTCATTGTCTCACCCATATTATGGGAACCAAATATGAGCACGTATGCGAGAGGAGTGCCAACATATTGTGCTCTACGATTTTTTT
GCAACCCAAAATGGCGGCGTACGAACGAGATGATAATATATTCAAATTGCCGCTAATCAGAAGCAAGTTTATTGCAATGTTCAGTGC
AGCGCAAAATGGCCGCTCAAGAAAAGGCTCGAATATATATTGCCTGCCTCTCATTCACTCTCTTTTATTACCGCAAGACCAAAATGA
CAATGTACAACAGAGAGAGCAAGAGAGATATTTAGATTGCCTCTCCTTGTCTCTCCCATATTATAGAGACCGAAAATGATTGCGTAT
GCGAGAAGAGTGCCATTGTATTGAGCTCCTCGACCCAAAATAGCGTCGGACGAACGAGATTATATATTTAAAATGCCGATCATTTTC
TCATCCATATAAATACTACCGAAAATGACTGTCTAAAGGTACTCATCGACTATATTTAAATCTGTGTATTTCTGTGAATAGATTGACCT
TTGCAATTTTTAACGGCATTGTCTATTAAATTAATATAATTTTCTTTTTTGATGAATATTTAACCGAACATTTACTTGAAATTAAATTATAA
AATTGGTTAAATAATGTTGAAATCTTACTTTCAGCTAAATGGGGCTATTTTGCAAGGGTTCCATCATGACATTGGTAAATAATTTTTAA
AGAATTAATTGTAAGTTCCAATAGACTGGAAATTATTTTGCAATATCATTCTTATCCCTATTTCCAAAAGCGAATTATTAGTTGCGTGA
AAATCAGAAGGAAAATTATTTAACGTGTTATGCCACGCCAAATAGCCGCGCAATAGGAAGCTAGACTATATAATGACTGCAACGAAA
ATTGTAAATTCCAATTAAAAGGATATTATTGTGCGATTTCACTTTAATTCTTATTTCAAAAAAGTTAATTATTAGTTGACGGAAATCAGA
ACGAATTTCACCGCAACGTCTTATGCAGCACAAAATGGCGGCGCAAAAGGATGGTTGCATATACAATAACTTCATCTCATTCAATCT
CTCCTATATTACCGCAAACTCGAAAGCCAAAACACGAATGATGAAGAGGGATAGATTTTATTGGGACAAAAATGATAGGTCACGCG
AGAGGAGTGGTCTAAATTTTACTCTCACAAAAATGTTGGCAATACAAAATGGCGGCGGAATGAAGAGGTGAAAATATATTAAAATTG
CCGCTCATTTTCTTCGCGGTAGAATTAGGACTGAACGTTGCCGGGTATAGGATCTCTATTGATGGCCTTTACTTATAAAGTGTATTT
CTACAGATCAAATTACTTTTTACTCTTTATCAATATTTAAATATTATAAATTGATTTAGTTAAAATACAATTCGAACAATCTTTTCTCCAAA
TAATAATAATGTTTAATACCTATTTGCGCATATGCGTTTATTTTTGGGATTTAATTTTAACATTTTTCAACAAAACCGTTACAAATGTAAT
TTTAAATCAGGAAACGACTTTGGTATGAAAATATGTTTTTTTGTGCGCTTTTAAACATGTAACTGCTCTTTTGTGCTGTTTTATTGAAT
GCTATCACAGCGTAAAATTTTAGTTTTAATACCAATACATTGGGAATAATTTGCGATTTCATTCTATTCTTATGCCCAAATAAGGAAATA
GTTTCCGGCAAAAAATCAGAATTTAGCTTTTACAAAAACTAGAGAGGAGAGGACAATATTATAATTGTAGACCGTTTTAAACACTTTA
AAATGTTTAACCATTTATCAATTATTCTACTAAATGTAGGTGATTTTATTTATTAGAATACGAATTCTTTATCTGAATCGAACTAAGTAAG
CCTAAGCGCTTAGGAAAAATACATACTTGACGAGTAGAGTGAAATAATTACAAATATTAGACATATCCATTGCTACTCGCATGTAGAG
ATTTCCACTTATGTTTTCTCTACTTTCAGCAACCGAGAAGAGAACCCACGTTTGAACAAGTATCGGCGTGTGGACAACAGCTATCC
CCGCTTCATAACGAATGAGGCTGCCGAGGACCTGATTTACAAGAAGTCCATGGGCGAGCGGGATCAGCCACAGAGCTCAGAGC
GGATCTCAATATTTAATCCGCCAGTATACACGCAGCACCAGGTGCGCAATGAAGCCCCCTACATACCCACCACATTTGACCTCCTC
TCAGACGATGAGGAGTCGTCACAGAGAGTTGCCAACGCCGGGCCATCTTTCAGGCCCTTGACTTACTCGGATGCTGTGCGTCTA
AGCCAGAATGGCTTCGCCAACTCCCGCGTAAGTGGGCACTCCAGCTATACGGTGCGCAGACCACCGGCACTAGTTGACAGAAG
CATTCTATCCCAGGAAATGGAGCGCATGGACCAAGAGCAGTATATCTACCTTATCCGTACCGCAGCCCAAAGTAATTCCGTGGGCA
GTCACTACGCCGAACCGGTTACTGATAACTCGGAGGTCAAGAAAGTCAGTGAAACCAACAAAAGGTAAATAAATTTTTTATATCCAT
CCATATCCGAATCAGTGGCAATAATGCAAAATGCTGATTTTATCACCAATTAGTGACGCACCACAGCCGTTAACCCCTCAACCTACC
© 2007 Antonio Barbadilla
AGACTCACCAGAACAGAATCCTTGCACCGTCGTTTTGCCAGCTGCGTCAACTTAAATGATGACTTCGCCAGCAATTTAAAGCAAG
El papel dominante de la bioinformática en la investigación postgenómica
Codificación de la información
 Sistemas vivos: información
digital cuaternaria (A,T,G,C) en
secuencias unidimensionales de
monómeros
 Ordenadores: información
digital binaria en ristras de 0 y 1
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
La gran pregunta
Fenotipo
DNA
Clarividencia
René Magritte
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Bioinformática
Propiedades de la información biológica
La información biológica
Existe una relación entre estructura molecular y
función en el sentido más amplio:
 DNA --> Fenotipo (todos los niveles)


La complejidad de los datos biológicos

El crecimiento explosivo de los datos biológicos
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
El crecimiento explosivo de datos
Hace ...
Antes
Nucleótidos
25 años
(1982)
680338 pb
(GenBank)
Proteínas
25 años
1500
300.000
DNA continuo
17 años
73 kb
> 270 Mbases
SNPs
17 años
centenares
11 millones
Genomas
12 años
0
Organismos
387
Organismos
Expresión
10 años
Limitado
pocos genes
© 2007 Antonio Barbadilla
Ahora
> Miles de
millones
Torrente de
datos
(microchips)
El papel dominante de la bioinformática en la investigación postgenómica
La avalancha de datos
La Bioinformàtica es crucial
para tranformar el torrente
de datos brutos en
conocimiento biológico
David B. Searls
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Biologia Computacional
Bioinformática
Los métodos computacionales se
han convertido en algo intrínseco
de la investigación biológica
moderna, y su importancia sólo
puede incrementar conforme
aumenta la importacia de los
métodos a gran escala de
generación de datos, la
complejidad de los datos y la
sofisticación de nuestras preguntas
Francis S. Collins
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Tres vertientes del análisis bioinformático:
Manejo de
volúmenes
masivos de datos

Análisis e
interpretación de
resultados
experimentales

Modelo de
sistemas
biológicos


© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Bases de datos
DB
http://www.ncbi.nlm.nih.gov/gquery/gquery.fcgi
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Secuenciación del genoma
(Aproximación aleatoria, Celera)
Potencia de cálculo
Ordenador Compaq de
800 procesadores Alfa
EV6 y EV7 con una
arquitectura de 64 bits y
más de 80 terabytes de
memoria (5 veces la
biblioteca del congreso)
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Análisis de genomas
Genome
sequence
Predicted
genes
Translation
Proteome
Database
Similarity
searrch²
Proteome
SwissProt
PDBsequences
Translated
ESTs
All-against-all
Comparison
Within
Proteome 1,3
Proteome
Proteome
database
Proteome
Protein
Comparison
Between
Proteomes 1,4
Proteome
1
Database of
Proteome 1
.....
Or
© 2007 Antonio Barbadilla
Search
Of
Clusters 5
Proteome
2
Database of
Proteome 2
Proteome
Cluster
Database
El papel dominante de la bioinformática en la investigación postgenómica
Mega-metagenomics
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Genómica comparativa
Metodología con una sensibilidad y
precisión comparable o superior al
análisis experimental
Genoma ratón 14% menor genoma humano (2,5 Gb vs 2,9 Gb)
90% ambos genomas presentan sintenia
A nivel nucleotídico 40% GH se alinea con GR
Tasa substitución neutra 0,5 por sitio. Doble ratón que humanos
% genoma sometido a selec purificadora >5%
Evolución no uniforme del genoma
Ambos ~ mismo número genes, 30.000. 80% único ortólogo, sin
homología <1%
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Genómica comparativa
¿Qué cambios
genéticos nos
hacen humanos?
Chimpancé vs Homo sapiens
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Base genética de la individualidad humana
AGAGTTCTGCTC G
AG G GTTATG C G C G
SNPs
Single Nucleotide
Polymorphism
AGAGTTCTGCTC G AGAGTTCTGCTC G
AG G GTTATG C G C G AG G GTTATG C G C G
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Base genética de la individualidad humana
International HapMap Project (http://www.hapmap.org)
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Expresión (DNA microarrays: Molecular portraits)
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Bioinformática
Análisis filogenéticos
Genómica evolutiva
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Proteómica
Redes de interacción
Redes de
interacción de
proteínas
(Gavin et al.
Nature 2002)
Máquina multiproteínas
232 máquinas de 12
proteínas promedio
© 2007 Antonio Barbadilla
Bioinformática
El papel dominante de la bioinformática en la investigación postgenómica
MAKING CONNECTIONS This network graph shows causal connections among
30,512 genes, 31,459 proteins, and 5,824 small molecules in Genstruct's model,
which contains 136,362 causal connections that can be evaluated to explain the
molecular state changes observed in large-scale systems biology experiments.
The red connections represent inhibitions; green, activation; light blue, reaction;
dark blue, a product; yellow, catalysis; orange, binding; and black, gene product
relations.
COURTESY
OF GENSTRUCT
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Red compleja de regulación génica en el erizo de mar
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Bioinformática
Modelo de sistemas biológicos
E-Cell (Masaru Tomita)
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Bioinformática
Entendiendo la célula
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Bioinformática
¿Qué gran panorámica emergerá del
océano de datos biológicos
?
a. La complejidad no es reducible
b. Nuevos principios generales de organización de lo
© 2007 Antonio Barbadilla
biológico
El papel dominante de la bioinformática en la investigación postgenómica
Bioinformática
Sistema biológico
(Organismo)
Aproximación reduccionista
(Experimentos)
Aproximación sintética
interdisciplinar
(Bioinformática: Biólogos, médicos, matemáticos,
físicos, informáticos,)
Bloques de construcción
(Genes/Moléculas)
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Bioinformática
Nivel de análisis
Definición
-omics
Estatus
Método análisis
Genoma
Conjunto completo de los
genes de un organismo o sus
organelas
Independiente del contexto
Secuenciación sistemática del
DNA
Transcriptoma
Conjunto completo de los RNA
mensajeros presentes en una
célula, tejido o órgano
Dependiente del contexto (el
complementos de RNAs varía
según cambios en la fisiología,
el desarrollo o patologías
Matrices de hibridación
SAGE
Análisis Northern a gran escala
Proteoma
Conjunto completo de
proteínas presentes en una
célula, tejido o órgano
Dependiente del contexto
Electroforesis en gel
bidimensional, fingerprinting
de péptidos
Análisis de dihíbridos
Metaboloma
Conjunto completo de
metabolitos (intermediarios de
bajo peso molecular)
presentes en una célula, tejido
o órgano
Dependiente del contexto
Espectrofotometría de
infrarrojos
Espectrofotometría de masas
Espectrofotometría resonancia
magnético nuclear
Interactoma
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
La Bioinformática en la investigación clínica
La intersección de la genómica y
bioinformática en la práctica clínica
es una necesidad que debe
incorporarse en la investigación
médica si que quiere que la
revolución genómica incida
efectivamente en la medicina
Nature 2004, 429: 439
© 2007 Antonio Barbadilla
Chris Gunter
El papel dominante de la bioinformática en la investigación postgenómica
Perspectivas de la Biotecnología
El ‘guru’ JUAN ENRIQUEZ
Ex-Director del Harvard Business
School´s Life Science Project y,
actualmente, es CEO de Biotechconomy
Conocer el lenguaje de
los genes es dominar el
futuro
Código digital
cuaternario
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
La Bioinformática hoy
Datos
Herramientas
bioinformáticas
© 2007 Antonio Barbadilla
Conocimiento
El papel dominante de la bioinformática en la investigación postgenómica
Bioinformática
Conclusiones
En la era postgenómica de
la investigación Biomédica
• El tratamiento y análisis masivo de información es parte de la práctica
de la investigación biomédica actual
• El disponer de recursos bioinformático integrados y de gran capacidad
para el tratamiento y análisis de información biomédica es hoy una
necesidad primaria de la investigación biomédica
• Los investigadores precisan conocimientos y capacidades para el
análisis e interpretación bioinformático mediante programas de
formación
• Desarrollo de análisis de sistemas dinámicos complejos
• Colaboración multidisciplinar
• Estilo de vida en la red
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Are you ready?
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Algunas consecuencias en la práctica de la investigación
•Aproximación “discovery science” por contraposición a la
aproximación “hypothesis driven”
•Desarrollos de tecnología de alto rendimiento (highthroughput) obtención datos a gran escala
•Desarrollos recursos computacionales potentes y
robustos (adquisición, almacenamiento, análisis,
integración, representación y modelado de la información
biológica)
•Grandes equipos -> Multidisciplinaridad y
complementariedad
BIG
SCIENCE
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
El proyecto de secuenciación del Genoma humano
ha transformado radicalmente
•la práctica de la biología molecular
•la conceptualización de la biología
Bioinformática
Desarrollos recursos
computacionales
potentes y robustos
(adquisición,
almacenamiento,
análisis, integración,
representación y
modelado de la
Mensaje información
codificado ...CCTTAACTTTG...
biológica)
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Consecuencia sobre la conceptualización de la
Biología molecular - >
Biología como una ciencia informacional
•Análisis de los sistemas biológicos en términos
de almacenamiento, transmisión y transformación
de la información ->
Biología de sistemas
Un sistema biológico es una colección de elementos que
interactúan para llevar a cabo una tarea biológica
específica -> Propiedades emergentes
Biología de sistemas: describir los múltiples componentes de
un sistema biológico y analizar las interacciones complejas
de los componentes dentro del sistema y con los
componentes de otros sistemas que dan lugar a las
propiedades
emergentes
© 2007 Antonio Barbadilla
El papel dominante de la bioinformática en la investigación postgenómica
Bioinformática
Bioinformática: síntesis de la revolución de la biología molecular y
de la informática
Nueva disciplina
Aproximación que cruza la arena tanto experimental como
teórica: experimentos realizados “in silico”


Nueva disciplina
 Curriculum:
 Licenciado en Ciencias de la Vida
 Máster en computación
 Doctor en análisis de secuencias
© 2007 Antonio Barbadilla