Lab8_Secuenciacion de DNA y Bioinformatica

Download Report

Transcript Lab8_Secuenciacion de DNA y Bioinformatica

Secuenciación de DNA y
Bioinformática
José A. Cardé, PhD
Lab Biol 3306-Genética
Universidad de Puerto Rico-Aguadilla
OBJETIVOS
Luego de haber completado el ejercicio, los estudiantes
podrán:
1. Mencionar los dos métodos principales de secuenciar DNA.
2. Explicar el racional del uso del dideoxiribonucleótido en la
estrategia de secuenciación.
3. Analizar una parte de una autoradiografía de una reacción de
secuenciación real determinar la secuencia de un fragmento de
DNA
4. Definir los que es bioinformática
4. Utilizar las bases de datos para un análisis de bioinformática
de las secuencias obtenidas y determinar el gen al que
corresponde.
TRASFONDO
Una vez usted obtiene el DNA se pueden hacer varias cosas
con el durante su análissi:
- Enzimas de restricción- mapas, clonar.
- Southern Blot- agarosas, tamaños
- Determinar secuencia
Hay dos acercamientos básicos utilizados para análisis de
secuencias de DNA
-Método químico, Maxim/Gilbert: Reacciones químicas con las
bases
-Método enzimático, Sanger: replicación de templado con el
dominio Klenow de la DNA polimerasa de E coli
TRASFONDO
Químico:
-Maxam and Gilbert
-Degradar
químicamente una de
las bases
-Fragmentos
radioactivos
-Electroforesis
TRASFONDO
Enzimático:
-Sanger/Dideoxi
-Interrumpir la
extensión de una
cadena
complementaria a la
que se secuencia.
-Incorporación de
ddNTP
-Electroforesis
TRASFONDO: M13
Fago M13
-Bacteriofago de E coli
-Genoma usado de vector
- ~7200 pb
-Infecta cepa de E coli JM101
-Entra al al célula por el factor
de fertilidad F
-DNA SS pasa a DS
-Se expresa y se forman
viriones
-Salen sin lisar
TRASFONDO: M13 GENOMA
Fago M13
-Bacteriófago de E
coli
-Genoma usado de
vector
- ~7200 pb
-Infecta cepa de E
coli JM101
-Polilinker para
insertar DNA a
secuenciar
TRASFONDO: M13-ESTRATEGIA
Fago M13
-Oligonucleótido primer de
17 bases
-Complementario a flanco
del polilinker
-Servira como primer
-Klenow replicará lo
insertado
-Klenow: dominio
polimerasa 53 de la DNA
pol 1 de E coli.
-Le falta dominio
exonucleasa 35
Reacción de Secuenciación
4 reacciones
-4 tubos con lo mismo:
-Klenow
-Templado a secuenciar
-Buffer para Klenow
-Los 4 dNTPs
-32P-ATP
-ddA o ddT o ddG o ddC
-En cada tubo la misma
reacción se detendrá en un
ddNTP distinto.
Reacción de Secuenciación
4 reacciones
-4 tubos con lo mismo:
-Klenow
-Templado a secuenciar
-Buffer para Klenow
-Los 4 dNTPs
-32PATP
-ddA o ddT o ddG o ddC
-En cada tubo la misma
reacción se detendrá en un
ddNTP distinto.
Reacción de Secuenciación
4 reacciones
-4 tubos con lo mismo:
-Klenow
-Templado a secuenciar
-Buffer para Klenow
-Los 4 dNTPs
-32PATP
-ddA o ddT o ddG o ddC
-En cada tubo, la misma
reacción se detendrá en un
ddNTP distinto.
Reacción de Secuenciación
Fragmentos en nido
-Reacción G
-Cada fragmento se
extendió hasta que se
incorporó una G dideoxi
-Marcado
radioactivamente por el 32
PATP
-Fragmentos de distintos
tamaños interrumpidos por
el ddGTP
-Así para los 4 ddNTPs
Reacción de Secuenciación
Autoradiografía
- muestra
- parte radioactiva
- emulsión fotográfica
- reducción de Ag
- precipitado
- lavados
- bandas
permanentes
Reacción de Secuenciación
Lectura de la gel
-Fragmentos separados
por tamaño
-De abajo hacia arriba
-Cada fragmento se
detuvo en la letra de su
reacción
-Cada fragmento es
complementario a lo que
se estaba secuenciando
bioinformática
• campo de la biotecnología que se ocupa en el
almacenamiento y la manipulación de
secuencias de información de DNA.
• de estas se espera que se pueda obtener
información biológica útil.
• diariamente, datos del análisis de secuencias
de DNA son sometidos a una base de datos
usando la internet (WWW) para identificar
genes o productos de genes.
bioinformática
• Los datos de la secuenciación de DNA tiene
usos limitado a menos que se pueda
convertir en información biológica útil.
• Bioinformática es el componente crítico de
la secuenciación porque se involucra en unir
la tecnología computacional con la
biotecnología.
• El uso diseminado del internet ha hecho
posible la adquisición con relativa facilidad
de información de distintos proyectos de
genomas.
bioinformática
• En un análisis típico, como primer paso,
luego de obtener la data de secuenciación
de DNA, el biólogo molecular buscará
similaridades de DNA usando varias bases
de datos en el WWW.
• Esta búsqueda lo dirigirá a la identificación
de DNA secuenciado o a identificar su
relación con genes relacionados.
• Las regiones codificantes para proteínas
pueden ser identificadas fácilmente por la
composición de nucleótidos.
bioinformática
• Así mismo las regiones no codificantes se
pueden identificar por la interrupción debido
a codones de terminación.
• El significado funcional de las nuevas
secuencias de DNA seguirá en aumento y
será cada vez mas importante según se
continúe generando mas y mas información y
generándose mas y mejores motores de
búsqueda.
PROCEDIMIENTO
• El propósito de este ejercicio es introducir al
estudiante a la bioinformática.
• Para que se obtenga experiencia en la búsqueda
en bases de datos, los estudiantes utilizaran
servicios gratuitos ya ofrecidos por el NCBI y que
se puede acceder a través del WWW.
• Al presente ya hay varios de estos como GenBank,
secuencias de nucleótidos en EMBL, las
traducciones de los CDS no redundantes de
GenBank (secuencias de proteínas).
PROCEDIMIENTO
• Los estudiantes pueden usar cualquiera de estas
bases de datos asi como otras disponibles en el
internet para este ejercicio.
• Para simplificar se ilustrará el uso del NCBI.
• Estos ejercicios involucran el uso de BLASTN para
comparar secuencias de nucleótidos y BLASTP
para secuencias de aminoácidos en las bases de
datos.
PROCEDIMIENTO
• Escoges sequence analysis y en la pagina que aparece bajas y escoges Basic
Local Aligment Search Tool (BLAST).
• Al llegar a la siguiente escoges nucleotide blast.
• Además de este hay otras opciones pero son para nosotros lo que nos
interesa es para secuencias de nucleótidos.
PROCEDIMIENTO
• Bajo nucleotide blast, click en el standard nucleotide-nucleotide BLAST (blastn).
• Las otras opciones son mas complicadas para aplicaciones especificas. Aquí hay tres
secciones:
enter query sequence
choose search set
program selection
PROCEDIMIENTO
• Enter query sequence
• Para comenzar a entrar la secuencia escribe lo siguiente exactamente:
atgcccggccccccaggggggcagaggcgccgc. Puede ser minúscula o mayúsculas. Una vez
escrita la secuencia, click en el Blast .
PROCEDIMIENTO
• A veces el servidor esta ocupado y los resultados tardan, solo hay que tratar de
nuevo. A continuación hay un ejemplo de cómo se pueden esperar los resultados>
PROCEDIMIENTO
• Al observar el reporte del Blastn nuestra secuencia presenta un pareo mejor con la
proteína efectora CD42 humana. Esta fue la que obtuvo la mayor puntuación.
• Revisión de las dos secuencias alineadas muestra que nuestra secuencia de 32
nucleótidos es idéntica al segmento de nucleótido de CDC42.
• Como regla general, una identidad de nucleótidos de mas de 21 pb entre dos
muestras indica usualmente que las secuencias están relacionadas.
• Excepción los poli A.
PROCEDIMIENTO
1. Obtenga una muestra de una autoradiografía y
coloquela sobre una caja de luz blanca o alguna
superficie blanca.
2. Lee la gel de 53 esto es de abajo hacia arriba
3. Lee primero 20 bandas y escríbelas
4. Lee lueg 30 bandas y escríbelas.
5. Ignora bandas muy pálidas.
PROCEDIMIENTO
Ejercicio 1:
Para familiarizarse con las auto radiografías lea la secuencia #1.
comience en la flecha o 6 cm desde el borde inferior y léala desde abajo por los
primeros 20 nucleótidos. Regístrela y sométala al NCBI con Blastn.
Comiéncela de nuevo pero léala hasta cubrir 30 nucleótidos. Registre, sométala
usando Blastn.
La secuencia se puede introducir directamente o leer, pasarla a un papel y luego
al programa.
Es crítico que usted no confunda los carriles mientras lee. La gel contiene carriles
para A, C, G T de izquierda a derecha.
Leer secuencias implica leer desde 53, esto se consigue de abajo hacia arriba.
Note que la mayor parte del espacio entre nucleótidos y la intensidad de las
bandas es básicamente similar. Ignore las bandas pálidas y escoja las oscuras.
Resultados para muestra 1:
cuales son los nombres de los genes?
A cuales especies pertenecen los genes?
PROCEDIMIENTO
Ejercicio 2
Ahora que estas familiarizado con la búsqueda por blast, lea la secuencia para la
autoradiografia 2. Si hay duda en cuales bandas escoger, use su juicio.
Ahora Lea la secuencia, comenzando unos 6 cm mas arriba del comienzo. Debe
leer como sigue
5’…ggacgacggtatggaatagagaggaagttcct..3’
Someta la secuencia usando blasn
Recuerde que la secuencia se introduce 53
El DNA es DS y contiene hebra superior 53 y la inferior 35. Algunas veces
estas corresponden a la hebra codificante y no codificante.
Si hay duda de las posiciones exactas con bandas exactas, use una N que significa
que puede ser cualquier nucleótido.
Una vez se reciba los resultados, baje y busque
Resultados para muestra 2:
Cual es el nombre del gen?
Compárela con la secuencia del genbank, cual hebra usted leyó?
PROCEDIMIENTO
Ejercicio 3.
Las secuencias se pueden acceder buscando en el GenBank por su
numero de acceso.
La información mostrada describe la secuencia del DNA y o el
gen, los científicos que contribuyeron y cierta información como la
proteína y la secuencia de aminoácido para el cual codifica.
Resultados para la muestra 3:
Cual es el nombre del gen?
Aproximadamente cuantos aminoácidos tiene este gen?
PROCEDIMIENTO
Ejercicio 4
Esta sección demuestra la interacción de dos proteínas codificadas por dos genes.
Las interacciones proteína a proteína juegan un rol importante en virtualmente
todos los procesos celulares.:
Transducción de señal
Lea la secuencia de DNA de la muestra 4. Comience desde abajo y registre la
secuencia
Luego comience 1/3 de la secuencia mas arriba y lea la secuencia desde ahí.
Someta cada secuencia por separado usando Blastn
Resultados de la muestra 4:
esta muestra contiene dos secuencias de DNA, Cuales son los nombres de los
genes?
Cuales son las funciones de las dos proteínas codificadas?
Como estas proteínas interactúan en una célula?
Preguntas de reflexión
1. Debiéramos hacer análisis prenatales para
enfermedades que son incurables actualmente?
2. Debiéramos hacer pruebas a nuestros hijos para
enfermedades que se manifiestan en la adultez?
3. Se le debe informar a los individuos los resultados
de pruebas genéticas?
4. Debieran tener las agencias de seguros la
información sobre problemas genéticos para
decidir sobre tus seguros?
5. Cual debe ser el rol del gobierno al establecer las
guías para pruebas genéticas en humanos?
6. Se debieran permitir los experimentos con tejidos
fetales humanos?
REFERENCIAS
Alberts, et, al., (2014). Essential Cell Biology, 3rd Ed, Garland
Science Publishing. New York.
Brooker, Robert J. (2014). Genetics Analysis & Principles.
(Quinta Edición). New York, McGraw-Hill Companies, Inc.
NCBI – National Center for Biotechnology Information
CSHL – Cold Spring Harbor Laboratory – Animations