spanish ppt format, 11.4 MB - Universidad Autónoma de San Luis

Download Report

Transcript spanish ppt format, 11.4 MB - Universidad Autónoma de San Luis

Genes, Alelos, Haplotipos e
Intrones.
CA García Sepúlveda MD PhD
Laboratorio de Genómica Viral y Humana
Facultad de Medicina, Universidad Autónoma de San Luis
Potosí
1
Sesiónes #8 y #9 Genes
Historia
La existencia (pero no el nombre) de los genes fue propuesta por Gregory
Mendel (1882-1884).
Mendel manejaba conceptos cruciales: segregación independiente de
cromosomas, distinción entre rasgos recesivos y dominantes, diferencia
entre homocigotos y heterocigotos al igual que la diferencia entre genotipo y
fenotipo.
Hugo de Vries en 1889 tuvo la decencia poco usual de hoy en día de ceder
el crédito a Mendel pero propuso el término “pangen” para describir la
unidad mínima de la herencia.
William Johannsen abrevió el término a gen dos décadas después.
1920, Thomas Hunt Morgan demostró que los genes residían en los
cromosomas (y en sitios específicos dentro de ellos llamados locus).
2
Sesiónes #8 y #9 Genes
Historia
Morgan y colaboradores mapearon por primera vez los
genes de los cromosomas de Drosófila.
1928, Griffith demostró que los genes podían ser
transferidos (principio transformante).
1941, George Wells Beadle y Edward Lawrie Tatum
demostraron que las mutaciones génicas inducen
cambios metabólicos = un gen una enzima.
1944, Oswald Avery, Collin Macleod y Maclyn McCarty
mostraron que el DNA es el sustrato físico de la
información genética.
1953, Watson y Crick exponen modelo de doble hélice
del DNA y como funciona.
3
Sesiónes #8 y #9 Genes
Definición de un gen
Región física localizable de una secuencia genómica (DNA o RNA) que
corresponde a la unidad básica de la herencia, que posee regiones
regulatorias, regiones que serán transcritas y otras secuencias
funcionales.
Gertsein ha expandido definición para incluir a los genes no-codificantes (de
proteínas) de RNA: “Un gen es la unión de secuencias genómicas que
codifican un conjunto coherente de productos funcionales potencialmente
empalmados”.
4
Sesiónes #8 y #9 Genes
Cis- y TransGen = Cistrón = Grupo de complementación
Cis
Una región de DNA posee efectos cis- cuando
afecta el funcionamiento (expresión, replicación,
etc) de secuencias físicamente contiguas a ella
(sinténicas) sin necesidad de una proteína (o
RNA) intermediario...p. ej.: sitio de origen de
replicación o los promotores de transcripción.
Opuesto funcional a efecto trans
5
Sesiónes #8 y #9 Genes
Cis- y TransTrans
Una secuencia con efectos trans- corresponde
simplemente a un gen que codifica para una
proteína (o RNA) que ejerce un efecto sobre otra
secuencia de DNA o RNA que no se encuentran
físicamente contiguas a través de un intermediario
(proteina o RNA).
6
Sesiónes #8 y #9 Genes
Genes eucariotas
Consisten en una secuencia de DNA que contiene un promotor encargado de regular la actividad
(expresión) del gen, al igual que una secuencia que codifica para un producto determinado
(proteína o RNA).
Cuando el gen es activado, la región codificante es transcrita para producir una copia de RNA que
en algunos casos posee actividad per se y en otros es posteriormente traducida hacia una
proteína
7
Sesiónes #8 y #9 Genes
Productos génicos
En la mayoría de los casos el RNA transcrito constituye un producto intermediario en el proceso
de manufactura de proteínas, pero en algunos casos el RNA mismo posee actividad funcional
(rRNA o miRNA).
Los rRNA de ribozimas poseen actividad catalítica mientras que los miRNA poseen actividad
reguladora.
A estos genes se les denomina genes de RNA o DNA no-codificante (por carecer de sustrato
protéico).
8
Sesiónes #8 y #9 Genes
miRNA
Los miRNA corresponden a moléculas pequeñas de
ssRNA de entre 20 y 30 bp que participan en la
regulación de la expresión génica.
Codificados por genes de RNA (o DNA no codificante)
pero no traducidos a proteínas.
Pasan directamente de transcritos primarios (pri-miRNA)
a formar estructuras secundarias complejas (pre-miRNA)
que son modificadas para formar miRNA maduro
involucrado en interacciones con el mRNA de un gen
específico (codificante de proteína) para regular su
expresión (de manera pos-transcripcional).
Las moléculas de miRNA maduras son parcialmente complementarias a uno más mRNA, por
lo que al unírseles inhiben su traducción hacia proteínas
Primeramente descritos en 1993 por Lee y cols, y como siempre el término se introdujo más
tarde (2001).
9
Sesiónes #8 y #9 Genes
RNA como repositorio de información génica
Recordemos que los genes también pueden ser
escritos en RNA, acercamiento de muchos virus
Dichos patógenos requieren del secuestro de
maquinaria celular para poder funcionar y de una
enzima responsable de retrotranscribir el RNA al
DNA empleado por dicha maquinaria celular
(Transcriptasa Inversa).
10
Sesiónes #8 y #9 Genes
Regiones reguladoras
Todos los genes poseen regiones reguladoras
además de las regiones codificantes para productos
génicos.
Una de estas regiones reguladoras son los
promotores, los cuales sirven para promover la
unión de la maquinaria transcripcional implicada en
la expresión del producto génico.
Los promotores poseen secuencias consenso
relativamente conservadas, algunas de estas
secuencias muestran una gran afinidad por la
maquinaria transcripcional (promotores fuertes) y
otros no (promotores débiles).
La afinidad por la maquinaria transcripcional
determina el número de interacciones que se dan
entre estos dos componentes y por ende el número
de veces que un gen es transcrito.
11
Sesiónes #8 y #9 Genes
Regiones reguladoras
Los potenciadores o “enhancers” constituyen otro
tipo de región reguladora aunque no tan común
como los promotores.
Estos elementos reguladores promueven la unión
de otros complejos proteicos involucrados en la
facilitación de la transcripción por lo que pueden
compensar en cierto grado la pobre actividad de
un promotor débil.
La mayor parte de las regiones reguladoras se
encuentran “up-stream” al codón de iniciación
(ATG) y en el extremo 5' del gen.
Si bien se ha logrado caracterizar muy bien los
promotores procariotas, con los eucariotas ha sido
difícil dada su complejidad.
12
Sesiónes #8 y #9 Genes
Regiones reguladoras
La gran mayoría de los genes procariotas se
encuentran organizados en operones o grupos
de genes cuyos productos poseen funciones
relacionadas y por ende, que son transcritos de
manera conjunta como una unidad.
En contraste, los eucariotas poseen genes que
son transcritos de manera independiente pero
posee una naturaleza interrumpida (con
exones e intrones a diferencia de los procariotas
monoexónicos).
Así pues, los genes procariotas son
policistrónicos pero monoexónicos, mientras que
los eucariotas son monocistrónicos pero
poliexónicos.
13
Sesiónes #8 y #9 Genes
Genes y genomas
Al complemento total de genes de un organismo se
le llama genoma.
Los genes se localizan en regiones bien definidas de
DNA llamados locus (plural loci).
El tamaño del genoma generalmente es menor para
los procariotas en comparación a los eucariotas,
tanto en número de bp como de genes.
No obstante, esta relación se rompe al contemplar
únicamente a los organismo eucariotas, en estos no
existe una proporción directa entre complejidad
genómica y complejidad del organismo.
Uno de los genomas más grandes descubierto a la
fecha pertenece a una Amoeba (Amoeba dubia) con
>670 mil millones de bases (ca 200 x mayor a Hosa).
14
Sesiónes #8 y #9 Genes
Genes y genomas
Hosa
Patr
Papa
Popy
Gogo
Homo sapiens
Pan troglodytes
Pan paniscus
Pongo pygmaeus
Gorilla gorilla
Mundo
Civilizado
Norte de México
Japón
EEUUAA
15
Sesiónes #8 y #9 Genes
Genes y genomas
Recordemos que el helecho lingular de Adder tenía el
mayor número de cromosomas no genes.
Originalmente se pensaba que Hosa poseía alrededor
de 100,000 genes, después del primer borrador del
HGP el número se redujo a ca 30,000, actualmente se
ha reducido incluso más a una cifra cercana a los
22,000 (20,488 según el último conteo de Science).
Ch21
La densidad génica de un genoma se puede usar
para describir la complejidad genómica (usualmente
en genes por Mbp), obviamente los procariotas
poseen mayor densidad que los eucariotas, con pocas
excepciones.
Ch6
La densidad génica del genoma humano oscila
alrededor de 12 y 15 genes por Mbp (excepto la región
del MHC que posee una densidad de alrededor de 45
por Mbp).
16
Sesiónes #8 y #9 Genes
Nomenclatura
Human Genome Organization (HUGO) Gene
Nomenclature Comittee (HGNC) para cada gen
conocido en forma de un nombre génico aprobado
y un símbolo (nombre abreviado).
Todos los nombres y símbolos aprobados
disponibles para consulta en la base de datos
presente en su sitio web.
Facilita intercambio de ideas entre investigadores y
unanimidad consensual de términos empleados.
Facilita la compilación de bases de datos
electrónicas a partir de publicaciones.
www.genenames.org
Trabajando con la filosofía de que cada nombre y
símbolo debe indicar función o rol biológico...en
vez de Cluster Designation (CD) 158E usar
KIR3DL1.
17
Sesiónes #8 y #9 Genes
Nomenclatura
18
Sesiónes #8 y #9 Genes
Dogma Central de la BioMol
Propuesto inicialmente por Francis Crick en 1958 y
replanteado en 1970.
Como en el dogma de fe, corresponde a un conjunto de
normas o creencias indispensables para comprender el
concepto de flujo de la información genética a través de
biopolímeros y en organismos vivos (de acuerdo a
nuestros conocimientos actuales)...
3x3
Propone 3 clases de biopolímeros: DNA, RNA y
polipéptidos.
Propone 3 modalidades de transferencia de información
entre estos biopolímeros: modalidad general, especial y
modalidad desconocida.
Cada modalidad posee 3 direcciones de transferencia
19
Sesiónes #8 y #9 Genes
Dogma Central de la BioMol
Las tres direcciones generales son:
de DNA a DNA (Replicación).
de DNA a RNA (Transcripción).
de RNA a AA (Traducción).
* Ocurren de manera normal en la mayoría de las células.
Las tres direcciones especiales son:
de RNA a RNA (Replicación de RNA).
de RNA a DNA (Retro-transcripción).
de DNA a AA (Solo in vitro).
*Ocurren de manera extraordinaria, pero ocurren.
Las tres direcciones desconocidas son:
de AA a DNA (Evolución inteligente).
de AA a RNA (Otra forma de evolución inteligente).
de AA a AA (controversia de priones).
* Actualmente se piensa que no ocurren nunca.
20
Sesiónes #8 y #9 Genes
Polimorfismo genético
La genética Mendeliana clásica solamente distinguía dos tipos de genes: el Wild-type
(normalmente circulante) y el Mutante (el menos común, inicialmente el que producida una
enfermedad o cambio fenotípico).
Hoy en día sabemos que algunos genes poseen diferentes variantes que pueden o no
producir cambios fenotípicos o enfermedad por ello en realidad no son mutantes = alelos.
En algunas instancias no es correcto emplear el término “wild-type” (HLA).
Polimorfismo genético = hace referencia a la existencia de múltiples alelos para un gen (o
locus).
Una mutación se considera polimórfismo cuando se le encuentra en más de 1% de la
población.
¿Por qué más del 1%? Por que el drift-genético que gobierna la evolución da lugar a
alelos nuevos todo el tiempo, no todos ellos son importantes por que no todos se
estabilizan su existencia en una población (fijación poblacional).
21
Sesiónes #8 y #9 Genes
Polimorfismo genético
Por otro lado, en aquellos sistemas en que sí existe un
alelo wild-type, un escrutinio más detallado (secuencia
nt podría revelar que incluso el WT es en sí polimórfico).
Los polimorfismos llegan a modificar sitios de restricción,
hecho que se explota para la producción de Mapas de
Polimorfismos de Longitud de Fragmentos de
Restricción (RFLP).
Normalmente la digestión por una enzima produce
patrones de migración electroforética específicos que
dependen de la existencia de secuencias específicas
para cada enzima (sitios de restricción).
Algunos polimorfismos (mutaciones) modifican estos sitios de restricción y el patrón
electroforético generado.
Originalmente esto se aprovechaba para pruebas de paternidad y autentificación de identidad
(por que hemos acumulado distintos tipos de mutaciones que nos hacen individuos
diferentes).
22
Sesiónes #8 y #9 Genes
Polimorfismo genético
La segregación de patrones de RFLP puede
ser observada al comparar a distintos
miembros biológicamente emparentados.
El RFLP puede ser empleado como
marcador genético en vez de evaluar
cambios fenotípicos de un organismo.
Debido a que el DNA se recombina y hereda
en forma de grandes fragmentos, es muy
posible que el sitio de restricción ni siquiera
se encuentre en el gen afectado (en el caso
de una patología).
Es decir, basta con que el sitio de restricción
se encuentre en el fragmento (Mbp) que es
heredado como “cassette” durante la
recombinación para que éste sea vinculado
a un rasgo fenotípico.
23
Sesiónes #8 y #9 Genes
Polimorfismo genético
Así pues, el RFLP de una persona normal
(wild-type) pudiera diferir del de una persona
enferma = un marcador genético para dicha
patología.
Este es el principio general detrás de los
estudios de epidemiologia molecular.
En perspectiva: el genoma humano posee
>5,000 marcadores identificados (al 2004),
los cuales se encuentran separados por una
distancia de entre 1 y 2 Mbp.
24
Sesiónes #8 y #9 Genes
Complejo Mayor de Histocompatibilidad (MHC)
El Complejo Mayor de Histocompatibilidad (MHC)
constituye el sistema genético más polimórfico de
los animales.
Fue la primer región en ser estudiada
exhaustivamente y la primera en ser secuenciada
por el HGP.
El MHC constituye una región genómica grande
(3.6 Mbp) presente en la mayoría de los
vertebrados.
Constituye la región más genéticamente-densa del
genoma de los mamíferos (> 150 genes).
Densidad promedio de eucariotas es de 14 genes
por Mbp, densidad de MHC = ca 42 genes/Mbp.
Contiene a genes involucrados en la respuesta
inmune innata y adaptativa, con funciones
inmunes, reproductivas e inflamatorias.
25
Sesiónes #8 y #9 Genes
Complejo Mayor de Histocompatibilidad (MHC)
Las proteínas de HLA codificadas
por MHC presentan péptidos a
células responsables de la vigilancia
inmune.
El MHC se divide en tres regiones
funcionalmente distintas:
MHC clase I, MHC clase III y MHC
clase II
Sistema genético Polimórfico
(muchos alelos), Complejo (muchos
genes) y Codominante (todos los
genes expresados).
Y el número sigue creciendo...
26
Sesiónes #8 y #9 Genes
Complejo Mayor de Histocompatibilidad (MHC)
MHC clase I
Codificante para proteínas de HLA con mismo
nombre (Clase I) involucradas en la
presentación de péptidos endógenos
(incluyendo a patógenos intracelulares) a
células inmunes. HLA-A, HLA-B y HLA-C
MHC clase II
Codificante para proteínas de HLA de Clase II
involucradas en la presentación de antígenos
exogenos a células inmunes e involucradas en
la selección de pareja sexual entre mamíferos
(incluyendo a nosotros). HLA-DP, HLA-DQ y
HLA-DR.
MHC clase III
Codificante para proteínas un poco más
primitivas del sistema inmune, incluyendo a
aquellas pertenecientes al complemento y
algunas citocinas.
27
Sesiónes #8 y #9 Genes
Region KIR del LRC (19q13.4)
Región KIR constituye la segunda región más polimórfica de genes inmunes.
Codificante para Receptores Inmunoglobulina-símiles de Células Asesinas Naturales (KIR).
28
Sesiónes #8 y #9 Genes
Region KIR del LRC (19q13.4)
Los 17 genes KIR se encuentran
codificados en una región de 150 kb del
Complejo de Receptores Leucocitario
(LRC) en el cromosoma 19 (19q13.4).
El LRC posee un tamaño de 1 Mb
abarcando casi la mitad del cromosoma
19.
Los genes KIR se encuentran
organizados dentro de la región KIR y
dentro del LRC en haplotipos.
Genes siempre presentes (constitutivos)
Genes para KIR inhibitorios
Genes para KIR activadores
Pesudogenes (no expresados)
29
Sesiónes #8 y #9 Genes
Region KIR del LRC (19q13.4)
Los genes KIR son polimórficos...
30
Sesiónes #8 y #9 Genes
Region KIR del LRC (19q13.4)
Los genes KIR se encuentran organizados en haplotipos..lo que significa que distintos
individuos poseen diferentes números y tipos de genes.
31
Sesiónes #8 y #9 Genes
Region KIR del LRC (19q13.4)
En resumen, la región KIR ilustra algunos aspectos de diversidad genética.
1.- Poligénica (17 genes: 12 genes verdaderos, 2 pseudogenes, uno de baja expresión y dos
homólogos).
2.- Polimórfica (existen 233 alelos de estos genes).
3.- Poli-haplotípica (existen diferentes arreglos de genes en cada cromosoma).
Los 17 genes han evolucionado gracias a la recombinación exhaustiva entre ellos lo que ha
dado lugar al intercambio de cassettes pequeños (exónicos) de secuencias...evidencia de
evolución divergente.
32
Sesiónes #8 y #9 Genes
Prioridades de diseño
Dos prioridades diferentes distinguen a las formas y hábitos de procariotas y eucariotas.
Filosofía procariota es minimalista, solamente poseen lo indispensable para propagar los
genes de individuos aislados (selección del más apto).
Filosofía eucariota es redundante, poseen mecanismos complejos, funcionalmente
empalmados y ciertos lujos que les permiten no solo asegurar el bien del organismo
aislado sino también de poblaciones enteras (evolución cooperativa).
Los procariotas por ende están diseñados para hacer caber cuanta maquinaria,
información y cualidades puedan hacer caber en un espacio pequeño.
Los eucariotas en general están diseñados para adoptar innovaciones biológicas que los
hagan sobrevivir con mayor éxito.
33
Sesiónes #8 y #9 Genes
Naturaleza interrumpida de genes eucariotas
Al principio se pensaba que los eucariotas tendrían organizaciones génicas similares a las de
los procariotas en donde un gen es colinear y directamente proporcional al tamaño de su
proteína codificada.
La secuencia génica del DNA = a la secuencia del transcrito de RNA = secuencia de aa.
Los genes eucariotas (superiores) difieren de los procariotas en que poseen una naturaleza
interrumpida.
La secuencia de DNA poseía fragmentos que no estaban presentes en el RNA maduro ni en
los aminoácidos.
Secuencia de DNA = secuencia de transcrito primario = secuencia de RNA maduro más
intrones = aminoácidos.
Las levaduras suelen poseer genes continuos sin interrupciones.
Los genes de los eucariotas superiores poseen dos tipos de secuencias génicas intrones y
exones.
34
Sesiónes #8 y #9 Genes
Naturaleza interrumpida de genes eucariotas
Los exones corresponden a las secuencias de
DNA que son exportadas del núcleo en forma
de RNA para ser traducidas en proteínas
Los intrones corresponden a las secuencias
de DNA que forman parte del transcrito de
RNA primario pero que se quedan “dentro” del
núcleo sin formar parte del mRNA maduro, sin
codificar para proteínas y por ende no son
blancos evolutivos.
Debido a que los intrones no codifican para
proteínas, pueden acumular mutaciones sin
impacto sobre las regiones colindantes
codificantes sin problema (a menos de que
dichas mutaciones caigan en la frontera
exónica en cuyo caso pudieran afectar el
splicing, ver más abajo).
35
Sesiónes #8 y #9 Genes
Naturaleza interrumpida de genes eucariotas
Los genes interrumpidos son objeto de un proceso no observado en procariotas, el splicing
nuclear mediante el cual los intrones son identificados y retirados del transcrito de RNA
primario (pre-mRNA) para formar un mRNA maduro (mRNA propiamente).
36
Sesiónes #8 y #9 Genes
Naturaleza interrumpida de genes eucariotas
Por ahora consideraremos que tras el splicing nuclear, el
orden de los exones es SIEMPRE el mismo que en la
secuencia de DNA original.
En realidad los exones nunca se separan unos de otro,
el splicing nuclear ocurre como una reacción
intramolecular en la cual los dos extremos de un intrón
se unen formando un “loop o asa intrónica” que
ulteriormente es liberada tras su escisión
Esto evita que se formen recombinantes postranscripcionales en los cuales los exones son
intercambiados con otros transcritos primarios.
37
Sesiónes #8 y #9 Genes
Intrones y teoría de la información
Teoría controversial pero lógica...Si quisiéramos diseñar
una sonda espacial para mostrar información sobre
nosotros a una civilización extraterrestre haría falta
contemplar:
Problemas:
Largo viaje: varios años luz transcurrirían hasta que llegara a un
sistema estelar cercano.
Estaría expuesta al daño: micrometeoritos, radiación, degeneración
de materiales, cambios térmicos, etc.
Soluciones:
Imprimirla en un material resistente que no permitiera ningún tipo de
modificación (inexistente).
Agregar maquinas que se encargaran de reparar los fragmentos
dañados.
Enviar todo en duplicado.
Dispersar la información para disminuir la posibilidad de daño a
partes cruciales.
38
Sesiónes #8 y #9 Genes
Intrones y teoría de la información
En todo caso, “agregar más papas al picadillo” implica un gasto que los procariotas no se
pueden dar dadas sus limitaciones y filosofía minimalista, en cambio los eucariotas somos
buenos para innovar.
Qué tipo de documento ha aguantado mejor el paso del tiempo: la biblia de Guttenberg escrita
en papel aprovechando el espacio al máximo (procariota) o los glifos gruesos, toscos, dispersos
en la piedra de edificios Maya(eucariota)...ahora solo hay que aprender a leer los glifos.
39
Sesiónes #8 y #9 Genes
Intrones y teoría de la información
En todo caso, “agregar más papas al picadillo” implica un gasto que los procariotas no se
pueden dar dadas sus limitaciones y filosofía minimalista, en cambio los eucariotas somos
buenos para innovar.
Qué tipo de documento ha aguantado mejor el paso del tiempo: la biblia de Guttenberg escrita
en papel aprovechando el espacio al máximo (procariota) o los glifos gruesos, toscos, dispersos
en la piedra de edificios Maya(eucariota)...ahora solo hay que aprender a leer los glifos.
Genoma codificado
de manera continua
Genoma codificado
de manera discontinua
40
Sesiónes #8 y #9 Genes
Conservación de organización génica
Por norma general, los exones son pequeños (entre 50 y 300 bp) en comparación a los
intrones (1000 bp o mas).
El número y tamaño de los intrones presentes en genes varía enormemente de especie a
especie pero la organización génica suele mantenerse relativamente conservada.
41
Sesiónes #8 y #9 Genes
Conservación de organización génica
Usualmente, los intrones poseen codones de terminación en los tres marcos de lectura
disponibles
Un marco de lectura corresponde al tipo de agrupamiento en tripletes que es usado para
traducir la secuencia de RNA a aminoácidos.
Debido a que el código genético se lee en forma de tripletes, existen tres marcos de lectura
distintos para toda secuencia de DNA...esto se abordará con mayor detalle más adelante.
42
Sesiónes #8 y #9 Genes
Conservación de exones
Un ejemplo clásico corresponde al gen de la
Dihidrofolato Reductasa (DHFR) de varios
mamíferos.
En la gran mayoría de los mamíferos, el gen
posee 6 exones correspondientes a los 2 kb de
mRNA.
Los genes individuales (incluyendo intrones)
varían mucho entre estas especies (desde 25 a 31
kbp).
Es decir, la porción codificante permanece
relativamente igual mientras que el tamaño de los
intrones varía.
Esto es un reflejo de la evolución, los genes
filogenéticamente emparentados tienden a poseer
organizaciones similares: tamaños y posiciones de
intrones y exones similares.
43
Sesiónes #8 y #9 Genes
Conservación de exones
Los genes emparentados muestran mayor similaridad en la secuencia de sus exones que en la
secuencia de sus intrones.
Recordemos que los intrones pueden acumular mutaciones sin impacto sobre función proteica
por ende sin selección natural.
Adelantándonos un poco, la evolución de nuevas proteínas (resultado de la tendencia eucariota
por innovar) depende de eventos de recombinación, mutaciones y translocaciones.
Estos eventos llevan al intercambio de secuencias funcionales específicas que hayan
demostrado ser útiles para determinada cosa (exones).
El intercambio y re-ordenamiento de exones (exon shuffling) se hace evidente en poblaciones a
diferencia de los rearreglos génicos que se dan a nivel de individuos.
De este modo, proteínas con funciones diferentes pueden compartir uno o dos exones (similares
en tamaño y secuencia).
44
Sesiónes #8 y #9 Genes
Conservación de exones
El grado de homología de secuencias
exónicas (de cualquier secuencia de
hecho) puede ser graficado en plots de
puntos.
Aquellos sitios (codones, bases, grupos de
10 bases, etc) conservados entre dos
secuencias se muestran con puntos
mientras que los sitios donde haya una
diferencia es marcado con otro carácter
El ploteo de la comparación de dos
secuencias idénticas da lugar a una línea
diagonal de puntos que muestra la
similaridad de secuencia.
45
Sesiónes #8 y #9 Genes
Conservación de exones
Este tipo de gráficas permite resaltar
fácilmente las homologías que existen
entre secuencias o sus diferencias,
también resaltan indels como corrimientos
verticales u horizontales de la diagonal.
Si comparásemos dos secuencias de DNA
semejantes veríamos que los exones se
encontrarían conservados (la diagonal
correría limpiamente por estas áreas)
mientras que la diagonal se perdería en
las regiones que difieren más (intrones y
regiones UTR).
En el caso de la imagen se puede
observar que la secuencia de Betaglobina
mayor posee una inserción a la mitad del
intrón 3 que desplaza la diagonal hacia la
derecha.
46
HLA-I
47
Sesiónes #8 y #9 Genes
Tamaños de exones
Conforme subimos en el árbol de la vida, los genomas
tienden a incrementar su tamaño, en gran parte gracias al
tamaño de los intrones.
El tamaño del genoma es proporcional a la complejidad
del organismo hablando de los eucariotas más primitivos.
Esta correlación entre tamaño de genoma y complejidad del organismo
se rompe a partir de los moluscos e insectos. En los eucariotas
superiores no hay una correlación entre tamaño del genoma y
complejidad del organismo.
El tamaño de los genes por norma general SI guarda cierta
proporción con la complejidad de eucariotas superiores
(a partir de los insectos).
48
Sesiónes #8 y #9 Genes
Tamaños de exones
La mayor parte de los intrones de los vertebrados < 2 kb, pero cerca
de un 10% de los intrones miden > 10 kbp y hasta 60 kbps.
El tamaño de los exones suele ser relativamente constante.
En hongos la mayor parte de los exones miden < 150 bp (codifican
proteínas de ± 40 aminoácidos), pero un porcentaje importante de sus
genes son monoexónicos.
En los vertebrados, la mayor parte de los exones son entre 150 y 300
bp (codificando para proteínas entre 50 y 100 aa).
Existe mayor diversidad en cuanto al número de
exones que poseen los genes.
49
Sesiónes #8 y #9 Genes
Número de exones
Evolución de eucariotas superiores ha
dependido en parte de la expansión
genómica.
Expansión genómica se vale de
recombinación y exon shuffling.
Cabe esperar que cuanto más complejo
(filogenéticamente hablando: nuevo) sea un
organismo, mayor variedad en tipo y
número de exones debe tener.
Esto se ve reflejado en el número de exones
que forman parte de sus genes.
50
Sesiónes #8 y #9 Genes
Número de exones
Las levaduras poseen un número importante
de genes monoexónicos (ca 95%), esta
proporción es menor en los insectos (ca 20%)
y mucho menor en los mamíferos ( ca 5%).
Mientras que la mayor parte de las levaduras
poseen genes de entre 2 y 5 exones, los
insectos muestran mayor número de exones
por gen (desde solo 2 hasta de 30 exones).
Entre nosotros los mamíferos, la diversidad es
mucho superior:
Desde solo 2 por gen hasta 60.
Lo más común entre nosotros son los
genes de 5 y 9 exones.
51
Sesiónes #8 y #9 Genes
Un gen Una proteina
La mayor parte de los genes consisten en secuencias de DNA completamente dedicadas a la
codificación de una sola proteína
Una misma secuencia de DNA puede contener más de un gen y un gen puede codificar para
más de una proteína
Mecanismos:
Genes empalmados
Marcos de lectura alternativos
Splicing alternativo
52
Sesiónes #8 y #9 Genes
Genes empalmados
Dos variedades de empalmamiento (en marco y
en marco alternativo).
En los genomas celulares (pro y eucariotas), las
secuencias de DNA generalmente solo se leen
en un solo marco de lectura
Situación en la que un gen forma parte de otro
gen.
Usualmente genes que poseen dos codones de
iniciación diferentes y un solo codón de
terminación.
Debido a que ambos codones de iniciación se
encuentran en el mismo marco de lectura, la
proteína corta es idéntica en secuencia de
aminoácidos al producto más largo.
53
Sesiónes #8 y #9 Genes
Genes empalmados
Algunos genomas virales y mitocondriales hacen uso (dada la carencia de espacio)
de otros marcos de lectura para codificar a más proteínas
Secuencia:
ATGCATGCATGCATGCATGCATGCATC
Marcos de lectura posibles (recordando que se leen en tripletes).
Marco #1
ATG CAT GCA TGC ATG CAT GCA TGC ATC
Marco #2
A TGC ATG CAT GCA TGC ATG CAT GCA TC
Marco # 3
AT GCA TGC ATG CAT GCA TGC ATG CAT C
Marco #4 = Marco #1 menos M inicial.
Proteína Marco #1=
Proteína Marco #2=
Proteína Marco #3=
Proteína Marco #4=
Met-His-Ala-Cys-Met-His-Ala-Cys-Ile
Cys-Met-His-Ala-Cys-Met-His-Ala
Ala-Cys-Met-His-Ala-Cys-Met-His
His-Ala-Cys-Met-His-Ala-Cys-Ile
54
Sesiónes #8 y #9 Genes
Genes empalmados
El empalme generalmente es pequeño.
55
Sesiónes #8 y #9 Genes
Splicing alternativo
Para algunos genes se generan patrones de
diversidad proteica alternativos gracias a las
modificaciones pos-transcripcionales que
sufre el transcrito primario de RNA.
Depende de arreglos alternativos de los
exones codificados por el mismo gen.
El orden siempre es idéntico a aquel
estipulado por DNA genómico.
No confundir con recombinación por
elección de copia...saltos de RNA pol.
El contenido de exones puede ser
mutuamente excluyente de tal forma que
nunca sean unidos dos exones en el mismo
mRNA.
Depende de maquinaria espliceosomal.
56
Sesiónes #8 y #9 Genes
Splicing alternativo
Ejemplo clásico de la Troponina T murina.
Contiene 5 exones diferentes pero únicamente cuatro llegan a formar el mRNA, el quinto
usualmente es eliminado por maquinaria espliceosomal.
De los 5 exones, dos exones son los mutuamente excluyentes, los otros tres SIEMPRE
estarán presentes en el mRNA.
Esto da lugar a dos proteínas con características diferentes (la -Troponina y -Troponina).
57
Sesiónes #8 y #9 Genes
Función de los intrones
Originalmente se pensaba que representaban fragmentos de secuencia de DNA cuya
expresión había dejado de ser útil para la proteína a la cual ayudaban a codificar: hipótesis
de “secuencia vieja”.
Posteriormente se pensó que los intrones correspondían a “DNA basura” o “DNA
espaciador”.
Hoy en día sabemos que algunos intrones poseen funciones regulatorias,
espliceosomales e incluso auto-catalíticas.
Los intrones no son muy bien comprendidos pero sabemos un poco más sobre su
participación en el splicing nuclear que de cualquier otra función (contienen secuencias
que son reconocidas por maquinaria espliceosomal).
Fueron descubiertos y llamados “secuencias de intervalo” por Phillip Allen Sharp y
Richard J. Roberts (Nobel de Fisiología y Medicina del 1993).
En 1978, Walter Gilbert propuso cambiar el nombre a intrones para acomodarse a la
nomenclatura de biomol de entonces (cistrón, replicón, operón)...proponiendo además el de
exón para las secuencias que serían expresadas.
58
Sesiónes #8 y #9 Genes
Clasificación de los intrones
Actualmente se conocen cuatro clases de intrones:
Nucleares – Muy comunes, también llamados espliceosomales requieren de la intervencion del
espliceosoma o de snRNA’s para ser retirados del precursor-mRNA (los pre-mRNA forman la
mayor parte de la masa del hnRNA)
Grupo I
Grupo II
Autocatalíticos, se escinden del pre-mRNA sin intervencion del espliceosoma.
Son ribozimas y un tipo poco frecuente de intrones.
Grupo III – Parecidos a los del grupo II por compartir estructura secundaria conservada.
59
Sesiónes #8 y #9 Genes
Clasificación de los intrones
Actualmente se conocen cuatro clases de intrones:
Nucleares – Muy comunes, también llamados espliceosomales requieren de la intervencion del
espliceosoma o de snRNA’s para ser retirados del precursor-mRNA (los pre-mRNA forman la
mayor parte de la masa del hnRNA)
Grupo I
Grupo II
Autocatalíticos, se escinden del pre-mRNA sin intervencion del espliceosoma.
Son ribozimas y un tipo poco frecuente de intrones.
Grupo III – Parecidos a los del grupo II por compartir estructura secundaria conservada.
Los del grupo I difieren de los del grupo II y III en
que requieren (los del grupo I) de un nucleósido
de guanina libre para lograr su escisión.
60
Sesiónes #8 y #9 Genes
Clasificación de los intrones
Actualmente se conocen cuatro clases de intrones:
Nucleares – Muy comunes, también llamados espliceosomales requieren de la intervencion del
espliceosoma o de snRNA’s para ser retirados del precursor-mRNA (los pre-mRNA forman la
mayor parte de la masa del hnRNA)
Grupo I
Grupo II
Autocatalíticos, se escinden del pre-mRNA sin intervencion del espliceosoma.
Son ribozimas y un tipo poco frecuente de intrones.
Grupo III – Parecidos a los del grupo II por compartir estructura secundaria conservada.
Los del grupo II y III generan circulo de escisión
al ser removidos.
61
Sesiónes #8 y #9 Genes
Espliceosoma
Complejo de proteinas y RNAs catalíticos encargados de remover los intrones del pre-mRNA a
través de una proceso llamado splicing y de unir los extremos exónicos liberados.
Compuesto por cinco “snRNPs” Small nuclear RNA proteins (U1, U2, U4, U5 y U6)
“snurps”
Componente de RNA rico en uridina (nucleósido de
uracilo).
Espliceosoma se arma “de novo” en cada hnRNA que
surge como transcrito primario.
Circulo de escisión propio de
los intrones de grupo II y III.
62
Sesiónes #8 y #9 Genes
Espliceosoma e Intrones Nucleares
Casi todos comienzan con GU y terminan en AG (regla GU-AG) lo que permite
identificar de manera presuntiva las fronteras exón/intrónicas.
Espliceosoma requiere de la existencia de secuencias conservadas presentes en todo
hnRNA de para su función:
- Sitio consenso 5´.
- Sequencia de ramificación.
- Tracto polipirimidina.
- Sitio consenso 3´.
¿Donde se lleva a cabo el splicing DNA/RNA?
63
Sesiónes #8 y #9 Genes
Clasificación de los intrones
Los del grupo I se caracterizan por requerir de nucleósidos de guanina libres para ser
escindidos y poseen una estructura secundaria diferente a la de los grupos II y III.
Los intrones del grupo I se pueden encontrar en bacterias y protozoos.
64
Sesiónes #8 y #9 Genes
Clasificación de los intrones
Los de los grupos II y III poseen homología estructural y
funcional por lo cual ocasionalmente se les clasifica
conjuntamente como de Grupo II (poseen una estructura
secundaria semejante).
Los del grupo II (o II y III) se encuentran filogenéticamente
emparentados al espliceosoma.
De hecho se piensa que son el
ancestro del espliceosoma.
65
Sesiónes #8 y #9 Genes
Origen de los intrones
Como ya se dijo, los procariotas tienen genes mono-exónicos continuos mientras que
los eucariotas suelen tener genes poliexónicos interrumpidos.
Si bien tenemos una buena idea acerca de como y de donde surgieron los intrones de
grupos I, II y III (precursores del espliceosoma), el origen de los intrones nucleares
es más controversial.
Existen dos teorías que explican su origen filogénetico, la de intrones-tempranos y
la de intrones-tardíos.
66
Sesiónes #8 y #9 Genes
Intrones tempranos
En tiempos ancestrales los genomas primordiales (progenotes=ancestro primordial de
procariotas y eucariotas) contenian intrones que fueron eliminados poco a poco por los
procariotas hasta desaparecer por completo de dicha rama del árbol de la vida.
Propuesta por Walter-Gilbert sugiriendo que procariotas los fueron eliminando en su
esfuerzo minimalista por optimizar recursos y acelerar crecimiento.
Lado bonito: la presencia de
intrones tempranos hubiese
permitido evolucionar rasgos
(proteínas) altamente
especializadas ya que los exones
se podrían intercambiar
relativamente fácil y re-barajar
para formar proteínas innovadoras
67
Sesiónes #8 y #9 Genes
Intrones tempranos
Actualmente solo los eucariotas poseen intrones nucleares, un reflejo de la filosofía
adaptativa de sus genomas (expansibles).
Lado feo: Difícil explicar el éxito para eliminar toda evidencia de intrones entre los
procariotas.
Quizás el mejor ejemplar residual de este eslabón perdido sean las mitocondrias y
cloroplastos, los cuales poseen muchas semejanzas con los procariotas sin embargo
poseen intrones nucleares en sus genomas. ¿Pudieron estos endosimibiontes haber
infectado a células eucariotas antes de que los procariotas comenzaran a deshacerse de sus
intrones?
68
Sesiónes #8 y #9 Genes
Intrones tardíos
En tiempo ancestrales los
progenotes contenian solo
exones, y fueron
incorporando intrones
después de la especiación
procariota/eucariota.
Teoría no explica de manera
tan sensual el proceso
evolutivo pero se ajusta mejor
que la otra al panorama
actual (intrones nucleares
solamente presentes en
eucariotas).
Propone que los intrones
surgieron de transposones o
elementos transferibles que
infectaron a células eucariotas
aprovechando el boom de la
creación de esta nueva rama
del árbol de la vida.
69