HOMOLOGY MODELLING Modelado por homologia o comparativo ACDEFGHIKLMNPQRST--FGHQWERT-----TYREWYEGHADS ASDEYAHLRILDPQRSTVAYAYE--KSFAPPGSFKWEYEAHADS
Download ReportTranscript HOMOLOGY MODELLING Modelado por homologia o comparativo ACDEFGHIKLMNPQRST--FGHQWERT-----TYREWYEGHADS ASDEYAHLRILDPQRSTVAYAYE--KSFAPPGSFKWEYEAHADS
HOMOLOGY MODELLING
Modelado por homologia o comparativo
ACDEFGHIKLMNPQRST--FGHQWERT-----TYREWYEGHADS ASDEYAHLRILDPQRSTVAYAYE--KSFAPPGSFKWEYEAHADS MCDEYAHIRLMNPERSTVAGGHQWERT----GSFKEWYAAHADD
Que es el modelado por homolog í a?
Es un método que permite predecir la
Estructura terciaria
(3D) de una proteína deseada (Target) conociendo – Su secuencia de (
Estructura primaria
) aminoácidos – La estructura
homologa
terciaria de una (template) resuelta por rayos-X o NMR
Por que usar HM?
Muchas veces Nuestra proteína de interes no tiene estructura 3D conocida HM es el mejor de los método de predicción de estructura terciaria a partir de la secuencia Pero ademas….
El universo de los “folds” posibles Cuan grande es??
Se estima que entre 1000-5000
Como va el trabajo?
Proyecto Proteomica estructural Hom. Mod.
Por que funciona el HM?
Se sabe que secuencias similares adoptan estructuras similares En una familia los residuos conservados en la secuencia, conservan la misma estructura La topología de los residuos del sitio activo también es conservada El proceso de evolución por selección natural “tolera” variaciones de la secuencia
Los 4 Pasos a seguir en HM 1-Encontrar un templado adecuado (Ej: BLAST pdb) 2-Alineamiento Target-Template (es el paso mas importante) 3-Construcción del modelo (existen diferentes aprox.) 4-evaluación y refinamiento del modelo
1-Busqueda del templado Como primera aprox. BLAST-pdb Sin templado NO hay modelo Se requiere que toda la secuencia del “target” este representada en el templado Se pueden utilizar mas de un templado
2-Alineamiento Es el paso critico en HM!!!!
Lo optimo es una identidad > 40% Entre 25-40% zona gris El alineamiento debe ser a lo largo de toda la secuencia “target” Alineamientos múltiples mejores que los de a pares Pequeños errores en alineamiento grandes errores en el modelo
Cuando identidad secuencia implica similitud estructural?
3a Búsqueda de regiones conservadas estructuralmente (RCE)
Target Tmpl.1
Tmpl.2
A C DE F G H I K LM NPQ R S T - F G H Q W E R T ---- T Y R E WY E G AS DE Y A H L R IL D PQ R S TV A Y A Y E - K S F APPGS F K W E Y E A M C DE Y A H I R LM NP E R S TV AGG H Q W E R T ----GS F K E WY AA HHHHHHHHHHHHHCCCCCCCCCCCCCCCCCCBBBBBBBBB
RCE #1 RCE #2 Helice RCE #1 Hoja B RCE #2
Las RCE Corresponden a las regiones estructuralmente mas estables de la proteína (Por gral. el interior) Altamente conservadas, y por gral. sin GAPS Usualmente corresponden a elementos de estructura secundaria
3b-Busqueda de regiones variables estructuralmente (RVE)
Target Tmpl.1
Tmpl.2
A C DE F G H I K LM NPQ R S T - F G H Q W E R T ---- T Y R E WY E G AS DE Y A H L R IL D PQ R S TV A Y A Y E - K S F APPGS F K W E Y E A M C DE Y A H I R LM NP E R S TV AGG H Q W E R T ----GS F K E WY AA HHHHHHHHHHHHHCCCCCCCCCCCCCCCCCCBBBBBBBBB
RVE (loop) RVE (loop)
3c Generar coordenadas del modelo (x,y,z) Usando las RCE como anclaje: Aminoácidos idénticos: transferir todas las coordenadas del mismo Aminoácidos similares: transferir “backbone”, reemplazar cadena lateral respetando las torsiones ( ) Aminoácidos diferentes: transferir solo el “backbone”
Agregar loops de las RVE
Target Tmpl.
FGHQ WE RT YAYE--KS
Biblioteca de loops
Secuencia HQ WE RT Estructura
Bibliotecas de loops Loops extraídos de estructuras de alta resolución (< 2 A) Incluyen longitud, secuencia, coordenadas + estructura 2ria de los #aa anteriores y posteriores Los aa anteriores y posteriores deben coincidir estructuralmente Si no esta en la base de datos (PDB). Se usan loops generados al azar y minimizados por MD
Agregar cadenas laterales Cuanto vale ?
Búsqueda en bibliotecas de rotameros para en relación con f/y
Ultimo paso: Refinar el modelo “optimizando la geometria” Se busca minimizar la función que relaciona la energia con las coordenadas atómicas: E = f(3n) (3n = x 1 ,y 1 ,z 1 …….x
n ,y n ,z n ) Elimina superposiciones de átomos ajusta las distancias y ángulos de enlaces a valores típicos (Estereoquímica de la estructura)
4-Evaluacion del modelo: que se puede evaluar?
Los programas de evaluación verifican si el modelo tiene: “Todo aquello que una buena estructura debe tener”
Una buena estructura posee: Mínimo numero de ángulos de torsión no permitidos (Ramachandran plot) Comparar con el templado!!
Tambien….
Maximizar el empaquetamiento de residuos hidrofobicos Minimizar la superficie hidrofobica expuesta a solvente Maximizar la superficie hidrofilica expuesta a solvente Maximizar numero de Puentes-H Buena estereoquímica en general
Errores en HM Posicion de la cad. Lat.
Desviaciones “backbone” Falta de templado
Mal alineamiento Templado incorrecto
Cuan bueno es el modelo?
Y entonces que hago?