HOMOLOGY MODELLING Modelado por homologia o comparativo ACDEFGHIKLMNPQRST--FGHQWERT-----TYREWYEGHADS ASDEYAHLRILDPQRSTVAYAYE--KSFAPPGSFKWEYEAHADS

Download Report

Transcript HOMOLOGY MODELLING Modelado por homologia o comparativo ACDEFGHIKLMNPQRST--FGHQWERT-----TYREWYEGHADS ASDEYAHLRILDPQRSTVAYAYE--KSFAPPGSFKWEYEAHADS

HOMOLOGY MODELLING

Modelado por homologia o comparativo

ACDEFGHIKLMNPQRST--FGHQWERT-----TYREWYEGHADS ASDEYAHLRILDPQRSTVAYAYE--KSFAPPGSFKWEYEAHADS MCDEYAHIRLMNPERSTVAGGHQWERT----GSFKEWYAAHADD

Que es el modelado por homolog í a?

Es un método que permite predecir la

Estructura terciaria

(3D) de una proteína deseada (Target) conociendo – Su secuencia de (

Estructura primaria

) aminoácidos – La estructura

homologa

terciaria de una (template) resuelta por rayos-X o NMR

Por que usar HM?

 Muchas veces Nuestra proteína de interes no tiene estructura 3D conocida  HM es el mejor de los método de predicción de estructura terciaria a partir de la secuencia  Pero ademas….

El universo de los “folds” posibles Cuan grande es??

Se estima que entre 1000-5000

Como va el trabajo?

Proyecto Proteomica estructural Hom. Mod.

Por que funciona el HM?

 Se sabe que secuencias similares adoptan estructuras similares  En una familia los residuos conservados en la secuencia, conservan la misma estructura   La topología de los residuos del sitio activo también es conservada El proceso de evolución por selección natural “tolera” variaciones de la secuencia

Los 4 Pasos a seguir en HM  1-Encontrar un templado adecuado (Ej: BLAST pdb)  2-Alineamiento Target-Template (es el paso mas importante)  3-Construcción del modelo (existen diferentes aprox.)  4-evaluación y refinamiento del modelo

1-Busqueda del templado  Como primera aprox. BLAST-pdb  Sin templado NO hay modelo  Se requiere que toda la secuencia del “target” este representada en el templado  Se pueden utilizar mas de un templado

2-Alineamiento Es el paso critico en HM!!!!

 Lo optimo es una identidad > 40%  Entre 25-40% zona gris   El alineamiento debe ser a lo largo de toda la secuencia “target” Alineamientos múltiples mejores que los de a pares  Pequeños errores en alineamiento grandes errores en el modelo

Cuando identidad secuencia implica similitud estructural?

3a Búsqueda de regiones conservadas estructuralmente (RCE)

Target Tmpl.1

Tmpl.2

A C DE F G H I K LM NPQ R S T - F G H Q W E R T ---- T Y R E WY E G AS DE Y A H L R IL D PQ R S TV A Y A Y E - K S F APPGS F K W E Y E A M C DE Y A H I R LM NP E R S TV AGG H Q W E R T ----GS F K E WY AA HHHHHHHHHHHHHCCCCCCCCCCCCCCCCCCBBBBBBBBB

RCE #1 RCE #2 Helice RCE #1 Hoja B RCE #2

Las RCE  Corresponden a las regiones estructuralmente mas estables de la proteína (Por gral. el interior)  Altamente conservadas, y por gral. sin GAPS  Usualmente corresponden a elementos de estructura secundaria

3b-Busqueda de regiones variables estructuralmente (RVE)

Target Tmpl.1

Tmpl.2

A C DE F G H I K LM NPQ R S T - F G H Q W E R T ---- T Y R E WY E G AS DE Y A H L R IL D PQ R S TV A Y A Y E - K S F APPGS F K W E Y E A M C DE Y A H I R LM NP E R S TV AGG H Q W E R T ----GS F K E WY AA HHHHHHHHHHHHHCCCCCCCCCCCCCCCCCCBBBBBBBBB

RVE (loop) RVE (loop)

3c Generar coordenadas del modelo (x,y,z)  Usando las RCE como anclaje:    Aminoácidos idénticos: transferir todas las coordenadas del mismo Aminoácidos similares: transferir “backbone”, reemplazar cadena lateral respetando las torsiones (  ) Aminoácidos diferentes: transferir solo el “backbone”

Agregar loops de las RVE

Target Tmpl.

FGHQ WE RT YAYE--KS

Biblioteca de loops

Secuencia HQ WE RT Estructura

Bibliotecas de loops  Loops extraídos de estructuras de alta resolución (< 2 A)  Incluyen longitud, secuencia, coordenadas + estructura 2ria de los #aa anteriores y posteriores  Los aa anteriores y posteriores deben coincidir estructuralmente  Si no esta en la base de datos (PDB). Se usan loops generados al azar y minimizados por MD

Agregar cadenas laterales Cuanto vale  ?

Búsqueda en bibliotecas de rotameros para  en relación con f/y

Ultimo paso: Refinar el modelo “optimizando la geometria”   Se busca minimizar la función que relaciona la energia con las coordenadas atómicas: E = f(3n) (3n = x 1 ,y 1 ,z 1 …….x

n ,y n ,z n ) Elimina superposiciones de átomos ajusta las distancias y ángulos de enlaces a valores típicos (Estereoquímica de la estructura)

4-Evaluacion del modelo: que se puede evaluar?

 Los programas de evaluación verifican si el modelo tiene: “Todo aquello que una buena estructura debe tener”

Una buena estructura posee:  Mínimo numero de ángulos de torsión no permitidos (Ramachandran plot) Comparar con el templado!!

Tambien….

 Maximizar el empaquetamiento de residuos hidrofobicos  Minimizar la superficie hidrofobica expuesta a solvente  Maximizar la superficie hidrofilica expuesta a solvente   Maximizar numero de Puentes-H Buena estereoquímica en general

Errores en HM Posicion de la cad. Lat.

Desviaciones “backbone” Falta de templado

Mal alineamiento Templado incorrecto

Cuan bueno es el modelo?

Y entonces que hago?