LAB_MOD_BIO_MOL_lab_3

Transcript LAB_MOD_BIO_MOL_lab_3

EVOLUZIONE DELLE PROTEINE

RELAZIONE ESISTENTE TRA SIMILARITA’ di sequenza e struttura in omologhi

Studio di un campione di strutture note di proteine omologhe (Chothia, Lesk, 1982)

Similarità strutturale misurata in termini di RMS

CALCOLO RMS

- Confronto di due strutture mediante SOVRAPPOSIZIONE - Determinazione di aa che si corrispondono nelle due strutture - Identificazione degli atomi che si vogliono confrontare (Cα o backbone)

RMS =



d n

n = numero residui d = distanza tra atomi corrispondenti

DIVERGENZA DI SEQUENZA E STRUTTURA

Se si valuta la relazione esistente tra divergenza strutturale (misurata in termini di RMS) e divergenza di sequenza si osserva che esse si corrispondono in MODO ESPONENZIALE.(valutato dal confronto di strutture note)

RMS (A) %identity -l’aumento di divergenza di sequenza si riflette in modo accentuato sulla -Proteine strutturalmente simili (rms< 2 Å) possono avere seq molto

differenti (degenerazione del codice strutturale-struttura più conservata di struttura continua con quella della identità di sequenza

Come nel confronto di sequenze e’ necessario allinearle, nel confronto di strutture 3D e’ necessario sovrapporle come corpi rigidi scegliendo una regola di corrispondenza tra coppie di atomi o di residui nelle due strutture. La prima difficoltà consiste nel fatto che le due proteine molto spesso non hanno lo stesso numero di residui. Per la sovrapposizione si possono utilizzare le catene dei carboni alfa appartenenti agli elementi di struttura secondaria perche’ in genere le inserzioni e delezioni si accumulano nei loop che possono semplicemente venire esclusi dalla sovrapposizione. I metodi di confronto 3D utilizzano l’

allineamento delle sequenze per decidere la regola di corrispondenza alla base della sovrapposizione strutturale

 Un allineamento strutturale può essere valutato in base alla deviazione quadratica media (root mean square deviation o r.m.s.d.), al numero di atomi che sono stati accoppiati nella sovrapposizione e alla valutazione della similarità dei residui sovrapposti.

L’r.m.s.d. o r.m.s. di una sovrapposizione tridimensionale è la distanza media tra gli atomi di tutte le coppie che hanno partecipato all’allineamento strutturale, per cui tanto più bassa è l’r.m.s. tanto migliore sarà l’allineamento strutturale calcolato





 1

D i

D = distanza tra coppie di atomi appaiati N = numero di coppie considerate

RMSD

r ai

e r

sono le posizioni dell´ atomo i nelle strutture a e b, n è il numero di atomi nelle strutture.

r.m.s.d. di una sovrapposizione 3D è la distanza media tra gli atomi di tutte le coppie che hanno partecipato all’allineamento strutturale, per cui tanto più bassa è l’r.m.s. tanto migliore sarà l’allineamento strutturale calcolato •

Root-mean-square deviation

– Deviazione quadratica media – Serve per paragonare strutture identiche, eccetto rotazioni e traslazioni

valutazione dell’allineamento strutturale un altro criterio di valutazione di un allineamento strutturale è rappresentato dal numero di atomi o di residui che sono stati accoppiati

si cerca di massimizzare il numero di atomi accoppiati e di minimizzare la corrispondente r.m.s.

a parità di numero di residui accoppiati, il migliore allineamento strutturale sarà quello con minore r.m.s. a parità di r.m.s. verrà considerato migliore l’allineamento strutturale operato con un maggior numero di atomi accoppiati oltre a questi due valori tipici delle sovrapposizioni tridimensionali, si può anche considerare il punteggio di similarità dei residui accoppiati

Diagramma di flusso della modellizzazione proteica

Allineamento multiplo di sequenza Sequenza proteica Ricerca nelle banchedati Dati sperimentali Assegnazione dei domini Proteina omologa nella banca dati PDB?

Sì Modellizzazione comparativa No Modello tridimensionale della proteina

Predizione della struttura secondaria Analisi della famiglia del fold Allineamento delle strutture secondarie Allineamento della sequenza alla struttura Predizione del fold

Sì

E’ stato predetto un fold?

Predizione della struttura terziaria ab-inito

Permette di costruire la struttura tridimensionale di una proteina sulla base della SIMILARITÀ DI SEQUENZA con un’altra proteina

di struttura NOTA

che viene usata come STAMPO.

Utilizza strutture note (template) di uno o più membri di una famiglia strutturale-funzionale per predire la struttura (target) di un altro membro della famiglia la cui sequenza sia nota.

Si basa sulle seguenti osservazioni:



le proteine appartengono ad un numero limitato di famiglie strutturali



proteine della stessa famiglia hanno strutture tridimensionali molto simili

HOMOLOGY MODELLING

• OMOLOGO 3D (PDB) •

ALLINEAMENTO RICERCA DEL TEMPLATO Blast-FastA

CRITERI IDENTITA’/SIMILARITA’ -CONOSCENZA FUNZ.-STR.-BIOCHIM .

Dalla sequenza al modello

Raw model Loop modeling Side chain placement Refinement

ALLINEAMENTO

 GUIDA LA COSTRUZIONE DEL MODELLO  CORRISPONDENZA aa target 

aa templato

 ricerca ALLINEAMENTO OTTIMALE  CORRISPONDENZA DI aa FUNZ. IMPORTANTI  CORRISPONDENZA DELLA STRUTTURA SECONDARIA TRA TEMPLATO E QUERY  VALUTAZIONE DEI GAP 

loop

 USO TEMPLATI MULTIPLI  

loc.similarità

ALLINEAMENTO

1. Generazione di allineamenti a coppie diversi con diversi programmi (nel caso di un solo templato) 2. Allineamenti multipli di omologhi per avere informazioni maggiori 3. Ricerca di informazioni biologico-biochimiche sugli aa conservati 4. Predizione di struttura secondaria per il target 5. Correzione dell’allineamento sulla base delle informazioni ai punti 2. 3. e 4.

CREAZIONE DEL MODELLO

 identificazione SCR (structural conserved regions) 

SCR

 scaffold del modello

_ ___ __ _ _ ____ __

_

___

__

_

____

__

x-ray

SCRs

No SCRs (loops ?)

Raw model Loop modeling Side chain placement Refinement

Costruzione del pre-modello

• La struttura del templato viene utilizzata come “stampo“ per costruire il modello seguendo l‘allineamento.

• Le coordinate 3D dei residui strutturalmente conservati si possono copiare direttamente.

• Le regioni variabili della struttura (generalmente loop) non si possono copiare.

flexible conserved

• •

Catene laterali

Problema

: Applicando le coordinate del

templato

sulla sequenza del

target

cambiano tipo, dimensione e posizione delle catene laterali. L‘RMSD cambia relativamente poco, però possono cambiare le conformazioni di residui importanti (p.es. del sito attivo) • Dove possibile è meglio mantenere le conformazioni delle catene laterali del

templato

• Esistono metodi standard per risolvere questo problema.

Raw model Loop modeling Side chain placement Refinement

PREDIZIONE DELLE CATENE LATERALI



AUSILIO DI LIBRERIE DI ROTAMERI Contengono i possibili conformeri delle catene laterali a fronte di specifiche conformazioni del backbone



OTTIMIZZAZIONE ENERGETICA DELLE STRUTTURA



rimozione di clash

•

Loop modeling

Al pre-modello possono mancare interi frammenti di catena principale – non conservati nella famiglia proteica – Inserzioni – Delezioni • Descrizione del problema: – Si cerca un fold che colleghi il frammento N terminale (pre-loop) con quello C-terminale (post-loop) tramite k residui – ( f , y ) sono gli unici parametri liberi loop post-loop pre-loop Raw model Loop modeling Side chain placement Refinement

PREDIZIONE DEI LOOP



REGIONI VARIABILI –



pressione selettiva



DUE STRATEGIE PREDITTIVE:



criterio geometrico testando diverse conformazioni



ricerca in PDB di frammenti simili nelle proteine a struttura nota



INFLUENZA DELL’INTORNO REFINEMENT CRITICO



E DIN. MOL.

OTTIMIZZAZIONE MEC.



CRITICITA’ nella predizione quando i LOOP rivestono ruolo funzionale o di interazione.

5. Ottimizzazione del modello Regolarizzazione di legami, angoli e torsioni Minimizzazione energetica Eliminazioni di clash strutturali

• Predizione di sequenza con poca o nessuna similarità con strutture note.

FOLD RECOGNITION

• Osservazione: La natura utilizza solamente un numero limitato di fold diversi •

Idea della fold

recognition: Cerca di rappresentare la struttura ignota con dei fold conosciuti, valuta quale potrebbe essere quello “giusto“.

FOLD RECOGNITION

-per casi predittivi in cui non ci sono omologie chiare con proteine a struttura nota (TWILIGHT ZONE) - metodi che rinunciano alla corretta formulazione del campo di forze agenti su una struttura proteica - detti mean force potential che individuano un potenziale che cattura la natura risultante delle forze in gioco - devo disporre di uno strumento quantitativo per misurare fitness di una sequenza con una struttura per poter assegnare alla seq in questione le strutture note e valutare la bontà dell’assegnazione - queste funzioni di pseudo-potenziale sono costruite sulla base di un’analisi statistica di strutture note

 

METODO DEGLI “Structural environment”

detto anche metodo dei profili 1D-3D o di Eisenberg ASSUNZIONE: ambiente di un residuo più conservato del residuo stesso (adatto a relazioni distanti) descrive intorno strutturale di ogni residuo in ogni proteina a struttura nota e valuta la frequenza con cui ognuno dei 20 aa si trova in un certo intorno ambiente descritto sulla base di 3 principi (aspetti + importanti di una struttura proteica): 1.

Quanto un residuo in una posizione è schermato dal solvente?

Quanto è a contatto con gruppi polari o idrofobici?

La struttura secondaria in cui è collocato Diverse combinazioni dei 3 parametri definiscono diverse CATEGORIE STRUTTURALI – sono state definite 18 classi strutturali 6 classi rappresentano l’intorno delle catene laterali che può essere non accessibile (B), parzialmente accessibile (P) o accessibile al solvente (E) P e B sono poi suddivisi sulla base della frazione dell’intorno che è costituita da atomi polari – 3 categorie di frazioni di contatti polari (frazione dell’area della catena laterale coperta da atomi polari): 0 0.4, 0.4-0.8, > 0.8. La categoria E è generalmente in un ambiente polare.

 6 classi: E, P1, P2, B1, B2 e B3  Ciascuna di queste potrà trovarsi in una struttura α o β o “altro” e quindi le classi possibili sono 18.

METODO DEGLI “Structural environment”

A questo punto entra in gioco un eventuale sequenza x cui voglio valutare la fitness per una data struttura (sequenza target). Confronterò gli amminoacidi della mia sequenza con gli ambienti strutturali definiti sulla base delle strutture note (si parla in questo senso di ALLINEAMENTO SEQUENZA-STRUTTURA) Si cerca, in sostanza, di adattare ad un fold già noto la sequenza in esame e si cerca l’allineamento ottimale (operazione fatta tra la seq e tutte le strutture disponibili); All’allineamento è sempre assegnato un punteggio di cui valutare la significatività statistica (E-value o z-score) .

METODO DEI CONTATTI TRA AMMINOACIDI

La funzione di pseudo-potenziale si basa su interazioni tra coppie di amminoacidi (sulla distanza tra amminoacidi nelle proteine a struttura nota); ASSUNZIONE ALLA BASE: le strutture native delle proteine sono stabilizzate da

interazioni intramolecolari tra i vari atomi della proteina e intermolecolari tra essi e le molecole di solvente

Dalla banca dati di strutture costruisce una funzione potenziale che descrive lo spazio conformazionale della proteina: per ogni possibile coppia di aa in una strututra valuto la distanza (di solito Cα-Cα) tra i residui in esame e calcolo la funzione di potenziale che descrive questa interazione; Le funzioni potenziale sono una per ogni coppia di residui e le costruisco sulla base della frequenza con cui osservo una data coppia a una data distanza nel database PDB.

METODO DEI CONTATTI TRA AMMINOACIDI

Ad esempio x la coppia ala-ala: misuro in ogni proteina la distanza tra i Cα e costruisco una distribuzione in cui metto in relazione ogni distanza alla freq con cui è osservata Per passare dalle frequenze a energie si usa il principio di Boltzmann che correla probabilità di uno stato con la sua energia Nel nostro caso certe distanze, calcolate su un numero finito di campioni come quello di PDB, possono non essere rappresentate: si introducono INTERVALLI DI

DISTANZE

La distanza geometrica è influenzata dalla distanza in sequenza: si prende in considerazione anche questa; Parametri da considerare: a,b (i 2 residui); c,d (atomi considerati per le distanze, es Cα-Cα); k è la distanza in sequenza.

Si fa confronto tra frequenza dei i residui a,b (di cui si considerano gli atomi c e d) a distanza k in sequenza e a distanza geometrica r e la frequenza di due qualsiasi residui del sistema che hanno gli stessi k,r,c,d – cioè si misura quanto è probabile osservare quell’interazione tra i residui a e b rispetto alla probabilità totale di trovare 2 aa a quei dati parametri k,r,c,d.

METODO DEI CONTATTI TRA AMMINOACIDI

Si possono calcolare anche potenziali per interazioni con il solvente con un approccio indiretto; L’intorno di atomi buried sono totalmente occupati da altri atomi della stessa proteina. Per atomi sulla superficie solo una frazione occupata da atomi della proteina, il resto dal solvente; S, che corrisponde al numero di atomi della proteina in una sfera di raggio dato, serve come misura quantitativa del grado di esposizione al solvente di atomi collocati al centro della sfera.

Homology modelling

Si determina l’allineamento ottimale Ottimizza un modello

Threading/Fold -recognition

Identifica prima gli omologhi Prova tutte le possibili strutture Prova tutti i possibili allineamenti Valuta molti modelli poco accurati

Il metodo

ab initio

(predizione

de novo)

•Il problema della predizione di struttura ab initio “data una sequenza proteica, calcolarne la struttura” •Il calcolo è basato sulla stima dell’energia relativa alla posizione di ciascun atomo nello spazio e la sua relazione chimico-fisica con gli altri atomi •Il minimo globale della funzione energia definisce la struttura 3D •È teoricamente possibile •Essendo la biofisica complessa ed incompleta è nella pratica ancora molto difficile ROSETTA, sviluppata dal gruppo di David Baker

Ab initio

methods for

modelling

NO allineamento NO struttura nota Costruire una funzione empirica che descriva le forze di interazione Esplorare lo spazio conformazionale per massimizzare funzione di merito

“Modello di folding”

su cui si basa Rosetta: “

Local sequence fragments rapidly

alternate between different possible

local structures, and folding occurs when the

conformations and relative orientations of these local segments combine to form

low energy global structures” E’ UN PROBLEMA DI CAMPIONAMENTO CONFORMAZIONALE

PROBLEMA DI CAMPIONAMENTO CONFORMAZIONALE: Ricerca della geometria di minima energia Richiede: 1. Metodo di ricerca/generazione delle conformazioni 2. Funzione “energetica” (funzione di scoring energetico) per valutarle Nei metodi ab-initio: Rappresentazioni ridotte delle proteine/ Potenziali detti knowledge-based semplificati/ ricerca di conformazionale coarse-grain

Building by homology (Homology modelling)

Allineamento con proteine a struttura nota

M A

A A A

T S K

G G A

F F Y

D E L

V V V

V I L

D E S Modello strutturale

Fold recognition (Threading)

Sequenza: + M A A G Y A Motivi strutturali noti V L S Modello strutturale

Ab initio

Sequenza M A A G Y A V L S Modello strutturale

Protein ubiquitination

Protein ubiquitination: regulatory process influencing several aspect of eukaryoyic cell biology Polyubiquitin (polyUb) chain: link ε-amino group of a Lys of one Ub to the C-terminal carboxyl group of the next Ub in the chain E1-E2-E3 responsible for activating and transferring Ub to proteins Fundamental mechanisms of Ub-chain assembly and of E1-E2-E3 regulation still not clearly understood  Passmore, and Bardford, Biochem J, 2004  Pickart, Cell, 2004  Brzovic and Klevit, Cell Cycle, 2006  Hochstrasser, Cell, 2006

Di-Ubiquitina

Ubiquitin like proteins

(Ubls) 8-20 kDa Ub 76 aa

Globular domain

(4βstrands in a antiparallel βsheet +αhelix) + flexible C- terminal terminating with a gly 7 Conserved lysine residues in Ub N.B. ISG15: ha due domini Ubl Ogni Ubl ha il suo set di E1-E2-E3

E2: Ub-conjugating enzymes

E1 E3/ E3

Cys forms a thiolester bond to C-terminal Gly of Ub Asn stabilizes oxyanion transition state

Multi-domain E2 classification in 17 familes reflecting structural organization of cat. dom.

Identification of phosphorylations by Cdks and CK2 kinases affecting E2 activity  Michelle et al., J Mol Evol, (2009)  Ye and Rape, Nat Rev Mol Cel Biol (2009)

• basandosi su strutture note di catene di DiUbiquitina cross-linkate K48 o K63 → homology modelling Delle polyUb non canoniche (K6, K11, K27, K29, K33)

K48-linked polyUb

Diverse strutture sperimentali di Di-Ub crosslinkata K48 via NMR o X ray e una struttura X-ray della tetra polyUb crosslinkata via K48

B_Cterm B_VAL70 B_LEU8 A_ILE44 B_ILE44 A_LEU8 A_VAL70 Legame isopeptidico

polyUb crossilinkata by K48 sono segnale universale per la degradazione da proteasoma Adottano una CONFORMAZIONE CHIUSA in cui L8, I44 and V70 (patch idrofobico sulla superficie di una singola molecola di Ub) sono sequestrati all’interfaccia tra due molecole di Ub adiacenti

Tetra-Ubiquitina crosslinkata K48

Strutture cmq dinamiche in soluzione – alcuni di questi residui potrebbero diventare accessibili per diretta interazione con fattori di riconoscimento

For example, does linkagespecific recognition arise from differential display of the events, ubiquitin (Ub) is engaged as a signaling

K63-linked polyUb

Diverse strutture sperimentali di Di-Ub crosslinkata K63 via NMR o X ray e una struttura X-ray della tetra polyUb crosslinkata via K63 polyUb crosslinkata via K63 agisce come segnale regolatorio piuttosto che degradativo in molti pathway, Adotta conformazione estesa in soluzione senza contatti diretti tra patch idrofobici

Tetra-Ubiquitina crosslinkata K48

Monomeric Ub

G76

Hydrophobic patch

K48 K63

Come conseguenza a queste differente in conformazione, il segnale di riconoscimento presentato dalle due tipologie di catene è molto diverso .

Differenti modalità di interazione con gli UBA-2 domain (di hHR23a). UBA-domain sono domini di legame per Ub – L’UBA domain di hHR23a è coinvolto nella modulazione dell’interazione tra catene di poliUb e proteasoma (alta affinità per catene poliUb linkate via K48)

Varadan R et al. 2005, Mol Cell, 18, 687-698

IL RICONOSCIMENTO SPECIFICO DI UNA DELLE DUE CATENE HA ORIGINE DA UN DIVERSO MODO DI ESPRRE LE SUPERFICI IDROFOBICHE O DALLA PRESENZA DI NUOVI PATCH DI INTERAZIONE SULLA SUP. DELLE DUE CATENE?

Non-canonical PoliUb chains

Nessuna di esse isolata finora in studi in

vitro

K48 Hydrophobic patch G76 \ K6 K27 K11 Lo studio delle catene non canoniche importante per: -Chiarire i meccanismi molecolari con cui avviene riconoscimento di specifiche catene di poliUb - Capire se solo le catene linkate da K48 o anche altre permettono K33 una struttura globulare stabilizzata da interazioni non covalenti tra molecole di Ub adiacenti - La conformazione estesa di catene linkate via K63 come hp da Varadan et al. è dovuta a vincoli sterici che prevengono diretto contatto tra i patch idrofobici di due unità di Ub K29 K63

SCOPO del lavoro di Fushman and Walker

• Studio computazionale via molecular modelling e docking • Studiano modelli di Di-Ubiquitina • Determinare quali dei 7 possibili legami isopeptidici tra due molecole di Ub può dare origine a conformazioni chiuse attraverso contatto diretto tra i patch idrofobici dei due monomeri di Ub adiacenti • Studiano anche proprietà conformazionali di catene in cui le due Ub interagiscono head- to-tail che sono state dimostrate essere simili a catene crosslinkate via K63 B_K63

• Usano il software HADDOCK ( modelling/docking – utile anche per fare modelli guidati da dati sperimentali NMR) • struttura iniziale X-ray di K48-linked Ub 2 (le singole subunità hanno struttura globalmente molto simile alla forma monomerica di Ub (backbone rmsd 0.65 Å) • Per evitare bias dovuti alle posizioni occupate esattamente nel cristallo dai due monomeri di Ub, le due Ub sono traslate l’una rispetto all’altra di 150 Å e ruotate in modo random. [LE TRATTANO COME UNITA’ SEPARATE] • IDEA DI PARTENZA: le due caratteristiche principali di Ub come monomero sono patch idrofobico su una faccia del β-sheet dell’Ub e la coda C-terminale flessibile (R72-G76). Tutti i dati sperimentali noti indicano che il patch idrofobico è una “binding hot spot” nell’Ub ed è direttamente coinvolto nella maggior parte di interazioni con gli Ub-binding domain. Gli autori si chiedono se un simile meccanismo possa essere coinvolto nella formazione di altre catene di poliUb in cui il patch idrofobico agisca cone un “Velcro” molecolare che forma contatti Ub/Ub.

• Quali catene crosslinkate da lys diverse permettono dei contatti idrofobici patch-to- patch tra due monomeri adiacenti di Ub.

• L’algoritmo di docking implementato in HADDOCK si occupa di proporre possibili modelli degli omodimeri Ub-Ub tenendo conto di alcuni vincoli di distanze tra residui pre-definiti

(

restraints)

• Dei due monomeri Ub distale (contiene G76 impiegata nel legame isopeptidico G76-KX) e Ub prossimale (contenente la KX legata e il C-terminale libero) • Vincoli imposti tali da considerare i possibili contatti tra gli amminoacidi del patch idrofobico (L8, I44 e V70) e vincolo sul legame isopeptidico usando dei set di distance restraints basati sulle tipiche distanze interatomiche per un legame peptidico in strutture cristallografiche.

• Si include una componente che permetta una certa flessibilità a backbone e catene laterali così da tener conto di possibili riarrangiamenti conformazionali all’interfaccia tra due molecole di Ub. Gli amminoacidi all’interfaccia che costituiscono segmenti flessibili

sono definiti come i 3 residui del patch idrofobico più il loro immediato intorno aa in sequenza (i 2 aa immediatamente

upstream

downstream

) + altri residui come la coda C terminale • solvente considerato in modo esplicito (modelling in soluzione) • 200 diversi run per ogni KX-linked model e clustering delle 200 strutture impostando come cutoff di rmsd globale (calcolata sul backbone) 2.5 Å dopo sovrapposizione sulla prima Ub (distale)

• 200 diversi run per ogni KX-linked model e clustering delle 200 strutture impostando come cutoff di rmsd globale (calcolata sul backbone) 2.5 Å dopo sovrapposizione sulla prima Ub (distale) • i cluster sono valutati sulla base dell’ HADDOCK SCORE (Hscore) considerando le 10 migliori per ogni cluster.

• in tutti casi CLUSTER1 ha il più basso valore medio di Hscore e anche la struttura a energia intramolecolare piu’ bassa.

• Per tutti L’energia elettrostatica (Eelect) è il maggior contributo a Einter (en. Intermolecolare) • Erest quantifica l’abilità di ciascuna catena di soddisfare i distance restraint impostati ( unambigous restraint associati al legame isopeptidico – ambigous restraints associati a contatti interdominio tra i patch idrofobici)

• • BSA (buried surface area) varia da 736 a 1458 Å complessi proteici.

2 per catene cross-linkate K48, K6, K29, K27, K11, i valori di BSA consistenti con quelli tipici per

Le 10 migliori strutture del miglior cluster secondo

Hscore sono state estratte per ogni catena Ub per i confronti 2 e usate NB rimodellano anche K48 e K63 che servono come controllo Migliori strutture per ogni modello Ub distale Ub prossimale

VALIDAZIONE DEI CALCOLI

Ub2K48* no vincoli su interazioni tra aa nei patch idrofobici Rotazione 45 ° di una delle due Ub rispetto a struttura Xray. Backbone rmsd alta ≈ 5Å.

si sovrappone bene (backbone rmsd ↓≈ 1Å) con le DiUb della struttura x-ray e con le DiUb della struttura x-ray della poliUb.

E’ importante notare che modellando K48Ub2 con piccolo numero di ambiguous restraints fornisce un modello simile a quelli generati da HADDOCK usando tutti vincoli derivabili da esperimenti NMR [ref.8, DijK A et al., 2005, Proteins]. “The inclusion of both linker-related restraints and ambiguous restraints representing hydrophobic patch to-patch interdomain contacts in HADDOCK2.0 was both necessary and sufficient for predicting the closed conformation of K48-linked Ub2 with good accuracy

VALIDAZIONE DEI CALCOLI 2

Gli autori concludono che i modelli ottenuti per Ub2 linkata da K48 e K63 servono come indicazione che il loro approccio, anche se non permette dettagli a livello atomico, è adatto a indicare quali linkageUb-Ub possono risultare in conformazion chiuse che permettano quindi contatti tra i patch idrofobici di due monomeri di Ub adiacenti.

Ulteriore validazione: il modello di Ub2 crosslinkata da K63 mostrano nessun contatto tra patch idrofobici L8-I44-V70, in accordo con dati NMR e SAXS sperimentali (small-angle-X ray scattering). [ref 9,10] e x-ray della Ub2 e Ub4 linkate da K63.

Non essendoci molti vincoli, sono strutture intrinsecamente più flessibili e che possono andare incontro a diversi cambiamenti conformazionali. Nessuna di queste conformazioni osservate sperimentalmente ha mai interazioni tra i patch idrofobici

METODI per calcolo interazioni deboli

LIGPLOT software: per calcolare contatti intra- intermolecolari. Usato in questo caso per calcolare Hbond intermolecolari e interazioni di non legame. Si basa su cutoff di distanze HBOND distanze di 2.7 e 3.35 Å per H-A e D-A e angoli (D-H-A, H-A-AA, e D-A-AA) di minimo 90 ° . Interazioni di non legame tra atomi distanti entro 3.9 Å.

Si definisce presente un contatto idrofobico se presente in almeno 4 delle 10 migliori strutture selezionate.

Energia libera di legame (Ebind) calcolata usando il server DCOMPLEX.

CLASSIFICAZIONE DEI MODELLI OTTENUTI

Confronto e classificazione rigorosa dei diversi modelli per ogni linkage Ub-Ub è difficile e non triviale. Cercare di considerare molteplici parametri che riflettano vari aspetti dei contatti inter molecolari. Scelgono 12 diversi descrittori [Table 2]

A.Energia intermolecolare [

quasi sempre from-115 kcal/mol to -280 kcal/mol ] . Int. elettrostatiche danno maggior contributo a Einter [ patch idrofobico sulla sup dell’Ub è circondato da amminoacidi polari e carichi (soprattutto basici) che possono contribuire all’interazione ].

B. Interazioni dirette deboli all’interfaccia, come legami a H e contatti idrofobici sono fattori che influenzano la stabilità dei complessi.

I Legami a H spesso sono adatti a conferire specificità a interazioni prot-prot dato il loro carattere predominantemente polare e energie di 3-7 kcal/mol per legame a H. Molti studi per correlare numero Hbond a BSA. N ° Hbond varia a seconda size interfaccia e idrofobicità. Numero medio Hbond per 100 Å 2 va da 0.35 a 0.59 per omo- e etero-dimeri [ref 30,32].

K48-linked e K27-linked Ub2 mostrano + ↑ n ° Hbond (tra 0.5 a 0.57 per 100 Å 2 ) K48- K6- K11-linked > n ° contatti idrofobici medi (da 14.4 a 10.9) tra L8, I44 e V70 delle 2 Ub. Head-to-tail, K29-, K63- e K33-linked Ub2 non mostrano contatti idrofobici. K63-linked e K33 linked Ub2 hanno il piu’ basso numero di Hbond medi.

Contatti idrofobici

K11 K48 K6 K27 HT K63 K33 K29

HBOND

K11 K48 K6 K27 HT K63 K33 K29

COMBINAZIONE DI CRITERI SFAVOREVOLI all’instaurarsi di un’interfaccia di interazione

(basso numero di legami a H e contatti idrofobici) DIMINUISCE LA STABILITA’

DELL’INTERFACCIA E RENDE

CONFORMAZIONI CHIUSE PER COMPLESSI K63-like

SFAVOREVOLI.

C. RESTRAINT ENERGY Erest (unambigous associati a legame isopep. ambigous associati al patch idrofobico). Per la maggior parte delle strutture unamb. constraint ben soddisfatti.

K48-, K11, K6-linked Ub2 basse violazioni umb. constraint, mentre K63- K33- e K29-linked Ub2 hanno più alti valori di Eamb. Questo supporta ulteriormente la conclusione che quest’ultime non possono permettere contatti idrofobici tra i loro patch idrofobici all’interfaccia di interazione.

E_ambigous

K11 K6 K48 K27 HT K63 K33 K29

CLASSIFICAZIONE DEI MODELLI OTTENUTI

D. SHAPE COMPLEMENTARITY. Di solito valutata in base a valori BSA. Mediamente, la formazione di omodimeri o eterodimeri all’interfaccia occupa il 12% dell’area accessibile al solvente (op. 6-29%). K48-linked Ub2 15% vs K63- (9%), K33- (10%) K29- (11%).

E. ASAhp (accessible surface area for L8, I44, V70) + è basso, + residuo è buried all’interno dell’interfaccia di interazione. K48- e K6-linked più basso valore ASAhp e K29- K63- K33- e HT più alto.

BSA

K11 K6 K48 K27 HT K63 K33 K29

ASAhp

K11 K6 K48 K27 HT K63 K33 K29

ANALISI DELLE COMPONENTI PRINCIPALI (PCA)

PROBLEMA: i descrittori scelti rappresentano vari ma spesso overlapping aspetti relativi alla natura delle int prot-prot. difficile capire come sceglierli per guidare la classificazione.

Usano quindi la PCA, tecnica classica per ridurre dimensionalità del data set trasformandolo in un nuovo set di variabili (componenti principali PCs) che catturano le caratteristiche essenziali dei dati. Fatte in modo che le prime variabili del nuovo sistema di riferimento, descrivano la maggior parte dell’informazione e le ultime il rumore di fondo. (ad esempio in questo lavoro le prime 3 PC1+PC2+PC3 il 90.6%). Tranne Eunamb. tutti i parametri gia’ descritti bene dalla PC1+PC2 (> 70%) NB Per farla usano i valori medi dei 12 descrittori calcolati sulle 10 migliori strutture del cluster migliore Sulla base dell’HADDOCK-score e fanno controlli anche variando il data set

ANALISI DELLE COMPONENTI PRINCIPALI (PCA)

Loading plot

le coordinate di ogni descrittore nel nuovo sistema di riferimento I descrittori che cadono tra le due circonferenze sono quelli meglio descritti dalla PCA

Score plot

coordinate dei dati originali nel nuovo sistema di coordinate Due gruppi di strutture lungo la PC1 K48 K27 K6 K11 -> formano strutture chiuse di Ub2 K63 K33 K29 HT -> non adatte a formare conformazioni chiuse di Ub2

DISCUSSIONE DEI DATI

• tutte catene polyUb sono composte da lo stesso tipo di monomero però riconosciute come segnali specifici da pathways diversi • La specificità deve essere connessa in ultima istanza con la conformazione delle catene di polyUb formate e della loro adattabilità a diversi tipi di UBA domain.

• Capire come i diversi linkage forniscono specificità e razionalizzare a livello molecolare l’ampio spettro di effetti che le catene di polyUb possono dare si rende ancor più necessario con la scoperta dell’esistenza di catene polyUb non canoniche o legate testa/coda.

• Con metodi di mol.mod/docking cercano di rispondere alla domanda

“Could polyUb chains of various linkages allow close contact between hydrophobic patch surfaces on the neighboring Ub units?

” Questa regione è chiave x’ è quella che media il legame con diverse Ub binding proteins. Quindi se poly-Ub in conformazione chiusa, saranno richiesti cambiamenti conformazionali per il riconoscimento.

• Riconoscono due gruppi : Ub2 che formano contatti idrofobici (K6, K11, K27 e K48) e catene che per impedimento sterico non possono formare contatti idrofobici patch-to-patch (K29, K33, K63 e HT) • Osservazioni fatte su catene diUb estrapolabili per le polyUb.

DISCUSSIONE DEI DATI

• L’approccio è statico (docking semi-flessibile), quindi sono modelli a bassa risoluzione per la seconda classe che non forma contatti idrofobici. Occorrerebbero metodi di simulazione che permettano cambiamenti conformazionali maggiori e di studiare l’evoluzione della struttura per avere modelli più raffinati. Inoltre gli autori stessi suggeriscono che I modelli da loro proposti possano a questo punto essere validati da misure sperimentali.

• Per polyUb K48-linked è noto che per int. con UBA domain è necessario cambiamento conformazionale. I modelli di K11- K27- e K6-linked Ub2 suggeriscano che anche per queste catene possa avvenire lo stesso e che legheranno I loro ligandi con una struttura sandwich- like come nel caso dell’interazione tra K48-linked Ub2 e UBA domain di hHR23a. E si hp che le conformazioni di queste polyUb siano pH-dipendenti, come per K48-linked.

CONFORMAZIONI CHIUSE dominanti a pH > 7 / CONFORMAZIONI APERTE aumentano al diminuire del pH. Protonazione H68 (vicino al patch idrofobico) di ciascuna Ub causa repulsione elettrostatica dei due monomeri di Ub.

DISCUSSIONE DEI DATI

• Le catene K63-linked like (K29-, K33- e HT) predette in open conformation con patch idrofobici sempre esposti per l’interazione.

• Quese proprietà conformazionali insieme alla loro flessibilità intrinseca potrebbero essere determinanti per la selettività (avidità) di legame per diversi recettori che contengono siti di binding per Ub multipli come Rap80.

LAB_MOD_BIO_MOL_lab_3

Transcript LAB_MOD_BIO_MOL_lab_3

EVOLUZIONE DELLE PROTEINE

RELAZIONE ESISTENTE TRA SIMILARITA’ di sequenza e struttura in omologhi

DIVERGENZA DI SEQUENZA E STRUTTURA

Root-mean-square deviation

Permette di costruire la struttura tridimensionale di una proteina sulla base della SIMILARITÀ DI SEQUENZA con un’altra proteina

di struttura NOTA

che viene usata come STAMPO.

Utilizza strutture note (template) di uno o più membri di una famiglia strutturale-funzionale per predire la struttura (target) di un altro membro della famiglia la cui sequenza sia nota.

Si basa sulle seguenti osservazioni:

le proteine appartengono ad un numero limitato di famiglie strutturali

proteine della stessa famiglia hanno strutture tridimensionali molto simili

HOMOLOGY MODELLING

• OMOLOGO 3D (PDB) •

ALLINEAMENTO RICERCA DEL TEMPLATO Blast-FastA

Dalla sequenza al modello

ALLINEAMENTO

ALLINEAMENTO

CREAZIONE DEL MODELLO

_

__

_

__

x-ray

No SCRs (loops ?)

Costruzione del pre-modello

Catene laterali

PREDIZIONE DELLE CATENE LATERALI

AUSILIO DI LIBRERIE DI ROTAMERI Contengono i possibili conformeri delle catene laterali a fronte di specifiche conformazioni del backbone

OTTIMIZZAZIONE ENERGETICA DELLE STRUTTURA

rimozione di clash

Loop modeling

PREDIZIONE DEI LOOP

REGIONI VARIABILI –

pressione selettiva

DUE STRATEGIE PREDITTIVE:

criterio geometrico testando diverse conformazioni

ricerca in PDB di frammenti simili nelle proteine a struttura nota

INFLUENZA DELL’INTORNO REFINEMENT CRITICO

E DIN. MOL.

OTTIMIZZAZIONE MEC.

CRITICITA’ nella predizione quando i LOOP rivestono ruolo funzionale o di interazione.

5. Ottimizzazione del modello Regolarizzazione di legami, angoli e torsioni Minimizzazione energetica Eliminazioni di clash strutturali

FOLD RECOGNITION

FOLD RECOGNITION

METODO DEGLI “Structural environment”

METODO DEGLI “Structural environment”

METODO DEI CONTATTI TRA AMMINOACIDI

METODO DEI CONTATTI TRA AMMINOACIDI

METODO DEI CONTATTI TRA AMMINOACIDI

Homology modelling

Si determina l’allineamento ottimale Ottimizza un modello

Threading/Fold -recognition

Identifica prima gli omologhi Prova tutte le possibili strutture Prova tutti i possibili allineamenti Valuta molti modelli poco accurati

Il metodo

ab initio

(predizione

de novo)

Ab initio

methods for

modelling

Building by homology (Homology modelling)

Protein ubiquitination

E2: Ub-conjugating enzymes

VALIDAZIONE DEI CALCOLI

VALIDAZIONE DEI CALCOLI 2

METODI per calcolo interazioni deboli

CLASSIFICAZIONE DEI MODELLI OTTENUTI

CLASSIFICAZIONE DEI MODELLI OTTENUTI

ANALISI DELLE COMPONENTI PRINCIPALI (PCA)

ANALISI DELLE COMPONENTI PRINCIPALI (PCA)

Directory