Transcript LAB_MOD_BIO_MOL_lab_3
EVOLUZIONE DELLE PROTEINE
RELAZIONE ESISTENTE TRA SIMILARITA’ di sequenza e struttura in omologhi
Studio di un campione di strutture note di proteine omologhe (Chothia, Lesk, 1982)
Similarità strutturale misurata in termini di RMS
CALCOLO RMS
- Confronto di due strutture mediante SOVRAPPOSIZIONE - Determinazione di aa che si corrispondono nelle due strutture - Identificazione degli atomi che si vogliono confrontare (Cα o backbone)
RMS =
d n
2
n = numero residui d = distanza tra atomi corrispondenti
DIVERGENZA DI SEQUENZA E STRUTTURA
Se si valuta la relazione esistente tra divergenza strutturale (misurata in termini di RMS) e divergenza di sequenza si osserva che esse si corrispondono in MODO ESPONENZIALE.(valutato dal confronto di strutture note)
RMS (A) %identity -l’aumento di divergenza di sequenza si riflette in modo accentuato sulla -Proteine strutturalmente simili (rms< 2 Å) possono avere seq molto
differenti (degenerazione del codice strutturale-struttura più conservata di struttura continua con quella della identità di sequenza
Come nel confronto di sequenze e’ necessario allinearle, nel confronto di strutture 3D e’ necessario sovrapporle come corpi rigidi scegliendo una regola di corrispondenza tra coppie di atomi o di residui nelle due strutture. La prima difficoltà consiste nel fatto che le due proteine molto spesso non hanno lo stesso numero di residui. Per la sovrapposizione si possono utilizzare le catene dei carboni alfa appartenenti agli elementi di struttura secondaria perche’ in genere le inserzioni e delezioni si accumulano nei loop che possono semplicemente venire esclusi dalla sovrapposizione. I metodi di confronto 3D utilizzano l’
allineamento delle sequenze per decidere la regola di corrispondenza alla base della sovrapposizione strutturale
Un allineamento strutturale può essere valutato in base alla deviazione quadratica media (root mean square deviation o r.m.s.d.), al numero di atomi che sono stati accoppiati nella sovrapposizione e alla valutazione della similarità dei residui sovrapposti.
L’r.m.s.d. o r.m.s. di una sovrapposizione tridimensionale è la distanza media tra gli atomi di tutte le coppie che hanno partecipato all’allineamento strutturale, per cui tanto più bassa è l’r.m.s. tanto migliore sarà l’allineamento strutturale calcolato
r
.
m
.
s
.
d
N
i
1
D i
2
N
D = distanza tra coppie di atomi appaiati N = numero di coppie considerate
RMSD
r ai
e r
bi
sono le posizioni dell´ atomo i nelle strutture a e b, n è il numero di atomi nelle strutture.
r.m.s.d. di una sovrapposizione 3D è la distanza media tra gli atomi di tutte le coppie che hanno partecipato all’allineamento strutturale, per cui tanto più bassa è l’r.m.s. tanto migliore sarà l’allineamento strutturale calcolato •
Root-mean-square deviation
– Deviazione quadratica media – Serve per paragonare strutture identiche, eccetto rotazioni e traslazioni
valutazione dell’allineamento strutturale un altro criterio di valutazione di un allineamento strutturale è rappresentato dal numero di atomi o di residui che sono stati accoppiati
si cerca di massimizzare il numero di atomi accoppiati e di minimizzare la corrispondente r.m.s.
a parità di numero di residui accoppiati, il migliore allineamento strutturale sarà quello con minore r.m.s. a parità di r.m.s. verrà considerato migliore l’allineamento strutturale operato con un maggior numero di atomi accoppiati oltre a questi due valori tipici delle sovrapposizioni tridimensionali, si può anche considerare il punteggio di similarità dei residui accoppiati
Diagramma di flusso della modellizzazione proteica
Allineamento multiplo di sequenza Sequenza proteica Ricerca nelle banchedati Dati sperimentali Assegnazione dei domini Proteina omologa nella banca dati PDB?
Sì Modellizzazione comparativa No Modello tridimensionale della proteina
Predizione della struttura secondaria Analisi della famiglia del fold Allineamento delle strutture secondarie Allineamento della sequenza alla struttura Predizione del fold
Sì
E’ stato predetto un fold?
No
Predizione della struttura terziaria ab-inito
Permette di costruire la struttura tridimensionale di una proteina sulla base della SIMILARITÀ DI SEQUENZA con un’altra proteina
di struttura NOTA
che viene usata come STAMPO.
Utilizza strutture note (template) di uno o più membri di una famiglia strutturale-funzionale per predire la struttura (target) di un altro membro della famiglia la cui sequenza sia nota.
Si basa sulle seguenti osservazioni:
le proteine appartengono ad un numero limitato di famiglie strutturali
proteine della stessa famiglia hanno strutture tridimensionali molto simili
HOMOLOGY MODELLING
• OMOLOGO 3D (PDB) •
ALLINEAMENTO RICERCA DEL TEMPLATO Blast-FastA
CRITERI IDENTITA’/SIMILARITA’ -CONOSCENZA FUNZ.-STR.-BIOCHIM .
Dalla sequenza al modello
Raw model Loop modeling Side chain placement Refinement
ALLINEAMENTO
GUIDA LA COSTRUZIONE DEL MODELLO CORRISPONDENZA aa target
aa templato
ricerca ALLINEAMENTO OTTIMALE CORRISPONDENZA DI aa FUNZ. IMPORTANTI CORRISPONDENZA DELLA STRUTTURA SECONDARIA TRA TEMPLATO E QUERY VALUTAZIONE DEI GAP
loop
USO TEMPLATI MULTIPLI
loc.similarità
ALLINEAMENTO
1. Generazione di allineamenti a coppie diversi con diversi programmi (nel caso di un solo templato) 2. Allineamenti multipli di omologhi per avere informazioni maggiori 3. Ricerca di informazioni biologico-biochimiche sugli aa conservati 4. Predizione di struttura secondaria per il target 5. Correzione dell’allineamento sulla base delle informazioni ai punti 2. 3. e 4.
CREAZIONE DEL MODELLO
identificazione SCR (structural conserved regions)
SCR
scaffold del modello
_ ___ __ _ _ ____ __
_
___
__
_
_
____
__
x-ray
SCRs
No SCRs (loops ?)
Raw model Loop modeling Side chain placement Refinement
Costruzione del pre-modello
• La struttura del templato viene utilizzata come “stampo“ per costruire il modello seguendo l‘allineamento.
• Le coordinate 3D dei residui strutturalmente conservati si possono copiare direttamente.
• Le regioni variabili della struttura (generalmente loop) non si possono copiare.
flexible conserved
• •
Catene laterali
Problema
: Applicando le coordinate del
templato
sulla sequenza del
target
cambiano tipo, dimensione e posizione delle catene laterali. L‘RMSD cambia relativamente poco, però possono cambiare le conformazioni di residui importanti (p.es. del sito attivo) • Dove possibile è meglio mantenere le conformazioni delle catene laterali del
templato
.
• Esistono metodi standard per risolvere questo problema.
Raw model Loop modeling Side chain placement Refinement
PREDIZIONE DELLE CATENE LATERALI
AUSILIO DI LIBRERIE DI ROTAMERI Contengono i possibili conformeri delle catene laterali a fronte di specifiche conformazioni del backbone
OTTIMIZZAZIONE ENERGETICA DELLE STRUTTURA
rimozione di clash
•
Loop modeling
Al pre-modello possono mancare interi frammenti di catena principale – non conservati nella famiglia proteica – Inserzioni – Delezioni • Descrizione del problema: – Si cerca un fold che colleghi il frammento N terminale (pre-loop) con quello C-terminale (post-loop) tramite k residui – ( f , y ) sono gli unici parametri liberi loop post-loop pre-loop Raw model Loop modeling Side chain placement Refinement
PREDIZIONE DEI LOOP
REGIONI VARIABILI –
pressione selettiva
DUE STRATEGIE PREDITTIVE:
criterio geometrico testando diverse conformazioni
ricerca in PDB di frammenti simili nelle proteine a struttura nota
INFLUENZA DELL’INTORNO REFINEMENT CRITICO
E DIN. MOL.
OTTIMIZZAZIONE MEC.
CRITICITA’ nella predizione quando i LOOP rivestono ruolo funzionale o di interazione.
5. Ottimizzazione del modello Regolarizzazione di legami, angoli e torsioni Minimizzazione energetica Eliminazioni di clash strutturali
• Predizione di sequenza con poca o nessuna similarità con strutture note.
FOLD RECOGNITION
• Osservazione: La natura utilizza solamente un numero limitato di fold diversi •
Idea della fold
recognition: Cerca di rappresentare la struttura ignota con dei fold conosciuti, valuta quale potrebbe essere quello “giusto“.
FOLD RECOGNITION
-per casi predittivi in cui non ci sono omologie chiare con proteine a struttura nota (TWILIGHT ZONE) - metodi che rinunciano alla corretta formulazione del campo di forze agenti su una struttura proteica - detti mean force potential che individuano un potenziale che cattura la natura risultante delle forze in gioco - devo disporre di uno strumento quantitativo per misurare fitness di una sequenza con una struttura per poter assegnare alla seq in questione le strutture note e valutare la bontà dell’assegnazione - queste funzioni di pseudo-potenziale sono costruite sulla base di un’analisi statistica di strutture note
METODO DEGLI “Structural environment”
detto anche metodo dei profili 1D-3D o di Eisenberg ASSUNZIONE: ambiente di un residuo più conservato del residuo stesso (adatto a relazioni distanti) descrive intorno strutturale di ogni residuo in ogni proteina a struttura nota e valuta la frequenza con cui ognuno dei 20 aa si trova in un certo intorno ambiente descritto sulla base di 3 principi (aspetti + importanti di una struttura proteica): 1.
Quanto un residuo in una posizione è schermato dal solvente?
2.
3.
Quanto è a contatto con gruppi polari o idrofobici?
La struttura secondaria in cui è collocato Diverse combinazioni dei 3 parametri definiscono diverse CATEGORIE STRUTTURALI – sono state definite 18 classi strutturali 6 classi rappresentano l’intorno delle catene laterali che può essere non accessibile (B), parzialmente accessibile (P) o accessibile al solvente (E) P e B sono poi suddivisi sulla base della frazione dell’intorno che è costituita da atomi polari – 3 categorie di frazioni di contatti polari (frazione dell’area della catena laterale coperta da atomi polari): 0 0.4, 0.4-0.8, > 0.8. La categoria E è generalmente in un ambiente polare.
6 classi: E, P1, P2, B1, B2 e B3 Ciascuna di queste potrà trovarsi in una struttura α o β o “altro” e quindi le classi possibili sono 18.
-
METODO DEGLI “Structural environment”
A questo punto entra in gioco un eventuale sequenza x cui voglio valutare la fitness per una data struttura (sequenza target). Confronterò gli amminoacidi della mia sequenza con gli ambienti strutturali definiti sulla base delle strutture note (si parla in questo senso di ALLINEAMENTO SEQUENZA-STRUTTURA) Si cerca, in sostanza, di adattare ad un fold già noto la sequenza in esame e si cerca l’allineamento ottimale (operazione fatta tra la seq e tutte le strutture disponibili); All’allineamento è sempre assegnato un punteggio di cui valutare la significatività statistica (E-value o z-score) .
METODO DEI CONTATTI TRA AMMINOACIDI
La funzione di pseudo-potenziale si basa su interazioni tra coppie di amminoacidi (sulla distanza tra amminoacidi nelle proteine a struttura nota); ASSUNZIONE ALLA BASE: le strutture native delle proteine sono stabilizzate da
interazioni intramolecolari tra i vari atomi della proteina e intermolecolari tra essi e le molecole di solvente
Dalla banca dati di strutture costruisce una funzione potenziale che descrive lo spazio conformazionale della proteina: per ogni possibile coppia di aa in una strututra valuto la distanza (di solito Cα-Cα) tra i residui in esame e calcolo la funzione di potenziale che descrive questa interazione; Le funzioni potenziale sono una per ogni coppia di residui e le costruisco sulla base della frequenza con cui osservo una data coppia a una data distanza nel database PDB.
-
METODO DEI CONTATTI TRA AMMINOACIDI
Ad esempio x la coppia ala-ala: misuro in ogni proteina la distanza tra i Cα e costruisco una distribuzione in cui metto in relazione ogni distanza alla freq con cui è osservata Per passare dalle frequenze a energie si usa il principio di Boltzmann che correla probabilità di uno stato con la sua energia Nel nostro caso certe distanze, calcolate su un numero finito di campioni come quello di PDB, possono non essere rappresentate: si introducono INTERVALLI DI
DISTANZE
La distanza geometrica è influenzata dalla distanza in sequenza: si prende in considerazione anche questa; Parametri da considerare: a,b (i 2 residui); c,d (atomi considerati per le distanze, es Cα-Cα); k è la distanza in sequenza.
Si fa confronto tra frequenza dei i residui a,b (di cui si considerano gli atomi c e d) a distanza k in sequenza e a distanza geometrica r e la frequenza di due qualsiasi residui del sistema che hanno gli stessi k,r,c,d – cioè si misura quanto è probabile osservare quell’interazione tra i residui a e b rispetto alla probabilità totale di trovare 2 aa a quei dati parametri k,r,c,d.
METODO DEI CONTATTI TRA AMMINOACIDI
Si possono calcolare anche potenziali per interazioni con il solvente con un approccio indiretto; L’intorno di atomi buried sono totalmente occupati da altri atomi della stessa proteina. Per atomi sulla superficie solo una frazione occupata da atomi della proteina, il resto dal solvente; S, che corrisponde al numero di atomi della proteina in una sfera di raggio dato, serve come misura quantitativa del grado di esposizione al solvente di atomi collocati al centro della sfera.
Homology modelling
Si determina l’allineamento ottimale Ottimizza un modello
Threading/Fold -recognition
Identifica prima gli omologhi Prova tutte le possibili strutture Prova tutti i possibili allineamenti Valuta molti modelli poco accurati
Il metodo
ab initio
(predizione
de novo)
•Il problema della predizione di struttura ab initio “data una sequenza proteica, calcolarne la struttura” •Il calcolo è basato sulla stima dell’energia relativa alla posizione di ciascun atomo nello spazio e la sua relazione chimico-fisica con gli altri atomi •Il minimo globale della funzione energia definisce la struttura 3D •È teoricamente possibile •Essendo la biofisica complessa ed incompleta è nella pratica ancora molto difficile ROSETTA, sviluppata dal gruppo di David Baker
Ab initio
methods for
modelling
NO allineamento NO struttura nota Costruire una funzione empirica che descriva le forze di interazione Esplorare lo spazio conformazionale per massimizzare funzione di merito
“Modello di folding”
su cui si basa Rosetta: “
Local sequence fragments rapidly
alternate between different possible
local structures, and folding occurs when the
conformations and relative orientations of these local segments combine to form
low energy global structures” E’ UN PROBLEMA DI CAMPIONAMENTO CONFORMAZIONALE
PROBLEMA DI CAMPIONAMENTO CONFORMAZIONALE: Ricerca della geometria di minima energia Richiede: 1. Metodo di ricerca/generazione delle conformazioni 2. Funzione “energetica” (funzione di scoring energetico) per valutarle Nei metodi ab-initio: Rappresentazioni ridotte delle proteine/ Potenziali detti knowledge-based semplificati/ ricerca di conformazionale coarse-grain
Building by homology (Homology modelling)
Allineamento con proteine a struttura nota
M A
A A A
A
T S K
G
G G A
Y
F F Y
A
D E L
Y
-
G
-
V
V V V
L
V I L
S
D E S Modello strutturale
Fold recognition (Threading)
Sequenza: + M A A G Y A Motivi strutturali noti V L S Modello strutturale
Ab initio
Sequenza M A A G Y A V L S Modello strutturale
Protein ubiquitination
Protein ubiquitination: regulatory process influencing several aspect of eukaryoyic cell biology Polyubiquitin (polyUb) chain: link ε-amino group of a Lys of one Ub to the C-terminal carboxyl group of the next Ub in the chain E1-E2-E3 responsible for activating and transferring Ub to proteins Fundamental mechanisms of Ub-chain assembly and of E1-E2-E3 regulation still not clearly understood Passmore, and Bardford, Biochem J, 2004 Pickart, Cell, 2004 Brzovic and Klevit, Cell Cycle, 2006 Hochstrasser, Cell, 2006
Di-Ubiquitina
Ubiquitin like proteins
(Ubls) 8-20 kDa Ub 76 aa
Globular domain
(4βstrands in a antiparallel βsheet +αhelix) + flexible C- terminal terminating with a gly 7 Conserved lysine residues in Ub N.B. ISG15: ha due domini Ubl Ogni Ubl ha il suo set di E1-E2-E3
E2: Ub-conjugating enzymes
E1 E3/ E3
Cys forms a thiolester bond to C-terminal Gly of Ub Asn stabilizes oxyanion transition state
Multi-domain E2 classification in 17 familes reflecting structural organization of cat. dom.
Identification of phosphorylations by Cdks and CK2 kinases affecting E2 activity Michelle et al., J Mol Evol, (2009) Ye and Rape, Nat Rev Mol Cel Biol (2009)
• basandosi su strutture note di catene di DiUbiquitina cross-linkate K48 o K63 → homology modelling Delle polyUb non canoniche (K6, K11, K27, K29, K33)
K48-linked polyUb
Diverse strutture sperimentali di Di-Ub crosslinkata K48 via NMR o X ray e una struttura X-ray della tetra polyUb crosslinkata via K48
B_Cterm B_VAL70 B_LEU8 A_ILE44 B_ILE44 A_LEU8 A_VAL70 Legame isopeptidico
polyUb crossilinkata by K48 sono segnale universale per la degradazione da proteasoma Adottano una CONFORMAZIONE CHIUSA in cui L8, I44 and V70 (patch idrofobico sulla superficie di una singola molecola di Ub) sono sequestrati all’interfaccia tra due molecole di Ub adiacenti
Tetra-Ubiquitina crosslinkata K48
Strutture cmq dinamiche in soluzione – alcuni di questi residui potrebbero diventare accessibili per diretta interazione con fattori di riconoscimento
For example, does linkagespecific recognition arise from differential display of the events, ubiquitin (Ub) is engaged as a signaling
K63-linked polyUb
Diverse strutture sperimentali di Di-Ub crosslinkata K63 via NMR o X ray e una struttura X-ray della tetra polyUb crosslinkata via K63 polyUb crosslinkata via K63 agisce come segnale regolatorio piuttosto che degradativo in molti pathway, Adotta conformazione estesa in soluzione senza contatti diretti tra patch idrofobici
Tetra-Ubiquitina crosslinkata K48
Monomeric Ub
G76
Hydrophobic patch
K48 K63
Come conseguenza a queste differente in conformazione, il segnale di riconoscimento presentato dalle due tipologie di catene è molto diverso .
Differenti modalità di interazione con gli UBA-2 domain (di hHR23a). UBA-domain sono domini di legame per Ub – L’UBA domain di hHR23a è coinvolto nella modulazione dell’interazione tra catene di poliUb e proteasoma (alta affinità per catene poliUb linkate via K48)
Varadan R et al. 2005, Mol Cell, 18, 687-698
IL RICONOSCIMENTO SPECIFICO DI UNA DELLE DUE CATENE HA ORIGINE DA UN DIVERSO MODO DI ESPRRE LE SUPERFICI IDROFOBICHE O DALLA PRESENZA DI NUOVI PATCH DI INTERAZIONE SULLA SUP. DELLE DUE CATENE?
Non-canonical PoliUb chains
Nessuna di esse isolata finora in studi in
vitro
K48 Hydrophobic patch G76 \ K6 K27 K11 Lo studio delle catene non canoniche importante per: -Chiarire i meccanismi molecolari con cui avviene riconoscimento di specifiche catene di poliUb - Capire se solo le catene linkate da K48 o anche altre permettono K33 una struttura globulare stabilizzata da interazioni non covalenti tra molecole di Ub adiacenti - La conformazione estesa di catene linkate via K63 come hp da Varadan et al. è dovuta a vincoli sterici che prevengono diretto contatto tra i patch idrofobici di due unità di Ub K29 K63
SCOPO del lavoro di Fushman and Walker
• Studio computazionale via molecular modelling e docking • Studiano modelli di Di-Ubiquitina • Determinare quali dei 7 possibili legami isopeptidici tra due molecole di Ub può dare origine a conformazioni chiuse attraverso contatto diretto tra i patch idrofobici dei due monomeri di Ub adiacenti • Studiano anche proprietà conformazionali di catene in cui le due Ub interagiscono head- to-tail che sono state dimostrate essere simili a catene crosslinkate via K63 B_K63
• Usano il software HADDOCK ( modelling/docking – utile anche per fare modelli guidati da dati sperimentali NMR) • struttura iniziale X-ray di K48-linked Ub 2 (le singole subunità hanno struttura globalmente molto simile alla forma monomerica di Ub (backbone rmsd 0.65 Å) • Per evitare bias dovuti alle posizioni occupate esattamente nel cristallo dai due monomeri di Ub, le due Ub sono traslate l’una rispetto all’altra di 150 Å e ruotate in modo random. [LE TRATTANO COME UNITA’ SEPARATE] • IDEA DI PARTENZA: le due caratteristiche principali di Ub come monomero sono patch idrofobico su una faccia del β-sheet dell’Ub e la coda C-terminale flessibile (R72-G76). Tutti i dati sperimentali noti indicano che il patch idrofobico è una “binding hot spot” nell’Ub ed è direttamente coinvolto nella maggior parte di interazioni con gli Ub-binding domain. Gli autori si chiedono se un simile meccanismo possa essere coinvolto nella formazione di altre catene di poliUb in cui il patch idrofobico agisca cone un “Velcro” molecolare che forma contatti Ub/Ub.
• Quali catene crosslinkate da lys diverse permettono dei contatti idrofobici patch-to- patch tra due monomeri adiacenti di Ub.
• L’algoritmo di docking implementato in HADDOCK si occupa di proporre possibili modelli degli omodimeri Ub-Ub tenendo conto di alcuni vincoli di distanze tra residui pre-definiti
(
restraints)
• Dei due monomeri Ub distale (contiene G76 impiegata nel legame isopeptidico G76-KX) e Ub prossimale (contenente la KX legata e il C-terminale libero) • Vincoli imposti tali da considerare i possibili contatti tra gli amminoacidi del patch idrofobico (L8, I44 e V70) e vincolo sul legame isopeptidico usando dei set di distance restraints basati sulle tipiche distanze interatomiche per un legame peptidico in strutture cristallografiche.
• Si include una componente che permetta una certa flessibilità a backbone e catene laterali così da tener conto di possibili riarrangiamenti conformazionali all’interfaccia tra due molecole di Ub. Gli amminoacidi all’interfaccia che costituiscono segmenti flessibili
sono definiti come i 3 residui del patch idrofobico più il loro immediato intorno aa in sequenza (i 2 aa immediatamente
upstream
e
downstream
) + altri residui come la coda C terminale • solvente considerato in modo esplicito (modelling in soluzione) • 200 diversi run per ogni KX-linked model e clustering delle 200 strutture impostando come cutoff di rmsd globale (calcolata sul backbone) 2.5 Å dopo sovrapposizione sulla prima Ub (distale)
• 200 diversi run per ogni KX-linked model e clustering delle 200 strutture impostando come cutoff di rmsd globale (calcolata sul backbone) 2.5 Å dopo sovrapposizione sulla prima Ub (distale) • i cluster sono valutati sulla base dell’ HADDOCK SCORE (Hscore) considerando le 10 migliori per ogni cluster.
• in tutti casi CLUSTER1 ha il più basso valore medio di Hscore e anche la struttura a energia intramolecolare piu’ bassa.
• Per tutti L’energia elettrostatica (Eelect) è il maggior contributo a Einter (en. Intermolecolare) • Erest quantifica l’abilità di ciascuna catena di soddisfare i distance restraint impostati ( unambigous restraint associati al legame isopeptidico – ambigous restraints associati a contatti interdominio tra i patch idrofobici)
• • BSA (buried surface area) varia da 736 a 1458 Å complessi proteici.
2 per catene cross-linkate K48, K6, K29, K27, K11, i valori di BSA consistenti con quelli tipici per
Le 10 migliori strutture del miglior cluster secondo
Hscore sono state estratte per ogni catena Ub per i confronti 2 e usate NB rimodellano anche K48 e K63 che servono come controllo Migliori strutture per ogni modello Ub distale Ub prossimale
VALIDAZIONE DEI CALCOLI
Ub2K48* no vincoli su interazioni tra aa nei patch idrofobici Rotazione 45 ° di una delle due Ub rispetto a struttura Xray. Backbone rmsd alta ≈ 5Å.
si sovrappone bene (backbone rmsd ↓≈ 1Å) con le DiUb della struttura x-ray e con le DiUb della struttura x-ray della poliUb.
E’ importante notare che modellando K48Ub2 con piccolo numero di ambiguous restraints fornisce un modello simile a quelli generati da HADDOCK usando tutti vincoli derivabili da esperimenti NMR [ref.8, DijK A et al., 2005, Proteins]. “The inclusion of both linker-related restraints and ambiguous restraints representing hydrophobic patch to-patch interdomain contacts in HADDOCK2.0 was both necessary and sufficient for predicting the closed conformation of K48-linked Ub2 with good accuracy
VALIDAZIONE DEI CALCOLI 2
Gli autori concludono che i modelli ottenuti per Ub2 linkata da K48 e K63 servono come indicazione che il loro approccio, anche se non permette dettagli a livello atomico, è adatto a indicare quali linkageUb-Ub possono risultare in conformazion chiuse che permettano quindi contatti tra i patch idrofobici di due monomeri di Ub adiacenti.
Ulteriore validazione: il modello di Ub2 crosslinkata da K63 mostrano nessun contatto tra patch idrofobici L8-I44-V70, in accordo con dati NMR e SAXS sperimentali (small-angle-X ray scattering). [ref 9,10] e x-ray della Ub2 e Ub4 linkate da K63.
Non essendoci molti vincoli, sono strutture intrinsecamente più flessibili e che possono andare incontro a diversi cambiamenti conformazionali. Nessuna di queste conformazioni osservate sperimentalmente ha mai interazioni tra i patch idrofobici
METODI per calcolo interazioni deboli
LIGPLOT software: per calcolare contatti intra- intermolecolari. Usato in questo caso per calcolare Hbond intermolecolari e interazioni di non legame. Si basa su cutoff di distanze HBOND distanze di 2.7 e 3.35 Å per H-A e D-A e angoli (D-H-A, H-A-AA, e D-A-AA) di minimo 90 ° . Interazioni di non legame tra atomi distanti entro 3.9 Å.
Si definisce presente un contatto idrofobico se presente in almeno 4 delle 10 migliori strutture selezionate.
Energia libera di legame (Ebind) calcolata usando il server DCOMPLEX.
CLASSIFICAZIONE DEI MODELLI OTTENUTI
Confronto e classificazione rigorosa dei diversi modelli per ogni linkage Ub-Ub è difficile e non triviale. Cercare di considerare molteplici parametri che riflettano vari aspetti dei contatti inter molecolari. Scelgono 12 diversi descrittori [Table 2]
A.Energia intermolecolare [
quasi sempre from-115 kcal/mol to -280 kcal/mol ] . Int. elettrostatiche danno maggior contributo a Einter [ patch idrofobico sulla sup dell’Ub è circondato da amminoacidi polari e carichi (soprattutto basici) che possono contribuire all’interazione ].
B. Interazioni dirette deboli all’interfaccia, come legami a H e contatti idrofobici sono fattori che influenzano la stabilità dei complessi.
I Legami a H spesso sono adatti a conferire specificità a interazioni prot-prot dato il loro carattere predominantemente polare e energie di 3-7 kcal/mol per legame a H. Molti studi per correlare numero Hbond a BSA. N ° Hbond varia a seconda size interfaccia e idrofobicità. Numero medio Hbond per 100 Å 2 va da 0.35 a 0.59 per omo- e etero-dimeri [ref 30,32].
K48-linked e K27-linked Ub2 mostrano + ↑ n ° Hbond (tra 0.5 a 0.57 per 100 Å 2 ) K48- K6- K11-linked > n ° contatti idrofobici medi (da 14.4 a 10.9) tra L8, I44 e V70 delle 2 Ub. Head-to-tail, K29-, K63- e K33-linked Ub2 non mostrano contatti idrofobici. K63-linked e K33 linked Ub2 hanno il piu’ basso numero di Hbond medi.
Contatti idrofobici
K11 K48 K6 K27 HT K63 K33 K29
HBOND
K11 K48 K6 K27 HT K63 K33 K29
COMBINAZIONE DI CRITERI SFAVOREVOLI all’instaurarsi di un’interfaccia di interazione
(basso numero di legami a H e contatti idrofobici) DIMINUISCE LA STABILITA’
DELL’INTERFACCIA E RENDE
CONFORMAZIONI CHIUSE PER COMPLESSI K63-like
SFAVOREVOLI.
C. RESTRAINT ENERGY Erest (unambigous associati a legame isopep. ambigous associati al patch idrofobico). Per la maggior parte delle strutture unamb. constraint ben soddisfatti.
K48-, K11, K6-linked Ub2 basse violazioni umb. constraint, mentre K63- K33- e K29-linked Ub2 hanno più alti valori di Eamb. Questo supporta ulteriormente la conclusione che quest’ultime non possono permettere contatti idrofobici tra i loro patch idrofobici all’interfaccia di interazione.
E_ambigous
K11 K6 K48 K27 HT K63 K33 K29
CLASSIFICAZIONE DEI MODELLI OTTENUTI
D. SHAPE COMPLEMENTARITY. Di solito valutata in base a valori BSA. Mediamente, la formazione di omodimeri o eterodimeri all’interfaccia occupa il 12% dell’area accessibile al solvente (op. 6-29%). K48-linked Ub2 15% vs K63- (9%), K33- (10%) K29- (11%).
E. ASAhp (accessible surface area for L8, I44, V70) + è basso, + residuo è buried all’interno dell’interfaccia di interazione. K48- e K6-linked più basso valore ASAhp e K29- K63- K33- e HT più alto.
BSA
K11 K6 K48 K27 HT K63 K33 K29
ASAhp
K11 K6 K48 K27 HT K63 K33 K29
ANALISI DELLE COMPONENTI PRINCIPALI (PCA)
PROBLEMA: i descrittori scelti rappresentano vari ma spesso overlapping aspetti relativi alla natura delle int prot-prot. difficile capire come sceglierli per guidare la classificazione.
Usano quindi la PCA, tecnica classica per ridurre dimensionalità del data set trasformandolo in un nuovo set di variabili (componenti principali PCs) che catturano le caratteristiche essenziali dei dati. Fatte in modo che le prime variabili del nuovo sistema di riferimento, descrivano la maggior parte dell’informazione e le ultime il rumore di fondo. (ad esempio in questo lavoro le prime 3 PC1+PC2+PC3 il 90.6%). Tranne Eunamb. tutti i parametri gia’ descritti bene dalla PC1+PC2 (> 70%) NB Per farla usano i valori medi dei 12 descrittori calcolati sulle 10 migliori strutture del cluster migliore Sulla base dell’HADDOCK-score e fanno controlli anche variando il data set
ANALISI DELLE COMPONENTI PRINCIPALI (PCA)
Loading plot
le coordinate di ogni descrittore nel nuovo sistema di riferimento I descrittori che cadono tra le due circonferenze sono quelli meglio descritti dalla PCA
Score plot
coordinate dei dati originali nel nuovo sistema di coordinate Due gruppi di strutture lungo la PC1 K48 K27 K6 K11 -> formano strutture chiuse di Ub2 K63 K33 K29 HT -> non adatte a formare conformazioni chiuse di Ub2
DISCUSSIONE DEI DATI
• tutte catene polyUb sono composte da lo stesso tipo di monomero però riconosciute come segnali specifici da pathways diversi • La specificità deve essere connessa in ultima istanza con la conformazione delle catene di polyUb formate e della loro adattabilità a diversi tipi di UBA domain.
• Capire come i diversi linkage forniscono specificità e razionalizzare a livello molecolare l’ampio spettro di effetti che le catene di polyUb possono dare si rende ancor più necessario con la scoperta dell’esistenza di catene polyUb non canoniche o legate testa/coda.
• Con metodi di mol.mod/docking cercano di rispondere alla domanda
“Could polyUb chains of various linkages allow close contact between hydrophobic patch surfaces on the neighboring Ub units?
” Questa regione è chiave x’ è quella che media il legame con diverse Ub binding proteins. Quindi se poly-Ub in conformazione chiusa, saranno richiesti cambiamenti conformazionali per il riconoscimento.
• Riconoscono due gruppi : Ub2 che formano contatti idrofobici (K6, K11, K27 e K48) e catene che per impedimento sterico non possono formare contatti idrofobici patch-to-patch (K29, K33, K63 e HT) • Osservazioni fatte su catene diUb estrapolabili per le polyUb.
DISCUSSIONE DEI DATI
• L’approccio è statico (docking semi-flessibile), quindi sono modelli a bassa risoluzione per la seconda classe che non forma contatti idrofobici. Occorrerebbero metodi di simulazione che permettano cambiamenti conformazionali maggiori e di studiare l’evoluzione della struttura per avere modelli più raffinati. Inoltre gli autori stessi suggeriscono che I modelli da loro proposti possano a questo punto essere validati da misure sperimentali.
• Per polyUb K48-linked è noto che per int. con UBA domain è necessario cambiamento conformazionale. I modelli di K11- K27- e K6-linked Ub2 suggeriscano che anche per queste catene possa avvenire lo stesso e che legheranno I loro ligandi con una struttura sandwich- like come nel caso dell’interazione tra K48-linked Ub2 e UBA domain di hHR23a. E si hp che le conformazioni di queste polyUb siano pH-dipendenti, come per K48-linked.
CONFORMAZIONI CHIUSE dominanti a pH > 7 / CONFORMAZIONI APERTE aumentano al diminuire del pH. Protonazione H68 (vicino al patch idrofobico) di ciascuna Ub causa repulsione elettrostatica dei due monomeri di Ub.
DISCUSSIONE DEI DATI
• Le catene K63-linked like (K29-, K33- e HT) predette in open conformation con patch idrofobici sempre esposti per l’interazione.
• Quese proprietà conformazionali insieme alla loro flessibilità intrinseca potrebbero essere determinanti per la selettività (avidità) di legame per diversi recettori che contengono siti di binding per Ub multipli come Rap80.