Diapositiva 1 - Laboratory of Molecular Modelling

Download Report

Transcript Diapositiva 1 - Laboratory of Molecular Modelling

PDB: banca dati di strutture (Protein Data Bank) –
ridondante – strutture ottenute sperimentalmente
via X-ray o NMR
http://www.pdb.org
Esempio: Deossiemoglobina umana (1a3n)
HEADER
TITLE
COMPND
COMPND
COMPND
COMPND
SOURCE
SOURCE
SOURCE
SOURCE
SOURCE
KEYWDS
EXPDTA
AUTHOR
REVDAT
REMARK
REMARK
REMARK
REMARK
OXYGEN TRANSPORT
22-JAN-98
1A3N
DEOXY HUMAN HEMOGLOBIN
MOL_ID: 1;
2 MOLECULE: HEMOGLOBIN;
3 CHAIN: A, B, C, D;
4 BIOLOGICAL_UNIT: ALPHA-BETA-ALPHA-BETA TETRAMER
MOL_ID: 1;
2 ORGANISM_SCIENTIFIC: HOMO SAPIENS;
3 ORGANISM_COMMON: HUMAN;
4 TISSUE: BLOOD;
5 CELL: RED CELL
OXYGEN TRANSPORT, HEME, RESPIRATORY PROTEIN, ERYTHROCYTE
X-RAY DIFFRACTION
J.TAME,B.VALLONE
1
29-APR-98 1A3N
0
1
2
2 RESOLUTION. 1.8 ANGSTROMS.
3
[…]
tipo di
atomo
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
ATOM
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
tipo di
amminoacido
N
CA
C
O
CB
CG1
CG2
N
CA
C
O
CB
CG
CD1
CD2
N
CA
C
O
CB
OG
VAL
VAL
VAL
VAL
VAL
VAL
VAL
LEU
LEU
LEU
LEU
LEU
LEU
LEU
LEU
SER
SER
SER
SER
SER
SER
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
3
3
3
3
3
3
coordinate
X
Y
Z
10.720
10.228
8.705
8.164
10.602
10.307
12.065
8.091
6.624
6.176
6.567
6.020
6.386
5.998
5.730
5.380
4.831
3.725
3.095
4.308
3.076
19.523
20.761
20.714
20.005
22.000
23.296
21.951
21.453
21.451
22.578
23.730
21.707
20.649
21.119
19.337
22.237
23.237
24.027
23.717
22.429
21.786
6.163
6.807
6.878
6.015
5.966
6.700
5.544
7.775
7.763
6.821
7.022
9.129
10.198
11.577
9.795
5.852
4.928
5.568
6.591
3.727
3.991
…
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
21.36
24.26
18.62
19.87
27.19
31.86
31.74
16.19
17.31
18.55
18.72
18.34
17.39
17.99
16.96
15.02
16.59
14.84
14.40
16.47
14.91
N
C
C
O
C
C
C
N
C
C
O
C
C
C
C
N
C
C
O
C
O
Classificazioni
gerarchiche
SCOP (Structural Classification of
Proteins)
•
Class
–
•
a, b, a/b, a+b, ...
Fold
– Similarità strutturale
•
Superfamily
– Omologia
•
Family
– Omologia e funzione
•
Principalmente annotata a mano
CATH
•
•
•
•
Class (a, b, a/b, a+b, ...)
Architecture
Topology (including connections between sec. str. elements)
Homologous superfamily
• Semiautomatica
– Solo Architecture viene assegnata manualmente
Esempi di categorie di fold (CATH architectures)
CONFRONTO STRUTTURE 3D DI PROTEINE – ALLINEAMENTO STRUTTURALE
Come nel confronto di sequenze e’ necessario allinearle, nel confronto di strutture 3D e’
necessario sovrapporle come corpi rigidi scegliendo una regola di corrispondenza tra coppie
di atomi o di residui nelle due strutture. La prima difficoltà consiste nel fatto che le due
proteine molto spesso non hanno lo stesso numero di residui. Per la sovrapposizione si
possono utilizzare le catene dei carboni alfa appartenenti agli elementi di struttura
secondaria perche’ in genere le inserzioni e delezioni si accumulano nei loop che possono
semplicemente venire esclusi dalla sovrapposizione. I metodi di confronto 3D utilizzano l’
allineamento delle sequenze per decidere la regola di corrispondenza alla base della
sovrapposizione strutturale
Un allineamento strutturale può essere valutato in base alla deviazione quadratica media
(root mean square deviation o r.m.s.d.), al numero di atomi che sono stati accoppiati nella
sovrapposizione e alla valutazione della similarità dei residui sovrapposti.
L’r.m.s.d. o r.m.s. di una sovrapposizione tridimensionale è la distanza media tra gli atomi di
tutte le coppie che hanno partecipato all’allineamento strutturale, per cui tanto più bassa è
l’r.m.s. tanto migliore sarà l’allineamento strutturale calcolato
N
r.m.s.d 
D
2
i
i 1
D = distanza tra coppie di atomi appaiati
N = numero di coppie considerate
N
RMSD
rai e rbi sono le posizioni dell´ atomo i nelle
strutture a e b,
n è il numero di atomi nelle strutture.
r.m.s.d. di una sovrapposizione 3D è la distanza media tra gli atomi di tutte le
coppie che hanno partecipato all’allineamento strutturale, per cui tanto più
bassa è l’r.m.s. tanto migliore sarà l’allineamento strutturale calcolato
• Root-mean-square deviation
– Deviazione quadratica media
– Serve per paragonare strutture identiche, eccetto rotazioni e
traslazioni
EVOLUZIONE DELLE PROTEINE
RELAZIONE ESISTENTE TRA SIMILARITA’ di
sequenza e struttura in omologhi
Studio di un campione di strutture note di proteine
omologhe (Chothia, Lesk, 1982)
Similarità strutturale misurata in termini di RMSD
CALCOLO RMS
- Confronto di due strutture mediante SOVRAPPOSIZIONE
- Determinazione di aa che si corrispondono nelle due strutture
- Identificazione degli atomi che si vogliono confrontare (Cα o backbone)
RMSD=
n = numero residui
d2
 n d = distanza tra atomi corrispondenti
valutazione dell’allineamento strutturale
un altro criterio di valutazione di un allineamento strutturale è rappresentato dal numero di
atomi o di residui che sono stati accoppiati
si cerca di massimizzare il numero di atomi accoppiati e di minimizzare la corrispondente r.m.s.
a parità di numero di residui accoppiati, il migliore allineamento strutturale sarà quello con
minore r.m.s.
a parità di r.m.s. verrà considerato migliore l’allineamento strutturale operato con un maggior
numero di atomi accoppiati
oltre a questi due valori tipici delle sovrapposizioni tridimensionali, si può anche considerare il
punteggio di similarità dei residui accoppiati
DIVERGENZA DI SEQUENZA E STRUTTURA
Se si valuta la relazione esistente tra divergenza
strutturale (misurata in termini di RMSD) e divergenza di
sequenza si osserva che esse si corrispondono in MODO
ESPONENZIALE (valutato dal confronto di strutture note)
RMSD
(A)
30% id.seq
%identity
- (RMSD< 2 Å) possono avere seq molto differenti
(degenerazione del codice strutturale-struttura più conservata
della seq)
SOGLIA di significatività per la SIMILARITA’
STRUTTURALE
.confronto a coppie di struttura e seq di proteine 3D note, quantificato usando come
parametri: lunghezza allineamento, % id seq, sim.struttura
 a confronto in un grafico: lunghezza allin vs id seq (e in terza dimensione sim.strutturale)
100
Sec str identity < 70%
%id seq
Sec str identity > 70%
30
0
0
Length alignment
150
Sim. Strut.parametrizzata come uguale/diverso (pallino/quadrato): 2 str. Uguali se > 70% della
struttura sec è in comune (rmsd bassa).
 al di sotto della soglia rumore di fondo elevato
 25% (x allin 80 aa) al di sopra del quale chiara similarità strutturale – soglia lunghezza dipendente
 possibile che proteine con identità < 25% abbiano strutture simili ma anche che non siano correlate
strutturalmente (twilight zone)
Protein ubiquitination
Protein ubiquitination: regulatory process influencing
several aspect of eukaryoyic cell biology
Polyubiquitin (polyUb) chain: link ε-amino group of a
Lys of one Ub to the C-terminal carboxyl group of the
next Ub in the chain
E1-E2-E3 responsible for activating and transferring
Ub to proteins
Fundamental mechanisms of Ub-chain assembly
and of E1-E2-E3 regulation still not clearly
understood
 Passmore, and Bardford, Biochem J, 2004
 Brzovic and Klevit, Cell Cycle, 2006
 Pickart, Cell, 2004
 Hochstrasser, Cell, 2006
Ubiquitin like proteins
(Ubls) 8-20 kDa
Ub 76 aa
Di-Ubiquitina
Globular domain
(4βstrands in a
antiparallel βsheet
+αhelix) + flexible Cterminal terminating
with a gly
7 Conserved lysine
residues in Ub
N.B. ISG15: ha due domini
Ubl
Ogni Ubl ha il suo set di
E1-E2-E3
E2: Ub-conjugating enzymes
E1
E3/E3
Cys forms a thiolester
bond to C-terminal Gly of
Ub
Asn stabilizes oxyanion
transition state
Multi-domain E2 classification in 17 familes
reflecting structural organization of cat. dom.
Identification of phosphorylations by Cdks
and CK2 kinases affecting E2 activity
 Michelle et al., J Mol Evol, (2009)
 Ye and Rape, Nat Rev Mol Cel Biol (2009)
Monomeric Ub
K48
G76
Hydrophobic
patch
K63
B_Cterm
K48-linked
polyUb
Diverse strutture
sperimentali di
Di-Ub crosslinkata
K48 via NMR o Xray e una
struttura X-ray
della tetrapolyUb
crosslinkata via
K48
B_VAL70
A_ILE44
B_LEU8
B_ILE44
A_LEU8
A_VAL70
Legame
isopeptidico
polyUb crossilinkata by K48 sono segnale universale per la degradazione da
proteasoma
Adottano una CONFORMAZIONE CHIUSA in cui L8, I44 and V70 (patch idrofobico
sulla superficie di una singola molecola di Ub) sono sequestrati all’interfaccia tra
due molecole di Ub adiacenti
Tetra-Ubiquitina crosslinkata
K48
K63-linked polyUb
Diverse strutture
sperimentali di
Di-Ub crosslinkata
K63 via NMR o Xray e una
struttura X-ray
della tetrapolyUb
crosslinkata via
K63
polyUb crosslinkata via K63 agisce
come segnale regolatorio piuttosto che
degradativo in molti pathway,
Adotta conformazione estesa in
soluzione senza contatti diretti tra
patch idrofobici