9_affinement2014

Download Report

Transcript 9_affinement2014

PARTIE IV
Affinement du modèle
1. Principales Etapes
Clonage, expression,
purification
Analyse
bioinformatique
Macromolécules de grande pureté
Cristallisation
Interprétation biologique
Question
biologique
Structure atomique
= MODELE
Cristaux
Affinement
cristallographique
Collecte et intégration
des données
Carte de densité
électronique
Données de diffraction
Phasage des réflexions
1. Principales Etapes





Phasage des réflexions avec l’une des méthodes
décrites
Calcul d’une première carte de densité
électronique
Construction d’un premier modèle dans cette
carte de densité
AFFINEMENT : dernière étape avant validation
et publication du modèle
PRE-REQUIS : modèle doit être correct
2. Rappels
Densité électronique
(r)
diffraction
Facteurs de Structure
Transformation de Fourier
Espace réel
Structure
dans le
cristal
Modèle
x,y,z,fj
Fh
Espace réciproque
expérience
calcul
Transformée de Fourier
Données de diffraction
Fobs
Fcalc, calc
3. Objectifs

L’affinement du modèle est un processus cyclique dont le
BUT est l’optimisation du modèle issu de l’interprétation
de cartes de densités électronique
Interprétation de la densité électronique
Construction
MODELE
d'un modèle
FINAL
atomique

Affinement de la structure
(module et phase)
Objectif : le modèle construit doit refléter le mieux
possible l’ensemble des données expérimentales
4. Principes
Minimisation de l’écart entre:
- le modèle (xyz)
- les données de diffraction
Fcalc
Fobs
Plus Fcalc est proche de Fobs
Plus le modèle est proche de la structure réelle
OR Fobs = constantes
C’est Fcalc qui est modifié
(x,y,z,B) modifiés
4. Principes

L’affinement est un problème délicat :





Nombre de données expérimentales mesurées est souvent faible
par rapport au nombre de paramètres à optimiser (x, y, z, B)

Ex FdhD: 1900 Atomes / Xtal Diffracte à 2.8Å

7600 paramètres à définir / 8950 Réflexions uniques
Le nombre important de paramètres à affiner
Le modèle initial peut être de qualité médiocre, importance de
la phase
La fonction à optimiser est complexe, non linéaire et peut
comporter plusieurs minima séparés par des barrières
énergétiques
Trouver une pondération adéquat entre les données
cristallographiques et non-cristallographiques
4. Principes
 Considérations
 Importance
à affiner:



générales
de la résolution dans les paramètres
3.8 – 3.2Å : Coordonnées, Groupes de B, pas de solvant,
importance de NCS et d’acalc si possible; Utilisation des angles de
torsion pour diminuer N
3.2 – 2.7Å : Bon modèle, Construction-reconstructions
importantes, Groupes de B
2.7 – 2.2Å : Construction du modèle facile, B individuel, quelques
molécules de solvant

2.2 – 1.4Å : Construction automatique, B individuel, bcp de solvant

<1.2Å : B anisotrope, Hydrogènes
4. Principes
Fobs
acalc, aobs
Cartes de densité électronique
Interprétation de la densité électronique
Construction, d'un modèle atomique
(x,y,z)
MODELE FINAL
« Nouvelles » valeurs
des Fcalc et des phases
Optimisation des paramètres
Modèle x+Δx, y+Δy, z+Δz
5. Observations et paramètres

Observations : tout ce qui est connu sur la
cristal avant l’étape d’affinement
Paramètres cristallins
 Modules des Fobs (nombre fixé)
 Stéréochimie des macromolécules


Paramètres : à améliorer pendant le processus
Positions atomiques (x,y,z) des atomes du modèle
 Paramètres de déplacements atomiques

5. Observations et paramètres
Les paramètres de déplacements atomiques :
Ils traduisent le désordre statique et dynamique


Désordre dynamique
Vibration d’un atome autour de sa position d’équilibre,
l’amplitude de ce mouvement est une fonction de la
température


Facteur d’agitation thermique w = exp (-Bj(sin θ/λ)2)
Désordre statique
Un atome ou un groupe d’atomes n’occupent pas la même
position dans chaque maille

Facteur d’occupation qj
5. Observations et paramètres

Rappels : Facteurs de diffusion atomique
60
53
fj en fonction de sin  /  à 0 K
50
40
sin  /  = 0  fj = Z
fj diminue lorsque sin  / 
augmente
iode
30
Série1
Série2
Série3
20
carbone
8
6
10
0
0
0, 2
0, 4
0, 6
0, 8
résolution
1
1 ,2
1 ,4
1 ,6
5. Observations et paramètres

Facteurs d’agitation thermique
La taille du nuage électronique est indépendante de la température 
diffraction par un cristal indépendante de la température ?
En fait, les atomes vibrent autour d’une position d’équilibre
position des atomes différente dans les mailles du cristal
« pseudo-taille » des atomes
Plus la vibration thermale est grande, plus « la pseudo-taille » de
l’atome est grande

Conséquences
L’intensité des rayons diffractés diminue lorsque  augmente
fj doit être multiplié par un facteur dépendant de la
température
5. Observations et paramètres

Facteurs d’agitation thermique
- Les facteurs d’agitation thermique (B) traduisent la vibration d’un
atome autour de sa position d’équilibre
- L’amplitude du mouvement dépend de la température
- Définition d’un facteur de diffusion atomique dépendant de la
température :
æ sin q ö2
-Bç
÷
è l ø
B
f = f .e
8
B = 20 Å2
B = 0 Å2
Les valeurs élevées
de B entraînent un
affaiblissement
rapide des intensités
diffractées pour des
valeurs croissantes
de S
B = 99 Å2
B = 0 Å2
5. Observations et paramètres

Facteurs d’agitation thermique
Protéine
isotrope
anisotrope
Molécule organique
Valeurs faibles
(cœur hydrophobe)
Valeurs élevées
(boucles flexibles)
Agitation isotrope
En général
5 Å2 < B < 50 Å2
Agitation anisotrope (différente dans les
3 directions de l ’espace) : ellipse
d’agitation (50 % de probabilité)
5. Observations et paramètres

Paramètres variables



Les coordonnées (x,y,z)
Les facteurs de température (B) désordre dynamique
Les facteurs d’occupation (q) désordre statique
Exemple : ArgRS – ARNt P212121 a = 210.2 Å b = 146.2 Å c = 86.1 Å
(12 000 atomes, 170 kDa dans l’ua)
Résolution
3.0
2.7
2.5
2.0
Réflexions
51 300
70 410
88 700
173 200
Obs/ paramètres
1.1
1.5
Safety
2.8
factor
3.6
Nécessité d'ajouter des informations supplémentaires
5. Observations et paramètres
Le rapport observations/paramètres est amélioré par ajouts
d’informations supplémentaires :
Diminuer Npar : affinement avec contraintes
- Contrainte de certains paramètres à des valeurs fixes
- Utilisation d’angle de torsion au lieu de positions x, y et z

Augmenter Nobs : affinement restreint
- Permet à certains paramètres de varier autour d’un idéal:

• Géométrie
- Longueur liaisons covalentes
- Angles liaisons covalentes
- Angles de torsion
- Contacts Van der Waals
• Symétries non cristallographiques
• Corrélation entre atomes liés
5. Observations et paramètres
E=
1
s
2
F
å( F
- Fcalc ) +
2
obs
h
... å (q - q o ) +
2
angles
...
å
paires
non-liées
Distance
å
1
s
2
d
( didéal - dobs )
2
+...
kf cos ( nf - fo ) +...
dihédraux
æ Aij Bij ö
iå j ç 12 - 6 ÷ + å kw (w - w o ) +...
r ø chiral, planair
èr
2
Angle de liaison
Angle dihédral
6. Procédures d’affinement
Comment ?
Définir une fonction d’énergie et trouver le minimum de
cette fonction
minimum
local
E
DE
minimum
Espace conformationnel
3 types d’algorithmes:
- Moindres carrés
- Dynamique moléculaire
- Maximum de vraisemblance
6. Procédures d’affinement

Méthode des moindres carrés
Déterminer le minimum de la fonction
Avec
Fobs
Fcalc
K’
whkl
hkl  K' Fhkl )2
ψ   whkl ( Fobs
calc
h,k,l
facteurs de structure observés
= données de diffraction
facteurs de structure calculés = modèle
facteur d’échelle
poids affecté à chaque réflexion
6. Procédures d’affinement

Méthode des moindres carrés

Ces méthodes ne permettent d’atteindre qu’un minimum local

Leur rayon de convergence est faible
Col
+150
6. Procédures d’affinement

Méthode des moindres carrés

Ces méthodes ne permettent d’atteindre qu’un minimum local

Leur rayon de convergence est faible
Col
+150
6. Procédures d’affinement

Méthode de dynamique moléculaire
Le modèle est artificiellement chauffé à 3000°K puis
refroidi progressivement à 300°K (attribution d’une
vitesse initiale aléatoire à chaque atome)
CNS
= technique du « recuit simulé »
exploration d’une plus grande gamme de conformations
Fonction d’énergie totale de la molécule
ETOT = EPOT + w Ecryst
EPOT dépend de la géométrie de la molécule
hkl  K' Fhkl )2
Ecryst   w hkl ( Fobs
calc
h,k,l
6. Procédures d’affinement

Méthode dynamique moléculaire

Obtention d’un minimum « vrai »

Le rayon de convergence est plus important
Col
+150
6. Procédures d’affinement

Méthode dynamique moléculaire

Obtention d’un minimum « vrai »

Le rayon de convergence est plus important
Col
+150
6. Procédures d’affinement

Maximum de vraisemblance
Méthode utilisée dans REFMAC5 (CCP4), Phenix,…
Des programmes plus récents construisent une fonction de
vraisemblance avec les paramètres à affiner
Les paramètres à définir sont décrits par des distributions
de probabilités
Le maximum de vraisemblance utilise le théorème de Bayes
6. Procédures d’affinement

Théorème de Bayes
p(A;B) = probabilité que A soit vrai si B est vrai
= 50%
= 0.1/0.2 = p(A,B)/p(A)
De la même manière:
p(B;A)=p(B,A)/p(B)
Théorème de Bayes:
p(B;A) =
p(model;données) =
p(B)p(A;B)
p(A)
p(model)p(données;modèle)
p(données)
p(données) = cte
p(A)=20%
p(A,B) = 10%
p(B)=25%
p(model;données) = p(model)p(données;modèle)
6. Procédures d’affinement
Méthode du maximum de vraisemblance
C’est une technique qui, sous l’hypothèse que les variables
ont une distribution connue

usuellement la distribution normale ou gaussienne
permet d’estimer les paramètres d’un modèle
d’une équation ou d’un système, linéaire ou non linéaire
avec des restrictions sur ces paramètres ou non
coefficients, matrice de variances et covariances
Plus spécifiquement la technique consiste à construire une
fonction appelée fonction de vraisemblance
construite à partir de la fonction de distribution
et à maximiser son logarithme par rapport aux paramètres
inconnus
7. Stratégies

Plusieurs cycles
affinement par recuit simulé
Calcul de nouvelles cartes
(2Fobs-Fcalc) et (Fobs-Fcalc)
Correction manuelle du modèle
Addition du solvant
(eau, ions, ligands)
7. Stratégies, TLS
 Affinement
de type TLS
(Translation/Libration/Screw)
 Permet
d’ajouter des éléments de descriptions
intermédiaire sans ajouter de nombreux
paramètres
 Description
de domaines rigides
 Nombre de domaines au choix de l’utilisateur
 20 paramètres / domaine
 Peut être utilisé à partir de 2Å de résolution (>2Å
dans le cas de NCS)
7. Stratégies, TLS
 http://skuld.bmsc.washington.edu/~tlsmd/
8. Suivie de l’affinement

Les étapes de l’affinement sont suivies par le facteur d’accord R
atomes au hasard
modèle de départ
affinement à 2.5 Å
affinement à 1.5 Å
affinement petite molécule
composé minéral
R
R
R
R
R
R
=
=
=
=
=
=
60 - 50 %
40 – 50 %
20 %
15 %
4 - 8 %
1 – 2 %
8. Suivie de l’affinement

Utilisation d’un facteur d’accord Rfree

Même définition que le facteur R mais utilise environ 1000 réflexions (1-5%;
dépend de la résolution) qui sont prisent au hasard* et qui ne sont JAMAIS
utilisées lors de l’affinement

Permet le bon suivie d’un affinement

Rfree > R:



5-7% à basse résolution
<1% à très haute résolution
Règle +/- générale: Rfree ≈ (Résolution en Å)/10
 *Sauf
dans le cas de Twinning
8. Suivie de l’affinement

Tableau synthétique après affinement:
Collection de données
R/Rfree
RMSD Longueurs de liaison
RMSD Angles de liaison
9. Pratique / Refmac5
Restrained refinement
Unrestrained
Rigid body
Structure idealisation
TLS & Restrained refinement
A tester en fin d’affinement
9. Pratique / Refmac5
FreeR
NCS
9. Pratique / Phenix
<4.5Å de résolution
2 - 3Å en début d’affinement
A utiliser à des résolutions
modérées: 2 - 3 Å
Refinement Target Weights:
- Optimize Xray/Stereochemistry
- A utiliser!
 Un
fichier pdb
X
ATOM
N
ATOM
C
ATOM
C
ATOM
O
ATOM
C
ATOM
C
ATOM
C
...
ATOM
N
ATOM
N
ATOM
C
ATOM
C
ATOM
C
ATOM
C
Y
Z
Occ
B
4217
N
PRO B 265
24.846 -10.676
50.273
1.00 27.45
4218
CA
PRO B 265
25.497 -11.345
51.398
1.00 29.70
4219
C
PRO B 265
27.029 -11.331
51.363
1.00 30.61
4220
O
PRO B 265
27.648 -10.957
50.353
1.00 31.31
4221
CB
PRO B 265
24.970 -12.783
51.286
1.00 30.01
4222
CG
PRO B 265
23.648 -12.613
50.698
1.00 30.57
4223
CD
PRO B 265
23.905 -11.584
49.610
1.00 27.97
4225
N
AGLU A 302
15.152 -18.914
10.502
0.50 26.16
4226
N
BGLU A 302
12.994 -20.474
10.131
0.50 20.40
4227
CA AGLU A 302
13.786 -18.984
9.961
0.50 28.63
4228
CA BGLU A 302
14.025 -19.938
11.034
0.50 23.96
4233
CB AGLU A 302
12.738 -19.272
11.031
0.50 28.05
4234
CB BGLU A 302
13.943 -18.424
11.242
0.50 23.64
Bibliographie
Intermédiaire
Intermédiaire
Bibliographie
facile
facile
méthodologique
Bibliographie
Cristallisation des protéines
- Crystallization of Biological macromolecules (1999). A. McPherson, CSHL Press
- Crystallization of Nucleic acids and Proteins (1992). A. Ducruix, R. Giegé, The
Practical approach series, IRL Press, Oxford University Press
- Crystallization of Membrane proteins (1991). H. Michel, Boca Raton, CRC Press
Cristallographie des protéines
Facile
- Crystallography made crystal clear (1993). G. Rhodes. Academic Press
- Outline of crystallography for biologist (2002) D. Blow, Oxford University Press
- Crystal structure analysis (1992). Glusker et Trueblood, Oxford University Press
Bibliographie
Théorie
- Protein crystallography (1976). T.L. Blundell, L.N. Johnson, Academic Press
- X-ray structure determination (1989). G.H. Stout, L.H. Jensen, Wiley & Sons
- Methods in Enzymology, volumes 276 et 277, Academic Press
Intermédiaire
- Macromolecular crystallography (1997). C.W. Carter, R.M. Sweet
- Introduction to macromolecular crystallography (2003). A. McPherson Wiley-Liss
- Principles of protein X-ray crystallography (1994). J. Drenth, Springer-Verlag
Méthodologique
- Practical protein crystallography (1997). C. Carter, R. Sweet. Academic Press