I hkl - CGE-2012

Download Report

Transcript I hkl - CGE-2012

La cristallographie en biologie structurale
R. Fourme
Univ. Paris-Sud et SOLEIL
[email protected]
tel. 0608258675
1
Cristallisation
Goutte de solution saturée de protéine
Réservoir de solution
avec proportion
accrue de précipitant
Méthode de cristallisation dite de la goutte pendante
Des cristaux aux propriétés très remarquables
 Des cristaux biphasiques mi-solides, mi-liquides (de
30 à 80% de liquide). L’arrangement du cristal est
du à l’empilement des molécules, les parties vides
étant comblées par la solution.
 Assez rigides pour présenter un ordre à très grande
distance. La perfection de l’arrangement est attestée
par la grande finesse des profils de diffraction, qui
peut parfois atteindre quelques millièmes de degré.
 Assez plastiques pour supporter des réarrangements
importants (déshydratation, amélioration de la
qualité cristalline par recuit thermique, compression
> 10% sous haute pression….)
 Peuvent être trempés à basse température
(éventuellement en ajoutant de l’antigel à la
solution ) mais ne supportent pas un refroidissement
lent au-dessous de 0° (la glace doit rester
amorphe, et non cristalliser).
Montage d’un cristal dans une mini-boucle de nylon. Cet échantillon est trempé dans
de l’azote liquide puis conservé dans un jet de gaz froid pendant l’enregistrement des
données pour diminuer les dommages secondaires sous irradiation X.
Coupe d‘une cellule haute-pression à diamants de grande ouverture,
en construction pour la ligne de lumière PROXIMA 1 de SOLEIL.
Dimensions hors-tout du cylindre : 59 mm x 30 mm
1
Cristal frais de la protéine urate oxydase
comprimé dans la cellule à diamants.
Diamètre de la cavité dans le joint 350 mm
Cristal de la protéine lysozyme après
irradiations successives et translations.
3
Fragment de diamant utilisé pour combattre
l’orientation préférentielle du cristal par
rapport aux culots des diamants
La gamme utile de pression est limitée par la pression de dénaturation
de la macromolécule, 0,1-2 GPa (1000 à 20000 atmosphères).
2
La diffraction X
2
Ihkl~ Fhkl
cristal
diffraction
= T.F.
RX
équivalence
reconstruction
= T.F. 1
z
Le calcul par TF-1 de la densité
électronique en chaque point (x,y,z)
donne une « image » du cristal.
y
x
1
(x,y,z) = V
-2i(hx+ky+lz)

F
e
h k l hkl
Coefficients = facteurs de structure = nombres complexes.
i (modules |F| connus à partir des intensités, mais les phases 
restent inconnues)

r
|F|
hkl

I hkl
C'est le problème des phases !
3
F = facteur de structure (nb. complexe)
= contribution des atomes à la diffraction
n
n atomes en {xi, yi, zi} : Fhkl =  fi e2i(hxi+kyi+lzi)
1
Facteur de diffusion du ième atome
La densité  est calculable si la position des atomes est connue
(donc si … le problème est résolu)
|F|
Un facteur de structure Fhkl est
la somme des contributions de
tous les atomes
f
 Tous les atomes interviennent pour établir la densité électronique en
chaque point de l'espace et vice-versa.
Technique globale
Variation du facteur de diffusion atomique f de quelques atomes
avec l’angle de Bragg (unité: nombre d’électrons).
f est la TF de la densité électronique de l’atome à symétrie sphérique.
Pour un angle de Bragg nul, f = Z.
f diminue rapidement aux grands angles, car l’extension du diffuseur
(cortège électronique) n’est pas négligeable devant la longueur d’onde du
rayonnement comme dans le cas des neutrons.
Cette diminution est encore plus rapide si la densité est étalée par
du désordre statique ou dynamique.
17
facteur d'atténuation dû à
l’agitation thermique (et au désordre).
fo = facteur de diffusion
2
f = fo
e-Bsin q
l2
B = facteur d'agitation thermique (unité : Å2)
(ou facteur de Debye-Waller)
1
Atome "ponctuel" ( à 0 K), B =0
Atome très peu agité (B~5Å2)
Atome peu agité (B~10Å2)
Atome assez agité (B>15Å2)
10
0
5,7 Å 2,8 Å
20
30
1,5 Å
1Å
q (°)
d (Å)
Équivalence entre angle de Bragg et résolution pour l = 1 Å.
basse
moyenne
haute
(rare pour les macromolécules)
f ~Z
I~
Z2
U diffracte 8500
fois plus que H
11
Paires de Friedel
et réflexions équivalentes par symétrie
Pour la diffusion « normale »,
les deux membres d’une
paire de Friedel ont la même intensité
I(hkl) = I(-h –k -l),
les intensités des réflexions équivalentes par
symétrie sont également identiques.
Ex: pour une maille orthorhombique
I(hkl) = I(-h k l) = I(h –k l) = I(h k –l) = I(-h -k l)…
i
Ah,k,l
fh,k,l
Fh,k,l
fh,k,l = -f-h,-k,-l
Bh,k,l
r
B-h,-k,-l
F-h,-k,-l
|Fh,k,l| = |F-h,-k,-l|
Notion de résolution
Relation de Bragg:
2d sin q = l
Les réflexions de Bragg aux « grands angles »
(de Bragg), donc associées à des distances interréticulaires
d petites, véhiculent l’information à haute résolution.
Ces réflexions sont de faible intensité compte tenu du déclin
des facteurs de diffusion aux grands angles, aggravé par de
gros (10-60 Å2) facteurs de Debye-Waller.
En cristallographie des macromolécules, la valeur moyenne
des intensités est faible (la diffusion se partage entre un très
grand nombre de réflexions) et le désordre statique et dynamique
est important. L’art du cristallographe est d’améliorer
le signal sur bruit: détecteur sans bruit propre, taches de Bragg
petites (faisceau X parallèle et monochromatique, bon cristal),
combattre la dégradation du cristal. Le RS est essentiel.
On appelle résolution utile du diagramme de diffraction la
valeur minimale dmin de d pour laquelle le signal de diffraction
est supérieur au bruit. dmin correspond sensiblement à la distance
minimale pour laquelle deux points de la structure sont vus
séparément. La résolution «atomique» (rare) est obtenue pour
dmin < 1,3 Å. La meilleure résolution jamais atteinte est autour
de 0,5 Å.
24
Application et visualisation
des densités électroniques
-2i(hx+ky+lz)+fhkl
(x,y,z) = V 
|F
|
e
h k l
hkl
1
En 2D :
y
x
z=n
z=n+1
etc...
25
En 3D :
Structure de la pénicilline (sel de K+)
x
z
y
Dorothy Hodgkin-Crawfoot, 1949
H
N
R
S
CH3
O
N
O
CH3
COO- K+
26
Autre présentation en 3D ("TURBO", "O"…)
20
FONCTION de PATTERSON
Phase inconnue
Fourier :
(x,y,z) = V h
|F|hkl e
k l
1
-2i(hx+ky+lz) +fhkl
Modules connus à partir des intensités
2
Ihkl ~ |F|hkl
Noté : {|F|,f}
Ihkl = Fhkl F*hkl
i=n
j=n
i=1
j=1
Ihkl =  fi e2i(hxi+kyi+lzi)  fj e-2i(hxj+kyj+lzj)
Ihkl = i j fi fje2i [ h(xi -xj ) + k(yi -yj) +l(zi - zj) ]
Vecteur différence entre les deux atomes i et j
facteurs de diffusion de la paire i-j
• Le facteur de structure F est la somme des contributions des
positions atomiques
•L'intensité I (ou F2) est la somme des contributions des
différences des positions atomiques (vecteurs différences)
pondérées par le produit des facteurs de diffusion de la paire i-j.
FONCTION de PATTERSON
21
Si (x,y,z), calculée avec F, dépend de la position
des atomes, la même fonction, calculée avec F2
dépendra des différences entre atomes. On l'appelle P(u,v,w)
Si (x,y,z) dépend d'une origine qui doit être connue
( vecteurs 0 -> atomes), P(u,v,w) ne dépend plus que
des vecteurs-différence {u,v,w}, donc pas de l'origine.
Ce Fourier (noté {|F|2,0} ) est appelé Patterson
1
P(u,v,w) = V

h k l
-2i(hu+kv+lw)
2 e
|F|hkl
P(u,v,w) calculable en tout point à partir de l’expérience.
P(u,v,w) a la même périodicité que (x,y,z)
Autres propriétés :
•Analogue à une densité mais les pics correspondent à des
vecteurs-différences entre atomes. (n atomes
n(n+1) pics
Intensité des pics ~ Z2.
Beaucoup plus compliquée !
•Symétrie initiale : les différences entre positions symétriques
entraîneront des positions spéciales : sections de Harker.
•Symétrie du Patterson = celle du groupe de Laue (P2/m pour
monoclinique, etc..). Donc centro-symétrique.
•Pic à l'origine = somme des distances entre atomes
identiques (coord. zéro).
•Élargissement des pics  recouvrements importants.
28
Autres types de Patterson's
1
P(u,v,w) = V

2
coefhkl
h k l
Patterson différence
e
-2i(hu+kv+lw)
Coef2 =(|Fo|-|Fc|)2
Pour les protéines : Coef2 =(|Fderivé|-|Fnative|)2
Patterson ponctualisé
Coef2 =F2point
Fpoint = facteur de structure ponctualisé
<Z>
Fpoint=Fréel.
2 2
F0 e- Bsinq /l
Suppression du pic à l'origine si coef2= (F2point -fi2 )
Patterson anomal
Coef2 = DF±2
Des détecteurs à localisation de surface
haut de gamme (et souvent hors de prix…)
Détecteur MARResearch à plaque photosensible («imaging plate»). Diamètre utile
345 mm. La lecture est faite par mesure de la luminescence excitée par laser,
avec un balayage en spirale assurant un temps de mesure constant par point.
(principe: le faisceau laser se déplace radialement à vitesse constante; la vitesse
angulaire de la plaque varie continûment avec w = k/r. La plaque tourne donc
de plus en plus vite à mesure que le faisceau laser se rapproche du centre).
Temps de lecture: environ 60 sec (pour le diamètre maximal et des
pixels de 140 mm). Pixels de 100 mm possibles.
Détecteur ADSC avec matrice de 9 grands CCD. Surface active : carré de 315 mm de côté.
Conversion photons X-visible par phosphore.
Chaque CCD est couplé à l’écran par fibres optiques assurant une démagnification
de l’image. Temps de lecture de l’ordre de la seconde.
Utilisé sur la ligne de lumière PROXIMA I de SOLEIL
Détecteur MARResearch à conversion directe photons X-électrons dans
une couche mince de sélénium. Dimensions 420 x 320mm.
Les charges sont détectées sur une surface pixelisée.
Temps de lecture de l’ordre de la seconde. Efficacité de détection
correcte dans un domaine de longueurs d’onde étendu, notamment à courte
longueur d’onde.
Pilatus 6M de DECTRIS. Compteur de photons X à pixels hybrides.
Number of modules
Sensor
Sensor thickness
Pixel size
Format
Area
Intermodule gap
Dynamic range
Count rate per pixel
Energy range
Calculated DQE
Energy resolution
Adjust. threshold range
Threshold dispersion
Readout time
Framing rate
Point-spread function
Data formats
External trigger/gate
Software interface
Cooling
Power consumption
Dimensions (WHD)
Weight
5 x 12 = 60
Reverse-biased silicon diode array
320 µm
172 x 172 µm2
2463 x 2527 = 6,224,001 pixels
431 x 448 mm2
x: 7 pixels, y: 17 pixels, 8.4% of total area
20 bits (1:1,048,576)
> 2 x 106 photons/s
3 – 30 keV
3 keV: 80%; 8 keV: 99%; 15 keV: 55%
500 eV
2 – 20 keV
50 eV
3.6 ms
12 Hz
1 pixel
Raw data, TIF, EDF, CBF
5V TTL, 3 different modes
Through socket connection; clients for EPICS, SPEC and
stand-alone operation are available
Close-circuit cooling unit for temperature stabilization
350 W
Approx. 600 x 600 x 550 mm
Approx. 95 kg
Caractéristiques du Pilatus 6M
Image obtenue avec le détecteur à CCD. La gradation des couleurs
(+ chaud = + intense) image la gradation des intensités.
De l’intensité Ihkl au module
du facteur de structure Fhkl
34
I
- Polarisation
- Correction de Lorentz
- Dépendance angulaire
I
|F| = c
Facteur
d’échelle
2q
Io
Intensité
Lp
Facteur de
Lorentz
Polarisation
I
Io
 Polarisation P
22
1+cos
p=
2


35
 Correction de Lorentz L
Une sphère d’Ewald non-idéale a une certaine « épaisseur »
Les réflexions ne traversent pas toutes la sphère d’Ewald à la même vitesse
Pour deux « équivalentes » :
Sens de
•
•
•
•
•
rotation
w
tangente
•
•
•
•
•
•
•
•
•
•
•
•
•
•
•
directe
•
•
•
•
•
I2
S2
w
I1
S1
S1 >> S2
I ~ aire S
w
Géométrie de rotation : correction L ~ 1/sin w pour que S1 = S2
I=n
 Moyenne
:
(Si n équivalentes pour Ihkl)
Ihkl =
 <Ii>hkl
I=1
n
36
 Facteur d’échelle c
Comparaison de jeux de données Fhkl de :
 Cristaux différents
 Enregistrements à différentes l
Pour une maille qui contient n atomes, l’intensité totale théorique (absolue) est :
I=n
Iabs= I= 1fi2
I=n
(f = facteur de diffusion de l’atome)
2
Iabs= I= 1 fio e
2
2
2
-2B(sin q)/l
2 I=n
Iabs= e-2B(sin q)/l . I= 1 fio
I=n

I=1
fio
2
2 I=n
Iréel= c e-2B(sin q)/l I = 1fio
2
=c
2
2
I réel = c I abs
Iréel
Approximation : B ~ le même pour tous
e-2B(sin q)/l
2
ln (
Iréel
I=n

2
2
2
) = ln c -2B(sin q)/l
2
I=1
fio
= équation d’une droite (droite de Wilson)
37
 Facteur d’échelle c
Droite de Wilson
Iréel : moyennes des Ihkl par tranche de résolution
ln c
o
o
o
)
o
o
o
2
o
o
o
fio
I=1

I=n
o
o
o
ln (
Iréel
o
o
2
o
2
(sin q)/l
c = facteur d’échelle global
B = facteur d’agitation thermique global
4
Importance des phases dans le calcul de la densité
Analogie en lumière visible (conte du canard et du chat)
Réalisation d’une expérience de diffraction optique :
Masque = « cristal fictif »
« molécule »
Laser
« cristal »
fentes
masque
Interférences
écran
5
Importance des phases dans le calcul de la densité
FT-1
..Un canard basse
résolution
FT
Un canard...
FT-1
100
Sa transformée de Fourier..
50
Un chat ..
0
FT
Échelle
d’intensités
FT-1
Sa transformée de Fourier..
Variantes autour des données de diffraction
Si on « coupe » en résolution :
On voit un canard flou (mal résolu)
Si on n’utilise que la haute résolution :
on voit seulement les bords du canard
6
Importance des phases dans le calcul de la densité
calculer un canardchat ou un chatcanard ?
FT-1
Amplitudes
??
Cartes composites
FT-1
??
 Les termes les plus important dans la transformée
de Fourier sont les phases (inconnues) et non les
amplitudes (connues) !
Kevin Cowtan's book of Fourier :
http://www.ysbl.york.ac.uk/~cowtan/fourier/fourier.html
Si on omet une région (secteur) des données,
la reconstruction perpendiculaire sera déformée :
Si on supprime des petites (10 %) zones aléatoirement distribuées :
on retrouve une image « correcte » mais avec du bruit
Résolution de la structure cristalline :
Approches expérimentales
De la diffraction
à la carte de densité électronique
Données de diffraction
Carte de densité électronique
Résolution de la structure : détermination de la phase
Remplacement moléculaire
Structure 3D
connue
maille
Il faut placer au mieux la modèle dans la maille.
La connaissance d’un fragment de la structure peut suffire à amorcer le
phasage.
Programme AMORE de J. Navaza
Principe du phasage de novo
 Chaque facteur de structure Fhkl est une somme d’ondes planes. En traduction
vectorielle, c’est un nombre complexe somme de nombres complexes.
 On détermine successivement la phase de chacun des Fhkl. On travaille donc
réflexion par réflexion.
 Supposons que la structure totale puisse se décomposer en deux sous-ensembles:
- La structure principale, complexe et inconnue, constituée d’atomes de Z petits (C,
N, O, H…) ou moyens (S)
- Une structure relativement simple (dite structure de référence) constituée d’atomes
qui diffusent d’une manière remarquable :
- soit des atomes lourds (à Z élevé)
- soit des atomes lourds ou mi-lourds en situation de diffusion anomale
 La contribution de la diffusion de la structure de référence à chaque Fhkl est
calculable (module et phase) car la position de tous ses atomes est connue (la
structure a été «résolue» au préalable).
Cette onde peut donc être utilisée comme onde de référence.
 L’expérience ne permet de mesurer que les amplitudes des ondes. Il faut donc
transformer l’information sur les amplitudes en information sur les phases.
 Il faut en général faire trois mesures d’intensités pour déterminer une phase sans
ambiguïté. On fait en effet une triangulation.
Problèmes à résoudre dans l’ordre:
- Fabriquer la structure de référence
- Déterminer les coordonnées de ses atomes
-Déterminer la phase de la structure complexe en s’appuyant sur la (ou les)
structure(s) de référence.
39
Comment résoudre en principe les phases
de novo
Principe : utiliser comme pivot une structure de référence
qui émet un contribution calculable à chaque facteur de structure
L'onde de référence vient d'un ou plusieurs atomes diffusant
de manière remarquable (atome lourd ou diffuseur anomal)
placés à des positions connues dans le cristal.
I
protéine
Hg
Interférence constructive
Interférence constructive
I
Interférence destructive
Ainsi, une information (inconnue) de phase a été
transférée en amplitude (donc mesurable)
Remplacement isomorphe
dérivée
native
Diffusion anomale à différentes longueurs d’onde
λ1
λ2
Méthode MIR
La méthode MIR pure et dure exige trois mesures de l’intensité du facteur de
structure Fhkl
Une mesure venant du cristal natif
Une mesure venant d’un cristal dérivé I
Une mesure venant d’un cristal dérivé II
Avec deux mesures seulement, il y a 2 solutions pour la phase de la structure
principale
L’ambiguïté est levée par la 3ème mesure
Avantages
A ouvert la cristallographie des protéines (Max Perutz, Hb)
Forts signaux, applicable à de très grosses structures.
Difficultés:
Fabriquer plusieurs dérivés
Les mesures ne sont pas effectuées sur le même cristal  Perte de temps et cause
d’erreurs.
Et surtout, les structures dérivées doivent être strictement identiques à la structure
native (aux atomes lourds près). Ceci n’est que rarement réalisé  Phases imprécises.
La structure principale et les sous-structures ne sont pas complètement séparables
(c’est à dire Fh1, Fh2… tirés des mesures sont approximatifs)
ne structure de référence
qui émet un contribution calculable à chaque facteur de structure
41
La référence des phases
Atome
lourd :
(Xh,Yh,Zh)
Phases fh
Fh(hkl) = fh e 2i(hXh + kYh + l Zh)
fh
condition d'isomorphisme :
Fph = Fp + Fh
Fph
Fp
 L'atome lourd ne doit pas
perturber le réseau cristallin
Fh
• |Fh| connu (approximativment) à partir de la variation Iph- Ip
Remplacement isomorphe
fabrication de dérivés d’atomes lourds
Protéine
+ liqueur-mère
+ sel d’atome lourd
Pt, Hg, U, Sm, Yb, Pb, Au,…
sous forme de sel
Par trempage de cristaux natifs
Acétate d'uranyle
Fluoro-uranate de potassium
Sodium hexachloroplatinate
Chlorure de mercure
Triméthyl acétate de plomb
Chlorure de plomb
Xénon
Par co-cristallisation
UO22+
UO2F53Pt(Cl)62Hg2+
Pb(CH3) 3+
Pb2+
Xe
92
92
78
80
82
82
54
Quartz capillary
crystal
Xenon input
1- 60 bar
M. Schiltz et al. (1994) J. Appl. Cryst. 27, 950
First structure solved using xenon
binding under pressure
2 Xe sites
with 100%
occupancy
LURE W32 beamline
Ligand binding domain of the human nuclear receptor RXR
W. Bourguet, M. Ruff, P. Chambon, H. Gronemeyer & D. Moras (1995), Nature 375, 377
42
Pour une sous-structure simple, calculer la Pattersondifférence {||Fph|-|Fp||2,0} pour localiser les atomes lourds
Site secondaire
Site principal
44
Comment déterminer les phases de la protéine ?
= construction de Harker
Pour chaque hkl :
Fh = facteur de structure d'un atome lourd-1
Fh = facteur de structure d'un atome lourd-2
|Fph|1 = module du dérivé 1
|Fp| = module de la native
|Fph|2 = module du dérivé 2
imaginaire
A
Plan complexe
A”
o”
Fh
o
|Fph|2
F o'
h
fp
|Fp
|
réel
|Fph|1
A'
Un seul dérivé =
2 phases valident la
relation:
Fph = Fp + Fh
Deux dérivés
Une seule
phase !
27
Autres "densités » utiles pour améliorer la structure.
Fo - Fc Visualisation des densités résiduelles
- Recherche des atomes d’hydrogène
- Mise en évidence des défauts
Valable si fcalc  fréel
1
D(x,y,z)= V
-2i(hx+ky+lz)+fcalchkl
 ||Fcalc|-|Fobs|| e
h k l
hkl
2Fo - Fc  avec phases : fcalchkl
- Pour amélioration des détails
« Omit" maps
On "enlève" la contribution d'une partie douteuse de la
molécule dans le calcul des Fcalc. Une carte (Fo-Fc) ne
montrera que la partie soustraite, sans biais du modèle initial.
53
Organigramme / Étapes :
(h, k, l, F)p (h, k, l, F)h1
MOSFLM, DENZO
SCALEIT, TRUNCATE...
...
(h, k, l, F)h2
Mise à l’échelle
SCALA
Patterson différence {DF2, 0}
VECSUM,
RSPS,
PEAKMAX
FFT
Localisation atome(s) lourds principaux
{|Fh|, h}
MLPHARE, FHLE
Affinement xi, yi,zi, Bi, occupi
Fourier-différence {DF, h}
Pics résiduels ?
Oui, (sites secondaires)
inclusion dans la
sous-structure (x,y,z,B,Occup)
FFT
(Détection des sites minoritaires)
SHARP, MLPHARE
non
i
Choix d ’une origine commune
(Fouriers croisés {DFi, j} )
Sous-structure d ’atomes
lourds déterminée, donc Fh
FFT
54
(suite..) Organigramme / Étapes :
Sous-structure d’atomes
lourds
Calcul des Fh
|F|obs
Construction de Harker
Détermination des phases probables
SHARP, PHASE,
MLPHARE, ….
fdépart
Calcul de Fourier (carte de densité)
Modification de densité
(aplatissement de solvant ..)
fbest
FFT
DM, SOLOMON
Fourier inverse, calcul des Fbest
Fourier final, construction du modèle
FFT, O,
TURBO-FRODO
55
Amélioration des phases :
Modification de densité
Une "bonne" carte de densité doit avoir une
région de solvant « plate »
Rarement le cas car les phases fexp sont imprécises
On impose donc une densité = 0 dans la région du solvant
Méthode :
1) On calcule un masque M(x,y,z) pour lequel :
Densité = 0 dans la zone solvant
Densité = 1 dans la zone protéine
2) On modifie la densité expérimentale selon :
corr(x,y,z) = initiale(x, y, z)
x M(x, y, z)
3) On inverse (FT-1) pour obtenir les Fcorr(hkl)
4) On recalcule une carte avec |F|obs et fcorr
56
Amélioration des phases :
Modification de densité
Carte initiale :
Résultat :
En principe : meilleure carte, mais attention à bien
définir la "frontière" protéine/solvant
Tiré de : http://www.ccp4.ac.uk/talks
Méthodes de phasage de novo
utilisant la diffusion anomale
18
Dépendance de f selon l
f (et m ) ~ l3
Pouvoir de diffusion et d’absorption d’un atome
... mais la décroissance régulière de f et m subit des
m (cm-1)
variations brutales au passage
d’un seuil d’absorption
58
• Si
l est proche d’une transition électronique, le facteur de diffusion
f de l’atome concerné est modifié et devient un nombre complexe, ce
qui traduit des changements de l’amplitude et de la phase de l’onde
diffusée. Ces changements sont dépendants de l
f
fl = f° + lf’ + lif”
partie constante
(indép. de l)
corrections réelle et
imaginaire
Ex: variation de f’ et f ’’ pour Se au voisinage de son seuil d’absorption K
61
Conséquence sur les facteurs de structure :
La loi de Friedel ...
..n'est plus exacte :
f’
Fa
protéine
at. lourd
total
f ” (+/2)
f’
Fa f ”
Fhkl
hkl
hkl

hkl
Fhkl
f”
sans diffuseur
anomal :
|F|hkl = |F|
hkl  
hkl
avec diffuseur
anomal :
|F|hkl ≠ |F|
hkl
hkl ≠ hkl
hkl
∆f±hkl=|F(l)|hkl - |F(l)|hkl
F+
FDfhkl= différences anomale
 Une sous-structure constituée de diffuseurs anomaux permet donc
d’obtenir l’équivalent de dérivés lourds.
Mais tout se passe à l‘intérieur du même cristal.
La structure ne change pas, c’est l’onde diffusée qui est modulée
par changement de la longueur d’onde.
L’isomorphisme est parfait et un cristal est suffisant
(s’il résiste au rayonnement X).
 Mesurer l’amplitude de Fhkl à 3 longueurs d’onde permet la
détermination non ambiguë de la phase pour la structure principale.
En fait, deux mesures suffisent à cause de la violation de la loi
de Friedel (paire de Fridel) et de la séparation des réflexions
équivalentes en deux classes (paires de Bijvoët).
 Dans la méthode MAD, on sépare sans approximation la
sous-structure de la structure principale.
En effet on obtient une liste des coefficients Fh qui permet de
résoudre la sous-structure par méthode directe de phasage.
Cette sous-structure peut posséder jusqu’à une bonne centaine
d’atomes, la complexité d’une « petite » molécule.
62
Conclusion :
Le problème des phase a une solution analytique !
• Les termes dépendant & indépendant de la long.
d’onde peuvent être séparés (Karle, Hendrickson):
sous forme d'une fonction : GT(l) = FT(h) + DA(l)
( h : vecteur hkl )
bleu = l dépendant
noir = indépendant
|GT(±h,l)|2 = |FT (h)|2
T pour Total
A pour Anomal
+ a(l) |FA(h)| 2
+ b(l) |FT (h)| |FA(h)| cos (T-A)
± c(l) |FT(h)| |FA(h)| sin (T-A)
|GT(±h,l)|2 = p1+ a(l)p2 + b(l)p3 + c(l)p4
63
|GT(±h,l)|2 = p1+ a(l) p2+ b(l) p3 + c(l) p4
avec :
p1 = |FT (h)|2
p2 = |FA (h)|2
inconnus
p3 = |FT (h)| |FA (h)| cos (T-A)
p4 = |FT (h)| |FA (h)| sin (T-A)
(Contrainte additionnelle : p1 p2 = p32 + p42 )
Et aussi :
f’2(l)+ f”2(l)
a(l) =
f°2
b(l) = 2 f’(l)
f°
f”(l)
c(l) = 2
f°
déterminés
à 3 long. d'onde
différentes
(f' et f" connus)
 Ceci est un jeu de 4 équations linéaires à 4
inconnues avec une contrainte. p1…p4 peuvent être
calculés, puis |FT| , |FA| et finalement D.
60
Atomes possédant un signal anomal utilisable
Domaine pratique des longueurs d'onde en diffraction X
0.5
CuK
1.5418
MoK
0.707
1.8
l(Å)
trop d’absorption
diffraction
faible
• seuils K (5e-)
Fe Co Ni Cu Zn Ga Ge As Se Br Kr Rb Sr
(1,7433 Å)
(1,2837 Å)
Lanthanides
(0,9795 Å)
(0,7699 Å)
• seuils LIII (10 -32 e-)
Pt
Hg
U
Sm Tb Ho
Sm ... Lu
(1.8460)..(1.3412)
(1.0722)
(1.0093)
• seuils M ( 80 -100 e-)
limité à: U (l = 2,2-3,4 Å)
(0.7223)
64
En résumé
MIR
Trois enregistrements à longueur
d’onde fixe
3 cristaux différents
MAD
 Deux ou trois enregistrements
à des longueurs d’onde différentes
Un seul cristal incluant un
diffuseur anomal
- les atomes lourds
doivent être …“lourds”
Ex : Pt, Hg, U
- metallo-enzymes
(Fe, Mn, Cu, Zn..)
- protéines modifiées
Se-Met, Se-Cys
sources de RX:
labos ou RS
source de RX: accordable
(RS) et très stable.
65
Autres méthodes de phasage (mixtes)
SIR = Single Isomorphous Replacement
1 seul dérivé lourd (+ native). On accepte l'ambiguité de
phase en prenant la valeur centroïde --> erreur importante
SIRAS = SIR + Anomalous Scattering
1 dérivé lourd (+ signal anomal) + native. L'ambiguité de
phase est levée par le terme anomal.
SAD = Single Anomalous Diffraction
1 cristal avec diffuseur anomal à 2 long. d'ondes ( = native +
dérivé anomal).
Etc..
67
Construction du modèle moléculaire
Densité électronique à résolution
non-atomique
Pré-requis :

Modèle moléculaire
- On part en général d'une chaîne poly-Ala
construite sur un tracé-repère calculé
automatiquement (Ex: option "bones" de O)
- Si résolution ≥ 1,7 Å : séquence nécessaire
- Utilisation de "contraintes" chimiques et
structurales de la chaîne peptidique.
68
Étapes d'une "reconstruction"
Carte de densité initiale ( |F|obs, fcalc)
"Squelettonisation" de la densité
-Modèle poly-alanine (chaîne des C)
-choix de la direction de chaîne
Construction des chaînes latérales
à partir de motifs-repères (Cys, Tyr, Trp..)
Nouvelle
densité
+ de résidus construits ?
Oui
Non
Affinement de la
structure
72
Affinement des structures obtenues
But : Obtenir une structure aussi précise que possible,
compatible avec les données de diffraction (résolution…)
inconvénient : seuls les |F|obs sont expérimentaux
(pas les phases)
Critère : Minimisation d'un facteur d'accord observé/calculé
||F|calc-|F|obs|
|Fobs|

||F|calc-|F|obs|2
-Au sens des moindres-carrés : R =
|Fobs|2
-Au sens de Hamilton : R =
… Sur l'ensemble des réflexions
Méthode : affinement des différences (observées/calculées)
Par moindres-carrés sur :
- coordonnées
- facteur de température
- ...
73
La structure est décrite comme une fonction linéaire
d'une série de n inconnues xi
F = p1x1 + p2x2 + ….. + pnxn
On possède m points de mesure (les modules |Fo|)
m équations à n inconnues (m > n)
Les valeurs exactes des paramètres pi sont
ceux qui minimisent la quantité :
i=m
D = i=1
wr(Foi-Fci)2
observé
calculé
Poids (de l'observation)
On fait varier les paramètres de façon à ce que
i=m
wr(Foi-Fci
i=1
)2
∂Fci
∂pj =0
j = 1, 2, …, n
Calcul des dérivées trop long, on approxime (série de Taylor)
hémoglobine
Octanucléotide GGTATACC (modèle de la forme A de l’ADN).
Structures précises (résolution 1,6 Å ) à P ambiante et 1.4 GPa
(paire stéréo).
Cette molécule est très compressible axialement et pratiquement
pas transversalement. C’est un ressort moléculaire. La géométrie des
paires Watson-Crick, qui portent l’information génétique, est quasiinvariante avec la pression.
 Importance possible de ces propriétés pour la sélection de
molécules prébiotiques si conditions environnementales extrêmes.
Protéase de VIH avec un inhibiteur lié au site actif
Ribosome