part 1 - ALB Crystallography Journals

Download Report

Transcript part 1 - ALB Crystallography Journals

Méthode Monte Carlo appliquée à l’Indexation des
Diagrammes de Poudre et à la Solution de Structure
A. Le Bail
Université du Maine
Laboratoire des Fluorures
CNRS – UMR 6010
Contenu de l’exposé
- Plantage du décor : Le labyrinthe de la méthode des poudres
- Lancement des démonstrations du logiciel McMaille
- Etat de l’art en indexation
- Résultats des démonstrations du logiciel McMaille
- Lancement des démonstrations du logiciel ESPOIR
- Etat de l’art des méthodes de solution de structure par essai-erreur
- Résultats des démonstrations du logiciel ESPOIR
- Conclusions
Plantage du décor
Détermination de structure par diffractométrie des poudres
Histogramme du nombre cumulé des structures déterminées
< 1000 - à comparer aux ~ 400000 structures sur monocristal –
anecdotique mais essentiel pour certains problèmes
Cette sous-discipline fait déjà
l’objet d’une monographie de
l’Union
Internationale de cristallographie,
publiée en 2002
Entre l’échantillon
et la structure
finale, la méthode
des poudres est un
labyrinthe
Mais l’exposé
d’aujourd’hui
s’intéresse
uniquement aux
méthodes
d’indexation et
de solution de
structure.
Et plus
spécifiquement
aux algorithmes
de type MonteCarlo.
Autre façon d’illustrer ce labyrinthe :
empiler les noms de méthodes et de logiciels…
Que choisir (liste très incomplète) ???
Dix ou quinze ans de créativité débordante !
Une partie de l'histoire de cette activité est consignée dans les archives
de la liste de discussion SDPD qu'il vous est recommandé de rejoindre:
http://groups.yahoo.com/group/sdpd/
Lancement des démonstrations
du logiciel McMaille
http://www.cristal.org/McMaille/
Objectif :
Indexer les diagrammes de poudre des échantillons 1, 2 et 3 du SDPD
(Structure Determination by Powder Diffractometry) Round Robin-2. Quelques
millions de tests de paramètres de maille par Monte-Carlo vont être effectués.
Logiciels d’Indexation des Diagrammes de Poudre
- Etat de l’Art L’Embarras du Choix ?
- Les « trois gros » individuels : TREOR, ITO, DICVOL
- Les autres
- Il faut les positions des pics – quels logiciels ?
- Les suites logicielles contenant souvent les « trois gros » et éventuellement
d’autres : CRYSFIRE, POWDER v2.00, POWDERX, PROSZKI, WINPLOTR
- Les derniers-nés : INDEX, X-Cell, SVD-Index, McMaille
- Quels logiciels ont participé (avec succès) au SDPD Round Robin 2 offrant
pour la première fois une compétition sur 8 diagrammes de poudre, incluant
l’indexation fin 2002 ?
- UPPW et « indexing benchmarks »
WERNER, PE; ERIKSSON, L; WESTDAHL, M - TREOR, A SEMI-EXHAUSTIVE TRIAL-ANDERROR POWDER INDEXING PROGRAM FOR ALL SYMMETRIES - JOURNAL OF APPLIED
CRYSTALLOGRAPHY, 1985, Vol 18, pp 367-370 .
VISSER JW - A FULLY AUTOMATIC PROGRAM FOR FINDING THE UNIT CELL FROM
POWDER DATA - JOURNAL OF APPLIED CRYSTALLOGRAPHY, 1969, Vol 2, pp 89-95 .
BOULTIF, A; LOUER, D - INDEXING OF POWDER DIFFRACTION PATTERNS FOR LOWSYMMETRY LATTICES BY THE SUCCESSIVE DICHOTOMY METHOD JOURNAL OF
APPLIED CRYSTALLOGRAPHY, 1991, Vol 24, pp 987-993 .
D’autres logiciels d’indexation
– Taup (=Powder) ; Lzon ; Kohl (=TMO) ; Fjzn
– Losh ; Mmap (dans Crysfire) ; Supercell (incommensurables)
– Scanix ; Autox
Et pour les positions des pics ? Quelques logiciels gratuits :
– CMPR
– DRXWin
– EFLECH
– GPLSFT
– pearson.xls
– Rawplot (avec GSAS)
– SHADOW
– Powder v2.00
– PowderX
– Winfit
– Winplotr (avec Fullprof)
– XFIT
+ les commerciaux : EVA, JADE, XPERT-Highscore, etc.
Faut-il créer d’autres logiciels d’indexation ?
L’indexation est plus un art qu’une science
Disposer de plusieurs programmes complémentaires
favorise la réussite de l’entreprise.
Quel est le taux de réussite de ces logiciels ? Difficile à
estimer… Faible dit le SDPD Round Robin 2 (2002).
SDPD Round Robin 2 – 2002
8 diagrammes de poudre à indexer
100 participants ayant téléchargé les données
6 réponses dans les temps (1 mois)
2 réponses hors limites
CRYSFIRE (P1, P3), DICVOL (P2), ITO (P4), Index (P5) et X-Cell (P6).
L’indexation ne serait donc pas si facile…
Les seuls logiciels à proposer des indexations pour les
échantillons les plus complexes (4-8) du SDPD Round Robin
sont récents :
Index (Joerg Bergmann)
X-Cell (Commercial - Accelrys)
McMaille (utilisé par les organisateurs du Round Robin)
Etant récents, peut-être avaient-il plus de raisons de chercher à
démontrer leur efficacité dans ce Round Robin ? Il n’est pas
question de conclure à l’inefficacité des autres logiciels,
pourtant…
Exemple : échantillon 3 du Round Robin
a priori simple : cubique
 Organisateurs: 18.881 18.881 18.881 90 90 90 (vol 6734 Å3)
 P1: 13.349 13.349 9.439 90 90 90 (Tetragonal - 1638Å3)
 P2: 18.878 18.878 18.878 90 90 90
 P3: 13.354 13.354 9.442 90 90 90 (Tetragonal - 1638Å3)
 P4: pas de solution
 P5: 18.878 18.878 18.878 90 90 90
 P6: 18.88 18.88 18.88 90 90 90
50% de réussite !
Où en sont les calculs d’indexation lancés en début d’exposé ?
Utilisation du logiciel McMaille
McMaille est distribué sous licence publique GNU. Il peut être
téléchargé à l'URL : http://www.cristal.org/McMaille/
Les cristallographes veulent des solutions rapidement. Est-ce possible
avec un logiciel comme McMaille ? Oui, si vous considérez que 5 à 15
minutes est rapide. La première approche recommandée avec McMaille
est d'utiliser le mode automatique.
La démonstration suivante fait appel au logiciel WinPlotr pour extraire
les positions et intensités des réflections. WinPlotr est configuré pour
créer directement un fichier d'entrée pour McMaille en mode
automatique.
Démarrer WinPlotr, ouvrir le fichier du diagramme de
poudre, sélectionner « automatic peak search »
Sélectionner les conditions appropriées
(doublet Cu-Kalpha1/2), cliquer sur OK
WinPlotr établit une liste de positions de pics et d'intensités
Sauver les résultats pour le programme McMaille
Donner quelques détails : un titre, la longueur d'onde du
rayonnement, le décalage de zéro, c'est tout !
La préparation est terminée, le fichier pour McMaille est créé.
Ce fichier parait très simple :
Il vous faut ensuite lancer l'exécution du programme McMaille, et
donner le nom du fichier d'entrée :
Le mode automatique dans McMaille est un "système expert" qui
examine toutes les symétries dans un domaine restraint de volumes
et de paramètres de mailles (pas de contrainte en cubique
cependant) :
Il s'ensuit la nécessité d'explorer d'autres intervalles de volumes et de paramètres de
maille si le mode automatique échoue, ou bien si l'utilisateur souhaite y regarder de plus
près. Dans ce but, McMaille prépare un fichier prêt pour un calcul en mode manuel à la
fin d'un examen en mode automatique. Le fichier créé pour le mode manuel est le
suivant :
Le lancement de McMaille en mode manuel avec ce fichier produit :
Un fichier .prf généré par McMaille pour cette indexation peut être
affiché par WinPlotr :
Pendant les calculs, il est temps d'examiner de plus près tous les
"secrets" du logiciel McMaille
Ci-dessous l'organigramme explicite où Ni est le nombre de pics indexés, N le nombre total
de pics, N' le nombre de pics non indexés tolérés, R la reliabilité de profil, R1, R2, R3 des
valeurs limites de R définissant un comportement particulier du programme de calcul :
Le plus gros problème du logiciel McMaille est le temps de calcul.
Une économie de temps est réalisée avec les listes des indices de
Miller hkl qui sont préétablies. De 400 à 1000 triplets hkl pour
chaque système cristallin sont lus dans des fichiers une seule fois au
départ du logiciel et gardés en mémoire pour usage ultérieur.
Dans la version 3 de McMaille, la forme idéalisée des pics se résume
à une simple colonne. Cette hyper-simplification a conduit à
multiplier la vitesse par 20, soit 20000 tests par seconde en symétrie
cubique et 6000 en maille triclinique. Ce qui fait la majeure part du
gain de vitesse c'est qu'un ajustement d'intensité n'est plus
nécessaire, les colonnes observées et calculées ont la même hauteur
et la même largeur fixée au départ. La reliabilité de profil RP est
fonction du pourcentage de chevauchement entre colonnes observées
et calculées.
Formes de pics en colonnes dans la version 3 de McMaille
Grossissement sur les dernières réflexions :
La largeur des colonnes, en modes automatique, est calculée par la formule :
0.3 x  / 1.54056
elle dépend du choix de l'utilisateur en mode manuel.
Un des deux cas qui conduisent à "affiner" les paramètres d'une
proposition de maille est quand Ni > N-N'
Un pic observé est considéré comme indexé si un chevauchement existe avec un pic
calculé. Le deuxième cas qui conduit à affiner les paramètres d'une proposition de
maille est lorsque R < R1 (il est recommandé de choisir R1 proche de 50%).
Pour en dire plus au sujet de l'affinement des paramètres de maille d'une
proposition retenue par McMaille : si R < R1 mais que R1 est de l'ordre de 50%,
un affinement classique par moindre carrés serait difficile. C'est donc par Monte
Carlo que sont "affinés" les paramètres des mailles retenues si R < R1.
Un petit changement de paramètre est testé et conservé si R s'améliore, et on tire
au sort quel sera le paramètre modifié. Ceci est effectué 200 fois en symétrie
cubique et jusqu'à 5000 fois en triclinique. L'amplitude du changement de
paramètre est elle-même tiré au sort
avec |delta maximum| = 0.02 Å. Pour le tout meilleur résultat (
à R < R3 ~ 5%) les paramètres de mailles sont finalement soumis à un réel
affinement par moindres carrés et les figures de mérite classiques (M20, F20) sont
calculées. Pour ce résultat sélectionné, des pseudo diagrammes "observés" et
calculés sont simulés avec des formes de pics gaussiennes, un fichier de type .prf
affichable par le logiciel WinPLOTR est créé.
D'autres logiciels compatibles avec certains fichiers en sortie de McMaille sont
CHEKCELL et CRYSFIRE.
Un problème qui se pose dans la plupart des calculs de type Monte Carlo est celui
de se retrouver bloqué dans un faux minimum de R. Pour l'éviter, il convient
d'accepter de temps à autre un changement de paramètre de maille qui n'améliore
pas la reliabilité R. La meilleure probabilité P d'accepter un nouveau paramètre de
maille malgré une reliabilité non-améliorée est de l'odre de 15%, comme le montre
le tableau ci-dessous qui donne le nombre de bonnes réponses obtenues pour un
même nombre de tirages au sort Monte Carlo en fonction de P:
P (%)
Test 1 – orthorhombique
Test 2 – rhombohédrique
Test 4 – monoclinique
Test 6 – triclinique
0
15
30
45
60
75
100
41
28
47
36
45
41
60
42
32
40
46
36
27
28
45
24
15
17
25
18
6
10
19
12
1
6
2
12
P : une valeur de 15 signifie que dans 15% des tests, un changement des paramètres sera accepté même si ce
changement n'améliore pas R ou bien ne fait pas s'améliorer le nombre de réflections indexées
P = 100 : un changement de paramètre sera toujours accepté
P = 0 : un changement de paramètre ne sera pas accepté si il n'améliore pas R.
McMaille est un logiciel d'indexation relativement insensible à la
présence d'impuretés. L'utilisateur décide du degré d'insensibilité
au moyen de deux paramètres ajustables :
N’ : le nombre toléré de pics non-indexés,
R2 : une reliabilité qui permet de ne garder que des solutions pour
lesquelles R < R2. Fixer R2 à 15% signifie que des propositions de
maille expliquant au moins 85% de l'intensité totale du diagramme
seront conservées dans la liste finale des possibilités.
Il est donc considéré qu'une impureté ne devrait pas concerner plus
de 15% de l'intensité totale du diagramme. Cependant, le nombre
des pics de faible intensité, appartenant à l'impureté, pourrait bien
être élevé, ce qui obligerait à choisir N' assez grand (si l'on décide
d'incorporer beaucoup de pics de faible intensité dans la liste des
données).
Les conclusions d'une étude systématique à propos des pics
appartenant à une impureté sont les suivantes pour McMaille. A
condition que l'intensité associée aux pics supplémentaires reste
inférieure à 15% de l'intensité totale :
- pour un nombre de pics supplémentaire inférieur à 30% du
nombre total des pics, McMaille parvient généralement à
retrouver la bonne indexation en tête de liste, cependant les
figures de mérite diminuent (R augmente);
- pour un nombre de pics supplémentaire compris entre 35 et 50%
du nombre total des pics, McMaille peut encore parvenir à
proposer la bonne indexation mais pas toujours en tête de liste. Il
est alors plus difficile de conclure.
Exemple d'une phase orthorhombique indexée en dépit de la
présence de 12 petits pics d'impureté additionnés à 20 pics (soit
37,5% en nombre mais moins de 15% en intensité)
Au-delà de ce problème des impuretés, il est envisageable de tenter d'indexer des
diagrammes multiphasés (obtenir en même temps plusieurs mailles indexant la
totalité du diagramme). Voyons le coût d'une telle tentative sur l'organigramme de
McMaille :
Ce coût se traduit essentiellement en temps de calcul prohibitif parce que
le nombre de propositions de mailles qui doivent être examinées de plus
près (ajustement par Monte Carlo si R < R1) devient rapidement énorme
dans la mesure où R1 doit être fixé très au-dessus de 50% (vers 75%). De
même, la limite R2 doit être similaire à R1, et R3 également doit être
largement supérieur à 50%.
Une série de tests avec des mélanges de phases permet de fournir
quelques conclusions en ce qui concerne l'usage de McMaille pour des
échantillons biphasés. A la condition que 30 pics sont examinés et que 13
à 17 pics appartiennent à l'une ou l'autre des deux phases, et que 40 à
60% de l'intensité totale appartienne à l'une ou l'autre des deux phases,
alors McMaille apparait capable de produire des solutions correctes dans
des temps raisonnables (moins d'une heure) pour des combinaisons de
deux phases qui ne seraient ni l'une ni l'autre monoclinique ou
triclinique. Pour ces dernières basses symétries, les temps de calcul
deviennent prohibitifs.
Exemple d'indexation d'un mélange de 2 phase (20 minutes de calcul) : l'une est
quadratique et l'autre est orthorhombique. McMaille combine les propositions de
mailles deux par deux et détecte les meilleures combinaisons indexant le plus
grand nombre de pics :
Pour plus de détails sur le
Round Robin, voir :
Site Web du SDPD Round Robin :
http://sdpd.univ-lemans.fr/sdpdrr2/results/
IUCr - CPD – Newsletter N°29
Sample 1 - Al2F10[C6N4H20]
Sample 2 - Sr5V3(F/O/OH/H2O)22
Sample 3 - C61Br2
Lancement des démonstrations
du logiciel ESPOIR
http://www.cristal.org/sdpd/espoir/
Objectifs :
1- trouver 9 atomes d’oxygène d’après le diagramme de diffraction de
neutrons de La2W2O9, connaissant les positions des atomes de La et W
déterminées par diffraction X de poudre (méthodes directes). Toutes
autres méthodes (Fourier différence, etc), ayant échoué à localiser les
oxygènes. ESPOIR fait cheminer au hasard 9 atomes d’oxygène dans la
structure où les 2 La et 2 W sont fixes, jusqu’à obtenir la meilleure
reliabilité. 100 tests indépendants de 200 000 mouvements d’atomes vont
être effectués par Monte Carlo, soit 20 millions de mouvements.
2- trouver la position de la molécule de bethanechol et d’un atome de Cl
dans la maille du chlorure de bethanechol.
Logiciels de Solution de Structure sur Poudre
- Etat de l’Art L’Embarras du Choix ?
- Méthodes Directes ou de Patterson classiques ou améliorées (EXPO,
SHELXS, etc)
- Méthodes dans l’espace direct utilisant des connaissances préalables
de la chimie du composé telles que la formule moléculaire, la
composition, l’existence probable de polyèdres définis, etc
(ENDEAVOUR, DASH, ESPOIR, TOPAS, POWDERSOLVE, FOX,
EAGER, OCTOPUS, PSSP, FOCUS, SAFE, SIMULATED
ANNEALING, etc). Ces méthodes fonctionnent par tirage au sort de
nombres compris entre 0 et 1. (Monte Carlo, recuit simulé, trempe
parallèle, algorithme génétique…).
ENDEAVOUR K. Brandenburg and H. Putz, Crystal Impact, Bonn, Allemagne
- Optimisation globale
combinée de facteur R et
d’énergie potentielle par
recuit simulé
- Intensités intégrées
J.Appl.Cryst. 32, 864 (1999)
Ag2NiO2 – structure typique
Schreyer and Jansen, Sol.
State Sci. 3, 25, (2001).
15 atomes dans l’u.a., P1.
45 Degrés de liberté.
Disponible chez Crystal
Impact à prix réduit pour
utilisateurs académiques.
DASH
W.I.F. David and K. Shankland Rutherford Appleton Laboratory,
développements ultérieurs par J. Cole and J. van de Streek CCDC, UK
- Recuit Simulé
- Intensités intégrées corrélées (Pawley)
- Chem. Commun. 931
(1998)
- Capsaicin - plus complexe structure en
termes de nombre de variables
Chem. Commun. 931 (1998)
- 16 degrés de libertés, dont 10 angles de
torsion.
Telmisartan, formes A et B –
structure typique
J. Pharm. Sci. 89, 1465 (2000)
13 degrés de liberté dont 7 angles de
torsion.
Commercial, avec réduction de 95%
pour le secteur académique
ESPOIR A. Le Bail, Université du Maine, France
Monte Carlo
Intensités intégrées ou pseudo
diagramme reconstitué à partir des
|Fobs| extraits.
Mat. Sci. Forum 378-381, 65 (2001).
Souzalite/Gormanite
Le Bail, Stephens and Hubert,
European J. Mineralogy 15 (2003)
19 atomes dans l’u.a. en P-1. Fe en
0,0,0; 54 Degrés de liberté.
Gratuit et ouvert – entièrement disponiible :
executable + Fortran et Visual C++ code
source (GPL - GNU Public Licence).
Site Web : http://www.cristal.org/sdpd/espoir/
TOPAS A.A. Coelho, R.W.Cheary, A. Kern, T. Taut. Bruker AXS GmbH,
Karlsruhe, Germany
Recuit simulé (+ fonctions de
pénalité définissables par
l’utilisateur, blocs rigides,
restrictions de distances
interatomiques, minimisation
d’énergie de réseau, incluant
des champs de force
définissables par l’utilisateur)
Caféine Anhydre C8H10N4O2
Stowasser and Lehmann, résumé au
XIX IUCr Congrès (Genève 2002)
5 molécules dans l’u.a.
93 Degrés de liberté
Diagramme de poudre ou
bien intensités intégrées
J.Appl.Cryst. 33, 899 (2000)
Commercial avec
réductions pour
utilisateurs académiques
POWDERSOLVE (partie de la suite logicielle Reflex Plus)
G.
Engel, S. Wilke, D. Brown, F. Leusen, O. Koenig, M. Neumann, C. ConesaMorarilla Accelrys Ltd., Cambridge, UK
Monte Carlo recuit simulé et Monte Carlo trempe parallèle
(Falcioni and Deem. J. Chem. Phys. 110, 1754 (1999))
Diagramme de poudre
J.Appl.Cryst. 32, 1169 (1999)
Docetaxel (C43H53NO14·3H2O) – structure la plus complexe
L. Zaske, M.-A. Perrin and F. Leveiller, J. Phys. IV, Pr10, 221 (2001)
29 Degrés de liberté incluant 3 rotations, 12 translations et 14 angles de torsion
Peut s’acquérir auprès d’Accelrys Inc., réduction généreuse proposée aux
chercheurs académiques
FOX V. Favre-Nicolin et R. Cerny, Université de Genève, Suisse
(Free Objects for Xtallography)
Trempe parallèle ou recuit
simulé
Correction automatique des
positions spéciales et du
partage d’atomes entre
polyhèdres, sans
connaissance a priori ; multidiagramme
Diagramme de poudre,
intensités integrées,
intensitées intégrées
partielles
Aluminium methylphosphonate Al2(CH3PO3)3
– structure la plus complexe
Edgar et al. Chem. Commun. 808, (2002).
3 molécules et 2 atomes d’Al dans l’u.a.
24 Degrés de liberté incluant distances et angles.
J.Appl. Cryst. (2002). 35,
734-743
Gratuit, source libre publiée
sous licence GPL
http://objcryst.sourceforge.net
EAGER K.D.M. Harris, R.L. Johnston, D. Albesa Jové, M.H. Chao, E.Y.
Cheung, S. Habershon, B.M. Kariuki, O.J. Lanning, E. Tedesco, G.W. Turner
University of Birmingham, UK
Algorithme génétique
Diagramme de poudre
Acta Cryst.A, 54, 632 (1998)
Heptamethylene-1,7-bis(diphenylphosphane oxide) Ph2P(O)(CH2)7P(O)Ph2 –
structure typique.
B.M. Kariuki, P. Calcagno, K.D.M. Harris, D. Philp, R.L. Johnston.
Angew.
Chem. Int. Ed. 38, 831 (1999).
35 atomes non-H dans l’u.a.
18 Degtés de liberté incluant 12 angles de torsion.
En développement actif
OCTOPUS K.D.M. Harris, M. Tremayne and B.M. Kariuki
University of Birmingham, UK
Monte Carlo
Diagramme de poudre
J. Am. Chem. Soc. 116, 3543 (1994).
Red fluorescein – structure typique.
Tremayne, Kariuki and Harris. Angew. Chem. Int. Ed. 36, 770 (1997).
25 atomes non-H dans l’u.a.
7 Degrés de liberté incluant 1 angle de torsion.
En développement actif
PSSP
P. Stephens and S. Pagola State University of New York, Stony Brook,
(Powder Structure Solution Program)
USA
Recuit simulé
Intensités intégrées
+ nouvelle méthode de
prise en compte du
chevauchement des
pics
Soumis au
J.Appl.Cryst. Preprint
disponible à
http://powder.physics.s
unysb.edu
Pigment Beta Haematin de la Malaria – structure la plus complexe
Pagola, Stephens, Bohle, Kosar, and Madsen. Nature 404 307(2000)
43 atomed non-H dans l’u.a. - 14 Degrés de liberté
Gratuit, incluant le code source. Disponible à http://powder.physics.sunysb.edu
FOCUS
R.W. Grosse-Kunstleve, L.B. McCusker and Ch. Baerlocher
ETH Zentrum, Zurich, Switzerland
Algorithme de recyclage de
Fourier automatique combiné
avec une recherche
spécialisée de réseau.
Intensités intégrées
J.Appl.Cryst. 32, 536 (1999)
Rubidium zincosilicate VPI-9 - une des
plus complexes structures.
McCusker, Grosse-Kunstleve,
Baerlocher, Yoshikawa and Davis.
Microporous Materials 6, 295(1996)
7 atomes de Si/Zn et 15 atomes
d’oxygène à l’étape de solution de
structure.
Gratuit. Disponible sur Internet
SAFE S. Brenner, L.B. McCusker and Ch. Baerlocher ETH Zentrum, Zurich, Switzerland
(Simulated Annealing and Fragment search within an Envelope)
Recuit simulé
+ option d’utilisation d’une
“enveloppe de structure”.
Tri--peptide C32N3O6H53
– structure la plus complexe.
Brenner, McCusker and Baerlocher
J.Appl.Cryst. 35, 243 (2002)
Diagramme de poudre
17 angles de torsion et 6 degrés de
liberté de position et orientation.
J.Appl.Cryst. 35, 243 (2002)
Domaine public.
Simulated Annealing Y. G. Andreev and P. G. Bruce, University of St. Andrews
Recuit simulé
Diagramme de poudre
J.Appl.Cryst. 30, 294 (1997)
Gratuit. Peu pratique et
requérant de changer le
code à chaque nouveau
problème (d’après les
auteurs ;-).
Méthode spéciale de
description de molécule
sans Z-matrice.
(CH2CH2O)6:LiAsF6 – structure la plus complexe.
MacGlashan, Andreev, and Bruce Nature 398 792(1999)
26 ayomes non-H dans l’u.a., 79 Degrés de liberté incluant
15 angles de torsion.
Et qui sont les « gagnants » du SDPD Round Robin 2 ?
(étant parvenus à déterminer entièrement les structures)
C’est tout…
(+ ESPOIR utilisé par les organisateurs)
« vainqueurs » du SDPD Round Robin 1 en 1998 : DASH et CSD
Voyons les résultats du calcul lancé en début d’exposé
avec ESPOIR
Premier exemple : La2W2O9
Ce cas est publié : “Ab initio structure determination of lanthanum cyclo-tetratungstate
-La2W2O9 from X-ray and neutron powder diffraction.” Y. Laligant, A. Le Bail et F.
Goutenoire, J. Solid State Chem. 159 (2001) 223-227. Malgré tous les efforts de
synthèse, pas de monocristaux. Un diagramme de diffraction X est indexé dans une
maille triclinique, les atomes de lanthane et de tungstène sont localisés par méthodes
directes et la reliabilité de Bragg (RB) est déjà à environ 15% sans les atomes
d'oxygène. Les tentatives de localisation de l'oxygène échouent (ils pèsent trop peu,
n'apparaissent pas clairement après des synthèses de Fourier différence). Un diagramme
de diffraction de neutron est enregisté. Il reste à localiser 9 atomes d'oxygène
indépendants en position générale du groupe d'espace P-1. Les intensités sont extraites
par "méthode Le Bail" au moyen du logiciel Fullprof. Les méthodes directes restent
impuissantes. ESPOIR est appliqué en fixant les positions déjà bien établies des 2 La et
2 W, tandis que les atomes d'oxygène sont recherchés par Monte Carlo en partant d'un
modèle totalement désordonné. Les données se résument aux 150 premières raies du
diagramme neutron, ce qui doit suffire pour estimer 27 paramètres x,y,z de position pour
ces 9 atomes d'oxygène. Cent tests sont lancés qui prennent une trentaine de minutes
avec un PC cadencé à 2.2 GHz. La solution est trouvée une dizaine de fois avec RP de
l'ordre de 6%.
Fichier de données pour ESPOIR
contenant la définition du problème:
paramètres de maille, groupe d'espace,
longueur d'onde, U,V,W, contenu
chimique, contraintes de distances
interatomiques, mouvements maximum
des atomes, conditions des tests Monte
Carlo (nombres d'évènements, nombre de
tests), définition des objets (ici un objet
gardé immobile correspondant à 2 La + 2
W, et un deuxième objet constitué de 9
atomes d'oxygène d'abord placés au
hasard).
Un deuxième fichier de données est
nécessaire contenant les indices de Miller
hkl et les facteurs de structure extraits du
diagramme de poudre.
Une fois ESPOIR lancé correctement, les reliabilités s'affichent avec
diverses indications (nombres de mouvements testés, nombres de
mouvements acceptés, nombres de permutations effectuées, etc) :
Ici, un minimum de R = 0.065 est atteint au test 21.
Il est possible de visualiser un pseudo diagramme de poudre reconstitué à partir des
positions des pics et des facteurs de structure extraits. On remarque ici que la résolution
n'est pas excellente. Les pics se chevauchent énormément, ce qui n'est pas étonnant
étant donnés les paramètres de maille tous proches de 7 angstroms.
La structure peut être visualisée au moyen du logiciel RASMOL intégré
dans la distribution du logiciel ESPOIR :
RASMOL n'est pas vraiment adapté pour une visualisation des structures
inorganiques. Ici c'est une projection réalisée au moyen du logiciel STRUVIR
(version VRML de STRUPLO) montrant des octaèdres WO6 et des bipyramides à
base triangulaire WO5 constituant la structure de La2W2O9 (atomes de lanthane
représentés par des sphères).
Deuxième exemple : Chlorure de bethanechol
Lorsque le composé est organique ou organométallique et que la
formule moléculaire tridimensionnelle est connue, une fois
l'indexation réalisée, le groupe d'espace établi, il reste à
positionner cette molécule dans la maille. La méthode Monte
Carlo est tout à fait adaptée à ce genre de problème. Dans le cas
du chlorure de bethanechol, deux objects sont placés au hasard
dans la maille, le bloc C7N2O2 sans les 17 atomes d'hydrogène
(description en coordonnées cartésiennes provenant de certaines
bases de données) et l'atome de chlore. Ces deux objets sont
promenés au hasard, la molécule subit des translations et
rotations, jusqu'à ce qu'un bon accord soit trouvé entre intensités
observées et calculées.
Ci-dessous les données pour le programme ESPOIR :
Bethanechol - molecule without H atoms + Cl random
8.880822 16.416883
7.140692 90.000000 93.829346
P 21/N
0.6995 4 12 4 2 1 3
0.027662
0.000000
0.000078
5
C
N
O
Cl
0
8. 8. 8. 8.
1.5 1. 0.02
20000 200000 100000
100000 0.30 2 20
2 4
7 2 2 0
1.5 0 0
0. 0. 0. 90. 90. 90.
1.12559
1.62885
4.89741
1.00
2.18536
3.78472
6.69582
1.00
3.38781
2.29083
4.00240
1.00
2.79920
2.34124
6.52033
1.00
2.94085
0.19817
5.37523
1.00
2.29373
4.13788
8.17289
1.00
2.47432
5.31671
4.78811
1.00
1.33316
5.24660
4.53231
1.00
2.60361
1.67334
5.14159
1.00
3.14464
4.77523
5.96655
1.00
3.50507
6.27914
4.41895
1.00
1 0
0 0 0 1
2.5 0 0
90.000000
Facteurs de structure extraits du diagramme synchrotron (par le logiciel Fullprof).
Pour un tel cas, le nombre de degrés de liberté est de 9 (3 paramètres de position et
3 paramètres d'orientation de la molécule, plus trois paramètres de position pour
l'atome de chlore) si on ne cherche pas à laisser libres les angles de torsion.
Cinquante intensités suffisent largement pour établir ces 9 inconnues :
50
0
2
0
22.08
0.00
1
1
0
5.72
0.04
0
1
1
57.71
0.00
1
2
0
53.90
0.00
-1
0
1
187.76
0.00
-1
1
1
86.45
0.00
0
2
1
97.82
0.00
1
0
1
91.13
0.00
1
1
1
126.19
0.00
-1
2
1
225.36
0.00
1
3
0
15.09
0.00
1
2
1
83.88
0.00
2
0
0
280.27
0.00
0
3
1
53.58
0.00
2
1
0
265.62
0.00
Etc...
La solution est obtenue rapidement, aussi bien d'ailleurs (mais moins
vite) en incluant les 17 atomes d'hydrogène. Résultat avec ESPOIR :
Application du programme DASH au même problème :
Conclusion pour ESPOIR et les méthodes de solution
en espace direct
- Nécessite généralement moins de données que les méthodes
directes (de 3 à 5 intensités par degré de liberté peuvent suffire).
- Possible de résoudre de très gros problèmes si la forme
moléculaire est connue, mais au final il ne sera pas possible de
réaliser des affinements sans contraintes de distances.
Conclusion pour McMaille
- Méthode d'indexation pleine de promesses.
- Déjà très efficace si vous avez du temps et un ordinateur rapide.
- Nécessite quelques connaissances en mode manuel, plus facile en
mode automatique mais il vaut mieux avoir estimé le décalage de
zéro au préalable.
- Vous pouvez l'améliorer si vous avez des idées (licence publique
GNU).
- En accès libre.
- Rester prudent avec le mode multiphase.
- Utiliser plusieurs logiciels d'indexation, jamais un seul.
Conclusion Générale
- Impossible de devenir un expert en détermination de
structure sur poudre en 20 minutes…
- Cette sous-discipline est encore très loin d’une utilisation
routinière.
- Ne choisir les logiciels basés sur des algorithmes MonteCarlo, génétique, recuit simulé (…) qu’en dernier recours (car
ils sont lents) ou bien si ils sont directement adaptés à votre
problème : molécule(s) ou polyèdre(s) connu(s) à localiser
dans une maille.
Une adresse utile pour un cours à distance :
SDPD Internet Course
http://sdpd.univ-lemans.fr/course/