Document 4625026

Transcript Document 4625026

Théorie statistique
des champs
2
Claude Itzykson Jean-Michel Drouffe
Théorie statistique
des champs2
S A V O I R S
A C T U E L S
InterEditions/Editionsdu CNRS
@ 1989, InterEditions, 25. rue Leblanc, 75015 Paris.
et
Editions du CNRS, 1, Place Aristide Briand, 92195 Meudon.
Tous droits réservés. Aucun extrait de ce livre ne peut être reproduit, sous quelque forme
ou par quelque procédé que ce soit (machine électronique, mécanique, à photocopier, 3
enregistrer ou tout autre) s a w l’autorisation écrite préalable de InterEditions.
ISBN 2-7296-0327-1
ISBN 2-222-04365-4
TABLE DES MATIERES
Avant-propos
........................................................................
IX
.....
1
1. Techniques générales ...........................................................
1.1 Définitions et notations .................................................
1.2 Graphes connexes et cumulants .....................................
1.3 Irréductibilité et transformation de Legendre ................
2 Développements en série .....................................................
2.1 Développement de haute température ...........................
2.2 Le rôle des symétries .....................................................
2.3 Développements de basse température - cas discret ......
2.4 Développement de basse température - cas continu .......
2.5 Développement en champ fort .......................................
2.6 Champs fermioniques ....................................................
3 Enumération de graphes .....................................................
3.1 Nombres de configurations ............................................
3.2 Graphes multiplement connexes ....................................
4 Résultats et analyse .............................................................
4.1 Techniques d’analyse des séries ......................................
4.2 Un exemple ...................................................................
Notes ......................................................................................
1
1
6
10
16
16
21
24
27
31
31
33
33
35
39
39
43
47
Chapitre VI11 .SIMULATIONS NUMERIQUES .............
49
Chapitre VI1 .
METHODES DIAGRAMMATIQUES
.
.
.
.
1 Algorithmes ...........................................................................
1.1 Généralités ....................................................................
1.2 Algorithmes classiques ...................................................
1.3 Simulations microcanoniques .........................................
1.4 Considérations pratiques ...............................................
1.4.1 Conditions aux limites .............................................
1.4.2 Taille du réseau .......................................................
1.4.3 Temps de thermalisation .........................................
1.4.4 Mesure des observables ............................................
49
49
53
57
58
58
60
61
62
VI
TABLE DES MATIÈRES
1.4.5 Erreurs statistiques ..................................................
1.4.6 Paramétrisation des champs ....................................
2 Mesures ..................................................................................
2.1 Détermination des transitions ........................................
2.2 Effets de taille finie .......................................................
2.3 Méthode de renormalisation Monte Carlo ......................
2.4 Equation de Langevin ...................................................
3 Simulations fermioniques ....................................................
3.1 Approximation des variables fermioniques gelées ...........
3.2 Fermions dynamiques ....................................................
3.3 Spectre hadronique ........................................................
Notes ......................................................................................
.
.
Chapitre IX .INVARIANCE CONFORME
.......................
.
1 Tenseur impulsion-énergie .
Algèbre de Virasoro ..........
1.1 Invariance conforme ......................................................
1.2 Tenseur impulsion-énergie .............................................
1.3 Transformat ions conformes en deux dimensions .............
1.4 Charge centrale .............................................................
1.5 Algèbre de Virasoro .......................................................
1.6 Les déterminants de Kac ...............................................
1.7 Représentations unitaires et minimales ..........................
1.8 Caractères de l’algèbre de Virasoro ...............................
2 Exemples ................................................................................
2.1 Modèle gaussien ............................................................
2.2 Modèle d’king ...............................................................
2.3 Modèle de Potts à trois états .........................................
3 Invariance moduliaire ...........................................................
3.1 Fonction de partition sur un tore ..................................
3.2 Formule limite de Kronecker ..........................................
3.3 Modèle d’Ising ...............................................................
3.4 La c1assificai;ion A-D-E des modèles minimaux ............
3.5 F’rustrations et symétries discrètes .................................
3.6 Modèles non. minimaux .................................................
3.7 Fonctions de corrélation dans un demi-plan ...................
3.8 Le voisinage du point critique .......................................
Appendice A Séries et produits û de Jacobi ..................
Appendice B Algèbre super-conforme ............................
Appendice C Algèbre des courants ..................................
C . l Algèbres de Lie simples .................................................
C.2 Modèles de ‘Wess-ZumineWitten .................................
C.3 Représentations et caractères des algèbres de Kac-Moody
.
.
.
.
.
Notes
......................................................................................
62
63
65
65
68
71
76
79
80
82
83
88
89
90
90
94
96
101
107
118
129
133
135
135
139
142
148
149
152
158
163
172
175
182
186
192
196
201
202
209
220
224
TABLE DES MATIÈRES
Chapitre X .
SYSTEMES DESORDONNES
ET METHODES FERMIONIQUES ..................................
.
VI I
229
1 Modèles unidimensionnels ..................................................
1.1 Le potentiel aléatoire gaussien .......................................
1.2 Equation de Fokker-Planck ...........................................
1.3 La méthode des répliques ..............................................
1.4 Réseau aléatoire unidimensionnel ..................................
2 Gaz bidimensionnel d’électrons en présence d’un champ
magnétique ............................................................................
2.1 Niveaux de Landau - L’effet Hall quantique ..................
2.2 Spectre à une particule en présence d’impuretés ............
3 Matrices aléatoires ...............................................................
3.1 Loi du demi-cercle .........................................................
3.2 Méthode fermionique .....................................................
3.3 Espacements des niveaux ...............................................
4 Approximation planaire ......................................................
4.1 Analyse combinatoire ....................................................
4.2 Approximat ion planaire en mécanique quantique ..........
5 Système de spins en interactions aléatoires .....................
5.1 Champ extérieur aléatoire et transmutation
dimensionnelle ...............................................................
5.2 Modèle d’king bidimensionnel désordonné ....................
Appendice A La conductivité de Hall en tant
qu’invariant topologique .....................................................
Notes ......................................................................................
229
229
232
240
246
........................
1. Réseaux aléatoires ................................................................
1.1 Réseaux poissonniens et statistique locale .....................
1.2 Equations des champs discrétisées .................................
1.3 Spectre du laplacien ......................................................
317
.
.
.
.
.
Chapitre XI .GEOMETRIE ALEATOIRE
256
256
260
269
271
274
277
283
284
292
295
295
298
308
313
2 Surfaces aléatoires ................................................................
2.1 Surfaces triangulées .......................................................
2.2 Anomalie conforme et action de Liouville ......................
2.3 Sommes sur des surfaces régulières ................................
2.4 Modèles discrets ............................................................
Notes ......................................................................................
317
318
332
339
343
343
351
358
377
386
...................................................................................
389
.
INDEX
Avant-propos
La théorie quantique des champs vise à décrire les interactions fondamentales dans un cadre unique conciliant les principes de la mécanique
quantique et les invariances géométriques et cinématiques. Cette discipline
s’est enrichie, au cours des deux dernières décennies, d’applications insoupçonnées, qui tiennent à la parenté de ses méthodes avec celles de la physique
statistique, à travers l’étude des phénomènes critiques ou des modèles de
physique du solide. Certains développements ont permis de s’affranchir en
partie des techniques perturbatives, qui sont à la source de succès considérables dans le domaine des interactions électromagnétiques et faibles. En
jetant un jour nouveau sur le rôle du groupe de renormalisation, en permettant d’aborder des questions comme le confinement des constituants dans la
chromodynamique, en s’ouvrant aux possibilités de simulation numérique,
en découvrant des problèmes nouveaux comme ceux posés par la théorie des
cordes quantiques, la théorie des champs s’est entièrement renouvelée.
Nous nous sommes attachés à en donner un panorama complétant un
texte précédent sur la théorie quantique des champs écrit par l’un des auteurs en collaboration avec J.-B. Zuber. Bien qu’on suppose du lecteur qu’il
possède quelques rudiments de cette théorie, le présent ouvrage veut éviter
de faire de trop nombreux appels à des connaissances extérieures et s’inscrit
dans le cadre d’un enseignement destiné à de jeunes chercheurs et, plus généralement, à des scientifiques intéressés par les progrès de cette discipline.
L’abondance des matières, le rythme rapide des nouvelles contributions et
les compétences limitées des auteurs ont cependant posé des bornes à l’ensemble des sujets traités.
Si l’on veut bien admettre ces limites, nous avons cependant tenté de
décrire les fondements de la théorie euclidienne des champs, reposant sur
l’usage des intégrales de chemins de Feynman et concrètement réalisée à
travers les modèles statistiques qui utilisent un réseau discret, dont le paradigme est le modèle d’Ising. Ce point de vue permet d’attribuer un sens
global aux quantités physiques, d’étudier des régimes de couplage fort, suggère l’existence de transitions de phases et montre le rôle du groupe de
renormalisation agissant comme filtre des propriétés universelles au voisinage des théories critiques continues.
X
AVANT-PROPOS
Le premier volume est consacré pour l’essentiel à l’illustration de ces
thèmes. I1 s’ouvre par une étude des chemins aléatoires et leur relation avec
les champs bosoniques, et introduit les intégrales fermioniques sur l’exemple
du modèle d’Ising bidimensionnel. I1 expose la méthode du champ moyen,
les propriétés relatives à l’invariance d’échelle, et illustre les idées de la
renormalisation dans le cadre de la transition de Kosterlitz et Thouless du
modèle des rotateurs. Un long chapitre est consacré à la théorie des transitions de phases continues à partir des idées de Wilson, où nous nous sommes
appuyés sur les contributions de nos collègues E. Brézin, J.-C. Le Guillou et
J. Zinn-Justin. C’est encore à Wilson qu’on doit la formulation des théories
de champs de jauge sur réseau et leurs applications à la chromodynamique
et au confinement dont la présentation clôt la première partie.
Le second volume est plus éclectique. On y trouve d’abord des indications sur les développements de haute ou basse température et les applications des simulations numériques de Monte Carlo, en particulier à la
chromodynamique. Un copieux chapitre décrit les résultats récents concernant les systèmes critiques bidimensionnels, dans le cadre des théories
conformes, qui servent aussi d’outil à la théorie des cordes quantiques. Nous
discutons ensuite les applications de l’intégration fermionique à des systèmes
désordonnés simples. Enfin le dernier chapitre expose quelques résultats de
géométrie aléatoire et introduit l’étude des surfaces fluctuantes.
Dans la première partie, au risque de répétitions, nous nous sommes
efforcés de présenter le sujet de manière aussi élémentaire que possible.
Nous ne supposons du lecteur qu’une certaine familiarité avec la notion de
poids statistique de Gibbs, ainsi qu’avec la représentation des amplitudes de
transition quantiques comme superpositions relatives à toutes les évolutions
possibles, affectées d’un poids exponentiel dans l’action. C’est précisément
ce parallélisme qui est à la source des convergences évoquées précédemment.
Le choix des sujets traités et les nombreuses omissions reflètent les intérêts des auteurs et leurs préoccupations. Nous ne sommes que trop conscients de nombreuses lacunes dont la liste serait à l’origine d’un texte encore
plus volumineux. I1 est quelque peu dangereux de vouloir systématiser ce
que l’on a cru comprendre sans laisser percer de-ci de-là des ignorances. I1
est bon de comprendre .A quel point la recherche débouche sur des problèmes
ouverts, des questions en suspens, des interrogations. Comprendre nécessite
le plus souvent que l’ori reprenne la plume, que l’on retrace les étapes d’un
raisonnement, que l’on refasse un calcul, que d’une façon générale on ne se
satisfasse jamais de ce ‘que l’on trouve écrit ou dit ici et là.
Malgré tous nos efforts, et ils s’étalent hélas sur une trop longue période, il nous a été difficile, voire impossible, de polir suffisamment notre
texte pour éviter les no tations conflictuelles, fruit de l’usage, les erreurs matérielles, voire les erreurs tout court. Comme il est rituel, nous invitons le
lecteur patient à les redresser et à nous en faire part. Nous espérons cependant que ces défauts inévitables ne nuisent pas trop à la compréhension de
AVANT-PROPOS
XI
l’ouvrage, même si une quantité change parfois de symbole de chapitre en
chapitre, ou si la même lettre désigne dans des paragraphes voisins deux
entités distinctes.
Nous avons inclus des passages en petits caractères, concernant des
compléments, des explications et quelquefois des exercices, le plus souvent
résolus. En outre, quelques appendices constituent de (trop) brefs résumés
de sujets qu’il n’était pas possible de présenter en détail. Enfin des notes
bibliographiques complètent chacun des chapitres et sont destinées à indiquer nos sources, fournir des jalons, et surtout à encourager le lecteur à
poursuivre son étude dans les articles originaux ou de revue. Ces notes sont
évidemment très incomplètes.
Parmi les textes qui servent de références, figurent bien entendu ceux
de la série publiée par C. Domb et M.S. Green, et maintenant J. Lebowitz,
intitulée Phase Transitions and Critical Phenomena, publiée par Academic
Press (New York). En ce qui concerne la mécanique statistique, citons K.
Huang, Statistical Mechanics, J. Wiley and Sons, New York (1963), H.E.
Stanley Introduction to Phase Transitions and Critical Phenomena, Oxford
University Press (1971), S.K. Ma Modern Theory of Critical Phenomena,
Benjamin New York (1976) et Statistical Mechanics, World Scientific, Singapour (1985), D.J. Amit Field Theory, the Renormalization Group and
Critical Phenomena, World Scientific, Singapour (1984).
Tandis que nous préparions cette édition sont venus s’ajouter plusieurs
ouvrages traitant des mêmes sujets. I1 s’agit tout d’abord du livre de M.
Le Bellac Des phénomènes critiques aux champs de jauge, une introduction
aux méthodes et aux applications de la théorie quantique des champs, publié
dans la même collection par InterEditions, Editions du CNRS Paris (1988)
et de ceux de G. Parisi Statistical Field Theory, Addison Wesley, New York
(1988) et S. Polyakov Gauge Fields and Strings, Harwood (1988). Enfin un
traité de J . Zinn-Justin devrait paraître sous peu.
La référence classique où 1,011 trouve un traitement des intégrales de
chemins est R.P. Feynman et A.R. Hibbs Quantum Mechanics and Path
Integrals, Mc Graw Hill, New York (1965). Des aspects variés sont discutés dans C. Itzykson et J.-B. Zuber Quantum Field Theory, Mc Graw Hill,
New York (1980), P. Ramond Field Theory, A Modern Primer, Benjamin,
Cummings, Reading, Mass. (1981), J. Glimm et A. Jaffe Quantum Physics,
Springer, New York (1981). De nombreux progrès récents de la théorie des
champs qui n’ont pas trouvé place dans notre traitement sont présentés
dans S. Coleman Aspects of Symmetry, Cambridge University Press (1985),
S. Treiman, R. Jackiw, B. Zumino et E. Witten Current Algebra and Anomalies, World Scientific, Singapour (1985). Pour s’initier aux systèmes intégrables, on consultera R. Baxter Exactly Solved Models in Statistical Mechanics, Academic Press, New York (1982) et M. Gaudin La Fonction d’Onde
de Bethe, Masson, Paris (1983). Bien entendu cette liste n’est qu’indicative
et 1’01.1 trouve de nombreuses autres références dans les notes.
XII
AVANT-PROPOS
L’un des auteurs (C.I.) remercie ses collègues qui lui ont fourni l’occasion d’enseigner des parties de cet ouvrage dans le cadre du Troisième cycle
de Suisse Romande à Lausanne, du Département de Physique de l’université
de Louvain la Neuve, du Troisième cycle de Physique Théorique à Marseille
et à Paris, où les deux auteurs ont eu l’opportunité de participer à l’enseignement. Nos remerciements vont aux secrétaires de ces institutions qui ont
pris part à la frappe des, divers textes préliminaires, ainsi qu’à toutes celles
et tous ceux qui ont permis la réalisation finale, à Dany Bunel et Sylvie
Zaffanella qui ont eu la lourde charge de mettre au point le manuscrit, à M.
Leduc qui a accueilli ce livre dans sa collection.
Nous remercions chaleureusement les chercheurs et amis du Service de
Physique Théorique à Saclay qui au cours des années ont été nos interlocuteurs et co11aborateui:s et qui sont trop nombreux pour être tous cités
ici.
Enfin le Commissariat à 1’Energie Atomique et son Institut de Recherche Fondamentale inous ont toujours offert des conditions de travail
d’une qualité difficile à égaler. C’est en quelque sorte témoigner de notre
gratitude que de dédier ce livre aux futurs chercheurs. C’est aussi la raison
pour laquelle nous sommes heureux de bénéficier d’une édition française
grâce au concours du Centre National de la Recherche Scientifique. Bien
souvent il nous est arrivé d’hésiter sur une formulation, simplement parce
que nous avions perdu l’habitude de nous exprimer dans notre langue et que
nous cherchions un précédent impossible à trouver, tant la langue anglaise
a fini par envahir toutes les publications dans notre domaine. S’il n’est pas
souhaitable de retourner à l’époque de la tour de Babel et si l’on ne peut
espérer revenir aux siècles où le français était une langue scientifique universelle, du moins peut-on souhaiter maintenir un vocabulaire et une capacité
d’exprimer les idées contemporaines dans sa propre langue. Sans prétendre
aux effets de style, nous nous sommes attachés à trouver une terminologie simple qui puisse rendre compte de concepts nouveaux et nous nous
associons à tous les efforts, heureusement de plus en plus nombreux, pour
maintenir une langue scientifique vivante.
Saclay, Février 1989
Avertissement
Dans cet ouvrage, nous avons utilisé les notations internationales. Ainsi,
les nombres décimaux ont un point décimal plutôt qu’une virgule, In représente le logarithme népérien, tan la tangente, sinh, cosh, tanh les lignes
hyperboliques, etc.
CHAPITRE VI1
METHODES DIAGRAMMATIQUES
Ce chapitre est consacré aux aspects techniques de divers développements déjà rencontrés dans le premier volume. Nous examinerons surtout
ceux qui sont reliés à la formulation des modèles sur réseau, à haute ou
basse température, ou à couplage fort. Nous n’explorerons pas de façon très.
approfondie le vaste domaine de la théorie des graphes, mais nous donnerons plutôt des exemples empruntés aux modèles les plus courants. I1
existe cependant de nombreux traits communs de nature topologique qui
sont manifestes dans des développements variés. I1 est bon de les souligner
malgré le caractère en apparence élémentaire des procédures employées.
1. Techniques générales
1.1 Définitions et notations
Un graphe étiqueté Ç est une collection de v éléments d’un ensemble
d’indices et de 1 paires de ces éléments, avec des répétitions possibles (liens
multiples). Nous utiliserons aussi le mot diagramme au lieu de graphe. Cet
objet abstrait sera représenté par le dessin de v points (ou sommets) reliés
par 1 lignes. A chaque sommet est associé la valeur de son indice.
Suivant le problème considéré, on ne retiendra qu’une partie de l’ensemble de tous les graphes possibles. A chacun de ces graphes admissibles,
on fait correspondre un poids w ( l ; ) (nombre réel ou complexe) par un ensemble de règles. On veut évaluer la somme des poids de tous les graphes
admissibles.
Parmi les restrictions que 1,011sera amené à considérer, citons
(i) la contrainte d’exclusion qui interdit à deux sommets de porter le même
indice,
(ii) la simplicité, lorsque deux sommets ne sont reliés que par une ligne au
plus (le graphe de la figure l(a) n’est pas simple).
Par exemple, la série de haute température de la fonction de partition
du modèle d’king
2
VII.1.1
METHODES DIAGRAMMATIQUES
z r l : El
k
(4
(b)
Figure 1 : ( u ) Un graphe étiqueté. ( b ) Le graphe libre correspondant.
est représentée par des jraphes associés à chacun des termes du développement
. graphe sera
du produit, caractérisés par un ensemble d’entiers { n z J }Le
constitué de nz3 lignes joignant les points i et j. Les points isolés ne seront
pas dessinés. La sommation terme à terme sur les configurations {uz = kl}
revient à retenir les termes où chaque u, n’apparaît qu’à une puissance paire.
Ainsi les graphes admissibles sont déterminés par les conditions suivantes
(i) une ligne ne peul joindre que deux points indexés par des sites voisins
(le graphe est dessiné sur le réseau)
(ii) le nombre de lignes incidentes en chaque sommet est pair
(iii) deux sommets distincts ont des indices distincts (contrainte d’exclusion).
Le poids associé est évalué en attribuant un facteur p à chaque ligne et en
n z J !ordre
,
du groupe de symétrie du graphe
divisant le résultat par
(2-3)
par échange de ses lignes.
n
Nous avions aussi écrit
qui conduit à un autre développement pour Z/(cosh@)N. Dans ce cas, les
graphes doivent être siinples, et leur poids est calculé en attribuant un facteur
tanh B à chaque ligne. Les deux développements ont chacun leur intérêt et sont
utilisés concurremment,.
Deux graphes sont isomorphes s’il existe une correspondance bi-univoque entre leurs éléments, telle que deux lignes homologues joignent des
points homologues. Ils lie different donc que par la valeur des indices des
VII.1.1
METHODES DIAGRAMMATIQUES
3
sommets. Cet isomorphisme est une relation d’équivalence, et les classes.
correspondantes, notées G, sont appelées graphes libres. Leur représentation
(figure l(b)) ne comporte plus d’indices. Conventionnellement, le poids w(G)
du graphe libre G est la moyenne des poids de tous les graphes isomorphes
correspondants. Appelons nombre de configurations n(G) d’un graphe libre
G le nombre des graphes étiquetés correspondants; on a alors
Cette notion est particulièrement utile lorsque le poids d’un graphe ne
dépend pas de ses indices, puisque les règles de calcul des poids des graphes
étiquetés s’étendent immédiatement aux graphes libres. Cependant, son
principal intérêt est de séparer l’influence du modèle ou du type de modèle
considéré (évaluation de w ( G ) ) des contraintes dues à la géométrie du
réseau (dont dépend n( G ) ) . Les sections 2 et 3 de ce chapitre traitent
successivement ces deux problèmes.
Les graphes ainsi introduits peuvent être généralisés dans diverses directions. Ainsi,
(i) on peut considérer plusieurs types de sommets,
(ii) les lignes peuvent être orientées,
(iii) une modification plus profonde consiste à étendre ces graphes unidimensionnels (collection de points de dimension O et de lignes de dimension 1) à
des dimensions supérieures (dimension 2 pour les théories de jauge);
(iv) enfin les indices peuvent être composés, et une ligne pourra en porter à
ses extrémités.
Cette liste n’est qu’indicative des extensions possibles.
Nous aurons besoin dans certaines applications (en particulier pour
l’estimation des fonctions de corrélations) de conserver un indice sur un
ou plusieurs sommets. Les classes de graphes isomorphes respectant cette
contrainte sont appelées graphes avec racines.
Deux sommets x , y d’un graphe G sont liés s’il existe un chemin
les joignant, c’est-à-dire une suite de liens du graphe 5 2 1 , 2 1 2 2 , ..., z,y.
On définit ainsi une relation d’équivalence entre sommets, et les classes
correspondantes permettent de séparer le graphe en parties connexes. Un
graphe connexe n’a qu’une seule partie connexe.
I1 peut exister sur un graphe des cycles ( x 1 , x 2 ,...,x,, X I ) , c’est-à-dire
des chemins fermés passant par n points distincts. Un graphe connexe sans
cycle est un arbre (figure 2 ( a ) ) . Le nombre de boucles d’un graphe est le
nombre minimal de lignes qu’il faut ôter pour qu’il devienne un arbre (figure
W)).
Un point d’articulation (figure 2(c)) est tel que sa suppression (ainsi
que celle des lignes qui lui sont incidentes) augmente le nombre de parties
connexes du graphe. C’est donc un point de passage obligé pour les chemins
4
METHODES DIAGRAMMATIQUES
VII. 1.1
Figure 2 : ( a ) Un arbre. ( b ) Un graphe à quatre boucles. ( c ) Un graphe
à deux points d’articulakion. ( d ) Un graphe multiplement connexe.
joignant certaines paires de points. En particulier, tous les sommets non
terminaux d’un arbre sont des points d’articulation. Un graphe sans points
d’articulation (figure 2i:d)) est appelé graphe multiplement connexe; deux
quelconques de ses sommets sont sur un cycle et peuvent donc être reliés
par deux chemins totalement distincts au moins.
Appelant
v k , le nombre de sommets d’où partent k lignes
v = C kv k , le nombre total de sommets
I, le nombre de lignes
b, le nombre de boucles
c, le nombre de pa:rties connexes d’un graphe
nous avons la relation
21 =
kvk
k
En effet, puisque chaque lien joint deux sommets, la somme des sommets
pondérée par le nombre de liens incidents est égale à deux fois le nombre de
liens. Par ailleurs, la relation d’Euler
v+b=c+Z
(5)
s’obtient par récurrence, en supprimant une à une les lignes du graphe
jusqu’à obtention de u points isolés. A chaque étape, ou bien on diminue le
nombre de boucles d’une unité, ou bien on augmente le nombre de parties
connexes.
(i) Calculer exp icitement jusqu’à l’ordre 4 la fonction de partition du
modèle d’king sur un réseau hypercubique à d dimensions.
Les graphes libres admissibles ayant au plus 4 lignes sont représentés
sur la figure 3. Leurs nombres de configurations, calculés pour u n réseau fini
de N points avec conditions aux limites périodiques, sont respectivement N d ,
1). En tenant compte du
N d , Nd(2d - l ) , $ N d ( d - 1) et $ N d ( N d - 4d
+
VII. 1.1
METHODES DIAGRAMMATIQUES
préfacteur de symétrie, les poids correspondants sont $pZ,&O4, $p4,p4,
aB4. La sommation de ces différentes contributions conduit à
2=1
+ $Nd,B2 + [ $ N d ( 6 d
-7)
+ i N 2 d 2 ]B4 + 0 ( B 6 )
A cet ordre, il est facile de vérifier l’extensivité de l’énergie libre. L’expression
N
-
F
N
-
In2
N
-
$dp2
+ k d ( 6 d - 7)p4+ u(f’)
est en effet indépendante de N .
(a)
(b)
(4
(cl
Figure 3 : Graphes du modèle d’king jusqu’à l’ordre ,û4.
Notons qu’il était plus rapide d’utiliser le développement en tanh p. En
vertu de la contrainte de simplicité, seul le graphe de la figure 3 ( d ) donne une
contribution non nulle, ce qui conduit à la formule suivante, équivalente à ( 6 )
dans un développement à l’ordre ,û4
Z = (cosh /3)Nd[l
1- i N d ( d
-
1)tanh4 ,û
+ 0(tanh6 a)]
Cette contrainte est donc bien utile dans ce cas pour réduire le nombre de
graphes, qui prolifèrent rapidement avec l’ordre. Les sous-sections suivantes
étudient d’autres techniques de réduction.
(ii) Théorème de Kirchoff. Les définitions précédentes nous permettent
de rappeler un théorème dû à Kirchoff, donnant le nombre d’arbres distincts
tracés s u r un graphe connexe et joignant tous les sommets. Associons à un
graphe connexe G sa matrice d’incidence A (qui est l’équivalent topologique du
laplacien). Sur la diagonale principale, (-A)%i est le nombre de liens incidents
au sommet i, alors quc ( - A ) L jest l’opposé du nombre de liens joignant les
sommets (distincts) i et j. Comme la somme des éléments de chaque ligne
ou colonne est nulle, det(-A) s’annule. Cela correspond à l’existence d’un
mode nul, unique car le graphe est conncxe. Le théorème stipule que tout
mineur principal (c’est-à-dire ( - l ) i + J fois le déterminant de la matrice où l’on
a supprimé la i-iènie ligne et la 1-ièrne colonric) est égal au nombre d’arbres
recherché.
Le vecteur propre corrcspondant à l’unique mode nul a toutes ses compole mirieur principal de l’élément ij (avec son signe).
santes égales. Soit
Puisque
5
6
MFTHODES DIAGRAMMATIQUES
VII. 1.1
tous les M k j , à IC fixi, sont égaux. Comme la matrice est symétrique, on en
déduit que le résultat s’étend à toute valeur de k, tout mineur étant égal à
la même valeur M . I1 nous suffit donc d’évaluer M = M i l . Soit v le nombre
de sommets et f? 2 v - 1 le nombre de liens. Introduisons la matrice Lai de
dimension 1 x v, où CI indexe les liens et i les sommets, après avoir orienté
arbitrairement chaque lien, en posant
+1
si le lien a part du sommet i
-1
si le lien a arrive au sommet i
O
si le lien a n’est pas incident au sommet i
On a alors (-A) = L??L. Appelons L’ la matrice déduite de L en supprimant
sa première colonne, de telle sorte que
où la sommation porte sur toutes les matrices La,...û., d’ordre (v - 1) x (v - 1)
obtenues en choisissant v - 1 lignes de L’. Chaque terme de la somme est de
la forme (detLkz..,a,,;2, et n’est non nul que si l’application i + a; associe à
chaque sommet i = 2, ..., v un lien incident. Dans ce cas, la matrice Laz ,,,Qu
ne diffère d’une matrice de permutation que par le fait que ses éléments sont
*1 plutôt que +l. I1 s’ensuit que (detLa,,,,,v)2 vaut 1, et que la matrice est
en correspondance bi-univoque avec un arbre. On a ainsi prouvé le théorème
de Kirchoff. Cette interprétation topologique du laplacien se révèle utile dans
les problèmes de percolation et de polymères. Nous en verrons une application
au chapitre XI.
1.2 Graphes connexes et cumulants
La propriété fondamentale d’exponentiation se fonde sur les conditions
suivant es:
(i) Le graphe vide (sans point, ni ligne) est admissible, et son poids est
égal à 1; il a c = O parties connexes et n’est donc pas connexe (e # 1).
(ii) Toute juxtaposition d’éléments de graphes admissibles est un
graphe admissible.
(iii) Le poids d’un graphe est égal au produit des poids de ses parties
connexes.
Sous ces hypothè:jes, la somme des poids des graphes est égale à
l’exponentielle de celle des graphes connexes.
VII.1.2
METHODES DIAGRAMMATIQUES
7
La contrainte d’exclusion est incompatible avec la condition (ii). On
vérifiera sans peine que dans ce cas la proposition précédente appliquée telle
quelle est inexacte en prenant pour exemple le modèle d’king à l’ordre B4.
Nous montrerons dans cette sous-section comment tourner cette difficulté et
construire un développement pour l’énergie libre.
La démonstration tient en quelques lignes. Un graphe quelconque sera
construit en choisissant indépendamment et successivement ses c parties
connexes
...Çc d’après la première condition. L’ordre dans lequel ce choix
est fait étant indifférent, chaque graphe est ainsi obtenu exactement c! fois.
Utilisant la propriété de factorisation et sommant sur le nombre c de parties
connexes
on reconnaît dans le membre de droite de cette relation l’exponentielle
annoncée, soit
Bien que dans la pratique, il ne soit pas toujours indispensable de se servir de ce résultat, la propriété d’exponentiation est d’une importance capitale : les calculs de quantités extensives, de comportements asymptotiques,
de longueurs de corrélation, d’effets de bord reposent sur une proprieté
d’exponentiation. Nous avons vu que la contrainte d’exclusion, fréquemment rencontrée, l’invalide. Cependant , un simple changement des règles
diagrammatiques, connu sous le nom de méthode des cumulants, permet de
rétablir la propriété.
Supposons donc qu’il existe un autre ensemble de règles n’obéissant,
pas à la contrainte d’exclusion. Nous en différencierons les graphes en
représentant les sommets par des cercles plutôt que des points noirs. Un
nouveau graphe représente une partie de la contribution de l’ancien graphe
obtenu en fusionnant les sommets portant le même indice. Si l’on veut
que le nouveau développement conduise au même résultat, on obtiendra
un système de contraintes que l’on peut écrire symboliquement
8
VII.1.2
ME:THODES DIAGRAMMATIQUES
10
l!
+-1 O O + 1 ooo+.**
2!
3!
(1+ . ) ( O - )
(1+.)(-0-+4+)=
-
=O
=
-c
Le facteur (i+.) tient compte de la possibilité de fusionner autant de points
isolés qu’on le désire. Dans ces relations, tous les points portent le même
indice, qu’on a omis pour la clarté de la formule.
Pour résoudre ces équations, nous allons préciser les règles de calcul
des poids. Dans le développement utilisant la contrainte d’exclusion,
(i) un facteur
zk
eE,t associé à chaque sommet relié
k lignes,
(ii) un facteur ,B est associé à chaque ligne,
(iii) le produit des facteurs précédents doit être divisé par l’ordre du
groupe de symétrie du graphe.
Le développement sans contrainte d’exclusion obéit aux mêmes règles,
le facteur zk étant remplacé par un facteur uk. Les équations (il)s’écrivent
alors
et permettent de ca1cu:ler de proche en proche les cumulants
‘uk
VII.1.2
METHODES DIAGRAMMATIQUES
u2
=-z2 -
9
(z)
2
z0
u3
I
z3
zo
22
=- - 3--
z1
zo zo
+ 2 (:)3
La solution peut s’exprimer sous forme compacte en introduisant les fonctions génératrices
u(h)=
k=O
(15)
IC!
Le premier membre des équations (12) s’interprète alors comme la suite des
coefficients du développement en h de expu(h)
(i) Justifier plus complètement la méthode des cumulants et vérifier
l’équation (16) jusqu’à l’ordre 4.
(ii) Retrouvons par ces règles l’énergie libre (7) du modèle d’king à haute
température. Les règles initiales imposent Z 2 k = 1, Z g k + l = O , de sorte que
z ( h ) = cosh h
~ ( h=)lncoshh = i h z - A h 4
(17)
+...
Les graphes connexes sont les quatre premiers de la figure 3. Mais, la contrainte
d’exclusion étant levée, leurs nombres de configuration diffèrent et sont maintenant respectivement N d , N d , $ N ( 2 ~ l )a~N, d ( 2 d - 1). Ces nombres sont tous
proportionnels à N , à cause de l’invariance par transition, ce qui assure à tous
les ordres l’extensivité de l’énergie libre. Les poids respectifs sont alors (puisque
212 = 1, 214 = -2) $p2, i p 4 ,-$p4,p4.On notera la perte de la positivité des
poids, consécutive à celle des cumulants. La sommation des graphes connexes
redonne immédiatement la formule (7) et fournit ainsi une vérification de la
proposition générale énoncée ci-dessus. La même méthode est applicable au
développement en tanh p. On doit introduire des facteurs Zk dépendant de la
(18)
10
MIETHODES DIAGRAMMATIQUES
VII. 1.2
direction des lignes incidentes, et les graphes obtenus ne sont plus simples.
Cela limite l'intérêt de la méthode pour les graphes simples. Le choix entre les
contraintes de simplicité et de connexité dépend du problème considéré. Nous
verrons en particulier qu'il est plus avantageux, pour les théories de jauge, de
choisir la simplicité.
En ce qui concerne les graphes avec racines, la répartition des indices
fixés entre les différentes parties connexes conduit à des relations similaires
à (11). Si Z ( i l . ..i k ) désigne la somme des contributions de tous les graphes
(connexes ou non) avec racines il ,.. . ,i k , et si (il . . . i k ) , désigne la somme
correspondante des graphes connexes calculés avec les règles des cumulants,
on a
= c
= , + ,,
= c + c c + ,< 22 >,
+ <: i 2 i 3 >,, + ,,,
(19)
En effet, les graphes non connexes se factorisent d'une part en parties
connexes ne comportant aucune racine et dont la somme va reconstruire la
fonction de partition 2, d'autre part en graphes avec racines qui vont réaliser
toutes les partitions possibles des indices i l , ..., ik fixés. Ces propriétés sont
évidentes zi un introduit une source j pour les champs. Les graphes avec
racines correspondent alors aux fonctions de corrélation, qu'elles soient non
connexes
ou connexes
Les relations (19) deviennent alors une simple conséquence de (20-21).
1.3 Irréductibilité e t transformation de Legendre
Poursuivons la réduction du nombre de graphes en décomposant les
graphes connexes en parties irréductibles. La notion d'irréductibilité peut
être plus ou moins poussée. Elle peut aller jusqu'aux graphes multiplement
connexes (cf. exercice ci-après). Une étape intermédiaire conduisant à des
calculs assez simples él!mine seulement les graphes réductibles relativement
aux lignes.
VII.1.3
METHODES DIAGRAMMATIQUES
11
Un graphe connexe est réductible s’il contient au moins une ligne dont
la suppression le rend non connexe; tel est le cas de celui de la figure 4u,
où l’on a indiqué les lignes par rapport auxquelles il peut être réduit. On
notera qu’un arbre est réductible par rapport à n’importe laquelle de ses
lignes.
Ayant supprimé les lignes de réductibilité, le graphe se trouve disjoint
en parties irréductibles, qui vont depuis le simple point isolé jusqu’aux “cactus” formés de blocs multiplement connexes reliés par des points d’articulation. Si l’on représente ces blocs par un cercle hachuré, tout graphe prend
l’aspect d’un arbre dont les sommets sont des cercles hachurés. La figure
4b illustre cette décomposition par une équation symbolique; le membre de
gauche est la somme des graphes connexes, représentés par un cercle vide.
Figure 4 : (u) Un graphe réductible et sa décomposition en parties
irréductibles. ( b ) Aspect général des graphes connexes.
Sous les conditions énoncées au paragraphe précédent, nous allons
montrer qu’il est possible de définir des règles diagrammatiques pour ces
graphes en arbre, puis nous les calculerons en exposant une méthode de
resommation des arbres.
Soit C ( { h i } )la somme des poids des graphes étiquetés connexes où l’on
associe au sommet étiqueté i, d’où partent IC lignes, un facteur dku(hi)/dht.
Ultérieurement, on annulera les champs auxiliaires hi afin de retrouver les
règles diagrammatiques initiales. L’opération de dérivation dC/dhi consiste
à choisir successivement dans tous les graphes de C les points d’indices i
et de remplacer leur contribution dku(hi)/dhFpar dk+f’u(hi)/dhf+l.
Ceci
s’interprète diagrammatiquement par l’addition d’une ligne supplémentaire
sur les graphes avec racine i, soit symboliquement
i
De même, nous faisons correspondre au cercle hachuré la fonction
12
METHODES DIAGRAMMATIQUES
VII.1.3
I ( h z ) , somme des poids de tous les graphes irréductibles calculés avec des
poids similaires dku(h,)/dht pour le sommet i. L’interprétation (22) de la
dérivation restant valable pour cette fonction, la contribution des sommets
hachurés dans les arbres de la figure 4b est donnée par la fonction génératrice
pour un champ unifoIme I ( h ) = I({hz})lh,=h. Ces graphes sont non
étiquetés et il convient, dans les règles diagrammatiques, de diviser leur
contribution par l’ordre de symétrie du graphe afin de reconstituer de façon
unique chaque graphe etiqueté connexe du développement primitif.
Pour resommer les arbres, nous allons les engendrer avec un poids
incorrect, puis corriger le résultat en utilisant les relations topologiques du
paragraphe 1.1. Considikons tout d’abord tous les graphes ayant un sommet
généralisé distingué. Leur somme C. s’obtient en comptant chaque arbre un
nombre de fois égal à son nombre de sommets. Construisons l’arbre à partir
de ce sommet d’où peutent partir IC = O, 1 , 2 , ... lignes. Le sommet généralisé
représenté par le cercle hachuré contient plusieurs sommets simples, et il va
falloir les “habiller” individuellement. Rajouter kt lignes incidentes à l’un
de ces sommets i revient à effectuer la dérivation ûkl/ûhf*.
A chaque ligne
qui relie le sommet i à l’un des sites voisins, on attribue un facteur ,L?. En
d’autres termes, le sommet habillé est obtenu à partir du sommet nu par
l’opération
+
,L?Cj<i)mj.
Revenant
qui revimi à effectuer la substitution hi + h,
maintenant à un champ extérieur uniforme hi E h, mi E m, on en déduit
la contribution des diagrammes avec un sommet généralisé distingué, soit
symboliquement
c’est-à-dire explicitement (rappelons que q est le nombre de coordination)
dkI(h)
c . = c F(pm)k= I ( h + qPm).
k=O
On peut faire un calcul similaire en particularisant cette fois un lien.
Le résultat CJ compte chaque graphe un nombre de fois égal à son nombre
de lignes
VII.1.3
METHODES DIAGRAMMATIQUES
13
Utilisant la relation ( 5 ) qui s’écrit dans ce cas
(26)
w-1=1
nous constatons que chaque graphe est compté exactement une fois dans la
différence C. - Cl. Le résultat final est donc
C ( h )= I ( h
+ qPm) -
,Om2
(27)
liens
où chaque terme est proportionnel au nombre total de sites N et où la
quantité m est solution de
c’est-à-dire, compte tenu de (27),
+
m = -1 d l ( h qPm)
N
dh
(29)
Les relations (27) et (29) expriment que les fonctions C et I sont transformées de Legendre l’une de l’autre. L’équation (29) implique la stationnarité
du membre de droite de (27) vis-à-vis des variations de m à h fixé. Ceci
permet de donner une expression sous forme compacte
m
I(h
+ qPm) -
,Om2
liens
dans laquelle nous pouvons maintenant, si nous le désirons, annuler le champ
extérieur h. Cette transformation de Legendre permet en principe d’étendre
la procédure du champ moyen à tous les ordres. Sous la forme d’un principe
variationnel, elle montre le caractère convexe de l’action effective C(h ) .
(i) Dans le cas du modèle d’king en champ extérieur nul, cette méthode
pourrait sembler dénuée d’intérêt, puisque tous les graphes d’ordre fini sont
irréductibles à cause de la parité des sommets. L’aimantation par site
est également nulle à tout ordre fini. Ce n’est plus le cas cependant à basse
température pour d 2 2. La formule (30), qui réalise en fait la resommation
d’un nombre infini de graphes, peut reproduire ces faits en remplaçant le
champ extérieur nul, h = O , par un champ moyen qpm. En effet, la série
déterminant la quantité Z peut être réordonnée en puissances d’une autre
variable que la température, l’inverse de la dimension, l / d , par exemple. I1 est
alors possible d’approximer i(h) à toute température par le graphe d’ordre le
14
METHODES DIAGRAMMATIQUES
VII.1.3
plus bas, c’est-à-dire rie comportant qu’un sommet, dont la contribution est
u(hi) =
lncoslihi. La formule (30), qui devient
ci
ci
In Z
-- = Extr (In cosh 2dBm - p d m 2 )
IV
m
lorsque tous les mi scnt égaux, n’a qu’un minimum à m = O pour B petit.
Lorsque @ croît, ce minimum devient un maximum, encadré par deux minima
correspondant à f m s c # O où msp est l’aimantation spontanée. La technique
diagrammatique n’indique pas le choix à faire parmi les extréma, ce dernier
résulte d’une étude globale. L’annulation de la dérivée seconde du second
membre de (31) fourriit le point de transition du deuxième ordre Pcd = 1.
Nous retrouvons ainsi le résultat du champ moyen. L’intérêt de la méthode
est de permettre un calcul systématique des corrections.
+
+
Figure 5 : Construction récursive du réseau de Bethe.
(ii)Nombre d’arbres sur un réseau de Bethe. Un réseau de Bethe est un
réseau formé d’un arbre infini où chaque site est relié à q voisins. Sa construction est illustrée sur la figure 5. Les arbres de Cayley construits de cette
manière récursive ont cependant la propriété malheureuse que, dans la limite
“thermodynamique”, le nombre de sites en surface est du même ordre que
le nombre total de sites. Les effets de surface ne peuvent donc être ignorés, à moins de ne considérer que les quantités relatives aux sites “profonds”
(c’est-à-dire que la liinite de volume infini doit être prise avant tout calcul).
C’est ce que nous en1;endrons par réseau de Bethe. De nombreux problèmes
sont solubles sur un tel réseau. Par exemple, on peut compter le nombre Nk
d’arbres à IC branches, par site. A cet effet, nous évaluerons la fonction géneN k t k . Remarquant que ces arbres ont des sommets à q
ratrice G ( t ) =
branches au plus, on obtient sans peine l’équation (correspondant à (27))
=(1
+ mt)Q- 1 - Iqtm2
2
...
VII.1.3
METHODES DIAGRAMMATIQUES
15
où m représente la contribution des arbres poussant au bout d’un lien donné
La solution
G ( t )= Extr { (1+ tm)4- 1 - iptm2}
m
devient singulière à t, = (p - 2 ) q - 2 / ( q - 1 ) q - l . Cette singularité provient du
poids important des arbres de grande taille et est reliée au seuil de percolation
sur ce réseau.
(iii) Réduction aux graphes multiplement connexes. Dans une telle réduction, les variables sur lesquelles s’effectue la transformation de Legendre
deviennent en nombre infini. On veut sommer des “cactus” (figure 6) où les
points d’articulation sont précisés. La relation topologique à utiliser est
Figure 6 : Décomposition d’un arbre en parties multiplement connexes.
où nb est le nombre de boucles, n, le nombre de points d’articulation et
nm ce même nombre de points d’articulation, chacun étant compté autant
de fois qu’il est relié à des boules différentes. Soit B({uE!”’})la contribution
de graphes multiplement connexes calculée en attribuant à chaque sommet i
d’où partent n lignes le facteur uin) (avec les règles habituelles, on utilisait
ûnu(hi)/ahl).L’habillage d’une boule pour en faire un cactus consiste à
remplacer la contribution d’un sommet par celle d’un sommet “habillé”
où g l k ) représente la contribution de l’ensemble des graphes connexes tels que
k lignes sont incidentes au sommet z
(34)
16
VII.1.3
METHODES DIAGRAMMATIQUES
L’utilisation de la relation (35) permet d’évaluer, comme précédemment, la
somme C des poids de tous les diagrammes connexes
Les formules ( 3 6 ) et ((37) sont à nouveau des conditions d’extrémalité sur le
membre de droite de (38), considéré comme fonction des variables indépenet 91“).
dantes
.In’
Ces techniques de réduction paraissent très attrayantes dans leur principe. En pratique, leur utilisation dans les développements pour les modèles
sur réseau conduit à des expressions si compliquées que leur usage reste limité.
Dans le cadre des thliones continues, des noyaux irréductibles analogues interviennent dans les equations intégrales de Schwinger-Dyson, dans l’analyse
des états liés par l’équation de Bethe-Salpeter et dans la théorie formelle de
la renormalisation.
2. Développements en série
2.1 Développement de haute température
Nous discuterons en toute généralité des modèles statistiques dont
l’action, intervenant ditns le poids de Boltzmann exp S , s’écrit
1
-V?i.:.akipz
/%! 2 1 ...zk
. . . p z+
S ( J )=
k22
c
JFipq
(39)
i,a
Les champs pi peuvent être soit bosoniques, soit fermioniques. Dans ce dernier cas, la source J fait également intervenir des variables grassmanniennes..
Dpi. On cherche à évaluer la
La mesure d’intégration est désignée par
fonctionnelle génératrice des fonctions de corrélation
ni
A haute température, l’exponentielle est développée en série de la variable
/3. Chaque terme est a,lors intégré sur les champs
évaluer l’intégrale
cpi.
On est alors amené à
VII.2.1
METHODES DIAGRAMMATIQUES
17
qui requiert la connaissance de la fonction de partition associée à un seul
site
Enonçons les règles diagrammatiques pour le calcul de Z. On considère tous
les diagrammes comportant les éléments suivants :
O Des sommets correspondant aux sites, à n 2 1 branches, indexés par le
site i et représentant un produit de n champs 9:’ . . .cpEn. Leur contribution
sera
Des sommets correspondant aux interactions à IC
indice, associés au facteur
2 2 branches, sans
(ij denotant les indices de sommets correspondant aux sites auxquels ce
sommet sera relié).
Des lignes joignant un sommet correspondant à un site à un sommet
correspondant à une interaction. Elles portent à leurs deux extrémités un
indice interne Q sur lequel il faudra sommer.
On se propose de resommer les contributions de tous les diagrammes
possibles, connexes ou non, avec contrainte d’exclusion pour les sommets
associés aux sites. Les méthodes de la section précédente peuvent être
utilisées, et nous allons en donner quelques exemples.
Un cas particulier est celui d’une interaction quadratique et homogène
(invariante par translation). Les sommets relatifs aux interactions, ayant
toujours deux branches, peuvent être omis, et l’on retrouve les diagrammes
habituels aux modèles de spin, et en particulier au modèle d’Ising qui
illustrait la section précédente.
(i) Etablir un développement valable à grande dimension pour le modèle
de spin O ( n ) en utilisant l’irréductibilité.
Les champs <pi sont des vecteurs unimodulaires à n composantes, inter. <pi .‘pj.La fonction génératrice des cumulants
agissant suivant l’action
ZJ )
u ( h E lhl) vaut donc
BE,.
La fonction de Bessel I k ( h ) ne doit pas être confondue ici avec la fonctionnelle
génératrice des graphes irréductibles I ((h}). Dans l’équation (42), la mesure
18
VII.2.1
M ETHODES DIAGRAMMATIQUES
sur cp est normalisée à l’unité. En posant H = h
on trouve
In Z
-=I(H)-N
H2
4Bd
,
+ 2dBm dans la relation (30),
dI
H=2/3ddH
(43)
Comme nous l’avons déjà indiqué, la valeur H = O cesse de donner la solution
physique lorsqu’elle correspond à un maximum. La transition est obtenue en
annulant la dérivée seconde du membre de droite de (43) pour H = O. A
l’ordre le plus bas, I ( H ) = u ( H ) , et on en déduit donc B, = n/2d, d’ordre l / d
en grande dimension. Les diagrammes jusqu’à l’ordre 6, ainsi que leur dérivée
seconde à H = O , sont représentés sur la figure 7. Puisque B est d’ordre a-’,
on constate qu’un diagramme d’ordre IC sera d’ordre d - k + [ k / 2 1 .Ceci est dû au
fait que l’irréductibilité oblige le diagramme à ne comporter que des cycles; un
cycle de longueur 2k ne peut utiliser que k directions différentes sur un réseau
et son nombre de configurations est une expression polynômiale en d, de degré
k. Si l’on réordonne 1.i série donnant I en pd et d - l , il n’y aura donc qu’un
nombre fini de diagrammes contribuant à un ordre donné en d-’. On est ainsi
conduit à l’équation donnant Bcd en série de d - l , à savoir
n
-
1
2 P , d - l - - -2d
2-2/(n+2)
4d2
- 7-8/(n+2)
+...
8d3
à comparer à l’expresision (111.104) obtenue dans la limite n infini.
(ii) I1 est intéressant d’étudier dans ce cadre la limite n + oû. De la
discussion précédente, on déduit que cette limite doit se faire à B/n fixé. Une
inspection de la figure 7 révèle que seuls contribuent les diagrammes dont
chaque partie multiplement connexe ne comporte qu’une boucle. Ceci suggère
l’utilisation du formalisme de l’exercice 3 de la section 1.3. La fonction u ( h )
se comporte comme
ce qui assure que les variables g(3), g(4) ... n’interviennent pas dans l’équation
(36). En fonction des variables g(’) (vecteur) et g(2)(matrice), le second
membre de l’équation (36) peut alors s’écrire
Nous ne retiendrons, dans le calcul de B , que le diagramme formé d’un seul
lien et les diagrammes à une seule boucle. En tenant compte du nombre de
boucles à p segments que l’on peut tracer sur un réseau (voir la section 3 de
ce chapitre), on arrive à la formule
(44)
e
0
a
2~2d/~3
-8P4d/(n5(n
+2))
-64P5d2/(n6(n
-8P6d3(7n
+2))
+
4 P 3 d / ( n 4 ( n+ 2 ) )
36P5d(2d - l ) / ( n 6 ( n 2 ) )
+ 1 6 ) / ( n 7 ( n+ 2 ) )
96P6d2(2d - l ) / n 7
0
+
+
M
d
4P6d(4d2 8d - 7 ) / ( n 7 ( n 2 ) )
ti
E
O00
-40p6d3/n7
0
-20B6(6d2 - 9d
+ 4)/n7
-6P4d(2d - i)/n5
Figure 7 : Diagrammes intervenant dans le calcul au sixième ordre du noyau irréductible I ( H ) et leur contribution à
d21(W/dH2
.
IHZO
20
METHODES DIAGRAMMATIQUES
Les conditions de stationarité relatives à u ( l ) et
où la quantité
Y
VII.2.1
conduisent alors à
est scilution de l’équation
1
m
n
=
dsIt(s)eëS”
La température critique est obtenue lorsque ce paramètre v prend sa plus
petite valeur possible égale à d . On vérifie que le développement en i / d du
résultat obtenu coïncide avec la formule (44) de l’exercice précédent dans la
limite n -+ 00.
(iii) Utiliser l’irrhductibilité pour retrouver, en toute généralité, les résultats du champ moyen avec corrections.
La formule (31) se généralise à des interactions quelconques. Cependant,
la méthode se complique légèrement, compte tenu des deux types de vertex
(interactions et sites: intervenant dans les diagrammes. Reprenons donc la
dérivation effectuée en 1.3, en précisant les changements à apporter. Nous
envisagerons tout d’abord l’irréductibilité vis-à-vis des vertex d’interaction. Un
diagramme sera réductible vis-à-vis d’un vertex si sa suppression le sépare en
exactement k parties disconnectées. I1 faut noter que cette définition n’est pas
aussi générale que celle de l’irréductibilité forte, où une simple disconnection du
diagramme assure la réductibilité. Diagrammatiquement, nous représenterons
les vertex d’interacticin par un point noir, les vertex-sites par un point blanc.
L’équation (22)
dans laquelle le verte:<-sitei a été distingué, doit être complétée par la formule
correspondante pour le vertex d’interaction
H 2. --
&
=
La reconstruction à partir d’une boucle irréductible faite en (23-24) se généralise alors sans difficulté
(49)
’
VII.2.1
METHODES DIAGRAMMATIQUES
21
de même que celle faite à partir d’un vertex d’interaction. La relation topologique à utiliser est maintenant, pour z1 boucles et nk vertex d’interaction à IC
branches
z1
C(k-
1)nk
=1
+ H)) + S ({m
(2)))
-
(53)
D’où la relation finale
C ( { h ) )= I ( { h
-
miHi
(54)
i
Les formules (50-51) expriment l’extrémalité du membre de droite de (54)
vis-à-vis des variations en H et m. Le développement diagrammatique de I
est tel que tout vertex d’interaction appartient au moins à une boucle et le
développement peut s’ordonner naturellement suivant le nombre de boucles.
Le premier terme redonne l’approximation du champ moyen, telle qu’elle a été
écrite en toute généralité dans les formules (VI.64)-(VI.66)). A nouveau, la
technique diagrammatique n’indique pas quel est le choix à effectuer lorsqu’il
y a plusieurs extrema; seule une méthode intégrale permet de résoudre ce
problème.
2.2 Le rôle des symétries
L’exploitation des symétries conduit à un développement en graphes
simples qui généralise le développement en tanh /3 du modèle d’Ising.
Un modèle chiral utilise des champs cp éléments d’un groupe G. La
base naturelle pour exprimer les fonctions de cp est formée des éléments de
matrice D&(cp) des représentations irréductibles T de G. Cette assertion
est le théorème de Peter-Weyl dans le cas des fonctions de carré sommable
sur un groupe de Lie compact. Elle est vérifiée a fortiori pour un groupe
22
METHODES DIAGRAMMATIQUES
VII.2.2
fini. La mesure d p sur les champs est la mesure invariante, ou mesure de
Haar sur le groupe G que nous normaliserons à l’unité. Les représentations
irréductibles satisfont aux relations d’orthogonalité et de complétude
est la mesure’
La représentation irréductible r est de dimension d, et 6(p, 9’)
de Dirac (fonction 6) sui: G. Au lieu de développer exp S en série entière dans
les champs cp, on le développe en fonction des coefficients des représentations
irréductibles DT(cp)et on effectue les intégrations par les méthodes de la
théorie des groupes, en utilisant en particulier la relation (56).
A titre d’illustration, reprenons le modèle de spin O ( n ) dont nous
récrirons l’action sous la forme
Les champs sont maintenant des rotations R E SO(n) dans un espace
à n dimensions, choisies pour amener un vecteur fixe 90sur le vecteur
+i = Riao. L’espace des spins est l’espace homogène S O ( n ) / S O ( n- 1).A
l’aide de la formule (56), exp S peut être développé en série de Fourier
n EdT
’I3 ( B T D T ( R Z 1 R j ) )
expS =
<ij>
(59)
r
dont les coefficients p, (qui sont des matrices r x r ) sont donnés par
LIT =
/
dR
exp Sij(R)
tandis que PO est un simple scalaire. Comme précédemment, chaque terme
du produit (59) est représenté par un diagramme. Pour chaque paire de
voisins (ij) pour laquelle on aura choisi une représentation non triviale
r # O, on dessinera une ligne allant de i vers j indexée par la représentation
r; on lui associera une contribution dTpT//3o (dans le calcul de la fonction de
partition, une puissance du scalaire ,BOa été factorisée). Le graphe est simple,
avec au plus une ligne joignant deux sommets. Chaque ligne est orientée;
le changement d’orientation revient à substituer à la représentation r son
adjointe F : DT =
11 est à noter que, d’après la définition (60), pr =
m.
Pour le modèle d’Ising, le groupe est 2 2 = { 1, -1) qui n’a qu’une seule
représentation non triviale. On retrouve immédiatement que PO = coshp et
pi = sinhp, ainsi que les règles du développement en ,&/@O = tanhp.
K.
VII.2.2
METHODES DIAGRAMMATIQUES
23
Lorsque plusieurs lignes T I , . . T , sont incidentes sur un même sommet,
l’intégration sur le champ Ri en ce site prend la forme
a,
/
d R Drl (R) ...Vrn(R)
En particulier, le cas n = 1 est exclu, car les représentations T sont
non triviales et l’intégrale correspondante s’annule. Lorsque n = 2, deux
lignes successives doivent porter la même représentation. Plus précisément,
l’intégration sur les variables attachées aux sommets intermédiaires d’une
ligne composée d’une suite de liens successifs se fait aisément par la formule
conduisant à une contribution pour une ligne brisée de la même forme
que l’interaction élémentaire. Une boucle formée de k maillons donne en
particulier un facteur
Les sommets communs à plus de deux lignes conduisent à des calculs plus
complexes, où interviennent les coefficients de couplage des représentations
TI,
...,T,.
Si, au lieu du modèle vectoriel, on considère le cas chiral avec une action
de la forme
s=p
les calculs se simplifient, car
Tr(R7lRj)
ph est alors multiple de la matrice unité.
C’est aussi le cas de l’action utilisée dans les modèles de jauge sur réseaux
L’interaction est quartique dans les champs. Plutôt que d’adopter la représentation graphique de la sous-section précédente, on préfére représenter l’interaction par la surface de la plaquette i j k l , dont les côtés portent les champs (figure
8). On est ainsi conduit à considérer des diagrammes qui ont la topologie de
surfaces constituées de plaquettes.
24
VII.2.2
METHODES DIAGRAMMATIQUES
Figure 8 : Repr,Ssentation de l’interaction dans le cas des modèles de
jauge.
Les méthodes de réduction à des graphes connexes peuvent être utilisées,
mais conduisent malheureusement à une prolifération excessive du nombre
de graphes. Par exerr.ple, si l’on énumère les graphes du quatrième ordre
apparaissant dans un réseau réduit à une seule plaquette, on en trouve
16 topologiquement distincts, parmi lesquels on identifie des sphères, des
tores, des plans projectifs et des bouteilles de Klein. Un seul de ceux-ci est
non connexe. Cette méthode n’est en pratique utilisable que pour certains
problèmes de resomma.tion à topologie fixée.
En revanche, les méthodes de théorie des groupes conduisent, pour ces
modèles, à des calculs relativement économiques. Ecrivant la représentation
P
r
en termes des caractères xT = TrVT et effectuant les intégrations à l’aide
des formules (56), on est amené à considérer tous les diagrammes ayant la
topologie de surfaces fermées. La première de ces surfaces borde un cube t n dimensionnel (à 6 facej), dont il existe N d ( d - i)(d - 2)/6 positions distinctes
sur le réseau hypercubique. On en déduit le début du développement de la
fonction de partition de ce modèle
z = p0”d
(+
1
@d(d
- l)(d - 2)
d:
r#O
(
+ ..
.)
2.3 Développements de basse température - cas discret
Dans les développements de haute température, on considérait une
configuration d'interactions donnée (représentée par un diagramme) et
on effectuait explicitement terme à terme la sommation sur toutes les
configurations de champs. Nous allons maintenant adopter le point de vue
dual en partant d’un &at ordonné minimisant l’énergie (ou maximisant le
poids de Boltzmann) en le modifiant peu à peu, prenant ainsi en compte les
excitations successives. Les techniques different suivant que le champ prend
des valeurs discrètes ou continues. Nous évoquerons le cas d’un champ à
valeurs continues dans I a sous-section suivante.
VII.2.3
METHODES DIAGRAMMATIQUES
25
Dans le cas discret, les niveaux d’énergie’(ou les valeurs de l’action) des
E l , ...), chaque
différentes configurations forment un spectre discret (EO,
niveau étant dégénéré no, nl, . . . fois. Supposons provisoirement que l’état
fondamental soit non dégénéré (no = 1)’et que chaque état excité soit
obtenu en modifiant un nombre fini de champs de l’état fondamental. Nous
reviendrons plus tard sur ces points. La fonction de partition s’écrit
et il s’agit de classer les états suivant leur énergie. Chaque configuration est
identifiée par l’ensemble des champs (pi dont les valeurs different de celle
de l’état fondamental ,pio). L’action va être récrite sous forme d’une somme
de termes So + Si S, . .. faisant intervenir un nombre croissant n de
champs modifiés
+ +
Sn
Sn(~il,.**~in)
E
(68)
i l ,...in
avec S, (,pi(O),. . . ,,pin)) = O pour n
de partition s’écrit donc
avec
f. .
212*...2,
.
> O et
SO
E
s ({,pio)}) . La fonction
= esn(vi1?...vin)- 1
( 70)
L’expression entre crochets dans (69) est développée et représentée graphiquement par des diagrammes. Les sommets sont étiquetés par les champs
pi # ,pio) différant de l’état fondamental. I1 y a également des sommets associés aux “interactions”; il sont reliés à ces sites et représentent les termes
f i j , f i j k , ... choisis dans le développement du produit (69). Les graphes
correspondants sont simples, en ce sens qu’au plus un sommet d’interaction
d’ordre n relie n sites donnés. Le développement obtenu est analogue aux’
développements de basse densité dans la théorie des gaz imparfaits.
Reprenons de nouveau l’exemple du modèle d’Ising, en présence d’une
source extérieure constante positive h. Ce champ est destiné à lever la dégénérescence entre les deux états fondamentaux C T ~ = +1 et ui = -1 d’une
+O qu’après la liquantité 2Nh. On ne prendra la limite de champ nul h
mite thermodynamique N -+ CO. Seuls les états différant de l’état fondamental
ai = +1 par un nombre fini de spins retournés contribueront. Pour un réseau
de N sites ayant chacun q voisins, l’action s’écrit
--f
26
METHODES DIAGRAMMATIQUES
VII.2.3
Le premier terme de cette expression fournit la contribution de l’état fondamental exp 3PqN. Le second terme indique que la contribution de chaque spin
retourné est un facteur exp(-2pq). Le dernier terme attribue aux lignes du
diagramme la quantitii (exp4p - 1 ) représentant l’effet des interactions.
Les premiers diagrammes sont indiqués sur la figure 9. Prenons de
nouveau comme exemple le réseau hypercubique à d dimensions, avec q =
2d. Les nombres de c:onfigurations des diagrammes sont respectivement N ,
a N ( N - l ) , N d , B N ( N - l ) ( N - 2 ) , N d ( N - 2 ) , Nd(2d-1) et O . En conséquence,
a
a
a
I
a
a .
* i i A
c.
Figure 9 : Premiers termes du développement de basse température du
modèle d’king.
La variable du développement est ici exp(-4@). Remarquons que la première
partie du terme d’interaction, exp(lp), tend à diminuer l’ordre du dévelop
pement; il va ainsi compenser exactement la contribution des sites situés à
l’intérieur d’un amas ‘de spins retournés qui interagissent avec leurs q voisins.
Seuls resteront donc les termes d’interface. Comme la surface d’un amas croît
avec le nombre de spins qui le composent, on est assuré de pouvoir réordonner
la série en puissances croissantes de exp(-4p) de telle f q o n que seul un nombre
fini de diagrammes contribue à un ordre donné. Une exception se produit pour
d = 1; quelle que soit la longueur d’une séquence de spins retournés, celle-ci
fournira un terme exp(-8p). On a ici le reflet de la dimension critique inférieure dc = 1du modèle d’king, phénomène déjà discuté au chapitre I (volume
1). La phase de basse 1,empérature disparaît et le développement à partir d’une
phase ordonnée perd son sens. Le développement de basse température met en
évidence la compétition entre termes énergétiques et entropiques. Celle-ci est
à l’origine de l’analyse de Peierls (1936) qui conduit à la preuve de l’existence
de phases ordonnées it basse température en dimension égale ou supérieure à
deux. L’argument de Peierls a inspiré de nombreuses généralisations.
I1 faut aussi remarquer que les propriétés de positivité observées dans le
développement à haute température de la fonction de partition ne sont plus
valables. Une conséquence est que l’analyse de ces séries révèle fréquemment
la présence de singularités complexes, qui en limite parfois l’utilité.
VII.2.3
METHODES DIAGRAMMATIQUES
27
Les développements de basse température nécessitent la connaissance
de l’état fondamental qui minimise l’énergie. En l’absence d’un champ extérieur, celui-ci n’est généralement pas unique. Dans le cas des modèles de
spins ferromagnétiques, un champ extérieur infinitésimal suffit à lever complètement la dégénérescence dans la limite thermodynamique. A faible température et champ nul, les états intermédiaires nécessaires pour passer d’un
état fondamental à un autre ont une énergie infinie à la limite thermodynamique; ces états sont totalement séparés, et il ne faut donc n’en considérer
qu’un seul, décrivant une phase pure.
Dans d’autres cas, la situation peut être plus complexe. Ainsi, dans un
modèle d’king antiferromagnétique, deux spins voisins tendent à prendre
des valeurs opposées à basse température. Cette contrainte ne peut être
satisfaite pour tous les liens sur certains réseaux; sur un réseau triangulaire
par exemple, elle est nécessairement violée pour un lien au moins sur chaque
triangle élémentaire. Cela entraîne une dégénérescence importante de l’état
fondamental, suivant la répartition de ces liens, dits frustrés. Par la suite,
il faut tenir compte du fait qu’un état donné peut être considéré comme
une excitation de plusieurs états fondamentaux et donc être représenté par
plusieurs diagrammes relatifs à des “vides” différents, qui communiquent
ainsi entre eux.
(i) Etudier la dégénérescence du modèle d’Ising antiferromagnétique sur
un réseau triangulaire en utilisant les expressions du chapitre II.
jauge
(ii) Déterminer le développement de basse température du modèle de
2 2 sur réseau, dont l’action est
P
Les champs uij prennent les valeurs f l . L’état fondamental est celui où chaque
terme de plaquette vaut + l . Cette contrainte se résout en exprimant que le
champ sur chaque lien est donné par un terme de jauge pure
aij
= sjsj
(Si
= *l)
pour des valeurs arbitraires des variables si aux différents sites du réseau.
L’état fondamental est donc dégénéré autant de fois qu’il y a de configurations
des { s i } , soit 2 N .
Relativement à une configuration de pure jauge, les diagrammes de
basse température sont formés de liens tels que ajj = -sisj. Cependant,
le changement d’état fondamental par renversement d’un si revient à changer
le signe des variables O sur tous les liens issus d’un site donné i. On est donc
amené à considérer comme équivalents deux diagrammes qui ne d i a r e n t que
par l’effet d’une transformation de jauge sur tous les liens issus d’un ensemble
de sites (figure 10).
(73b)
28
METHODES DIAGRAMMATIQUES
VII.2.4
Figure 10 : Diagrammes de basse température équivalents pour une
théorie de jauge sur rtiseau.
2.4 Développement de basse température
-
cas continu
La méthode exposcie au paragraphe précédent nécessite quelques am&
nagements pour être appliquée au cas continu. En effet, les excitations ne
sont plus locales, mais deviennent collectives (ondes de spin). La formule
(67) est une intégrale, et doit être évaluée par la méthode du col et ses corrections perturbatives (éventuellement renormalisées). Cette technique a été
utilisée maintes fois dans cet ouvrage, et nous n'allons qu'en rappeler brièvement le principe. Le (développement se fait autour d'un état fondamental
{ cpp}, satisfaisant à l'équation du col
L'action est développé'e au voisinage de cet état maximisant l'action en
isolant une partie quadratique définie négative
La fonction de partition s'écrit alors
Le développement diagrammatique est obtenu en développant l'opérateur
exp V({6/6ji}) en série. Chaque monôme de V est associé graphiquement à
un vertex. A source j nulle, l'effet des dérivations est de joindre, de toutes
VII.2.4
METHODES DIAGRAMMATIQUES
29
les manières possibles, ces vertex par des lignes auxquelles on attache un
propagateur (A-l)ij (théorème de Wick).
A la différence du cas discret, on obtient ainsi un développement en
puissances de /3-’ au lieu de exp(-P). En effet, A-l est proportionnel à
0-l’ et, bien que V contienne aussi un facteur p, le nombre de propagateurs
l’emporte sur le nombre d’interactions, suivant le comptage standard du
nombre de boucles. Le facteur B-’ joue ici le rôle de la constante h.
Remarquons que la configuration stationnaire cpo est indépendante de p.
Lorsqu’on cherche à expliciter ces séries, le problème le plus sérieux est
l’existence de modes nuls, vecteurs propres de A pour la valeur propre O, et
en particulier ceux qui proviennent du théorème de Goldstone. L’opérateur
A est alors seulement semi-défini et ne peut plus être directement inversé.
I1 est nécessaire d’isoler ces degrés de liberté et de les traiter par intégration
directe et non par la méthode du col, inadéquate. Un exemple d’un tel
traitement est donné au chapitre VI paragraphe 2.4 (volume 1) pour le
calcul des corrections au champ moyen des systèmes de jauge continus.
Une méthode générale consiste à introduire un terme brisant la symétrie,
dont on prend ensuite la moyenne. Pour cela, introduisons une fonction
non invariante f(cp) brisant la symétrie. Dénotons par gcp la transformée de’
la configuration ‘p par l’action du groupe G, et supposons que l’équation
f(gcp) = c ait une solution unique g E G. I1 se pourrait qu’il n’existe aucune
fonction possédant cette propriété globale ; cette difficulté est généralement
esquivée en demandant que la propriété précédente ne soit valable qu’au
voisinage de l’identité. Pour un groupe d’invariance global, il suffit en fait
que f(gcp) = c ne détermine g qu’à une transformation du petit groupe
Go de cpo près (ce sous-groupe de G laisse cpo invariant et en conséquence
tous les termes de l’action développée au voisinage de cp”). Cette restriction
n’apporte que des complications inessentielles dans la suite, et nous laissons
le lecteur modifier les formules pour en tenir compte.
Ecrivons
avec
En principe, le jacobien devrait être écrit ldet M(cp)l, mais la valeur a b s e
lue peut être omise, car le déterminant ne s’annule pas compte tenu de nos
hypothèses. Introduisons l’identité (77) dans l’intégrale fonctionnelle définissant 2 et utilisons l’invariance de l’action de la mesure et du jacobien.
On obtient
s,
2=
s
es(9)S(f(cp)- c)detM(cp)dcpdg
30
METHODES DIAGRAMMATIQUES
VII.2.4
On peut maintenant intégrer sur g. De plus, puisque le résultat est indépendant de c , on peut aussi intégrer sur c avec un poids arbitraire normalisé
expF(c) (par exemple proportionnel à exp - c 2 ) . D’où l’expression
2=
J
exp [S(cp)
+ F(f(cp))+ TrlnM(cp)] dcp
(79b)
Sous cette forme symbolique, l’invariance est apparemment brisée par la présence du terme F(f(cp))et la méthode du col s’applique sans difficulté. Le
terme detM(cp), non local, peut être remplacé par une intégrale grassmannienne équivalente en introduisant des champs auxiliaires $,$I (fantômes de
Faddeev-Popov)
Une illustration typique est fournie par le modèle u non linéaire (modèle O ( n ) )à deux dimensions (qui est la dimension critique inférieure) dans
la phase de basse température. Ce système à symétrie globale a un comportement similaire à celui des champs de jauge en dimension quatre, et est également asymptotiqueinent libre. Comme il est beaucoup plus simple que son
homologue, il a été étudié en détail en vue d’extraire des renseignements sur
la génération dynamique de masse par une utilisation habile de calculs perturbatifs. De plus, des conjectures intéressantes ont été faites concernant une
expression exacte de la matrice de diffusion (Zamolodchikov). Le lecteur trouvera dans la littérature un traitement détaillé du modèle u et de ses diverses
généralisations à une variété homogène arbitraire (plutôt que la sphère). Ces
généralisations ont éi,é en particulier très utiles dans l’application de la méthode des répliques aux systèmes désordonnés bidimensionnels (chapitre X)
ou en théorie des cordes.
(i) Partant d’un modèle originellement invariant par G, étudier la symétrie résiduelle sous la forme (79c).
(ii) Pour le mocèle vectoriel bidimensionnel, dont l’action s’écrit
montrer que la renormalisation de la constante de couplage est donnée à l’ordre
le plus bas par les expressions
n-2
1 =-1
g2
p - ga
aP
go”
+
2aIn pa +. . .
=-
e
g
3
+ . ..
4a
où p fixe l’échelle de normalisation et où a est l’inverse du facteur de coupure
ultraviolet. Ces formules expriment la propriété de liberté asymptotique ultraviolette, montrant que, lorsque l’échelle de masse p augmente indéfiniment, le
VII.2.4
METHODES DIAGRAMMATIQUES
31
couplage renormalisé g s’approche de O lorsque n > 2. Le facteur ( n - 2) est
en conformité avec le fait que cette propriété n’est valable que pour n > 2, le
cas limite étant le modèle X Y pour lequel n = 2. Un prolongement analytique
pour n inférieur à 2 inverserait les conclusions.
2.5 Développement en champ fort
L’introduction d’un champ extérieur dans les développements décrits
précédemment ne modifie pas de façon importante la dérivation des séries
de basse température. I1 supprime néanmoins le problème des extrema dé&.
nérés. Pour le modèle d’Ising, par exemple, la contribution diagrammatique
du vertex devient
z = exp(-2H - 2Pq)
où H est le champ extérieur, alors que celle du lien reste
u = exp(4P) - 1
(83)
Le développement apparaît naturellement comme polynômial dans les variables u et z , et le problème rencontré au paragraphe 2.3 consistait à le
réordonner dans la variable de basse température (1 u)-’.Si on cherche,
au contraire, un développement valable autour du champ extérieur H infini,
ce réarrangement devient inutile, la variable appropriée étant z , qui compte
le nombre k de sommets du diagramme. Le nombre de liens, à k fixé, étant
borné (par i k ( k - 1) en dimension infinie, par iqlc à nombre de voisins q
fixé sur le réseau), chaque coefficient de ce développement est un polynôme
en u de degré correspondant.
Ainsi, pour le modèle d’king, la formule (72) se récrit
+
1
-In 2 = H + Pd+ z
N
+ z2(du- i)+ z3[d(2d- l) u 2- 2du+ f]+ O(z4) (84)
par lecture directe des graphes de la figure 9.
L’utilisation de ces développements a été illustrée au chapitre III
(volume 1) lors de l’étude de la singularité de Lee et Yang.
2.6 Champs fermioniques
L’extension des règles diagrammatiques aux intégrales grassmanniennes
ne pose aucun problème sérieux, si l’on tient compte soigneusement des
propriétés d’antisymétrie (chapitre II, volume 1). Donnons un exemple
élémentaire en démontrant par la méthode perturbative un résultat familier
concernant les intégrales gaussiennes.
Soit une intégrale sur des variables anticommutantes { q i , q i } , en présence de sources {vi,vi}, elles-mêmes anticommutantes
32
M ETHODES DIAGRAMMATIQUES
VII.2.6
=det(m - A)expfj(m - A)-’q
(85)
Dans le développement qui va suivre, le terme de masse joue un rôle
essentiel et est incorporé à la mesure d’intégration. La seconde exponentielle
de l’intégrand est développée en série et interprétée diagrammatiquement.
Chaque terme comportant un facteur ’A
:
est représenté par une ligne
orientée allant du site i au site j. Lors de l’intégration sur les variables
grassmanniennes qz et ijf , les seuls termes donnant une contribution non
nulle sont 1 et gq:. En conséquence, les diagrammes à retenir sont formés
de boucles fermionique:; orientées fermées et d’arcs orientés ouverts partant
d’une “source’’ f j et se terminant sur un “puits” q . Une boucle ( i l i z . . . inil)
fournit une contribution - Tr (A,,,, . . . A,,,,,) /nmn. La trace porte sur
les indices (a@ des niatrices AG’. Le signe moins pour chaque boucle
fermionique provient de l’anticommutation nécessaire pour ramener l’ordre
de tous les champs grassmanniens sur lesquels on intègre dans le sens
standard q, ij. Enfin le facteur i / n résulte d’une compensation incomplète
des facteurs de symétrie.
En principe, nous devons aussi omettre les diagrammes où deux lignes
passent en un même site i avec le même indice a. Cette règle d’exclusion
peut cependant être tout simplement ignorée. En effet, nous avons vu que
la méthode des cumulants permet de s’affranchir de ce type de contrainte.
Or, du fait de l’identitib
expmijq = 1
+ mqq
valable dans les algèbres de Grassmann, les règles diagrammatiques pour
les cumulants coïncident avec les règles initiales.
Vérifier qu’effectivement la somme des contributions relatives à l’ensemble des diagrammes où plusieurs lignes passent en un point z (avec le même
indice interne a ) s’annule.
Une autre conséqcence de la trivialité de la transformation en cumulants est l’exponentiat.(on immédiate du développement diagrammatique.
En l’absence de sources, l n 2 est la somme des contributions de tous les
diagrammes comportant une seule boucle. Quant au seul terme connexe
comportant des sources, proportionnel à fj,qJ, il est donné par la somme
des contributions des diagrammes formés d’un arc simple (ij). On a ainsi
reconstruit de façon perturbative le développement en A / m de
VII.2.6
METHODES DIAGRAMMATIQUES
lnZ(q,q)=Trln
33
(86)
D’autres exemples seront présentés au chapitre X. Notons ici que le modèle d’Ising tridimensionnel admet une présentation grassmannienne non
triviale comportant des termes d’interaction quartiques et conduisant à
des règles diagrammatiques complexes, en relation avec les surfaces fermioniques.
3. Enumération de graphes
3.1 Nombres de configurations
Nous avons déjà remarqué que la notion de graphe libre permettait
de séparer l’influence du réseau utilisé sous forme d’un nombre de configurations du diagramme n ( G ) . Ce nombre dépend de la taille N du réseau
considéré. Dans le cas d’un réseau fini avec conditions périodiques, il est
clair qu’un diagramme connexe aura un nombre de configurations proportionnel à N , en raison de la symétrie de translation. Ceci est valable au
moins pour N suffisamment grand afin d’éviter des configurations spéciales
où la périodicité est mise à profit pour refermer une boucle. Bien que nous
ne considérons pas ces termes par la suite, leur étude est légitime et peut
révéler des effets de taille finie intéressants. Généralement, n ( G ) sera un
polynôme dont le degré en N est le nombre de parties connexes du graphe.
La partie linéaire en N , f i ( G ) ,est particulièrement importante, car c’est la
seule qui subsiste lors du calcul de In 2, quantité extensive proportionnelle
à N.
Pour évaluer ces nombres de configurations, nous nous restreindrons
aux graphes simples, puisque la multiplicité d’un lien n’affecte pas le nombre
de configurations. Le calcul peut être ensuite réduit à l’évaluation de certains
diagrammes multiplement connexes par l’utilisation du théorème suivant.
Considérons l’ensemble des graphes G I ü G2 = { G } pouvant être obtenus
à partir de deux graphes G1 et G2 donnés par la mise en commun de
certains de leurs éléments. Si on désigne par Ic(G;Gl,Ga) le nombre de
façons différentes dont G peut être scindé en G1 et G2, on a alors la formule
Nous appliquerons cette formule à divers cas.
[a) Réduction aux diagrammes connexes
Si GI et Ga sont des graphes libres ayant respectivement cl et c2 parties
connexes, G aura au plus c1 c2 parties connexes, et un seul des graphes
G1 ü G2 aura exactement c1 + c2 parties connexes (celui ne mettant en
+
34
METHODES DIAGRAMMATIQUES
VII.3.1
commun aucun des é!éinents de G I et G2). De la sorte, on peut relier le
nombre de configurations d’un graphe à ceux de graphes ayant moins de
parties connexes. Ainsi, avec deux graphes triangulaires, la relation
n ( A ) 2= 2 n ( A A ) + 2 n ( M ) + 2 n ( @ ) + n ( A )
(88)
permet de ramener le calcul de n ( A A ) aux nombres de configurations de
graphes connexes. Des formules similaires peuvent être utilisées pour les
théories de jauge, où les graphes ont la topologie de surfaces. Par exemple,
pour deux cubes,
(b) Réduction aux diagrammes multiplement connexes
La même méthode peut être employée pour deux graphes G I et G 2
ayant une racine commune i. Dans les graphes intervenant au membre de
droite de (87),un seul aura un point d’articulation i. Ainsi,
n(AiI2= 2n(
)
+ 2n(@) +.(Ai)
(90)
2
Par ailleurs, lorsque l’on somme le nombre de configurations d’un graphe
avec racine i , sur la position de cette racine, on obtient N p fois le nombre de
configurations du graphe libre correspondant, où p est le nombre de points
équivalents au vertex choisi pour racine par automorphisme du graphe libre.
La formule (90) de notre exemple devient alors
[3Nn(A)]’= 2Nn(
w)+ 4Nn( 6 ) )+ 3 N n ( A )
(91)
(c) Réduction le long d’un lien
On peut encore considérer le cas où GI et G2 ont une ligne commune
i j , ce qui permet de réduire les graphes pouvant être séparés en deux par
coupure le long d’une ligne. Ainsi,
1
4 A 3 ) 2
=2 4
6) + n(&)
(92)
3
Compte tenu du fait qt.’un réseau de nombre coordination g possède $Ng
liens, on en déduit
[3Nqn(A)12 = 2Nqn( 6 ) )
+ 3Nqn(A)
(93)
Après ces réductions, les diagrammes qui subsistent sont beaucoup
moins nombreux, mais leur nombre de configurations ne peut plus être
obtenu à l’aide de méthodes générales simples et doit être examiné cas
par cas. La table I compte les anneaux fermés, la table II présente quelques
VII.3.1
35
METHODES DIAGRAMMATIQUES
diagrammes irréductibles plus complexes pour un certain nombre de réseaux
classiques (triangulaire et carré à deux dimensions, cubique, cubique centré
et à faces centrées en dimension trois). Finalement, la table III montre les
diagrammes intervenant en théorie de jauge sur un réseau hypercubique à
d dimensions.
-
- triangulaire
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
20
22
24
26
-
2
3
6
15
42
123
380
1212
3966
13265
45144
155955
545690
1930635
6897210
24852576
carré
C.C.
cubiaue
c.f.c.
1
3
12
2
22
148
7
207
2736
28
2412
61896
124
31754
1579324
588
452640
43702920
8
33
168
970
6168
42069
301376
2241420
17173224
134806948
1079802216
8798329080
...
2938
6840774 1282524918
...
15268 108088232
...
81826 1768560270
...
449572
2521270
14385376
-
Table I :Nombre réduit de configurations n(G) pour des graphes en boucles
sur les réseaux triangulaire, carré, cubique, cubique centré (c.c.) et cubique
à faces centrées (c.f.c.).
3.2 Graphes multiplement connexes
La méthode que nous avons utilisée jusqu’ici se révèle assez rapidement
complexe de par le nombre de termes qu’elle met en jeu. I1 est en particulier
nécessaire de calculer tous les graphes, qu’ils soient multiplement connexes
ou non. I1 est bien sûr aussi possible de faire appel aux méthodes générales
de cumulants et transformées de Legendre, mais on perd alors le bénéfice de
la simplicité des diagrammes. Une troisième méthode, applicable modèle par
modèle et réseau par réseau, permet d’exprimer directement les résultats en
n’utilisant que les graphes multiplement connexes et simples.
Le point de départ est le théorème suivant. Si A ( G ) et B ( G ) sont deux
ensembles de poids satisfaisant à la relation
36
VII.3.2
ME:THODES DIAGRAMMATIQUES
-
oli+ 7
Diagramme
triangulaire
carré
cubique
C.C. c.f.c.
12
I- I
B I - l- l
41- 1 - 1
@ I 6 I - 124
Q I 3 I - /
@ I - 1-1
@ I - 1-1
D I - 1 - 1
8 1
1 1
A l -
-
2 l1
II
1
600
-
-
48
480
3888
-
3132
-
24
3
192
I
-
-
20
436
-
Table II : Nombre réduit de configurations n(G) pour les premiers graphes
irréductibles.
A(G) =
B(g)
(94)
SCG
et tels que, si G peut être décomposé en deux parties GI et Gz disjointes
pour lesquelles
VII.3.2
37
METHODES DIAGRAMMATIQUES
6.1
$d(d - l) ( d - 2)
10.1
i d ( d - l) ( d - 2)(2d - 5)
11.1
Sd(d - l) ( d - 2)(2d - 5)
12.1
- I1d2 ( d - l) ( d - 2)(12d - 29)
12.2
$d(d - l ) ( d - 2)(d - 3)
12.3
$d(d - l) ( d - 2)(d - 3)
14.1
Sd(d - l) ( d - 2)(2d - 5)2
14.2
2d(d - l ) ( d - 2)(4d2 - 22d
14.3
d(d - l )( d - 2)(d - 3)
14.4
4d(d - l ) ( d - 2 ) ( d - 3)
15.1
$d(d - l ) ( d - 2)(d - 3)(2d - 5)
15.2
+d(d - l ) ( d - 2)(d - 3)
15.3
$d(d - l)(d - 2)(d - 3)
15.4
d(d - l)(d - 2)(2d - 5)2
+ 31)
Table III : Les premiers graphes relatifs au développement de couplage fort
des théories de jauge jusqu’à l’ordre 16.
38
VII.3.2
MIETHODES DIAGRAMMATIQUES
15.5
4d(d - l)(d - 2)(4d2 - 22d + 51)
16.1
$d(d - l) ( d - 2)(4d2 - 24d
16.2
i d ( d - l)(d - 2)(d - 3)
16.3
8d(d - l ) ( d - 2)(d - 3)2
16.4
16d(d - l)(d - 2)(d - 3)2
16.5
16d(d - l) ( d - 2)(d - 3)’
16.6
i d ( d - l ) ( d - 2)(d - 3)(2d - 5)
16.7
-d(d - l ) ( d - 2)(22d2 - 113d
16.8
2d(d - l ) ( d - 2)(d - 3)
16.9
+d(d - l)(d - 2)(2d - 5)2
16.10
2d(d - l ) ( d - 2)(4d2 - 22d + 31)
16.11
4d(d - l ) ( d - 2)(d - 3)
+ 37)
+ 147)
Table III (suite)
La démonstration de ce théorème s’appuie sur l’inversion de la formule
(94)’ qui s’écrit
(- i)”‘G’B(G) =
(-i)p(g’A(~)
SCG
(96)
VII.3.2
METHODES DIAGRAMMATIQUES
39
et se démontre par récurrence sur le nombre p(G) de liens de G.
La formule (96) se prouve en appliquant la formule (94), puis les formules
(96) à tout graphe g strictement inclus dans G (d’après l’hypothèse de récur( - l ) P ( g ‘ ) . L’appariement des
rence). Le coefficient de B ( g ) est alors
graphes g’ et g” qui ne different que par un lien arbitraire fixé n’appartenant
pas à g, montre que la paire correspondante ne contribue pas à ce coefficient.
Seul reste non apparié le graphe g’ formé de G auquel on a ôté le lien choisi;
on arrive ainsi à (96).
xG,g,,g
Les graphes g contribuant à (96) se divisent en trois catégories: g C G I ,
g C G2 et g = g1 ii 92 avec g1 G G I , g 2 C G2 tous deux non vides. Le
théorème peut alors se démontrer sans difficulté.
Appliquons maintenant ce résultat à une théorie dont le réseau est
limité aux liens et sites d’un graphe donné. Choisissons A ( G ) = lnZ(G). I1
est clair que les hypothèses du théorème sont vérifiées lorsque G n’est pas
connexe. On en déduit donc, pour le réseau complet
ln2=
c
(97)
g connexe
où les poids B peuvent être calculés directement par la formule (94). Aux
ordres les plus bas, jusqu’à trois liens, on a
Cette procédure se prête bien à une automatisation. Le lecteur prendra
garde au fait que la formule d’inversion (96), valable pour les graphes
étiquetés, ne l’est plus pour des graphes libres.
Dans un deuxième temps, on applique ce même théorème aux graphes
articulés, pour lesquels la relation (95) reste valable.
4. Résultats et analyse
4.1 Techniques d’analyse des séries
Les méthodes que nous avons décrites fournissent des séries qui seront
tronquées à un certain ordre n dans un calcul explicite
40
METHODES DIAGRAMMATIQUES
VII.4.1
On se trouve alors confronté à deux types de questions.
(1) Trouver les singularités zi de la fonction f et étudier le comportement de f dans leur voisinage. En particulier, on aimerait savoir s’il est’
vraisemblable ou non de supposer que ce comportement est de la forme
et, dans ce cas, détermmer l’exposant critique yi et, si possible, l’amplitude
Ai.
(2) Extrapoler la fonction en dehors de son cercle de convergence. Par
exemple, on peut voulciir estimer sa limite f ( z = KI).
Bien entendu, ces problèmes ne peuvent être résolus stricto sensu,
et toutes les méthodes vont supposer une information supplémentaire :
singularité des coefficients fk propriété d’analyticité, comportement connu
dans une région, etc, que l’on cherchera à exploiter en choisissant alors
la méthode la plus appropriée. Cette information fait malheureusement
souvent défaut, et on en est alors réduit à procéder aveuglément, en essayant
différentes techniques et en comparant leurs résultats. Nous ne donnerons ici
qu’un aperçu rapide de ces méthodes, amplement décrites dans des ouvrages
spécialisés.
I1 faut noter que l’on a acquis des connaissances précieuses sur le comportement aux grands ordres des séries perturbatives en théorie continue des
champs. L’origine en est un travail de Bender et Wu sur l’oscillateur anharmonique généralisé par Lipatov aux théories des champs simples. Ceci constitue
un outil important pour l’analyse de ces séries. Dans le cas des modèles sur
réseau, rien d’aussi s,jstématique n’a été fait, bien qu’il existe des résultats
isolés qui reflètent en particuler la nature du réseau.
La méthode la plu:; directe est celle des quotients. Si fk est réel, et si la
singularité ZO la plus proche est unique, isolée et “algébrique” (c’est-à-dire
de la forme (loo)), le rapport de deux coefficients successifs se comporte
comme
-fk
= zo [ 1 + l + Y +O(&]
1
f k+l
L’étude de la limite de cette suite et de la façon dont elle s’en approche va
donc fournir à la fois ;:O et y. L’utilisation d’accélérateurs de convergence
comme les tables de Neville est très pratique dans cette étude.
VII.4.1
41
METHODES DIAGRAMMATIQUES
Les tables de Neville résultent d’une disposition commode des formules
d’itération d’ilitken. Si l’on désigne par f (z 1x0,.. . ,x k ) l’unique polynôme
en z de degré k coïncidant avec f(x) aux points 20,.. . ,X k , les formules
permettent une construction récurrente de formules d’interpolation à 2, 3,
... points. Si on applique cette mét,hode à une suite { u n } et si la forme
asymptotique de celle-ci est polynômiale dans la variable l / n , on est conduit
à considérer les suites successives
u n ) =(n
+ i)u,+i
- nun = iimun
u ~ 2 ) = + { ( n + 2 ) -nui’)
u~~,
un)
=$ { ( n+ 3)u?i1
1
+O
=iimu,+0(7)
- n u n ) } = iimun + O
1
1
(n.)
...
Dans la pratique, on observe tout d’abord une amélioration de la convergence,
puis une détérioration due à des instabilités (le terme correctif, d’ordre croissant en l / n , voit son coefficient grandir).
Les problèmes apparaissent lorsque le nombre de termes disponibles
n’est pas suffisant pour que la singularité impose le comportement présupposé de la forme (100). Cette méthode est également limitée à une singularité
réelle, et ne peut en traiter qu’une seule à la fois.
Les approximants de Padé fournissent un moyen puissant d’analyse
simultanée de plusieurs singularités, avec de grands domaines de convergence. L’idée est d’approximer une fonction analytique par une suite de
fractions rationnelles. Plus précisément, l’approximant de Padé [ L / M ]( 2 )
PL(z)/QM
( z ) est l’unique fraction rationnelle dont le développement de
Taylor coïncide avec les termes connus de la série jusqu’à l’ordre L M
inclus
+
f ( z ) - ~ ‘ L ( ~ ) / Q M ( z=) O(2L+M+1 )
(104).
+ +
+
L’équation (104) donne ( L + M + 1) relations pour ( L 1) ( M 1) - 1
inconnues. Les approximants de Padé ont des domaines de convergence
plus importants que les séries de Taylor. Ils reconstruisent parfaitement
les pôles par construction même, et sont donc particulièrement adaptés à
l’étude des fonctions méromorphes. On observe expérimentalement qu’ils
peuvent simuler des points de branchement par accumulation successive
de pôles et de zéros le long d’une coupure. En cela, ils répondent au
désir d’extrapoler les séries en dehors de leur cercle de convergence. Leur
42
METHODES DIAGRAMMATIQUES
VII.4.1
convergence prend cependant parfois une allure erratique. On observe aussi
sur certains approximants l’apparition de singularités supplémentaires sans
rapport avec celles de la fonction que l’on examine.
La singularité algébrique (100) n’a pas la forme la plus adaptée à ces
approximants. Cependant, s’il n’y a pas de singularité sous-dominante au
même point, c’est-à-dire si ( z - zo)-’f(z) est régulière en zo, la dérivée
logarithmique
1 (if y
partie régulière
f ciz z - zo
+
a un pôle isolé et c’est; donc à elle que l’on doit appliquer la méthode.
Dans les problèmes rencontrés en pratique, on peut voir des singularités non
factorisables ( A ( z ) ( z- z o ) Y B ( z ) ) ,ou la confluence de deux singularités
( A ( z- z0)Y B ( z - z0)D . .), etc. La méthode devient alors moins précise.
En général, la détermination de la position zo est relativement correcte,
alors que l’exposant critique y est plus instable.
Les approximants intégraux sont une généralisation des précédents.
Ils sont la solution d’une équation différentielle d’un type bien choisi, à
coefficients polynômiaux déterminés de telle façon que f( z ) soit également
solution (à l’ordre connu). Par exemple, l’équation linéaire du premier ordre
+
+.
+
fournit à la fois les approximants de Padé classiques en imposant Q k
O
( k E -1)’ et les apprmimants de la dérivée logarithmique en choisissant
RL E O. Ces approximants sont singuliers aux zéros de Q et se comportent
selon
A ( z - ZO)’
+B
Ils sont ainsi mieux adaptés à l’étude de certains comportements sousdominants au voisinage des singularités et conduisent alors à de meilleurs
déterminations des exposants critiques. Mais on est souvent noyé sous le
nombre d’approximants possibles; l’écart entre les différentes déterminations
est parfois important et il est alors difficile de choisir entre elles. Nous
noterons finalement qui: ces approximants intégraux se généralisent au cas
de fonctions à plusieurs, variables et permettent ainsi d’aborder l’étude des
points tri-critiques.
La connaissance de certaines propriétés d’analyticité de la fonction
permet de combiner au mieux les transformations de variable et les méthodes
décrites plus haut. NOUSen donnerons un seul exemple. Supposons que la
fonction possède des singularités confluentes en un point z, connu, soit
VII.4.1
METHODES DIAGRAMMATIQUES
f ( z ) admet alors une représentation intégrale de forme
et sa transformée
est une fonction méromorphe. Les coefficients du développement de Taylor
de g ( t ) sont aisément déduits de ceux de f(z). Les approximants de Padé,
mal adaptés aux singularités confluentes de f(z), le sont en revanche parfaitement pour analyser la structure méromorphe de g ( t ) . C’est la méthode
dite de Padé-Mellin.
En conclusion, l’extraction d’exposants critiques et d’amplitudes à
partir des séries perturbatives est un art. Mis à part quelques cas simples,
elle requiert une expertise importante.
4.2 Un exemple
Nous ne pouvons énumérer ici toutes les séries connues pour les modèles
les plus simples. Le chapitre VI (volume 1) donne quelques exemples concernant les champs de jauge. Nous nous limiterons à citer quelques résultats
relatifs au modèle d’king sur un réseau cubique centré, système pour lequel
les séries disponibles sont particulièrement longues. D’autres séries figurent’
dans les références données en fin de chapitre.
Utilisant la variable t G tanh p, l’énergie libre à haute température est
donnée par le développement
1
- In 2
N
+ 12t4 + 14%‘ + 2496t’ + 52168t1’+
+ 1242078t12+ 32262852t14 + 892367762tl‘ + 0(t1’)
= In 2 - 4 in( 1+ t )
(109)
Cette série permet d’obtenir l’énergie interne et la chaleur spécifique par
dérivations successives, et on peut déterminer ainsi l’exposant critique (Y.
La fonction de corrélation ( C J O C T ~ ) dépend d’une variable supplémentaire
x; les diagrammes de haute température correspondants ont des sommets
impairs en O et x. On est principalement intéressé par les propriétés à grande
distance de cette fonction. I1 revient au même d’étudier sa transformée de
Fourier
44
METHODES DIAGRAMMATIQUES
VII.4.2
X(k) = z e i k . x (ooox)= x - -k
P2 2 +O(k4)
2d
pour de petites impulsions k. Ici x est la susceptibilité magnétique statique.
L'anisotropie du réseau ne se manifeste qu'à partir des termes d'ordre 4
en k. Si on ne désire pas étudier ces phénomènes d'anisotropie, on peut se
restreindre à l'étude des. moments sphériques
toujours convergents à haute température (car la fonction de corrélation décroît exponentiellement). En particulier, = 1+po diverge à la température
critique avec un exposant y. De même,
= 2dx/p2 est une longueur de
corrélation effective, dont on attend une divergence qui fournit l'exposant
u. Pour le réseau cubique centré étudié, on dispose des séries suivantes
x
x =1+
+ 56t2 + 392t3 + 2648t4 + 17864t' + 118760t6 -k 789032t7
+ 5201048t' t-34268104t' + 224679864tl' + 1472595144tll
+ 9619740648t12+ 62823141192t13+ 409297617672t14
+ 2665987056:200t15+ 17333875251192t16+ 112680746646856t17
+ 731466943653464t" + 4747546469665832t"
+ 3077910Afi7!i700312t20+ 199518218638233896t21+ O(t22)
8t
(112)
et
,UZ
=8t
+ 128t2 + 1416t3 + 13568t4 + 119240t' + 992768t6
+ 7948840t7 + 61865216t' + 470875848t' + 3521954816t"
+ 25965652936tl' + 189180221184t'2 + 1364489291848t13
+ 9757802417152t14+ 69262083278152tl' + 488463065172736t16
+ 3425131086090312t17+ 23896020585393152t1'
+ 1659582390(35454632t1'+ 1147904794262960384t2'
+ 7910579661767454248t21+ O(t22)
(113)
La positivité des coefficients entiers de ces deux séries nous assure que la
singularité la plus proche est réelle et positive.
Illustrons les techniques d'analyse des séries sur le cas de la susceptibilité. Deux difficultés se présentent immédiatement. La première est une symétrie du modèle. Le réseau choisi se scinde en effet en deux sous-réseaux cubiques simples décalés, et l'interaction n'agit qu'entre spins de sous-réseaux
VII.4.2
METHODES DIAGRAMMATIQUES
45
différents; l’opération consistant à changer l’orientation de tous les spins
d’un sous-réseau ainsi que le signe de la température est donc une symétrie. Nous observerons donc une singularité antiferromagnétique à -t, dont
il faut tenir compte. En conséquence, on peut subdiviser la susceptibilité
en parties paire et impaire, suivant que la paire de spins considérée est
ou non sur le même sous-réseau. La partie impaire est reliée à la partie
paire par l’adjonction d’une contribution spatiale d’une maille de réseau, ce
qui revient approximativement à la multiplier par l’énergie interne, avec un
exposant (Y - 1. On s’attend donc à ce que le coefficient xn de la série (112)
se comporte suivant
xn N An7-ltLn[i + B(-i)nna-7+1 1
On est ainsi amené à considérer la quantité
et l’exposant critique y apparaît alors comme la limite de la suite
La seconde difficulté est l’existence d’une singularité confluente prédite
par le groupe de renormalisation. La correction à la formule (114) est de
la forme (1 cn-*l), où A1 = wu. Il n’est donc pas possible d’utiliser
de manière efficace les tables de Neville pour améliorer la convergence des
suites, et on observe effectivement de fortes instabilités si l’on tente de le
faire. Cependant, si l’on connaît t, (dont on a une bonne détermination),
on peut utiliser la méthode de Padé-Mellin décrite plus haut. Une autre
possibilité est d’employer la valeur approximative A1 = 0.50 pour supprimer
cette singularité. Ainsi, Zinn-Justin considère la moyenne jjn = ( ~ ~ + 2 y ,+- ~
yn-2)/4, puis la quantité
+
qui remplace l’équation (115) en éliminant totalement la correction due à
la première singularité confluente.
Toutes ces méthodes ont permis d’extraire de façon cohérente des séries
de haute température les résultats suivants
tC1 =6.3543
y =1.239 f 0.0025
u =0.6305 f 0.0015
q =0.035 f 0.003
46
METHODES DIAGRAMMATIQUES
VII.4.2
I1 est à noter que la longueur de corrélation effective calculée à partir de p2
n'est pas la véritable longueur de corrélation qui caractérise la décroissance
exponentielle
quantité dont on peut également construire des développements. On se
reportera au paragraphe 3.5 du chapitre VI (volume 1) pour une discussion
des difficultés que l'on peut rencontrer pour obtenir les séries correspondantes.
Les développements de basse température sont un peu plus irréguliers
et sont donc moins faciles à exploiter. Pour la fonction de partition, on a
l'expression suivante en termes de la variable u = exp( -4P)
In 2 =u4
+ 4u7 - 4 i u 8 + 28u"
- 64u" + 48$u12 + 2 0 4 ~ ' ~7 8 6 d 4
+ 1 1 6 4 ~ '+- ~9 2 2 a . 1 -~ ~8~7 6 0 +~ 2~0~0 3 2 ~ ~-' 9164~"
- 8 4 2 1 5 $ ~+~2~9 4 6 7 7 8 ~ ~-' 3 7 8 9 9 6 ~
-~5 ~6 9 7 0 4 ~ ~ ~
+
- 694845120~
+~2~1 6 0 7 8 1 0 8 6 ~+~0~( u 2 ' )
- 5 4 0 1 2 8 8 2 ~ ~1~1 2 6 4 0 8 9 6 ~
-~5~1 6 4 4 6 4 ~ ~ ~
(120)
La répartition des coefficients positifs et négatifs illustre le commentaire fait
plus haut concernant lii, possibilité de singularités complexes. Nous avons
utilisé une notation abrégée, écrivant par exemple 4 i au lieu de (4
pour éviter les numérateurs énormes d'une notation fractionnaire.
+ i)
L'aimantation spontanée ((T)n'est pas nulle dans cette région et s'écrit
((T)=1- 2u4 - 16u" + 18u' - 1 6 8 ~ +
~ '384ul1 - 3 1 4 ~ ' ~1 6 3 2 ~ ' ~
+ 6 2 6 4 -~ 9~7~4 4 ~ -' ~1 0 0 1 4 ~ +' ~8 6 9 7 6 2 ~-~205344~"
~
+ 8 0 1 7 6 ~ . +~ ' 1 0 0 9 3 3 8 ~-~3~5 7 9 5 6 8 ~ ~+' 4 5 7 5 2 9 6 ~ ~ ~
+ 8 3 0 1 0 2 4 ~+~3832961
~
3u24 - 7 9 4 2 7 9 6 ~ ~ ~
+ 1 1 1 8 1 1 8 ~+~4~3 0 1 6 0 5 2 ~-~133595088;~~'
~
+ 0(u2')
( 121)
I1 convient d'en tenir compte pour calculer la fonction de corrélation connexe
((To(T~), = ((TOC,) - ( ( T ) ~et, pour accéder ainsi à la susceptibilité à basse
température
VII.4.2
METHODES DIAGRAMMATIQUES
47
+ X =u4 + 16u7 - 1 8 ~ '+ 2 5 2 ~ ~- '5 7 6 +~ 5~1 9~ ~ ~+'3 2 6 4 ~ ~ ~
- 1 2 4 6 8 . 1+
~ ~2~0 5 6 8 ~
+~2 ~6 6 6 2 ~- ~2 ~1 5 5 6 8 ~+~5 ~2 8 5 7 6 ~ ~ '
+
- 164616~~
-' 3014889~~' 1 0 8 9 4 9 2 0 ~-~13796840~"
~
+
- 2990961~'~ 190423962~'~
- 399739840~'~
- 22768752~"
+ 2803402560~'~- 8743064909~'~+ C1(u2')
(122)
L'analyse des pôles et résidus des approximants de Padé de la dérivée
logarithmique de ces développements permet d'estimer les exposants a', ,û
et y' au-dessous de la température critique. Ces résultats sont moins précis
que les précédents obtenus par les séries de haute température. On constate
que l'égalité y = y' semble vérifiée. Les exposants trouvés sont
p =0.312 f0.05
y' =1.25 f 0.05
Enfin, nous terminerons par le développement en champ fort, dans les
variables p = exp(-2,ûH) et u = exp(-4,û). Les premiers termes de ce
développement sont donnés par
+ (4u7 - 4$us)p' + (28u1' - 64u" + 36+u1')p3+
(1221" + 2O4ul3 - 798u14 + 948u15 - 366iul6)p4
+ ( 1 2 ~ +' ~2 1 6 ~ +' ~1 2 6 2 -~ 9072d7
~ ~
+ 17592~~'
- 14184~~
+' 4174$u2')p5 + (27u16 + 3 1 2 ~ ' ~
+ 2 3 6 8 ~ ~+' 4 3 1 2 ~ ~-' 92992~" + 275021+uz1
In 2 =u4p
+ 2 1 6 0 3 6 ~ '-~ 51444$~'~)p~
+ 7 0 4 ~ ~+'4404~'' + 1 7 6 1 6 ~ '-~ 36348~"
- 353640~"
+ (72u"
- 8 3 3 0 6 4 ~ '+
~ 3795726~'~
-7072736~
+~6798900~'~
~
+
- 3 3 4 4 7 1 2 ~ ~669438+u2')p7
~
+ O($)
Notes
Les sujets traités dans ce chapitre sont d'une nature plus technique.
Plusieurs revues et de nombreuses références figurent dans la série Phase
48
MEïHODES DIAGRAMMATIQUES
VII.Notes
Transitions and Critical Phenomena, vol. 3 intitulé Series Expansions for
Lattice Models, C. Domh et M.S. Green eds, Academic Press (1974), et plus
récemment, dans les Proceedings of the 1980 Cargèse Summer Institute on
Phase Transitions, M. Levy et al. eds, Plenum (1982).
La théorie générale des graphes est exposée dans C. Berge, The Theory
of Graphs, Methuen (1962). La technique de réduction est discutée par
F . Englert, Phys. Rev. 129 567 (1963), qui contient des références à des
travaux antérieurs.
Les développements en série, et en particulier ceux concernant le modèle
d’king, sont présentés dans C. Domb, Adv. Phys. 19,339 (1970) et dans une
série de travaux de M.F. Sykes et ses collaborateurs, J. Math. Phys. 6 283
(1965); J. Phys. A 5 624,640,653,661,667 (1972); J. Phys. A6 1517 (1973);
J. Math. Phys. 14 1060, 1066, 1071 (1973); J. Phys. A12 L25 (1979). Voir
aussi S. McKenzie, J. Phys. A8 L102 (1975) et A12 L185 (1979), ainsi que
B.G. Nickel dans les comptes rendus de l’institut d’été de Cargèse mentionné
plus haut. Les problèmes relatifs à la fonction de corrélation spin-spin sont
examinés par M.E. Fisher et R.J. Burford, Phys. Rev. 156 583 (1967).
La théorie des approximants de Padé est développée dans le livre de
G.A. Baker, Jr, Essentals of Padé Approsimants, Academic Press (1975).
Pour l’analyse des singularités confiuentes par la méthode de Padé-Mellin,
voir G.A. Baker et D.L. Hunter, Phys. Rev. B7 3377 (1973). D’autres
techniques sont présentées par J. Zinn-Justin, J. Physique 42 783 (1981).
Parmi les généralisations à plusieurs variables, voir M.E. Fisher et J.H. Chen
dans les comptes rendus de l’institut d’été de Cargèse cité plus haut, et
J.H. Chen, M.E. Fisher et B.G. Nickel, Phys. Rev. Lett. 48 630 (1982).
Le travail de R. Peierls sur l’existence de phases ordonnées à basse température a été cité au chapitre II (volume 1). Pour la liberté asymptotique
du modèle CJ, voir A.M. Polyakov, Phys. Lett. B59, 79 (1975), E. Brézin et
J. Zinn-Justin, Phys. Rev. B14, 3110 (1976). Les expressions de la matrice
S pour certains modèles bidimensionnels sont dues à A.B. Zamolodchikov
et A.B. Zamolodchikov, Nucl. Phys. B133, 525 (1978).
CHAPITRE VI11
SIMULATIONS NUMERIQUES
Les capacités croissantes des ordinateurs ont stimulé des recherches
numériques de plus en plus ambitieuses portant sur des systèmes de taille
croissante. Ces simulations peuvent être confrontées à des solutions analytiques permettant d’en préciser les limites de validité, ou de servir de guide
dans l’exploration de comportements mal ou peu connus. On dispose ainsi
d’un moyen d’expérimentation bien contrôlé dont la souplesse se conjugue
avec les hypothèses théoriques offrant la possibilité de vérifier ces dernières,
de les modifier en fonction des données ou encore de découvrir de nouveaux
territoires. Nous allons décrire ici les méthodes générales de mise en oeuvre
de simulations de taille (relativement) grande. Divers exemples de résultats ainsi obtenus ont été présentés dans les chapitres précédents de sorte
que nous nous limiterons à quelques illustrations supplémentaires portant
principalement sur les théories de jauge dont beaucoup de développements
reposent en partie sur les indications tirées de telles simulations. Les plus
récentes ont même requis la conception d’ordinateurs spécialisés. Nous décrirons aussi la technique de renormalisation Monte Carlo dans l’espace de
configuration due à Ma, Swendsen et Wilson. Enfin nous évoquerons l’extension de ces méthodes au cas de systèmes fermioniques, tenant compte
des difficultés évoquées au chapitre VI.
1. Algorithmes
1.1 Généralités
Les ordinateurs actuels peuvent traiter des systèmes comportant jusqu’à des dizaines de millions de variables. Ces nombres croîtront probablement de manière significative dans un proche avenir. Les mesures peuvent
être cependant assez nombreuses pour atteindre une précision statistique
suffisante. Bien que les tailles des systèmes traités restent encore assez m e
destes en comparaison avec les ensembles macroscopiques, les effets collectifs
apparaissent néanmoins très clairement et l’on est capable d’obtenir des résultats précis concernant les phénomènes critiques. En examinant de près
50
SIMULATIONS NUMERIQUES
VIII.1.1
les méthodes numériques utilisées, on acquiert un sens plus concret des fondements de la physique statistique d’équilibre, des problèmes d’ergodicité,
de la signification des concepts probabilistes et de la question capitale de
l’approche à l’équilibre. Bien que superficiellement, ce chapitre ne traite que
d’aspects techniques, le lecteur se convaincra sans peine que le sujet mérite
un examen attentif et que la pratique est le meilleur guide en ces matières.
Le nombre colossal de variables interdit dans la majorité des cas
un traitement exact qui consisterait à énumérer toutes les configurations
possibles et à calculer leur contribution. Qu’on songe aux quelque lOSoo0
configurations d’un système de spins binaires sur un réseau bidimensionnel
de taille 30 x 30 x 30! Il existe cependant quelques tentatives de ce type où
l’on a calculé pour un système d’king 4 x 4 x 4 par exemple les contributions
du nombre déjà macroscopique d’états, environ 2.101’, en exploitant au
mieux ses symétries. En pratique on doit se contenter d’un échantillon
représentatif de l’ensemble des états. On effectue sur chaque échantillon
les mesures souhaitées et on analyse les erreurs statistiques comme lors
d’observations dans de!; expériences de laboratoire. En quelque sorte il s’agit
aussi dans le cas présent d’une forme d’expérimentation contrôlée où l’on a
à faire front à deux types de difficultés. La première est celle de simuler ce
qui est d’ordinaire naturellement fourni par des agrégats macroscopiques,
la seconde est celle d’estimer les biais provenant des tailles relativement
petites.
On pourrait songer tout d’abord à une méthode directe utilisant un
générateur de nombres aléatoires pour choisir successivement et indépendamment les différents degrés de liberté et leur associer un poids statistique,
produit du facteur de Boltzmann par la mesure relative aux champs. Une
application classique de cette technique est la roulette qui assure un gain
(positif et sans risque) aux établissements de jeu aux dépens de ceux qui
ignorent, ou veulent ignorer, les lois statistiques. L’application de cette idée
et son élaboration est à l’origine de la dénomination méthode de Monte Carlo
qui a été donnée à ces simulations. L’échantillonnage simple est couramment
pratiqué avec succès dans les questions de percolation ou d’hydrodynamique.
Cependant, cette méthode n’est pas bien adaptée aux exemples auxquels nous songeons, systèmes de spins généralisés, théories de jauge, surfaces aléatoires, etc..., dont les poids de Boltzmann impliquent l’interaction
de plusieurs degrés de liberté et qui sont susceptibles d’engendrer des effets collectifs non triviaux. Comme c’est le cas d’ordinaire, les fluctuations
d’énergie sont d’ordre f l ,où N désigne la taille. Or les configurations qui
ne sont pas énergétiquement très voisines de la valeur moyenne (nous utilisons ici le terme énergie quand il faudrait parfois parler d’action) ont un
effet négligeable dans l’estimation de la plupart des observables. L’échantillonnage simple ne prend pas ceci en compte et, afin d’optimiser le rendement des calculs, il est nécessaire d’introduire un biais. Désignons par le
symbole x l’ensemble des variables caractérisant une configuration. Une si-
VIII. 1.1
51
SIMULATIONS NUMEFUQUES
mulation engendre une suite de valeurs {xi} attachées à des configurations
choisies indépendamment selon une loi de probabilité l‘(xi). On remplace
la valeur moyenne cherchée
par celle de la suite
On vérifie que dans la limite d’un “temps” infini, n
tendent vers la quantité requise
à une erreur d’ordre
-+
00,
les variables fn
i/Jn près.
Vérifier que si toutes les configurations xi sont choisies avec la même
loi de probabilité P ( x ) , la moyenne temporelle (l/n)
!(xi) tend vers
P ( x ) f ( x ) .En déduire l’égalité ( 2 b ) .
E,
Le facteur de Boltzmann peut varier sur plusieurs ordres de grandeur.
Si P ( x ) est presque constant, très peu d’échantillons contribuent significativement à la somme (2a) et le nombre d’itérations n, c’est-à-dire le temps
de calcul, devient énorme. I1 est cependant possible de corriger en partie ce
défaut puisque la loi de probabilité P ( x ) demeure à notre disposition. On
est ainsi conduit à adapter cette dernière à la quantité à calculer, ce qui
introduit la notion d’échantillonnage sélectif Le choix optimum consiste a
prendre le poids de Boltzmann lui-même, de sorte que, à une normalisation
près, P ( x ) = exp(-p’Fl(x)).
Les interactions couplent les valeurs locales des champs (les composantes de x). On choisit d’engendrer la configuration xi+l à partir de xi à
l’aide d’un processus de Markov. Les quantités xi et xi+p,séparées par un
intervalle de temps fini, ne seront pas indépendantes, ce qui sera néanmoins
sans conséquence pourvu que ces corrélations décroissent suffisamment vite
avec p de sorte pue la distribution de xifp s’approche de la loi souhaitée,
P ( x ) , indépendamment de xi. La relation (2b) reste alors valable.
Soit W(xi, xi+1) la probabilité conditionnelle de tirer xi+l étant donné
xi. Elle définit le processus de Markov. On lui demande de posséder les
propriétés suivantes
(i) N o m a h a t i o n
W(x, y) = 1
(ii) Ergodicité W ( x , y ) > O. En d’autres termes, on doit pouvoir
atteindre chacune des configurations.
(iii) Probabilité limite
E,
52
SIMULATIONS NUMERIQUES
VIII.1.1
X
Considérée comme une matrice dans l’espace des configurations, la distribution W a donc une valeur propre maximale unité d’après les conditions
(i) et (ii) et la condition (iii) entraîne que le vecteur propre correspondant
de composantes positives n’est autre que P(x). Ainsi WP appliqué à une
loi de distribution arbitraire sur les configurations la transforme, lorsque p
croît indéfiniment, en celle définie par P , ce qui est le résultat désiré. On
peut aussi obtenir la distribution limite de l’estimation f n de (f).Pour n
grand c’est une loi gaussienne exp[-(fn - (f))’/2c~:], avec une déviation
standard telle que
Obtenir cette relation par transformation de Fourier.
Les trois conditions précédentes sont loin de déterminer uniquement la
probabilité conditionnelle W(x, y). I1 est commode en pratique de décompcser W en une succession d’étapes élémentaires
w(x’ y) =
IV1 (x’ z1) w2 (z 1,552 1 * * * Wk (Zk -1 ’Y
(5)
zi
On impose alors la condition plus restrictive de l’équilibre détaillé
de sorte que la relation (3) soit automatiquement satisfaite. I1 est plus facile
de vérifier et de mettre en oeuvre la condition (6) et ses propriétés de
symétrie sont souvent très utiles. Mais même cette dernière laisse encore
un grand arbitraire pour W, lequel explique la diversité des algorithmes.
Concrètement on préfère procéder en étapes élémentaires qui n’affectent
qu’un petit nombre de degrés de liberté à la fois. Par exemple Wj reviendra à
agir sur une variable a u site j sans modifier celles relatives aux autres sites.
Cette procédure est iiitéressante pour les systèmes ayant des interactions
à courte portée en limitant le temps de calcul nécessaire à chaque étape,
indépendamment de la taille. Le temps total pour balayer le système
entier (c’est-à-dire pour effectuer une itération complète du processus de
Markov) sera donc proportionnel au volume de ce dernier. L’impartialité
demande cependant de mentionner le défaut principal de cette procédure,
à savoir, qu’il est difficile d’exciter ainsi les modes collectifs de grande
longueur d’onde à basse température ou près d’un point critique. Le temps
de thermalisation nécessaire pour effacer la mémoire de la configuration
VIII.1.1
53
SIMULATIONS NUMERIQUES
initiale devient relativement long. De plus le domaine critique est caractérisé
par des corrélations importantes entre configurations successives (c’est le
ralentissement critique). En d’autres termes il existe aussi des phénomènes
critiques ,dynamiques à l’approche de l’équilibre, contrepartie des propriétés
critiques statiques.
1.2 Algorithmes classiques
Le moyen le plus simple de satisfaire à la condition ( 6 ) est de choisir
qui s’interprète comme la thermalisation d’un spin (ou d’une variable locale)
avec une source à la température voulue, les autres degrés de liberté du
système étant figés. La variable cible est réactualisée en contact thermique
avec la source en tenant compte de ses interactions avec les spins voisins qui
restent passifs. C’est l’algorithme du themnostat (“heat bath” en anglais).
Comparée au problème initial de réactualiser simultanément l’ensemble
des variables avec une probabilité proportionnelle au poids de Boltzmann, la
procédure est considérablement simplifiée puisque la loi de probabilité (7) ne
dépend que du voisinage d’un site. Dans une simulation du modèle d’Ising
par exemple, on calcule le champ local hj =
O k auquel est soumis le
spin au site j. Indépendamment de sa valeur initiale on choisit alors pour
le spin final une valeur +1 avec une probabilité p j = [l exp(-2phj)]-’
et -1 avec la probabilité complémentaire. En pratique, ce choix se fera en
engendrant un nombre aléatoire uniformément distribué dans l’intervalle O
et 1 et en prenant le spin égal à +1 si ce nombre est inférieur à p j , et à -1
sinon. Cet algorithme s’applique efficacement à des systèmes discrets plus
généraux.
Quand on a affaire à des variables continues il n’est pas toujours facile
d’engendrer des nombres aléatoires selon la loi (7) qui peut conduire à des
calculs longs et dispendieux qu’on cherche à éviter. La méthode suivante est
mieux adaptée. Définissons la fonction &‘(y) telle que
ck(j)
+
Si on choisit pour y une loi de probabilité uniforme sur [O, 11, on vérifie
que x = F(y) est distribué selon la loi de probabilité P ( z ) . L’inversion
nécessaire dans l’expression ci-dessus est en général malcommode, excepté
dans des cas très simples comme celui de la distribution normale ou de la loi
exponentielle; mais on peut l’éviter par l’usage d’un procédé qui admet de
nombreux raffinements. Par une transformation simple on peut supposer que
la variable z prend ses valeurs dans l’intervalle [O, il. L’algorithme suivant
engendre II: en deux temps selon la probabilité P ( z ) .
54
SIMULATIONS NUMEFUQUES
VIII.1.2
1. On tire deux variables x et y indépendamment et uniformément distribuées sur [O, 11.
2. Si P ( x ) < (SupP)y on procède à un nouveau tirage, sinon on retient la
valeur x qui se trouve être correctement distribuée.
Confirmer la validité de la méthode et calculer le taux de rejet dans le
second temps.
Cet algorithme demande d’engendrer deux nombres aléatoirement, de
calculer P ( x ) , de faire une comparaison et effectuer ces opérations un
nombre moyen de fois égal à SupP. Son efficacité s’accroît lorsque la loi
devient plus uniforme. On en trouvera de nombreuses adaptations dans un
texte de référence cité dans les notes.
En généralisant les idées précédentes, Metropolis a été conduit à proposer une méthode qui peut se substituer à celle du thermostat. On réactualise
encore la configuration x site par site d’après les règles suivantes.
M1 On engendre au hasard une valeur d’essai pour le champ au site donné
conduisant à une nouvelle configuration y. La loi de probabilité & ( y )
qui gouverne ce choix est arbitraire (excepté un souci d’efficacité) et
peut même dépendre de la valeur antérieure du champ.
M2 Si H ( y ) 5 H ( x ) , la configuration y est acceptée et l’algorithme
s’achève.
M3 Si au contraire l’énergie croît, H(y) > ‘H(x),on tire un nombre X au
hasard uniformément distribué dans l’intervalle ] O , l[et on n’accepte la
configuration y que si X < exp-B(X(y) - X ( x ) ) . Sinon on conserve
l’ancienne configuration x.
Observons que le deuxième temps de l’algorithme serait identique si l’on
cherchait l’état fondamental du système. C’est dans le troisième temps qu’un
accroissement d’énergie est admis selon une loi de probabilité qui dépend de
la température. Vérifier que la probabilité de transition
Wj (x, Y ) 0:
r)
si %(Y) 5 3i(x), x # Y
si % ( y ) > ‘H(x)
& ( Y ) ~ X -PB ( W Y ) - WX))
Q ( z ) ( l- exp -/3(N(z) - X(x)) si x y
Z,%(Z)>X(X)
(9)
satisfait aux conditions requises pourvu que Q ( y ) obéisse au critère d’ergodicité. On pourrait se contenter de demander qu’une puissance finie de W
remplisse ces conditions.
On choisira Q(y) de manière à maximiser (empiriquement) l’efficacité
de la procédure. Par exemple on modifiera une variable continue cp selon
un incrément aléatoire Scp en s’assurant que la valeur moyenne (Scp) reste
de l’ordre de grandeur des fluctuations dans le système entier. Tirer trop
VIII.1.2
SIMULATIONS NUMERIQUES
55
souvent des valeurs beaucoup plus grandes de l’incrément conduirait à un
taux important de rejets. Inversement, si les valeurs sont trop petites, le
taux de rejet serait faible, mais l’évolution très lente. Dans les deux cas il
serait nécessaire de balayer le système un très grand nombre de fois pour
obtenir des configurations indépendantes et une bonne thermalisation. En
pratique on admet qu’un taux de rejet d’environ 50% conduit à de bons
résultats.
I1 est possible d’appliquer l’algorithme plusieurs fois à la même variable
locale avant de passer à la suivante. Si ce nombre devient très grand, il
revient à créer une chaîne de Markov secondaire qui converge vers la loi
de probabilité (7). I1 est donc possible d’interpoler entre la méthode de
Metropolis et l’algorithme du thermostat, ce qui peut améliorer l’efficacité.
(1) On utilise sur les ordinateurs des suites déterministes, possédant des
propriétés d’ergodicité, en guise de générateurs de nombres aléatoires. I1 faudrait peut-être qualifier ces nombres de “pseudo-aléatoires” . Les générateurs
classiques sont fondés sur des congruences linéaires du type suivant. On produit une suite de nombres xn entre O et 1 à partir du système dynamique
auxiliaire un tel que
~n
un+1
=2-’~n
=Aun
[mod 2’1
La suite des nombres (2,) obtenue possède des propriétés aléatoires “raisonnables” pour un choix approprié de l’entier impair A . L’algorithme est facile
à mettre en oeuvre et bien adapté à la structure des ordinateurs. I1 peut cependant présenter des défauts et c’est une sage précaution que de vérifier les
propriétés du générateur dans des simulations de grande taille. Par exemple on
peut découvrir des corrélations entre trois tirages consécutifs susceptibles de
produire des biais considérables dans des simulations tridimensionnelles. I1 faut
alors utiliser des procédures plus complexes. Ainsi en utilisant un générateur
du type précédent on peut extraire un nombre au hasard dans une table qu’on
renouvelle aléatoirement à l’aide d’une suite telle que (10) après modification
des constantes A et uo. En tout cas, une simulation d’importance requiert de
nombreuses vérifications statistiques destinées à assurer l’indépendance et la
distribution correcte des configurations. I1 est évident que la substitution d’un
générateur de nombres aléatoires à un autre ne doit pas modifier les résultats.
(2) I1 est possible, dans certains exemples, de classer les champs en
groupes sans interaction directe. Ainsi dans le cas d’interactions entre proches
voisins sur un réseau (hyper-) cubique, les sites peuvent être groupés selon la
parité de la somme de leurs coordonnées. I1 est essentiel de tenir compte de
cette possibilité dans les simulations sur un processeur vectoriel ou parallèle.
En effet les machines vectorielles “pipelinées” effectuent très rapidement des
séquences d’opérations répétées sur des tableaux d’éléments, à condition que
ces opérations soient indépendantes, le résultat d’un pas de calcul ne devant
56
SIMULATIONS NUMERIQUEÇ
VIII.1.2
pas influencer le suivant. La même remarque est valable pour les calculs
faits en parallèle. Pour satisfaire à cette contrainte, on peut décomposer
chaque balayage du réseau en deux boucles successives traitant les sites pairs,
puis impairs. L’organisation des mémoires doit elle aussi être soigneusement
étudiée. Par exemple, un spin d’un modèle d’king peut être représenté par un
bit (unité d’information binaire). Ces derniers peuvent être groupés en mots
(l’unité d’information d’un ordinateur) de façon telle qu’ils puissent être traités
simultanément à l’aide d’une seule instruction logique. Cela assure ainsi une
parallélisation des calculs sur les machines monoprocesseur. Ces considérations
sont importantes dans la pratique, car le temps, la capacité de mémoire et le
coût sont des limitations essentielles. Les progrès effectués ne permettront
pas de s’en affranchir, car on les mettra à profit pour augmenter la taille des
systèmes simulés.
(3) Citons encore une autre difficulté qui peut se présenter quand une
série de balayages réguliers successifs conduit à la Stabilisation d’états métastables. Considérons à titre d’exemple une théorie de jauge bidimensionnelle
avec une action
s =81
fflOZff304
+
B2
OlO203ff4U5U6
qui fait intervenir des termes bordant deux plaquettes adjacentes. Supposons
/?z grand et négatif. Ce modèle est équivalent à un système antiferromagnétique
de spins dans un champ extérieur. Un état fondamental peut être représenté
comme l’indique la figure 1. 11 a l’aspect d’un damier sur lequel les variables
de plaquettes prennent alternativement les valeurs +1 et -1. Si l’on initialise
le système en choisissant toutes les variables de plaquette égales à +1, un balayage régulier des liens ligne à ligne laisse la configuration inchangée, comme le
lecteur s’en assurera aisément. Le même phénomène se produit pour B2 grand
et positif (système ferromagnétique), lorsqu’on prend pour point de départ une
configuration en damier. Dans les deux cas l’état initial reste stable et il est
très difficile d’analyser la transition du premier ordre entre les deux régions.
Cette difficulté se présente aussi dans les simulations du modèle à huit vertex
(ou ce qui est équivalent des chaînes de Heisenberg quantiques, ou encore des
systèmes d’king couplés). Pour une simulation plus efficace, on pourra tirer
au hasard le lien à réitctualiser, au lieu de balayer le réseau régulièrement. Les
résultats ne sont cependant pas encore satisfaisants car le plan peut être divisé
en deux régions correspondant aux deux configurations dégénérées (résultant
de l’échange des plaquettes paires et impaires) dont les frontières évoluent très
lentement. I1 est nécessaire de comprendre le mécanisme de stabilisation pour
surmonter cette difficulté. On s’attend à ce que la transition entre la phase de
pure jauge (ou ferromagnétique) et la phase gelée (ou antiferromagnétique) se
produise le long d’uns ligne voisine de la droite j 3 1 + 4 B 2 M O . Supposons Bi positif et donc 8 2 négatif. Si on renverse une variable de lien dans l’un ou l’autre
état ordonné on s’attcnd à un accroissement d’énergie de l’ordre - 2 p 2 et -6B2
respectivement, processus qu’on peut considérer comme très improbable. En
VIII.1.2
SIMULATIONS NUMERIQUES
57
revanche si on renverse simultanément les variables sur deux liens parallèles
voisins, la variation d’énergie est bien plus faible. I1 s’agit donc de l’excitation
élémentaire dans ce domaine et il paraît judicieux de fonder une simulation
sur cette technique de double renversement. Malheureusement ce faisant on
violerait le critère d’ergodicité si on n’alternait pas avec un balayage lien par
lien. L’efficacité d’une simulation sera grandement accrue si on s’inspire des
remarques précédentes.
Figure 1 : La configuration en damier de l’état fondamental d’un
système de jauge décrit par l’action (11) pour PZ < O. Les variables le
long des liens appartenant aux lignes ondulées et les variables de plaquettes
en grisé sont égales à -1.
1.3 Simulations microcanoniques
On a proposé de s’affranchir de l’usage des générateurs de suites
pseudo-aléatoires tout en engendrant une séquence ergorlique de configurations à l’aide d’un processus déterministe dans l’espace de configuration.
L’idée consiste à contraindre l’énergie à demeurer dans un étroit intervalle
de largeur SE comme dans l’analyse du théorème ergodique. On comparera
cette technique à celle d’un générateur de nombres aléatoires. Dans les deux
cas l’ergodicité résulte du mécanisme spécifique qui gouverne le mouvement.
Les simulations microcanoniques nécessitent une vérification expériment ale
des propriétés d’indépendance statistique. La méthode qu’on va exposer
semble satisfaire à ce critère.
Considérons un démon possédant un réservoir d’énergie positive de
capacité 6E. I1 visite tous les sites successivement et renverse les spins
(s’il s’agit d’un système à variables dichotomiques) chaque fois qu’il le
peut. Si l’énergie nécessaire pour modifier la configuration localement est
supérieure à celle dont il dispose dans son réservoir, ou si la modification
58
SIMULATIONS NUMERIQUES
VIII.1.3
envisagée dégage une iinergie supérieure à la capacité du réservoir, les
variables demeurent inchangées. Sinon le spin est renversé et la quantité
d’énergie disponible dans le réservoir est modifiée en conséquence. I1 est
aisé de procéder à une simulation de ce type dans le cas d’un modèle d’Ising
ou de tout modèle analogue, en tirant en outre parti de la subdivision
possible du système en groupes de variables qu’on pourra traiter en parallèle.
Concrètement on mettra en oeuvre un “bataillon de démons” visitant
simultanément des spins sans interaction directe.
La procédure exposée ci-dessus peut être considérée comme l’analogue
d’un générateur pseudo-aléatoire, sur le même plan que les algorithmes
usuels. Elle a conduit jusqu’à présent à d’excellents résultats pour des
systèmes de type Ising. Son intérêt réside dans sa très grande économie
de temps de calcul. On peut lui apporter des améliorations empiriques
pour augmenter l’ergodicité, par exemple en redistribuant aléatoirement
les contenus des réservoirs des différents démons à des intervalles de temps
réguliers.
Contrairement aux précédents algorithmes, l’énergie est fixée (à SE
près) dans les simulations microcanoniques. I1 est alors nécessaire de mesurer la température. 11 cet effet, l’énergie moyenne dont disposent les
démons peut servir de thermomètre. A l’équilibre thermique la distribution de l’énergie des réservoirs doit être donnée par le facteur de Boltzmann
exp(-PEdémon). Etant donné que le réservoir ne possède qu’un seul degré
de liberté, il est facile de calculer son énergie moyenne en fonction de p.
Pour un système d’Ising par exemple, &,4mon est un multiple de l’énergie
correspondant au renversement d’un spin (que nous prenons comme unité
pour simplifier) avec une coupure à l’énergie maximale SE. Ainsi
relation qu’il est facile d.’inverser pour obtenir p.
1.4 Considérations pratiques
I1 est clair d’après ce qui précède que les simulations Monte Carlo
constituent en fait un art. Les détails de leur mise en oeuvre dépendent
du but qu’on s’est fixé (et des capacités de l’utilisateur). Nous présentons
ci-dessous quelques remarques techniques supplémentaires.
1.4.1 Conditions aux limites
Tant que les tailles des réseaux employés demeurent modestes, les conditions au bord jouent un rôle essentiel. Par exemple un réseau tndimensionnel de lo3 sites avec bords libres possède 48.8% de sites sur la frontière.
Cet effet croît avec la dimension et l’estimation des quantités thermodynamiques devient douteuse. La façon la plus courante de s’affranchir en partie
VIII.1.4.1
SIMULATIONS NUMEFUQUES
59
de ce problème est d’utiliser des conditions de bord périodiques. Du point
de vue de l’ordinateur ceci se réalise aisément à l’aide d’une instruction
élémentaire modulo. De plus on utilisera au mieux la structure binaire des
données en choisissant une taille linéaire en puissance de 2, qui remplace
cette opération par une instruction logique, plus rapide à exécuter. I1 est
même possible de traiter toutes les dimensions à la fois en enveloppant le
réseau sur une hélice. Considérons par exemple un réseau bidimensionnel.
Dans la mémoire de l’ordinateur on dispose les sites en une série linéaire
(1’1)’(1’2)’
( l , L ) , (2’1)’
(2,L), (3’1)’
De la sorte les adresses
des sites voisins d’un site donné s’obtiennent à partir de la sienne en les
décalant de quantités fixes ( k l et f L ) . Les conditions hélicoïdales reviennent à étendre la règle aux sites initiaux et finaux, les adresses étant définies
modulo L 2 . Ce procédé simplifie considérablement le programme et est très
efficace.
La périodicité introduit cependant des effets parasites qui peuvent
provoquer des désastres si on n’en est pas conscient comme le démontrent
les exemples suivants.
(i) La mesure des masses (ou des longueurs de corrélation) résulte de
l’ajustement d’une décroissance exponentielle en exp( - x / c ) au comporte
ment asymptotique des fonctions à deux points (cpocp,.). Du fait des conditions aux limites, les fonctions de corrélation deviennent périodiques. Si on
~ cpo, la formule précédente est
ne retient que la première duplication c p de
modifiée en
- - e ,
e - - ,
I
-
grand
O
Cstcosh
-
.
.
(T) SL
2-
(13)
O<z<L
On observe un cas typique de ce comportement sur la figure 2.
(ii) Dans les théories de jauge on déduit le potentiel statique entre
quarks de l’observation de la moyenne d’un opérateur de Wilson. Ce dernier
est relatif à une boucle de taille R dans la direction spatiale, T dans la
direction temporelle, dans la limite où T + 00 à R fixé. Si T = L dans un
volume périodique de taille L, la boucle se décompose en deux circuits fermés
en raison des conditions aux limites. Ces dernières sont appelées boucles de
Polyakov. Si on les utilise plutôt que les boucles de Wilson, on élimine le
problème de la limite T + 00 ainsi que les effets de coin caractéristiques
des boucles de Wilson.
(iii) La fonction de partition d’une théorie des champs à la température
T, 2 = Trexp - X / T peut s’exprimer comme une intégrale fonctionnelle
euclidienne impliquant une variable temporelle supplémentaire
et une contrainte de périodicité Q(0,x) = @(l/T,x)dans le cas le plus
60
VIII. 1.4.1
SIMULATIONS NUMEFUQUES
7
I
II
10
14
77
Figure 2 : Comportements typiques en cosinus hyperbolique dans le
calcul du propagateur du pion (d’après A. Billoire, R. Lacaze, E. Marinari
et A. Morel, Nucl. Phys. B251 [FS13], 581 (1985)).
simple d’un champ bosonique scalaire. On utilise dans les simulations
des
numériques un réseau asymétrique de N,“x Nt sites, N,a, > Ntat,
conditions au bord péria,diques, et on se réserve la possibilité de choisir des
mailles a, et at inégales. Dans la limite continue, la température s’exprime
selon
1
Nt at
T=-
(iv) Enfin on peut étudier divers effets grâce à des conditions de
bord antipériodiques. Ces dernières permettent par exemple la mesure des
énergies libres d’interface à basse température.
1.4.2 Taille du réseau
Le choix de la taille linéaire L du réseau est évidemment directement
relié au coût de la simulation. C’est le facteur déterminant de la précision
numérique, en particulier en dimension élevée (trois ou quatre). Cependant
les simulations sur des réseaux de très petite taille ne sont pas inutiles.
Les calculs sont alors très rapides et fournissent des informations semiquantitatives sur les plages de paramètres à explorer dans des simulations à
plus grande taille. Expérimentalement on observe que la mesure de certaines
observables thermodynamiques (comme l’énergie interne) est déjà assez
précise sur de petites tailles.
Bien entendu de plus grands réseaux réduisent les effets de taille finie. Pour des raisons techniques (initialisation des boucles, vectorisation ...)
le temps nécessaire à la réactualisation d’une variable est lui aussi réduit
VIII.1.4.2
SIMULATIONS NUMERIQUES
61
lorsque la taille croît et les marges d’erreur sur les quantités thermodynamiques s’amenuisent. De toute f q o n il est nécessaire d’utiliser des réseaux
aussi grands que possible pour mesurer les fonctions de corrélation. Dans
ce cas on peut réduire le coût en ne faisant croître la taille que le long de la
direction de séparation des champs. Notons qu’une simulation devient sans
intérêt dès que la longueur de corrélation dépasse la dimension linéaire. I1
semblerait donc que l’étude détaillée des phénomènes critiques fasse appel
à des systèmes de tailles très importantes.
1.4.3 Temps de thermalisation
I1 est important de se faire une idée du temps nécessaire pour atteindre
l’équilibre thermique ainsi que celle de l’intervalle séparant deux configurations de la chaîne de Markov qui peuvent être considérées comme indépendantes. Rappelons la définition des fonctions de relaxation. Partant d’un
état hors d’équilibre caractérisé par un écart SO d’une quantité thermodynamique (température, champ extérieur, ...) à la valeur d’équilibre, on définit
une fonction de relaxation non linéaire pour une observable A comme la
fonction
et le temps de relaxation associé
On peut aussi définir des quantités similaires à l’équilibre, en se fondant sur
la théorie de la réponse linéaire
L’hypothèse la plus courante est que les deux fonctions sont reliées par la
relation
où B est la quantité conjuguée à û (l’énergie interne si û est la température,
l’aimantation s’il s’agit du champ extérieur...).
Cette hypothèse qui implique que le temps de thermalisation est de
l’ordre des temps de fluctuation à l’équilibre, n’a d’intérêt que si on a un
moyen d’estimer a priori ces derniers, ce qui est rarement le cas. On peut
faire des remarques semblables dans le cas d’états métastables séparés par
62
SIMULATIONS NUMERIQUES
VIII. 1.4.3
une barrière énergétique AE. D’après la théorie des processus d’activation
thermique, on peut supposer que le temps de relaxation se comporte comme
-
r 7-0 exp(PAE)
(PAE > 1)
(20)
où 70est un temps caractéristique de la phase métastable. Ces phénomènes
sont typiques de transitions du premier ordre et sont à l’origine des boucles
d’hystéresis que nous discuterons plus loin. La barrière énergétique est
ici l’énergie de “nucléa,tion” de la phase stable. On rencontre des effets
analogues dans les problèmes comme celui des verres de spin qui conduisent
à des temps de relaxation extrêmement longs, et qui de ce fait rendent la
méthode de Monte Carlo très inefficace.
Au voisinage d’une transition du second ordre, le temps de relaxation
diverge puisque les champs sont corrélés dans des volumes d’ordre Id.On
s’attend donc à un ralentissement critique au voisinage de T,,associé à un
exposant critique dynamique
r - ( 1 - 8 ) -c
Pour la fonction de relaxation ~ A A le, temps de relaxation est approximativement proportionnel à la susceptibilité X A A = P N [ ( A 2 )- ( A ) 2 ]Pour
.
un
système fini il n’y a pas à proprement parler de divergence (voir ci-dessous).
Dans la pratique, en 1’a.bsence de prédictions convaincantes, on se contente
d’estimer r en observant comment une observable se stabilise à sa valeur
d’équilibre. I1 faut prentdre garde au fait que des observables distinctes peuvent avoir des temps de relaxation très différents.
1.4.4 Mesure des observables
La mesure de certaines observables peut consommer une fraction non
négligeable du temps de calcul comparé à celui qui est nécessaire pour
engendrer les configurations d’équilibre. Nous verrons ainsi que les moyennes
fermioniques impliquent l’inversion de très grandes matrices Ld x L“. Les
fluctuations statistiques constituent un autre facteur de limitation. I1 est
clair que les mesures perdent tout sens si les moyennes des quantités
qu’on désire obtenir sont de l’ordre du bruit statistique. Par exemple on
ne peut calculer des dtirivées par des approximations de différences finies
entre des quantités memrées sur des échantillons indépendants. C’est le cas
par exemple de la chaleur spécifique C = dE/dT. Nous verrons qu’il est
possible de contourner cette difficulté pour obtenir cette grandeur. I1 est
plus facile de mesurer des moyennes thermodynamiques, mais leur intérêt est
en général restreint lorçqu’on s’intéresse aux quantités renormalisées de la
limite continue. On cherchera plutôt à obtenir les masses ou les longueurs de
corrélation qui requièrent malheureusement des simulations plus soigneuses
et plus longues, puisqu’il s’agit de les déterminer à partir de la façon dont
un signal décroît avec la distance et tend à disparaître dans le bruit.
VIII.1.4.5
63
SIMULATIONS NUMEFUQUES
1.4.5 Erreurs statistiques
Soit A l’estimation de la moyenne d’une observable, égale à la moyenne
arithmétique sur N mesures. On prendra comme ordre de grandeur de
l’erreur statistique la quantité
I
.
formule qui suppose les valeurs Ai sans corrélation, ce qui n’est pas le cas
lorsqu’elles sont engendrées par une chaîne de Markov. On retrouve là la
nécessité de faire des tests variés de l’indépendance statistique des mesures.
) ~divers
Une méthode empirique consiste à calculer les valeurs de ~ v ( b Asur
échantillons et à vérifier que les résultats sont indépendants de N.
La détermination du temps de relaxation TAA (équation (18)) est
évidemment reliée à cette question. On montre que la formule précédente
doit être multipliée par un facteur d’ordre d m .
Justifier ce résultat.
1.4.6 Paramétrisation des champs
Les champs peuvent prendre leur valeur dans des domaines variés, en
particulier dans des groupes de Lie (c’est le cas des champs de jauge).
La structure de ces domaines peut allonger le temps de calcul de manière
significative. De plus la paramétrisation adoptée peut influer sur la capacité
de mémoire nécessaire.
A titre d’exemple considérons le cas de champs prenant leur valeur dans
le groupe S U ( 2 ) . Nous avons le choix entre les techniques suivantes.
6 ) Nous pouvons paramétriser les champs à l’aide de matrices complexes
2 x 2. Ceci implique de garder en mémoire 8 mots (nombres à virgule
flottante) par champ. I1 est facile d’effectuer les multiplications des
matrices qui nécessitent 32 multiplications ordinaires (en fait ce nombre
peut être légèrement réduit grâce à des astuces de programmation).
(ii) Nous pouvons encore traiter les champs comme des points sur la sphère
unité S3 dans un espace quadridimensionnel sous la forme U = a0 ia.Ü,
avec a i a2 = 1, a0 et a réels. Cette fois-ci, 4 mots sont suffisants.
En revanche la multiplication est un peu plus complexe à programmer :
UU’ = (aoab - a.a‘) i(a0a‘ aoa a A a‘).Z), mais ne nécessite que
16 opérations élémentaires.
+
+
+
+
+
La seconde paramétrisation est la meilleure à tous points de vue et c’est
celle qu’on préférera, Elle a l’avantage supplémentaire de se prêter à une
simulation utilisant l’algorithme du thermostat (Creutz, 1980). Le poids de
Boltzmann relatif à un champ U se réduit à exp Tr U V où V est une somme
de matrices qui admet une paramétrisation analogue de la forme V = bo S i b 3
sans contrainte sur b2 = bi b2. Le tirage de U s’effectue selon la loi
+
64
SIMULATIONS NUMERIQUES
dP(U‘ == U V - l )
c
(
VIII.1.4.6
dâ‘ d--exp(pbab)dao
Le choix de ab est gouverné par une exponentielle et s’obtient en utilisant
les algorithmes usuels corrigés par une procédure de rejet pour tenir compte
du facteur en racine camée. On choisit alors la direction de a’ uniformément
au hasard et on peut reconstruire l’élément du groupe. On obtient ainsi une
méthode de simulation très efficace.
La structure des groupes W ( n ) pour n 2 3 ne permet pas de telles
simplifications. La variété du groupe est plus compliquée et jusqu’à présent
il a semblé préférable d’employer une paramétrisation en termes de matrices
complexes n x n bien que la capacité de mémoire nécessaire en soit considérablement accrue.
I1 est parfois possible de discrétiser à son tour le domaine des valeurs
des champs dans le but de diminuer la capacité de mémoire nécessaire (un
seul entier suffira à prescrire la valeur du champ) ainsi que le temps de
calcul (en construisant une table de multiplication appropriée). Cependant
il est indispensable de s’assurer qu’on ne modifie pas ainsi les propriétés du
système que l’on étudie.
Examinons le cas du groupe U(1) qui est bien représenté par 2, pour n
grand. On a étudié très exhaustivement les systèmes de spins correspondants
(l’action s’écrivant ,O &s,j) cos[27r(mi - mj)/n],mi = O , . . .,n - 1) ainsi que
leur contrepartie invariante de jauge. Ces modèles présentent génériquement
deux transitions pour n > 4 (figure 3). On interprète la phase intermédiaire
comme décrivant des ondes de spins analogues à celle du modèle X Y
(chapitre IV, volume 1). La transition entre la phase intermédiaire et
celle de haute température appartient à la même classe d’universalité que
la transition du modèle à symétrie U(1). A très basse température, la
structure discrète de 2, devient apparente et le système possède une seconde
transition. Lorsque n croît, le point critique inférieur s’approche de la
température nulle. On conçoit qu’il est alors possible de remplacer l’étude du
modèle U(1) par celle d’un modèle à symétrie 2, pourvu que la température
excède cette transition inférieure.
La technique précédente serait extrêmement intéressante si on pouvait
l’étendre aux cas des groupes continus non abéliens. Malheureusement les
sous-groupes finis intéressants ne sont qu’en nombre fini et en général pas assez denses pour assurer une transition discrète à température suffisamment
basse.
Considérons à nouveau le cas du groupe S U ( 2 ) . En se servant de la
structure des polyèdres réguliers (c’est-à-dire en se réduisant à S O ( 3 ) obtenu
par quotient de S U ( 2 ) par son centre Z 2 ) et en écartant les groupes cycliques
et diédraux (d’ordre supérieur à quatre), peu représentatifs, on a le choix entre
les sous-groupes suivants (chapitre XI).
VIII.1.4.6
SIMULATIONS NUMERIQUES
65
(1) Q groupe quatemionique à 8 éléments. C’est le groupe multiplicatif des
éléments izl, f i q , un double recouvrement du groupe à quatre éléments
des rotations d’angle ?r autour de trois axes orthogoiiaux.
(2) T double recouvrement du groupe tétraédral, 24 éléments.
(3) O double recouvrement du groupe cubique ou octaédral, 48 éléments.
double recouvrement du groupe icosaédral ou dodécaédral, 120 élé(4)
ments.
Les théories de jauge quadridimensionnelles correspondantes exhibent une
transition du premier ordre unique à une valeur de la constante de couplage
égale respectivement à 1.23, 2.175, 3.21 et 5.9. Rappelons que pour S U ( 2 )
le raccord entre régimes de couplage fort et faible s’effectue aux environs de
B N 2. On voit donc que les deux derniers groupes peuvent être utiles dans un
domaine limité comme approximation au modèle à symétrie continue.
Dans le cas de S ü ( 3 ) , et en écartant comme précédemment des séries
infinies généralisant les sous-groupes cycliques et diédraux, qui n’offrent pas
une approximation satisfaisante de la variété, on connaît des sous-groupes
discrets d’ordre 108, 216, 648 et 1080 (liste non exhaustive). Les transitions
du premier ordre correspondantes sont à B = 2.5, 3.2, 3.43 et 3.58. Aucune
de ces approximations ne semble donc étre un substitut satisfaisant pour le
groupe continu, puisque la région de transition vers la limite continue se situe
aux environs de x 5.9 dans le cas de SU(3).
2. Mesures
Lorsqu’un programme a été suffisamment développé, on a à sa disposition un système dont les paramètres (température, champ extérieur, ...) peuvent être modifiés à volonté, permettant ainsi d’effectuer diverses mesures.
Mis à part les questions relatives au traitement statistique des données déjà
discutées, nous allons passer en revue ci-dessous divers points spécifiques
aux phénomènes critiques.
2.1 Détermination des transitions
La première tâche consiste à déterminer le diagramme de phase - s’il
n’est pas déjà connu - et à situer les régions critiques. On effectue une
exploration préliminaire le long d’un chemin dans le diagramme de phase
parcouru dans un sens et dans l’autre, tout en mesurant une (ou plusieurs)
observables. A titre d’exemple considérons un modèle de jauge de groupe
2,. La température est choisie assez grande et la configuration initiale totalement désordonnée. On autorise le système à évoluer pendant un temps
assez long pour atteindre l’équilibre thermique (ce dernier étant déterminé
par la condition que les observables fluctuent autour d’une valeur moyenne
stable). On poursuit le processus de Markov en faisant décroître régulièrement la température par un très faible décrément à chaque balayage, tout en
poursuivant la mesure de l’énergie moyenne d’une plaquette E = 1- (?I.U p ) .
66
VIII.2.1
SIMULATIONS NUMEFUQUES
Lorsqu’on atteint une température suffisamment basse, on inverse le processus de manière à revenir à la température initiale. La figure 3 représente la
courbe obtenue pour la valeur de l’énergie. On y observe deux boucles d’hystéresis qui signalent l’existence de deux transitions et déterminent grossièrement leur position.
o.e
E
O.ii
o. O
0.0
1.0
2.0
3.0
P
Figure 3 :L’énergie moyenne d’une plaquette dans une théorie de jauge
en fonction de la température (d’après M. Creutz, L. Jacobs et C. Rebbi,
Phys. Rev. D20, 1915 111979)).
26
Pour obtenir les températures critiques avec précision et connaître leur
ordre, il est nécessaire de procéder à une étude plus minutieuse. Dans
les circonstances présentes un effet d’hystéresis n’est pas nécessairement
caractéristique d’une transition du premier ordre. En principe, quand on a
affaire à une telle transition, le système peut rester bloqué dans une phase
métastable jusqu’à ce qu’une fluctuation d’énergie libre provoque un saut
vers une phase plus stable. Une observable telle que E présente alors une
discontinuité. Dans le ciis d’une transition du second ordre, il se pourrait que
le phénomène d’hystéresis soit dû à un temps de relaxation très grand viçà-vis du temps de calcul. L’énergie à l’équilibre est une fonction continue de
la température et la boiicle devrait s’amenuiser avec une variation plus lente
de la température. Ceci ne constitue cependant pas un critère très fiable,
car le facteur dominant est la taille finie du système. Les singularités des
courbes relatives au système infini sont alors supprimées et il devient très
difficile de distinguer les comportements caractéristiques qui différencient
les transitions selon l e x ordre. En tout état de cause, il n’existe pas de
transitions dans les systèmes finis. I1 faut donc que les critères qu’on va
présenter soient suffisamment clairs pour permettre une distinction qui
subsiste sans ambiguïti à limite thermodynamique.
A titre d’exemple on peut préparer le système dans deux états, l’un
d’entre eux étant totalement ordonné et l’autre désordonné. On laisse alors
VIII.2.1
SIMULATIONS NUMERIQUES
67
Figure 4 : Evolution des systèmes à la température critique selon que
la configuration initiale est ordonnée ou désordonnée. ( a ) Modèle de jauge
2 6 (transition du second ordre). (b) Modèle de jauge 2 2 (premier ordre).
Même source que la figure 3.
chacune de ces configurations évoluer à la température critique (ou à une
valeur très voisine). Dans le cas d’une transition du second ordre, chacun des
spécimens atteint le même état d’équilibre (figure 4a) alors qu’ils demeurent
dans des phases différentes s’il s’agit d’une transition du premier ordre
(figure 4b). I1 reste cependant la possibilité que le temps de relaxation
vers l’équilibre soit extrêmement long. On étudiera alors un échantillon
possédant une interface séparant deux phases pures en le laissant évoluer à
diverses températures proches de la valeur critique. On a représenté sur la
figure 5 le résultat de telles expériences effectuées sur le système de jauge 2 2
quadridimensionnel à des valeurs p = 0.41, 0.42, .. ., 0.47. Les courbes sont
suffisamment caractéristiques pour qu’on puisse confirmer l’existence d’une
transition du premier ordre pour une valeur critique légèrement supérieure
à 0.44 (on sait que la dualité prédit la valeur 0.4407).
Dans le cas d’une transition du second ordre, on veut déterminer les
exposants critiques et l’amplitude des singularités, ou plus généralement
l’ensemble des quantités universelles. Cherchons à estimer la difficulté de
telles mesures sur l’exemple du modèle d’Ising. Nous voulons mesurer la
susceptibilité
x=
ou la chaleur spécifique
(
-
(
(23)
68
VIII.2.1
SIMULATIONS NUMERIQUES
O .1’
1
I
1
2 2
0.5
E
0.4
0.:1
O.?
0.1
0.11
O
100
200
300
400
Figure 5 : Evolulion temporelle d’un système de jauge 22 où les
conditions initiales mettent en présence deux phases pures, lorsque B croît
(du haut vers le bas) de 0.41 à 0.47. Même source que celle de la figure 3.
Signalons au passage un détail technique qui a son importance. Comme
on l’a déjà indiqué ces quantités ne peuvent être obtenues par différentiation
des quantités mesurées, aimantation ou énergie, en raison des erreurs statistiques. Cette méthode ne permettrait pas de distinguer le signal du bruit.
La technique correcte consiste à mesurer l’aimantation et l’énergie sur des
échantillons s t a t i s t i q u w w n t indépendants et d’estimer leur variance comme
l’indiquent les équations (23) et (24). Insistons sur l’indépendance statistique.
Des mesures effectuée:; le long d u même processus de Markov portent sur des
configurations en général corrélées et conduisent ainsi à une sous-estimation.
La figure 6 montre l’effet d’une taille finie sur la chaleur spécifique
du modèle d’king tridimensionnel. La température critique est déterminée
par extrapolation du maximum de la courbe. L’ajustement des exposants
critiques est bien plus délicat et très sensible à la détermination de T,.
D’autres méthodes sont nécessaires. La première consiste à invoquer des
informations sur les effets de taille finie, incorporant ainsi des contraintes
sur les quantités qu’on cherche à obtenir.
2.2 Effets de taille finie
Les lois d’échelle ont déjà été étudiées dans les chapitres précédents
et nous y reviendrons. Résumons-les ici dans l’optique présente. Nous
considérons un système dans un volume Ld dépendant d’une seule échelle
L (on peut aussi généraliser à des tranches ou des barreaux). I1 nous faut
VIII.2.2
SIMULATIONS NUMERIQUES
69
1 0
O8
cv
06
O1
O2
0.0
Figure 6 : La chaleur spécifique du modèle d’Ising sur des réseaux
de taille croissante. La courbe en pointillé est l’estimation de la limite
thermodynamique (d’après K. Binder, Physica 6 2 508 (1972)).
tenir compte à la fois du déplacement de la température “critique” T,(L)
et de celui des différents exposants y(L), . . .. On fait l’hypothèse que la
susceptibilité se comporte comme
Pour un système fini toutes les quantités sont bien sûr régulières et il est
incorrect stricto sensu d’utiliser le terme de température critique. Nous le
définissons cependant ici comme la valeur correspondant au maximum de
X L . Ceci signifie donc que l’exposant s’annule. Dans d’autres cas comme
celui des tranches ou de barreaux, il peut y avoir un exposant y(L) non
trivial. Par exemple dans le cas d’une tranche, quand la taille de l’échantillon
est très grande dans d - 1 dimensions et peut être considérée en pratique
comme infinie relativement à la dernière direction, y(L) interpole entre la
valeur y(m) du système thermodynamique à d dimensions et y* = y(1) du
système à ( d - 1) dimensions.
T,(w), la longueur de
Lorsque la température s’approche de T,
corrélation croît d’abord selon la loi de puissance attendue t;”, jusqu’à ce
qu’elle devienne de l’ordre de LI où les effets de taille finie commencent à
l’emporter. Le déplacement de la température critique peut donc être estimé
en supposant L N <, et son comportement est de la forme
<
70
SIMULATIONS NUMERIQUES
VIII.2.2
On s'attend par conséquent à ce que la seule variable qui gouverne le
système,.outre la température, soit le rapport LI< N Lt', ce qui conduit à
la loi d'échelle (Fisher 1969)
Une analyse générale confirme cette hypothèse en dimension inférieure
à la dimension critique supérieure (chapitre IV, volume 1). On vérifie
explicitement que cette loi s'applique dans certains cas solubles et on peut
l'observer dans des simulations numériques très précises en basse dimension.
Lorsque, dans la fonction ci-dessus, l'argument x tend vers l'infini, on
doit retrouver le comportement critique du système infini, correspondant
à L + 00. Ceci conduit, aux contraintes suivantes sur la fonction X ( z )
et
Inversement, à L iixé, le comportement de X ( s ) à s = O est gouverné
par l'équation (25), et l'on trouve
X - ( s ) z ~ A(L)L(Y(L)-Y)/"s-Y(L)
o
(30)
Dans le cas d'un système fini, y ( L )s'annule et X ( 0 ) est fini. On prédit donc
que la hauteur du pic dans la susceptibilité est gouvernée par
Les relations (26) et (31) sont capitales pour obtenir les exposants
critiques avec une précision raisonnable à partir de données semblables à
celles de la figure 6.
Dans les lois d'txhelle précédentes on ne tient pas correctement compte
de divergences de type logarithmique x lnt. Généraliser la discussion pour
incorporer un tel comportement logarithmique. La formule (27) doit être
soustraite à une temjkrature fixe 2'0, en écrivant par exemple
N
On en déduit que la hauteur du pic varie logarithmiquement.
VIII.2.2
SIMULATIONS NUMERIQUES
71
La même technique permet d’extraire des informations sur les énergies
d’interface. Suposons par exemple des conditions au bord antipériodiques
dans une direction. I1 apparaîtra une interface à température assez basse
(une surface perpendiculaire à des liens frustrés), d’aire S ( L ) = L d - l ,
d’ordre 1/L par rapport au volume V ( L ) = L d . L’énergie libre peut être
écrite asymptotiquement
+
+
F(T’L ) = V ( L ) F m ( T ) S(L)F,(T) O (l/L2)
(33)
où .Fm(T)est l’énergie libre par unité de volume du système infini et F,(T)
l’énergie libre d’interface par unité d’aire. En principe les singularités de ces
fonctions sont différentes’ mais si la loi d’échelle (27) s’applique, on peut les
relier de la manière suivante. Ecrivons en effet un terme supplémentaire dans
le développement (28)’ à IC grand, de la fonction d’échelle correspondant à
la chaleur spécifique, en substituant à y l’exposant (Y et à w la quantité ( Y / Y .
I1 vient
X(z) = X,Z?
+ Y,IC+ + . . .
(34)
Insérons ce résultat dans la formule (33). On en tire l’exposant a , relatif à
l’énergie libre d’interface
a, = Jq! = a + u = 2 - u ( d - 1)
(35)
Trouver les inégalités qui doivent être satisfaites par les exposants pour
que les développements précédents aient un sens. On trouve en particulier
0 2 1 (v < 1). Dans le cas logarithmique limite 0 = 1, on peut estimer
l’amplitude de A s ( c o ) . Pour des valeurs 0 < 1 , équivalentes à l’existence de
forces à longue portée, on ne pourrait plus séparer les termes de volume des
termes de surface.
Dans la pratique, lorsqu’on procède à la détermination des exposants
à partir des données numériques’ le paramètre le plus sensible est la température critique. Une erreur sur cette quantité induit des variations importantes sur les autres grandeurs critiques. Les lois d’échelle introduisent des
contraintes qui améliorent la situation. Cependant la méthode décrite cidessus, qui implique des mesures très précises sur des échantillons de taille
aussi grande que possible, conduit à des simulations très onéreuses. Dans
ces conditions, il est heureux qu’une autre méthode très ingénieuse ait été
développée pour traiter efficacement le régime critique.
2.3 Méthode d e renormalisation Monte Carlo
Nous avons donné au chapitre IV du premier volume une description
des aspects élémentaires du groupe de renormalisation dans l’espace de
configuration. La technique des blocs de spins semble particulièrement bien
72
!SIMULATIONS NUMERIQUES
VIII.2.3
adaptée aux simulations numériques. Nous considérons maintenant sa mise
en pratique, en rappelant d’abord les formules qui sont nécessaires dans le
traitement des systèmes du type Ising.
Choisissons un ensemble d’opérateurs { X a }, aussi petit que possible,
pour des raisons pratiques, afin de permettre les simulations les plus rapides,
et aussi grand que possible pour des raisons théoriques afin de donner
l’action la plus générale, dans le cadre d’interactions de courte portée
possédant la symétrie voulue. L’action s’exprime comme une superposition
de termes en X , avec un ensemble {g,} de constantes de couplage
Les variables de bloc p i ( { a } ) ,définies en utilisant par exemple la règle
majoritaire
sont aisées à déterminer dans un traitement numérique. Si la somme des
variables d’un bloc s’annule, pi est choisi aléatoirement. Les deux ensembles
{ p i } et {ai} décrivent la même situation physique à des échelles distinctes
dont le rapport X est celui de la taille des blocs. Rappelons qu’alors les deux
actions correspondantes satisfont à la relation
En pratique cette relation n’est qu’approchée puisque, par nécessité, l’ensemble des termes X , est fini. Le point fixe g: de la transformation
g(O) + g ( ’ ) est le point, critique. Dans son voisinage on peut linéariser la
transformation
La méthode de renormalisation Monte Carlo (Swendsen, Wilson) donne
directement accès à la matrice T plutôt qu’aux valeurs renormalisées des
couplages après décimation. Ceci permet un calcul très précis des exposants
critiques sans avoir à déterminer a priori la température critique (ou les
couplages critiques). Si on revient à la discussion du chapitre IV et à la figure
IV.2, on se souvient que l’approche au point critique dépend de la grandeur
des valeurs propres de la matrice T relativement à l’unité. Dans la base
qui diagonalise T , les opérateurs essentiels sont ceux qui correspondent aux
VIII.2.3
73
SIMULATIONS NUMERIQUES
valeurs propres plus grandes que un. Les constantes de couplage associées
auront un flot de renormalisation qui s’écarte du point fixe. En particulier la
température correspond à la plus grande valeur propre ymax dans le secteur
pair et la température réduite satisfait à
Si on tient compte du fait que la relation entre longueurs de corrélation
s’écrit
I
on déduit du comportement (
-
t-” que l’exposant critique
y=-
u
a la forme
In X
ln Ymax
Pour calculer les autres exposants, par exemple y, il faut introduire un
champ extérieur (c’est-à-dire plus généralement des opérateurs X, impairs).
} voisines de la
Pratiquement, on engendre des configurations { d o )très
température critique. On détermine alors les configurations après décimation {CJ!~) = p i ( { d k - ’ ) } ) } et on mesure les valeurs correspondantes XLk)
des opérateurs X,. Après moyenne statistique sur des configurations { d o ) }
indépendantes, on obtient les quantités
On en déduit alors la matrice T en récrivant l’équation (38) sous la forme
Insistons sur le fait essentiel, qui est la possibilité d’accéder directement
aux exposants sans avoir besoin d’une estimation très précise de la température critique, les coefficients de la matrice T étant des fonctions régulières
des couplages. On poursuit l’étude numérique en examinant la stabilité relativement au nombre de décimations. On a aussi un contrôle sur l’écart au
point critique. Si les résultats ne sont pas assez stables, l’ensemble {X,} est
insuffisant et doit être modifié.
Nous présentons ci-dessous les données obtenues par Swendsen pour
le modèle d’king bidimensionnel. L’ensemble des opérateurs choisis est le
suivant
74
SIMULATIONS NUMERIQUES
Opérateurs pairs
1- Proches voisins
2- Seconds voisins ( i l )
3- Quatre spins aux coins d’une
plaquette
4- Troisièmes voisins (20)
5- Quatrièmes voisins (21)
6- Quatre spins aux coins d’un
rectangle
7- Cinquièmes voisins (22)
VIII.2.3
Opérateurs impairs
1- Un spin couplé au champ magnétique
2- Trois spins voisins aux coins d’une
plaquette
3- Trois spins alignés
4- Trois spins ( 0 0 ) , (io), (21)
Les symboles (10)’ (11)’. . ., désignent les coordonnées relatives des spins
en interaction. On part d’un réseau de taille 64 x 64 et du seul couplage
entre proches voisins iixé à sa valeur critique connue. Sur les tables Ia et
Ib, on a fait figurer les exposants dominant et sous-dominant en l’absence
de champ extérieur (on ne considère que des opérateurs pairs). Les valeurs
exactes attendues sont 2 - Y = 1 et -1. Le nombre d’opérateurs introduits
croît le long de la verticale. On constate qu’un seul couplage est insuffisant
et que l’introduction de plus de deux termes ne produit pas d’amélioration
sensible dans la table Ia. En revanche on voit dans la table Ib qu’il est
nécessaire d’accroître le nombre de couplages pour obtenir une évaluation
précise de l’exposant du terme sous-dominant. Bien entendu cet exemple
est très favorable, encore que l’on s’attende plus généralement à ce que la
méthode s’applique avec un petit ensemble de couplages bien choisis. Le
nombre d’itérations (par blocs 2 x 2) varie dans la direction horizontale.
L’instabilité du flot est apparente sur la partie droite de la table. Elle est
diie ici à des effets de taille finie, mais dans un cas plus général elle pourrait
correspondre aussi à un écart à la température critique. La table IC présente
une analyse similaire relative à l’exposant magnétique (ici la dimension du
champ magnétique esl, 2 - ,LI = 1.875) impliquant les opérateurs impairs,
analyse à laquelle s’appliquent des commentaires analogues. On poursuit
l’étude en modifiant la taille du réseau (les résultats, qui ne sont pas
donnés ici, confirment la validixé de la méthode). On peut encore tester la
technique en utilisant les mêmes données, et en considérant deux itérations
consécutives comme une seule décimation d’un facteur X2. Si on constate des
différences significatives, on en conclura que certaines interactions que l’on
a négligées sont en f a t importantes (inversement, remarquons qu’un bon
accord ne signifie malheureusement pas que la méthode soit nécessairement
correcte).
(i) On n’a pas inclus les effets de taille finie dans la discussion précédente.
Ceci peut être fait L l’aide d’une procédure un peu plus complexe. Cette
dernière implique deux simulations indépendantes sur deux réseaux dont la
taille diffère par un facteur A. Les constantes de couplage sont ajustées de
telle sorte que la ( n$. 1)-ième décimation sur le plus grand réseau et la n-ième
sur le plus petit donrient des valeurs identiques pour les valeurs moyennes des
VIII.2.3
75
SIMULATIONS NUMERIQUES
(a)
1
2
3
4
5
6
7
1
0.912( 2)
0.967( 3)
0.968( 3)
0.969(4)
0.969(4)
0.969( 3)
0.969( 5)
2
0.963(4)
0.999(4)
1.O01(4)
1.002(5)
1.001(5)
1.001(5)
l.OOO(5)
3
0.957(2)
0.998(2)
0.999(2)
0.999(2)
0.997(2)
0.997( 2)
0.997(2)
4
0.940( 7)
0.993(6)
0.992( 6)
0.988( 5)
0.990( 5)
O. 988(5)
0.984(4)
(b)
1
-2.19(3)
-2.17(3)
-1.11(3)
-0.94(3)
-1.04(3)
-1.08(21)
2
-2.20(4)
-2.34(6)
-1.14(3)
-0.94(3)
-1.04(3)
-1.03(4)
3
2
3
4
5
6
7
-2.20(3)
-2.56(6)
-1.16(3)
-0.91(2)
-0.98(2)
-0.99(20)
4
-2.32(8)
-2.56(22)
-1.35(20)
-0.80(8)
-0.84(9)
-0.76(20)
(cl
1
2
3
4
1
1.8810(1)
1.8804(1)
1.8806(1)
1.8808(1)
2
1.8757(2)
1.8758(2)
1.8758(2)
1.8759(2)
3
1.8731(4)
1.8740(4)
1.8740(4)
1.8741(4)
4
1.8706(5)
1.8735(7)
1.8732(8)
1.8737(9)
’
Table I : Détermination des exposants pour un système d’king bidimensionnel sur un réseau de taille 64 x 64 à l’aide de la méthode de
renormalisation Monte Carlo, d’après Swendsen. Les erreurs sur le dernier
chiffre sont indiquées entre parenthèses. ( a ) Exposant thermique dominant.
( b ) Exposant thermique sous-dominant. ( c ) Exposant magnétique.
quantités X,. Comme les grandeurs physiques doivent être égales, les effets
de taille finie sont identiques et disparaissent du résultat final.
(ii) Différentes améliorations ont été proposées. Décrivons ici une version
} engendrées avec un poids
(Gupta et Cordery) où les configurations { u ( ~ )sont
avec
u p =pi({#)})
dépendant des variables de blocs. Les constantes de couplage 9:’) de l’action
décimée sont remplacées par des valeurs approximatives g a . L’avantage de
cette méthode est que l’introduction de couplages à la fois pour les sites et
pour les blocs diminue les corrélations temporelles à longue portée dues à la
divergence de la longueur de corrélation. Si l’approximation était exacte, les
variables de bloc seraient non corrélées
76
SIMULATIONS NUMERIQUES
VIII.2.3
(xp) = O
(45)
S’il n’en est pas ainsi, on a au premier ordre
de telle sorte qu’il esi possible de déterminer les couplages renormalisés sans
erreur de troncation
La procédure peut être itérée. Si les valeurs propres de T, correspondant
aux opérateurs inessentiels, sont suffisamment petites, on atteint l’action
correspondant au point fixe en deux ou trois itérations. La détermination des
exposants est alors poursuivie comme ci-dessus.
2.4 Equation de Langevin
Nous avons déjà souligné l’importance de la dynamique engendrant
le processus de Markov qui sous-tend la méthode de Monte Carlo. Mais
nous ne nous sommes pas étendus sur le sujet qu’il est difficile d’analyser
théoriquement. I1 a été suggéré d’employer une méthode engendrant les
configurations selon un schéma dynamique plus aisé à contrôler. La méthode
de quantification stochastique utilise les équations classiques du mouvement
complétée par un terme additionnel engendré par un bruit blanc. Cette
iEchnique a des app1ic;itions intéressantes à la détermination des fonctions
de corrélation et aux simulations fermioniques. Elle trouve son origine dans
une proposition de Parisi et Wu Yong Shi destinée à s’affranchir d’un choix
de jauge dans les théories invariantes locales.
Considérons un modèle général, correspondant à l’action S[cp]. L’évolution classique des champs soumis à un bruit additionnel dépendant du
temps q ( t ) est décrite par l’équation de Langevin
Le premier terme tend à attirer le système vers son point d’équilibre
classique. Le terme d’excitation est pris comme une variable gaussienne
(77i(t)) =O
(%(t)7lj(t’))=azjqt - t’)
(49)
...
La notation (.) repréernte ici la moyenne stochastique sur le bruit. Nous
surlignerons les quantités obtenues comme valeurs moyennes sur les champs.
VIII.2.4
SIMULATIONS NUMERIQUES
77
La loi de probabilité P(cp,t ) relative aux configurations des champs satisfait
alors à une équation de Fokker-Planck qui résulte aisément de (48)’ à savoir
a
6
[
“1
6s
t )+ 2
-P(cp, t ) = - --P(cp,
at
6vi
6vi
6P(cp
@i
Dans la limite stationnaire P = O, on retrouve le poids de Boltzmann
habituel exp S. De la sorte, toute observable A satisfait à
( A )t--t- i w A
(51)
Dans le cas d’une action possédant des symétries, en particulier par un
groupe local, le résultat précédent ne s’applique qu’à la partie invariante des
opérateurs A. Les composantes “longitudinales” (c’est-à-dire, en particulier,
celles qui correspondent à des transformations de jauge) ne sont soumises
qu’au bruit blanc. I1 s’ensuit qu’elles effectuent une marche au hasard et leur
valeur (quadratique) moyenne diverge comme le temps t (chapitre I). Cette
divergence n’influe pas bien entendu sur la mesure des quantités invariantes.
Ces propriétés sont à l’origine de la proposition initiale, et sont encore valables
dans le contexte d’une théorie des champs continue.
I1 est en principe aisé de mettre en œuvre une simulation de l’équation
de Langevin. En effectuant des tirages au hasard du bruit qi(t) on suit
l’évolution d’une configuration { c p } à l’aide des équations dynamiques.
Les valeurs moyennes des observables se déduisent alors des moyennes
temporelles
1
t
A = lim
t-*w
t
dtA
Cependant, comme dans toute simulation numérique, il est nécessaire
de discrétiser le temps. Si E désigne le pas temporel élémentaire, on écrira
une version discrète de l’équation de Langevin sous la forme
Nous avons utilisé une variable réduite I- = t / &et modifié l’échelle de 77
d’un facteur
de telle sorte que les nouveaux
soient des variables
gaussiennes normales indépendantes
JE,
Le temps de calcul nécessaire est proportionnel à .E-’. I1 est donc
intéressant de choisir E aussi grand que possible, ce qui nous amène à
examiner l’effet de la discrétisation temporelle. En particulier, la loi de
probabilité limite des champs ne sera plus exp S mais un poids de Boltzmann
78
SIMULATIONS NUMERIQUES
VIII.2.4
modifié exp S‘ impliquant une nouvelle action effective SI. En dérivant
l’analogue de l’équation (50) dans le cas discret, et en développant jusqu’au
premier ordre en E , on obtient une nouvelle équation de Fokker-Planck
continue correspondant à
I1 est possible de redéfinir les champs de teIle sorte que le terme quadratique
dans le coefficient de E s’annule en posant
Dans une théorie en Xp4, cet effet s’interprète à cet ordre comme un terme
de masse additionnel na2 + m2+ +XE. Des termes inessentiels affectent aussi
la constante de couplage nue.
(i) Cette technique est difficile à mettre en pratique dans le cas des
champs de jauge purs de groupe S ü ( n ) en raison de la structure non triviale
de la variété des champs. L’équation du mouvement stochastique qui remplace
(48) s’applique à un élément de l’espace tangent, c’est-à-dire de l’algèbre de
Lie. Soient ta les générateurs de cette algèbre, tels que [ta,to] = if,o7tr et
Trt,tp = fr6,p. Si a,, désigne la dérivée par rapport au paramètre conjugué
de ta dans le groupe. l’équation de Langevin discrétisée la plus simple s’écrit
où H. est une matrice hermitienne aléatoire satisfaisant à
Après quelques transformations, cette équation du mouvement discrète
conduit à une équation de Fokker-Planck à la limite continue de la forme
VIII.2.4
SIMULATIONS NUMERIQUES
79
Cette formule peut à nouveau s’interpréter comme une renormalisation des
champs accompagnée d’une modification du couplage, qui s’écrivent
p -p
(1 -
(ii) Est-il possible de trouver une meilleure discrétisation de l’équation
de Langevin de sorte que l’erreur soit d’ordre supérieur à E?
3. Simulations fermioniques
Les intégrales grassmanniennes ont été définies par leurs propriétés
algébriques et ne peuvent être calculées comme des intégrales usuelles. I1
n’existe pas de méthode permettant d’explorer stochastiquement le domaine
d’intégration, et l’existence d’une “puce grassmannienne” (comme élément
d’un ordinateur) demeure à ce jour une plaisanterie. En d’autres termes il
est impossible de simuler les fermions à l’aide d’une méthode Monte Carlo
directe et il faut effectuer les intégrales grassmanniennes en retournant à
leur définition (chapitre II, volume 1).Les simulations numériques ont donc
pour tâche d’estimer les déterminants ou les inverses d’énormes matrices,
dans les meilleurs cas où l’on est parvenu à ramener à une forme quadratique
la partie fermionique de l’action.
La chromodynamique quantique est l’un des domaines où il est nécessaire de procéder à des simulations impliquant des variables fermioniques. A
ce jour les programmes correspondants sont extrêmement lourds et coûteux
et atteignent les limites des capacités des ordinateurs. La discussion qui va
suivre risque donc de ce fait de n’avoir bientôt qu’un intérêt historique.
Nous allons nous limiter au cas de théories de jauge sur réseau. Considérons un modèle où les champs bosoniques, c’est-à-dire les variables de
liens U ,et les champs fermioniques qi, qi, ont des interactions dictées par
l’action
où n’apparaissent que des termes quadratiques dans les fermions. I1 est
généralement possible de se ramener à ce type, même dans le cas de modèles
plus complexes tel le modèle de Gross-Neveu (voir chapitre X) au prix de
l’introduction de champs bosoniques auxiliaires. Dans la discussion qui va
suivre la présence d’indices supplémentaires, décrivant les degrés de liberté
de saveur ou les composantes spinorielles, ne change rien à l’essentiel.
Si on effectue les intégrales grassmanniennes, on trouve que les champs
de jauge évoluent selon une action effective
80
SIMULATIONS NUMERIQUES
VIII.3
S,ff(U) = S,(U) + ln d e tD( U )
(63)
On conçoit que la nécessité d’obtenir la valeur du déterminant crée une
difficulté additionnelle dans l’application de la méthode Monte Carlo. Son
caractère non local introduit en outre des interactions à longue portée.
Même lorsqu’on a réussi à engendrer les configurations selon la distribution
statistique voulue, une autre difficulté se présente dans la mesure des
observables impliquant des champs fermioniques. Nous avons en effet
Le problème est donc d’obtenir la matrice inverse D(U)-’ dépendant de la
configuration {U}, qui apparaît dans les moyennes fermioniques. Dans un
premier temps on se limite à une approximation qui simplifie énormément
les simulations et qui revient à négliger les paires de quarks virtuels.
3.1 Approximation des variables fermioniques gelées
L’hypothèse la plus violente consiste à décréter que le terme en
lndet D ( U ) dans (63) n’a que peu d’influence sur la distribution des configurations des champs de jauge, du moins en un sens qualitatif, et même
semi-quantitatif (on parle alors d’“approximation gelée”, en sous-entendant
les variables fermioniques). L’intérêt pratique de cette hypothèse est évident, puisqu’elle évite d’évaluer (répétitivement) le déterminant, opération
fort longue. Un autre intérêt (qui pourrait cependant être un défaut) est
que l’action effective devient indépendante des détails du modèle fermionique (choix de la discrétisation de ces variables, nombre de saveurs, masses
nues des quarks, etc...]. Ainsi les mêmes configurations peuvent être utilisées
tout en modifiant les paramètres et les caractéristiques de la partie fermionique du modèle (qui interviennent cependant dans le calcul des moyennes
des observables telles que celles qui sont décrites par les équations (64b)( 6 4 ~ ) )On
. peut de la sorte effectuer des comparaisons précises sans erreurs
statistiques.
L’approximation gelée revient à découpler les paires de quarks virtuels
comme s’ils avaient de très grandes masses. En effet, si l’on sépare le
propagateur des quarks en une contribution cinétique et une contribution
VIII.3.1
massive, D ( U ) = A ( U )
l’action effective s’écrit
SIMULATIONS NUMERIQUES
81
+ m, et si on effectue un développement en l / m ,
i
Figure 7 : les deux termes qui interviennent dans la détermination de
la masse des mésons.
à un terme additif près sans intérêt. On voit que le déterminant est en
apparence négligeable lorsque m tend vers l’infini. Cet argument naïf néglige
bien entendu les effets de renormalisation et peut être franchement faux dans
le cas d’anomalies. Ces dernières correspondent précisément au cas où la
combinaison d’un coefficient qui tend à s’annuler (une puissance inverse de
m ) et un terme divergent conspirent pour engendrer un ou plusieurs termes
finis dans le développement précédent. Ignorons cependant cette possibilité
ici. I1 n’en reste pas moins que l’approximation gelée devient douteuse dans
les cas où on s’attend à ce que la création (et l’annihilation) de paires
virtuelles joue un rôle important. Considérons par exemple le propagateur
mésonique ( ( & q i ) ( q j q j ) ) .Les deux termes du membre de droite de l’équation
(64c) sont représentés schématiquement sur la figure 7. Le diagramme
( b ) engendre des boucles par itération, de sorte que sa contribution est
fortement reliée aux termes négligés dans l’approximation gelée. Cependant
la contribution de ce terme s’annule dans de nombreux cas d’intérêt en
raison de règles de sélection sur le moment angulaire ou les nombres
quantiques internes; il en est ainsi lorsqu’on étudie le propagateur des
mésons p et 7 r . I1 est néanmoins important dans des cas tels que celui du
méson q qui est un singulet du groupe de saveur (ce cas fait aussi intervenir
l’anomalie mentionnée ci-dessus). Ces états ayant une masse relativement
élevée, on peut supposer que l’approximation gelée est raisonnable dans la
spectroscopie des mésons les plus légers 7 r , p, K , K * , etc, ainsi que des
baryons légers N , A, A, C, etc.
82
SIMULATIONS NUMEFUQUES
VIII.3.1
La formule ( 6 5 ) fournit un procédé systématique pour évaluer les corrections en i / m à l’approximation gelée. Le développement correspondant dit
en paramètre d e saut reste difficile à employer et n’a pas fourni jusqu’ici des
améliorations très sensibles.
Les simulations utilisant l’approximation gelée ne peuvent se passer de
l’évaluation de la matrice inverse G = D(U)-’. En pratique cette évaluation
consomme une part importante du temps de calcul.
Deux remarques permettent de simplifier cette inversion de matrice. Tout
d’abord il est en général suffisant de calculer une seule colonne de la matrice
G . En effet, dans la plupart des applications on cherche à obtenir les masses
des mésons ou des baryons à partir de la loi de décroissance des corrélations
((Qiyq,)(ijjyqj))et ( ( & Q i i j i ) ( q j q j q j ) ) , symboliquement, en gardant l’indice i
fixe et en faisant varier j. En second lieu la matrice D est maigre en ce sens
qu’elle ne fait intervenir que des termes entre proches voisins. De ce fait la
multiplication par cette matrice est peu coûteuse. Ces propriétés peuvent être
mises à profit dans des techniques itératives. Dans la méthode de Gauss-Seidel,
applicable à une matiice positive définie D , on considère la suite
Ces équations se découplent pour chaque colonne de G , et l’on espère atteindre
le point fixe de la suite, G = D - l , si E est suffisamment petit.
On étudiera les propriétés de convergence de cette suite dans une base
qui diagonalise D et cm montrera que dans des simulations de champs de jauge
effectuées à des valeurs de 0 assez grandes, la convergence est assurée pourvu
que E < Cstm, c’est-à-dire en pratique pour des masses de quark élevées. Le
nombre d’itérations iiécessaires pour atteindre une précision fixée à l’avance
croît comme l / m pour des masses de quark faibles.
On peut apporter diverses améliorations. Par exemple on pourra utiliser
une procédure de relaxation du second ordre
en ajustant empiriquement les valeurs de E et p pour obtenir une convergence
plus rapide. La valeur p = f de la méthode de Runge-Kutta est théoriquement
la meilleure pour assurer une approche vers la limite désirée, mais des valeurs
légèrement supérieures de ce paramètre fournissent des suites par excès pour
un temps assez long et donnent de ce fait des meilleurs estimations quand on
n’utilise qu’un petit nombre d’itérations.
Une autre amélioration utilise les valeurs { G ( n )- G ( n - l ) } pour estimer
les erreurs et donc la meilleure valeur à choisir pour E à l’étape suivante de
l’itération. Ceci conduit à ce qu’on appelle la méthode du gradient conjugué.
VIII.3.2
SIMULATIONS NUMEFXQUES
83
3.2 Fermions dynamiques
Allons maintenant au-delà de l’approximation grossière de la soussection précédente et analysons les techniques disponibles en pratique pour
traiter l’action non locale complète (62).
Par bonheur dans l’algorithme Monte Carlo de réactualisation, il n’est
pas nécessaire de calculer chaque fois l’action complète (62). Seule sa
variation SSe, est en réalité requise lorsqu’on fait varier un champ U +
U + S U . On a
de sorte qu’on retrouve le problème d’estimer G = D(U)-’. Ce calcul
se présente maintenant à de nombreuses reprises, non seulement dans la
mesure des observables comme c’était déjà le cas précédemment, mais aussi
à chaque pas de réactualisation. Les méthodes les plus directes sont celles
qui ont été présentées ci-dessus. Elles sont malheureusement très coûteuses.
I1 existe cependant une méthode, dite des pseudwfermions, qui introduit
des variables bosoniques complexes auxiliaires {pi} (les pseudo-fermions)
et qui se fonde sur l’identité
Cette expression est évaluée par une méthode statistique grâce à une
simulation Monte Carlo ordinaire portant sur les variables cp.
Si la matrice D n’est pas définie positive, les intégrales (69) perdent
leur sens. On s’affranchira de ce problème en utilisant une action pseudofermionique p i D t D<p (qui introduit des interactions entre seconds voisins).
La valeur moyenne (ptp) fournit la matrice inverse (DtD)-’ dont on tire
la quantité voulue D-’ = (DtD)-’Dt après multiplication rapide par une
matrice maigre.
Nous avons maintenant affaire à deux simulations Monte Carlo, celle
relative aux pseudo-fermions s’insérant à l’intérieur de celle pour les champs
de jauge. En principe SS,, doit être calculée chaque fois à l’aide d’un champ
de jauge réactualisé et l’algorithme des pseudo-fermions peut se révéler assez
lent. A l’heure actuelle on ne calcule SSe, qu’une seule fois à la fin d’un
balayage complet du réseau. Cette approximation est supposée suffisamment
précise pourvu que ôU reste assez petit.
Etendre la méthode de quantification stochastique pour prendre en
compte les fermions et généraliser la formule (58) en y incluant l’effet du
déterminant.
84
SIMULATIONS NUMERIQUES
VIII.3.3
3.3 Spectre hadronique
Nous concluons ce chapitre par une rapide revue des tentatives pour
prédire le spectre de niasse des particules “élémentaires” légères à partir
des simulations numériques de la chromodynamique quantique sur réseau.
Rappelons d’abord quelques détails du modèle. Les interactions fortes sont
décrites par une théorie de jauge SU(3) des degrés de liberté de couleur
qui couplent plusieurs familles de quarks. Nous nous bornerons ici aux
hadrons légers d’étrangeté nulle et ne retenons donc que les quarks de masse
la plus faible. Ces derniers forment un doublet isotopique pour le groupe
de saveur SU(2). Les particules observées sont des états liés singulets de
couleur en raison du confinement des quarks. Les opérateurs créant ces
particules sont selon toute vraisemblance non locaux. Cependant comme ils
possèdent une composante locale n’impliquant que des champs de quarks
évalués au même point, on n’étudie pour simplifier que les longueurs de
corrélation des produits d’opérateurs correspondants, qzqz pour les mésons,
qzqzqz pour les baryons. On couple les indices spinoriels et d’isospin de
manière à produire des états de nombres quantiques bien définis, en tenant
compte des limitations imposées par le groupe ponctuel fini du réseau.
Par exemple le méson T pseudo-scalaire d’isospin 1 est étudié à l’aide de
l’opérateur qzZy5Tq,, où T désigne l’ensemble des trois matrices 2 x 2 de
Pauli agissant sur les indices d’isospin des quarks. Nous indiquons dans
la table II les principitles caractéristiques des particules les plus légères
dépourvues d’étrange%. Une étude plus complète doit bien entendu inclure
les quarks lourds et e n particulier le quark étrange qui figure dans des
particules porteuses d’étrangeté relativement légères comme le méson K ,
doublet isotopique pseudo-scalaire (495 MeV).
Dans la spectroscopie des hadrons légers, la chiralité joue un rôle
important bien qu’il ne s’agisse que d’une symétrie approximative. Dans la
limite où la masse des quarks s’annule, le théorème de Goldstone prédit que
le pion a une masse nçlle. Sa masse très faible (139MeV) en comparaison
de la valeur typique de l’ordre de 1GeV pour les autres particules, ainsi
que la vérification expérimentale des prédictions de l’algèbre des courants,
montrent l’importance de la brisure spontanée de l’invariance chirale. Les
simulations Monte Carlo sont actuellement effectuées à l’aide de l’action
fermionique de Susskind (VI.157) ou de celle de Wilson (VI.150). On se
souvient que la première possède une symétrie chirale discrète et on s’attend
dans ce cas à ce que la masse du pion s’annule avec la masse du quark. La
figure 8 montre une vérification de ce comportement.
Lorsqu’on utilise l’action de Wilson, l’invariance chirale est explicitement brisée par la régularisation due au réseau, mais on espère la retrouver
à la limite continue. Si T désigne le paramètre qui figure dans cette action,
cette limite de masse nulle ne se produira pas à la valeur naive 1/2dr du
paramètre de saut K = 1 / [ 2 ( m u + d r) ]lorsque la maille u tend vers zéro, en
raison des effets de la renormalisation sur la masse du quark. Ces effets ne
VIII.3.3
SIMULATIONS NUMERIQUES
Particule
85
P ( J ~ ) CMasse (MeV)
1-(O-)+
1+(1-)O-(1-)O+ ( O - ) +
1-(1+)+
1+(1+)1-(O+)
O+ (Of)+
139
770
783, 1020
549, 958
1270
1235
980
975
i (:+)
939
$ ($+)
1232
Table II : Caractéristiques expérimentales des particules légères. Nous y
faisons figurer I’isospin I, la G-parité selon le cas, le spin J , la parité P et la
conjugaison de charge C. Le contenu en quark est indiqué dans la dernière
colonne pour les états mésoniques.
I
Figure 8 : ( u ) Masses des états hadroniques légers dans un modèle
utilisant l’action fermionique de Susskind, en fonction de la masse du quark.
( b ) La masse du pion en fonction de la racine carrée de celle du quark; le
comportement linéaire est celui prédit par l’invariance chirale (d’après D.
Barkai, K.J.M. Moriarty and C. Rebbi, Phys. Lett. 156B,385 (1985)).
86
VIII.3.3
SIMULATIONS NUMERIQUES
sont pas contrôlés par défaut de symétrie chirale. La valeur critique deviendra K, et l’invariance chirale sera restaurée lorsque le paramètre K tend
vers K, par valeurs infkrieures. C’est bien ce qu’on observe sur la figure 9,
où le point critique correspond à l’annulation de la masse du pion.
ma
I
.I
6.6
6 .I
I
1.0
I
2
Figure 9 : Masses hadroniques en fonction de l’inverse du paramètre
de saut dans une simulation utilisant l’action de Wilson (d’après S. Itoh,
Y. Iwasaki et T. Yoshie, Phys. Lett. B167,443 (1986)).
Les simulations Monte Carlo étant très onéreuses, elles ne sont effectuées intensivement que pour une valeur fixée du couplage de jauge PJ.
On est confronté dans le choix de ce paramètre à deux contraintes contradictoires. La première est de prendre ce couplage aussi faible que possible
pour assurer une convergence rapide et éviter d’utiliser un trop grand réseau (l’échelle de la maille décroît lorsque BJ croît en raison de la liberté
asymptotique) qui est lui aussi un facteur de coût. La seconde contrainte
requiert un choix de couplage aussi grand que possible dans une plage où
se manifeste l’invariance d’échelle pour permettre un passage au langage de
la théorie continue et utiliser les expressions relatives à la liberté a sy m p te
tique. Malheureusement’ au moment où nous écrivons ces lignes, on n’a pas
encore effectué d’étude intensive de la limite continue en tenant compte des
degrés de liberté fermioniques. Rappelons que dans la région continue on
s’attend à ce que les masses restent constantes dans l’échelle AL donnée par
(V1.31). Dans le cas SU(3) les formules (VI.22)valables pour une théorie
de jauge pure doivent être modifiées selon
VIII.3.3
SIMULATIONS NUMERIQUES
87
où Nf est le nombre d’états fermioniques de saveur, deux dans le cas présent.
Ce nombre ne peut excéder 16 pour respecter la liberté asymptotique
(bo > O ) . Etant donné l’absence de confirmation numérique des propriétés
d’invariance d’échelle en présence des fermions, on fait l’hypothèse que la
plage dans laquelle cette invariance se manifeste est la même que dans le
cas de jauge pure. Les données sur la tension de corde (voir la figure 16 du
chapitre VI) donnent une borne inférieure PJ 2 5.7. Jusqu’ici les simulations
ont été faites pour des valeurs PJ = 5.7 ou 6 . Ces choix sont peut-être trop
optimistes.
I1 est important de vérifier que les diverses formulations sur réseau
du même modèle continu donnent des résultats compatibles. On présente
m ~ fonction de m x / m pd’après une
sur la figure 10 le rapport m ~ / comme
compilation de diverses simulations. Cette figure illustre l’état de la question
jusqu’à 1987 en montrant en outre les barres d’erreur. Avec de telles erreurs,
toutes les données sont compatibles. Cependant les simulations effectuées à
PJ = 6 et dans l’approximation gelée sont systématiquement inférieures à
la ligne pointillée, tandis que celles effectuées à 5.7 sont au-dessus de cette
ligne. Ceci semble indique qu’on n’a pas encore réellement atteint le régime
asymptotique.
I
1.0
1,
.. -.
..
.
l.21,
,
,
I
,
,
I
,
m.lm.
0.2
O.&
0.6
0.1
1.0
Figure 10: Relation entre la masse du pion et celle du nucléon
exprimées en terme de la masse du p, selon diverses simulations (d’après
Bowler et al, Phys. Lett. 162B, 354 (1985)).
88
SIMULATIONS NUMERIQUES
VIII.3.3
En conclusion, l’échantillon limité que nous avons présenté parmi les résultats numériques très nombreux obtenus par plusieurs groupes, démontre
un accord qualitatif remarquable avec le spectre physique. On s’attend donc
à ce que des simulations plus complètes incorporant les degrés de liberté fermioniques confirmeront le rôle de la chromodynamique quantique comme
théorie des interactions fortes.
Notes
La première proposition pratique de simulation Monte Carlo est due à
N. Metropolis, A.W. Rosenbluth, M.N. Rosenbluth, A.H. Teller et E. Teller,
J. Chem. Phys. 21, 1087 (1953). On trouvera une revue générale de la
méthode dans la contribution de K. Binder, Monte Carlo Investigations of
Phase Transitions and Critical Phenomena dans la série Domb et Green,
vol. 5B, Academic Press, New York (1976). Les applications aux théories de
jauge sont discutées par M. Creutz, L. Jacobs et C. Rebbi, Phys. Reports
95 201 (1983). On trouvera des indications complémentaires dans Advances
in Lattice Gauge Theory, D.W. Duke et F.J. Owens eds, World Scientific,
Singapore (1985). Voir aussi la série “Topics in current physics”, Monte
Carlo Methods in Statistical Physics, vol. 7 (1979) et Applications of the
Monte Carlo Method, vol. 36 (1984)’ K. Binder ed., Springer Verlag, Berlin.
Les algorithmes généraux intervenant dans les simulations numériques font
l’objet du livre de D. Knuth, The art of Computer Programming, AddisonWesley, Reading (1973), dont le second volume discute en particulier les
générateurs de nombres aléatoires.
Pour une discussion du ralentissement critique, voir L. Van Hove, Phys.
Rev. 93 268 (1954) et la revue de P.C. Hohenberg et B.I. Halperin, Rev.
Mod. Phys. 49 435 (1977).
La méthode de renormalisation Monte Carlo est présentée par K. Wilson dans Recent Developments in Gauge Theories, école d’été de Cargèse
1979, G. ’t Hooft et aleds., Plenum, New York (1980). Voir aussi les travaux
de S.K. Ma, Phys. Rev. Lett. 37 461 (1976), L.P. Kadanoff, Rev. Mod. Phys.
49 267 (1977). L’article de R.H. Swendsen dans Real Space Renormalization,
Topics in current physics, 30, p. 57, T.W. Burkhardt et J.M.J. van Leeuwen
eds, Springer, Berlin (1982) a inspiré la discussion de la section 2.3.
On doit la suggestion d’utiliser l’équation de Langevin dans les simulations Monte Carlo à G. Parisi et Wu Yong Shi, Sci. Sin. 24 483 (1981),
G. Parisi, Nucl. Phys. B180 [FS2] 378 (1981) et B205 [FS5] 337 (1982).
CHAPITRE IX
INVARIANCE CONFORME
Au début des années 70, Polyakov et quelques autres tentèrent d’exploiter l’invariance conforme des modèles critiques, propriété qui va au-delà
de la simple invariance d’échelle. Cette dernière multiplie les distances relatives par un facteur constant (c’est-à-dire indépendant des positions), alors
que les transformations dites spéciales font intervenir un facteur de dilatation fonction de la position. Les propriétés d’invariance correspondantes
permettent non seulement de fixer la forme de la fonction à deux points,
mais aussi celle des fonctions à trois points au point critique. Cependant
le groupe conforme est un groupe de Lie de dimension finie, et le nombre
de contraintes qui en résultent est limité. Un phénomène nouveau apparaît
en deux dimensions, bien connu dans la théorie des fonctions analytiques.
I1 s’agit de l’existence d’une infinité de transformations conformes locales.
On se propose alors d’examiner les conséquences possibles de l’invariance
conforme locale en deux dimensions. Ce programme brillamment entrepris
par Belavin, Polyakov et Zamolodchikov en 1983, est l’origine d’une vague
d’applications nouvelles en physique statistique. Comme le sujet est encore
en plein développement, le présent chapitre ne sera pas aussi élémentaire
que les précédents, pas plus qu’il ne restera vraisemblablement à jour dans
un proche futur. Ceci est d’autant plus vrai que ce sujet est étroitement lié à
la théorie des cordes, qui vise à la description quantique d’objets étendus et
propose d’englober toutes les interactions connues, en incluant les théories
de jauge et la gravité.
Les idées d’invariance d’échelle locale, et peut-être même de groupe
de renormalisation local, ne sont pas encore complètement élucidées. Elles
nous incitent cependant à examiner avec soin divers aspects des phénomènes
critiques qui n’occupaient pas le devant de la scène. L’un d’entre eux est la
pertinence des effets de taille finie, où, en raison de l’absence d’une échelle
de longueur intrinsèque, on observe une sensibilité maximale à des effets
géométriques comme ceux des frontières. De même on s’interrogera sur
la signification des valeurs obtenues pour les exposants et les corrélations
critiques ... I1 s’avère que pour de nombreux systèmes bidimensionnels,
ceux-ci possèdent une interprétation inattendue en termes de théorie des
groupes (et même de théorie des nombres), car ils sont reliés à la théorie
des représentations de certaines algèbres de Lie infinies. Une troisième
90
INVARIANCE CONFORME
question, à laquelle on connaît seulement une réponse partielle à ce jour,
et qui n’est pas traitée ici, est la relation avec les modèles intégrables.
Finalement les questions les plus profondes sont probablement liées aux
généralisations possibles: étude du voisinage du point critique, ou tentative
de compréhension plus profonde des phénomènes critiques en dimension plus
élevée. Le succès actuel dans le cas bidimensionnel peut être partiellement
attribué à l’utilisation de fonctions analytiques, qui permettent de ramener
des problèmes bidimensionnels à une situation unidimensionnelle.
1. Tenseur impulsion-énergie
-
Algèbre de Virasoro
1.1 Invariance conforme
Comme les effets de taille finie jouent un rôle majeur au point critique,
nous devons d’abord préciser ce que l’on entend par système critique
dans un domaine borné. Ceci peut être envisagé de diverses manières,
soit en dilatant le domaine, soit en exprimant que le système n’a pas
de longueurs intrinsèques autres que celles dictées par la géométrie, soit
finalement en étudiant le comportement à courte distance des corrélations
et en vérifiant qu’il est en accord avec celui qui prévaut dans un volume
infini. La caractérisation locale des systèmes critiques est cruciale pour ce
qui va suivre, et sera complètement élucidée en deux dimensions.
Considérons à titre d’exemple la fonction de corrélation des spins
d’Ising en deux dimensions au point critique. D’après le chapitre II nous
savons que la dimension du champ de spins vaut $. Dans le plan infini nous
avons
On a aussi indiqué que dans une bande de largeur L(0 5 x < L ) , avec
conditions limites périodiques, la fonction de corrélation correspondante
s’écrit
Nous constatons que lorsque L + 00, ou r12 + O, cette expression se réduit
à (1).Plutôt que de modifier la géométrie (en variant L ) on préférera caractériser intrinsèquement le modèle critique par son comportement invariant
d’échelle à courte distance.
Une transformation conforme dans un espace euclidien de dimension d
est une transformation qui conserve les angles, mais pas nécessairement les
distances. Ces transforniations forment un groupe qui inclut le groupe euclidien comme sous-groupe (translations: d paramètres et rotations: $d(d - 1)
IX.1.1
91
INVARIANCE CONFORME
paramètres), dilatations (un paramètre) et transformations conformes spéciales ( d paramètres), obtenues en composant une inversion, une translation et une seconde inversion. Ceci décrit la composante connexe du groupe
conforme non compact SO(d 1,1) possédant $(d l)(d + 2) paramètres.
De façon plus correcte, l'espace euclidien est complété par un point a l'infini (ce qui lui donne la topologie d'une sphère compacte), de sorte que les
transformations précédentes sont alors bien définies en tout point.
+
+
Afin de comprendre globalement le groupe conforme, il est commode
de faire une application de l'espace euclidien complété R d ,muni de la métrique
r2 =
. . r j , sur la sphère s d de l'espace euclidien Rd+',x:
x2 = 1 en
utilisant une projection stéréographique (conforme), schématisée sur la figure
1. Les relations entre r et x sont
+. +
+
x=-
2-
2r
i +r2
i2- i
=r2
i
+
Figure 1: (a) Projection stéréographique de Sd sur Rd. (b) Le cône
isotrope (cône de lumière) dans l'espace de Minkowski Ed+','.
Si l'on utilise des coordonnées homogènes, la sphère Sd peut être identifiée avec la section x+ = 1 du cône de lumière C de l'espace Minkowski de
métrique :x - x: - x2. Les rayons du cône C sont en correspondance biunivoque avec les points de Rd U { C O } . Les transformations conformes sont
interprétées comme des transformations de Lorentz homogènes dans Rd+'sl.
Le petit groupe d'un vecteur de genre lumière s'identifie au groupe euclidien en d dimensions (le point choisi peut être considéré comme le point
à l'infini). Par exemple si le vecteur de genre lumière a pour composantes
(x+,x-,x)= (1,1,0), une translation A, est représentée par
92
INVARIANCE CONFORME
IX.1.1
Aa(1,l70)=(1,1,0)
Aa( 1, -1, O ) =( 1,-1, O )
+ a 2 ( 1 , 1 , O ) + ( O , O , a)
(4)
Aa(O,O,v) = a . v ( 1 , 1 , 0 ) +(O,O,v)
Une inversion qui appartient à la composante non connexe à l’identité de
O(d 1, I) correspond à x- -+ -x-, et une dilatation par un facteur X est
représentée par une rotation hyperbolique dans le pian x+, x- sous la forme
+
Revenant à l’espace à d dimensions, une transformation conforme
spéciale s’écrit
r-+rl=
1
+
r + r2b
2b.r b2r2
+
Sous forme infinitésimale on a
r + rl = r .+ Sr
(7)
Les déplacements euclidiens conservent la métrique et ont par conséquent un
jacobien unité. Au contraire les dilatations, tout comme les transformations
spéciales, ont un jacobien différent de l’unité, et dans le second cas
.-Wr‘) -
D(r)
1
(1
+ 2b.r + b2r2)d
Supposons que les modèles critiques soient non seulement invariants
d’échelle, mais également invariants conformes. Cette hypothèse sera progressivement étayée par la suite. Nous considérons par souci de simplicité
des observables scalaires, dont la dimension est notée A . Les hypothèses
précédentes impliquent que dans une transformation conforme, les fonctions
de corrélation obéissent à
Dans le cas d’une fonction à 2 points, utilisant l’invariance par translation,
rotation et dilatation, on obtient à une constante de normalisation C12 près
IX.1.1
INVARIANCE CONFORME
93
Sous l’action d’une transformation spéciale, il vient
Par conséquent les équations (9) et (10) ne sont compatibles que si A1 = A2
On peut définir une “base orthonormée” d’observables en choisissant les
combinaisons appropriées qui diagonalisent la matrice symétrique réelle des
coefficients Cob.Un simple changement d’échelle des champs remplace alors
Cab par 6ab. Un raisonnement analogue permet d’obtenir les fonctions à
trois points
Vérifier que (13) est bien la solution unique de la condition (9).
L’invariance conforme est à elle seule insuffisante pour déterminer la
structure des corrélations à plus de trois points. Ceci découle de ce que
certaines combinaisons comme ?-13T24/T23T14 (où ~ i dénote
j
Iri-rjl ) sont
invariantes par transformation conforme. Des informations supplémentaires
sont requises, et elles seront fournies dans le cas bidimensionnel par l’hype
thèse d’invariance conforme locale. Contentons-nous pour le moment de
traduire la condition (9) sous forme infinitésimale en écrivant
r’ =r
+ 6r
(m)
Aid
= D(r‘)
A(r’) = A(r) + 6A(r)
Exiger que la transformation infinitésimale r -+ r+6r appartienne au groupe
conforme, implique que 6r soit au plus quadratique en r, c’est-à-dire de la
forme
où bai, SA, 6 E i j = - 6 ~ j i et 6bi sont respectivement les paramètres infinitésimaux des translations, dilatations, rotations, et transformations spéciales.
Sous forme explicite
94
INVARIANCE CONFORME
IX.1.1
+ 6Xr.V + ~ ~ E ~ ~- (r JTV ,,)+Vr26b.V
~
- 2(r.Sb)(r.V)
+ AA(~’X- 2r.Sb)I A(r)
bA(r) = [Sa.V
(16)
Par conséquent, si 6AD(rp)dénote la variation correspondante du champ
(scalaire) A,, l’équation (9) exprime que
n
(Al(r1). . SA,(r,).
. .An(rn)) = O
(17)
p=l
Généraliser les expressions ci-dessus au cas des champs tensoriels
1.2 Tenseur impulsion-énergie
Les théories critiques dans un espace euclidien infini sont obtenues par
un processus limite à partir d’une intégrale (ou d’une somme) sur des poids
de Boltzmann. Les observables locales sont exprimées en termes des champs
fondamentaux qui apparaissent dans ces poids, et que nous désignons
collectivement par A. Les fonctions de corrélation sont des moyennes prises
avec un poids de Boltzmann, le facteur de normalisation étant la fonction
de partition. Si nous oiiblions le passage à la limite, nous pouvons effectuer
au numérateur un changement de variables d’intégration (ou de sommation)
du type A(r) -+ A(r) i-6A(r)
où Sr(r) est mairitena,nt un champ vectoriel arbitraire, c’est-à-dire qu’il
n’est pas nécessairement de la forme (15). Nous supposons de plus que
les observables A, se transforment comme dans (18)’ auquel cas elles
appartiennent à une classe restreinte (les dimensions correspondantes sont
notées Ai). Quoi qu’il en soit, nous désignons par 6A, la variation de
l’observable A,. Dans ces conditions la variation totale des fonctions de
corrélation contient non seulement une contribution analogue à (17)’ mais
elle inclut aussi un terme provenant du comportement de la mesure (qui
inclut le poids de Boltzmann) dans le changement de variables (18). Ce
terme est du premier ordre en 6r, et s’annule manifestement quand 6r est
constant (cas d’une translation). I1 ne peut donc dépendre que des dérivées
de Sr. Comme nous nous plaçons dans le cadre d’une théorie locale, nous
écrivons la forme la plus simple possible, comme postulat définissant le
tenseur impulsion-énergie
IX.1.2
INVARIANCE CONFORME
95
n
(Al (r1). . . SAp(rp). . . A n ( r n ) )
p= 1
+
(19)
1
d d r ( A l ( r 1 ) . .An(rn)Tij(r))
dibrj(r) = O
Cette formule est analogue à celle qui définit le tenseur impulsion-énergie
de l’espace de Minkowski, où cette construction fournit le courant de
Noether des quantités conservées, impulsion et énergie. C’est ce qui explique
la terminologie. Etant donné un lagrangien, on obtient sans peine un
candidat classique pour Tij. On peut cependant rencontrer au cours de
la quantification des difficultés, dont l’origine réside dans la définition et
le comportement de la mesure d’intégration. A ce point il est donc plus
honnête de considérer (19) comme un postulat, que nous appellerons identité
de Ward, exprimant le comportement des corrélations sous l’action d’un
changement de coordonnées différentiable infinitésimal. Dans un contexte
plus général, le tenseur impulsion-énergie apparaît comme la réponse à un
changement infinitésimal de métrique, ce qui assure qu’il est symétrique.
Nous ne nous engagerons pas dans cette voie, bien que la plupart des
applications bidimensionnelles suggèrent que l’on a beaucoup à apprendre
des propriétés d’une théorie quantique sur un espace courbe.
Revenant à l’équation (19)’ examinons les contraintes qu’implique
l’invariance par transformations euclidiennes et par dilatations globales.
Substituant les expressions correspondantes pour SA, et ôr, nous obtenons
(i) Invariance par translation, 6r constant: l’équation (19) se réduit à (17).
(ii) Invariance par rotation: diSr, = S ~ j i= -&ij constant. Pour que
l’équation (19) se réduise à (17)’ il faut que Tzj soit symétrique
Tij(r)= Tji(r)
(20)
(iii) Invariance par dilatation: SiSrj = &SA. Pour retrouver (17) le tenseur
impulsion-énergie doit être de trace nulle
Si l’on considère maintenant une transformation spéciale, telle que
&Srj = 2 (r& - r,Sbi) - &,(Sb.r), le second terme de (19) s’annule
identiquement compte tenu de (20) et de (21). I1 s’ensuit que dans une
théorie locale l’invariance euclidienne et l’invariance d’échelle suffisent à
elles seules à assurer l’invariance par le groupe conforme. Ceci constitue
l’importante observation initiale.
Si l’on interprète un changement infinitésimal de coordonnées dans le
sens actif, le carré de l’élément infinitésimal de longueur entre points voisins
est modifié suivant (gi:)
= 6ij)
96
INVARIANCE CONFORME
IX.1.2
s
Substituant $Ti,âgij for TijaiSrj, on trouve que ddrTij(r)6gij(r) apparaît
comme la réponse de la mesure fonctionnelle (y compris le poids de Boltzmann)
à un changement de métrique. Comme tout est rapporté ici à la métrique de
l’espace euclidien gi;), nous n’avons pas jugé utile de distinguer entre indices
covariants et controvariants.
Supposons que pour une variation générale de coordonnées, les variations de SA, soient locales, de la forme (18).Supposons en outre Sr arbitraire
et de support compact. Après une intégration par parties, nous pouvons récrire l’équation (19)’ en identifiant le coefficient de Sr, sous la forme
n
=
p= 1
{S(r
- rp)8jp)-
d
(ûjS(r - r,))} (Al(r1).. . An(rn))
(23)
Cette équation exprime la conservation du tenseur impulsion-énergie. De
fait le membre de droite et par conséqueat celui de gauche s’annulent pour
r appartenant à un domaine arbitraire privé d’un voisinage des points r l ,
... rn.
I1 n’est pas possible pour le moment d’aller beaucoup plus loin dans
le cas général. Nous nous restreignons donc désormais aux propriétés spécifiques à la dimension deux.
1.3 Transformations conformes en deux dimensions
En deux dimensions, le groupe conforme global n’est autre que le
groupe de Lorentz familier S O ( 3, l) . I1 peut être réalisé sous forme de
transformations homographiques du plan complexe (complété par un point à
l’infini). Ces transformations exhibent l’isomorphisme des groupes S O ( 3 , l )
et SL(2,C)/ { &l}.Au lieu d’utiliser deux coordonnées réelles indépendantes
x et y, il est commode d’introduire les deux combinaisons complexes z =
x + iy et Z = x - iy. Avec ces notations la métrique euclidienne devient
antidiagonale, et il faut prêter at tention aux composantes des tenseurs. Nous
écrivons
IX.1.3
97
INVARIANCE CONFORME
Nous utiliserons souvent la notation abrégée d pour ô, et
avons donc
8 pour dz . Nous
Un tenseur symétrique de trace nulle tel que T est obtenu dans une base
z , 2 en formant le scalaire
+ i (Tll + iT12) r”
T ~ ~=< (Tll
~ ( -~iT12) t2
où
= t1
+ i t 2 , f = t1 - i t 2 . Ainsi
Avec a , b, c, d complexes obéissant à ad - bc = 1, les transformations
conformes globales s’écrivent
z,Z
+ z‘,
2‘
2’
az
+b
= f(z) = -
cz
+d
- az+b
Z’ = f ( ~=) - (27)
cz
+2
On peut aussi envisager les transformations conformes globales qui changent
l’orientation et correspondent à la composante non connexe à l’identité.
Elles sont engendrées par la conjugaison complexe et ne joueront pas
pour l’instant un rôle crucial, car nous nous occuperons principalement de
transformations infinitésimales.
Les champs tensoriels se transforment avec multiplication par des
Ici nous rencontrons une spécificité de
puissances entières de f’ et
la dimension deux, où il est possible d’envisager une généralisation de la
notion de tenseur comportant un nombre non entier d’indices z et 2 . Plus
précisément nous définissons un champ de poids conformes ( h ,h ) comme un
champ se transformant selon
7.
A ( z ,Z )
+
A’(z,2 ) = f’(z)hmhA(f(z),m)
où h ne représente pas le complexe conjugué de h. La notation suggère
simplement que le poids h est associé au comportement relatif à la variable
2. La quantité h - 6 joue le rôle de moment angulaire, ou de spin, et implique
que par rotation z -+ e%, A’ est multiplié par ei(h-h)p.Dans la suite nous
considérerons principalement des champs de spin h - h entier. De fait ce
sont les seules observables. Cependant il est naturel d’envisager également
98
INVARIANCE CONFORME
IX.1.3
le cas de fermions de spin demi-entier, et d’autres généralisations
ont été
examinées. La dimension A est la somme
A=h+h
Pour un champ scalaire réel nous avons
h = h = ’ A2
Nous pouvons récrire l’équation (29) sous forme infinitésimale
+
( A SA)dzhdZh.== A ( z + 62,Z
+ SZ)[d(z + Sz)lh[d(Z+ 6Z)]’
Par conséquent, avec
62 := E ( z )
6A = SZA+ SZA
(33)
nous avons
S,A(z,Z) = { & ( z ) d , + h & ’ ( z ) } A ( z , Z )
& A ( z ,2) = {E(z)dz + hE’0) A ( z ,2 )
(34)
Comme on l’a déjà indiqué, la nouveauté du cas bidimensionnel est l’existence d’une classe infinie de transformations conformes engendrées par une
fonction analytique arbitraire f( z ) au lieu de la fonction homographique,
que nous avions utilisée jusqu’à présent (nous laissons de côté la possibilité
que f puisse être une fonction analytique de 2 ). Que ces transformations
soient conformes résulte immédiatement de ce que la métrique se transforme
selon
~
d,zdz -t dfdf = f’(z)f‘(z)dzdZ
(35)
de telle sorte que les angles sont préservés, les longueurs étant multipliées
localement par un facteur de dilatation If’(z)l.L’interprétation de telles
transformations ne va pas de soi. En effet, en général
(i) la fonction f ( z ) n’est pas définie dans tout le plan complexe
(ii) même dans ce cas (en admettant des pôles isolés), elle ne définit pas
une application bijective.
Les seules applications bijectives du plan complexe (complété) sont les
transformations homographiques, c’est-à-dire celles correspondant au
groupe global. I1 y a alors deux interprétations possibles, toutes deux intéressantes. Dans la première, nous utilisons l’hypothèse d’invariance locale
pour obtenir des quantités relatives au domaine transformé. Ci-dessous nous
examinerons par exemple une telle application du plan privé d’un point sur
IX.1.3
INVARIANCE CONFORME
99
un ruban périodique. Dans la seconde interprétation, nous étudierons l’effet de transformations infinitésimales conformes locales telles que (33), avec
E ( Z ) considéré au premier ordre, mais à part cela fonction arbitraire de z. I1
faut garder à l’esprit que les fonctions analytiques sont rigides, c’est-à-dire
que E ( Z ) ne peut être régulier et s’annuler en dehors d’un domaine fini, tout
en restant analytique.
Dans un changement de coordonnées “infinitésimal” holomorphe arbitraire
sz
=s&g(Z)
62 =&g(z)
les champs qui se transforment selon
6 A ( z ,2 ) = SE [gaz
+ h(a,g) +
+ h(&g)]A ( z ,?)
(37)
sont appelés champs primaires. Insistons sur le fait que g est arbitraire, et
n’est pas restreint à être un polynôme du second degré en z (auquel cas A
pourrait être appelé quasi primaire). Nous traiterons de façon quasi exclusive de champs primaires, l’exception la plus notable étant, de façon surprenante, le tenseur impulsion-énergie. Pour une fonction générale g ( z , ?),
nous avons
Cette quantité s’annule pour g (g) holomorphe (anti-holomorphe). Insérons
cette expression dans l’équation (19). Naturellement le deuxième terme
s’annule dans les régions (finies) du plan z , où g et 9 possèdent la propriété
d’analyticité mentionnée ci-dessus, suggérant une propriété de covariance
des corrélations de champs primaires dans des transformations analytiques
générales. Rendons cet énoncé plus précis. I1 est commode de faire une
transformation d’échelle sur le tenseur impulsion-énergie, de façon à insérer
un facteur 1/27r dans l’intégrale de définition de T . Choisissons une paire
de fonctions g , 9, s’annulant suffisamment vite à l’infini pour permettre des
intégrations par partieS.Nous supposons g holomorphe, anti-holomorphe
au voisinage des points 2 1 , . . ., z,, de telle sorte que nous puissions utiliser
l’équation (37)’ et posons g p g(z,, Z p ) , 8, ûzl,.Nous obtenons
n
100
INVARIANCE CONFORME
IX. 1.3
Comparant les deux membres de cette équation, on en déduit que
ûz (T,,(z, ??)Al. . .A,) s’annule sauf aux points z1 .: .z,. Une relation ana,
. . . A,). L’équation (39) montre que la
logue s’applique à a, ( T z z ( z Z)Al
première de ces fonctions est méromorphe en z , avec des pôles simples et
doubles situés en z1 . . . 2 , et qu’une propriété conjuguée est valable pour la
seconde, de sorte que nous pouvons écrire l’identité de Ward sous la forme
Etant donné le traitement parallèle des variables z et Z , nous omettrons
par la suite de répéter les équations, et nous n’expliciterons que la partie
relative à z. Le lecteur prendra garde au fait que certains champs, comme
A ci-dessus, peuvent dépendre à la fois de z et 2, alors qu’il résulte de
l’équation (40) que T,, ne dépend que de z , dans le sens où les corrélations
avec insertion de T,, sont des fonctions méromorphes de la variable z . En
conséquence nous le désignerons par T ( z ) , et de façon analogue, TzZsera
noté T ( t ) .
Soit maintenant g( z ) analytique dans un domaine qui inclut les points
z l , ..., z,, et soit C une courbe dans ce domaine qui entoure ces points une
fois dans le sens positif. La forme intégrale de (40) s’écrit
et on obtient une équation analogue conjuguée pour T . Les générateurs des
transformations conformes globales correspondent à des fonctions g ( z ) qui
sont des polynômes du second degré en z , auquel cas le membre de droite
de l’équation (41) doit s’annuler. I1 s’ensuit qu’une fonction de corrélation
avec insertion de T ( z ) doit s’annuler comme z - ~pour z grand
( T ( z ) A ~z1)
( ~. .~.A,(z,,
,
z,))
Z’CO
z - ~ ~ (z1;
z ~- . ;, z,, 2,)
(42)
(et à nouveau une équation conjuguée s’applique à T ) . La dimension canonique de T est deux (et d en dimension d ) , puisque son intégrale doit être
IX. 1.3
INVARIANCE CONFORME
101
sans dimension, comme l’action. Une conclusion hâtive aurait été que le
membre de gauche de l’équation (42) s’annule comme z2-2 à l’infini. Le
présent énoncé est plus fort, et implique l’invariance conforme globale. Un
polynôme du second degré dépend de trois paramètres complexes, ce qui
est bien sûr la dimension (complexe) du groupe SL(2,C). Combinant (42)
et (40)’ nous déduisons, par un développement autour de z = 00, que les
transformations conformes globales entraînent
n
translations
p= 1
n
( ~ ~ a+, h~p>)( A l ( z 1 , E l ) . . . An(zn, 2,))
=O
dilatations (complexes)
p= 1
11
(zig,,,
+ 2hpzp)( ~ l ( z 1E,I ) . . .~ ~ ( z2,)), ,
= O transformations spéciales
p= 1
(43)
De la même façon que nous n’écrivons pas de faqon explicite les équations
conjuguées, nous omettrons parfois de mentionner la variable dans les
équations en z .
En deux dimensions, rotations et dilatations réelles sont des transformations conjuguées. Dans le formalisme complexe, elles se combinent pour
donner des dilatations complexes, ainsi que l’indique l’équation (43).
Les relations (41) expriment une forme généralisée de covariance par
transformation conforme locale infinitésimale. Pour aller plus loin, nous
avons besoin des corrélations impliquant le tenseur impulsion-énergie, et
notre première tâche consiste à étudier leur comportement dans les transformations mentionnées ci-dessus.
1.4 Charge centrale
L’invariance par translation dans le plan implique que la valeur
moyenne ( T ( z ) )soit une constante. Dans l’équation (42)’ cette constante
a été implicitement choisie égale à zéro
(44)
( T ( z ) )= (T(E)) = O
De la même façon l’invariance par translation et l’invariance d’échelle
globale entraînent que la fonction à deux points correspondante doit être
une fonction homogène de 212. De l’équation (42) nous déduisons donc
102
IX.1.4
INVARIANCE CONFORME
ce qui nous apprend que T a pour poids conformes (2’0) (et (T les poids
(0’2)) comme prévu. Le choix du facteur $- dans la normalisation de la
constante réelle c commune à T et T est conventionnel. Son objet est de
produire la valeur c = 1 pour un champ scalaire de masse nulle (ainsi qu’on
le verra ci-dessous, cf. section 2.1). Comme l’échelle de T est déjà fixée
par des relations telles que l’équation (40)’ nous n’avons pas la liberté de
fixer la valeur de c. Si la théorie admet une interprétation en termes d’un
hamiltonien quantique. agissant dans un espace de Hilbert d’états muni d’un
produit scalaire défini positif, et un spectre borné inférieurement, alors c doit
être positive, ainsi que nous le montrerons ultérieurement. Mais cela n’est en
rien nécessaire pour une interprétation statistique cohérente, et nous allons
rencontrer des exemples intéressants correspondant à c < O.
La constante sans dimension c est appelée charge centrale pour des
raisons qui apparaîtront par la suite. Une des principales conclusions de
ce chapitre sera que la connaissance de c est (presque) suffisante pour
caractériser un modèle critique dans nombre de cas. Quoi qu’il en soit, elle
fournit une information essentielle aux multiples conséquences.
L’apparition de la charge centrale c peut s’interpréter comme une anomalie résultant du fait qu’une symétrie classique (ici l’invariance conforme
locale) ne peut pas être étendue au cas quantique en raison d’effets dus à la
renormalisation. Dans le contexte des intégrales de chemin, ceci peut être
interprété en disant que la mesure fonctionnelle complète ne peut pas être
rendue invariante. On peut aussi par exemple considérer que les équations
du groupe de renormalisation expriment un comportement anormal dans
une dilatation en dehors des points fixes.
Nous venons de \air que ( T ( z ) )s’annule dans le plan infini. Si nous
avions invariance par transformations conformes locales infinitésimales, nous
nous attendrions à ce que cette valeur moyenne reste égale à zéro. Mais
à l’exception des transformations engendrées par un polynôme du second
degré en z , nous savons que nous ne pourrons pas, d’une façon stricte,
parler d’invariance, étant donné que les transformations ne sont pas des
applications bijectives du plan complexe (complété) sur lui-même. Nous
ne nous attendons pa:j à ce que ( S T ( z ) )s’annule. De fait, combinant les
équations (41) et (45)’ nous avons
z -+ z’ =z + 6 e g ( z )
T -+ T’ =T + ST
dz’ g ( z ’ )
2i7r (2’ - z ) ~
et par conséquent
( S T ( z ) )= &cg”‘(z)
SE
(46a)
IX.1.4
INVARIANCE CONFORME
103
On obtient une expression analogue pour T . Quand g est un polynôme du
second degré, g”’ s’annule et on retrouve l’invariance attendue. L’équation
(46) donne une première expression de l’anomalie. Etant donné que ( T ( z ) )=
O, et que les poids de T sont (2,0), il est naturel de postuler que la loi de
transformation minimale incorporant cette anomalie s’écrit
avec une expression analogue pour T.Ce comportement se différencie de
celui des champs primaires, donné par l’expression (33). L’équation (47)
nous apprend que T n’est pas un champ primaire. Le tenseur impulsionénergie se transforme selon une loi inhomogène, avec une contribution
supplémentaire proportionnelle à l’identité. Ceci suggère que l’anomalie
doit pouvoir être déduite du comportement correspondant de la fonction
de partition, ou de l’énergie libre.
Transcrivons ici les expressions (12) et (13) pour des fonctions a 2 et
3-points arbitraires, en omettant les variables z
Par conséquent
Vérifier que ceci est en accord avec
Considérons la généralisation de la loi de transformation infinitésimale
(47) à une transformation conforme finie correspondant à une application
du plan sur un domaine éventuellement différent. Nous avons maintenant
z’ = f(z). A T ( z ) correspondra T’(z’). Dans l’interprétation active, la
formule de transformation s’écrit
T(z)dz‘ = T’(z’)dz’’
+ &c{z‘,z}dz’
(50)
où le symbole {z’,z} désigne la dérivée schwarzienne de l’application z
z’ = f(z),soit
104
IX. 1.4
INVARIANCE CONFORME
Au premier ordre en ô&, ceci se réduit à la dérivée troisième de & g ( z ) , pour
f(z) = z &g(z).
+
I1 n’est pas évident d’obtenir la dérivée schwarzienne à partir de la
composition de transformations infinitésimales. Nous en donnerons une preuve
directe utilisant le champ libre dans la section 2 . 1 . Faisons ici une petite
digression afin de donner une interprétation de la dérivée schwarzienne. Celle-ci
joue vis-à-vis du groupe conforme global le même rôle que la dérivée ordinaire
vis-à-vis des translations. Si nous utilisons la notation
pour la différentielle quadratique correspondante (on rappelle que z’ et z sont
reliés analytiquement) la compatibilité de l’équation (50) requiert
Dans l’équation ( 5 2 c ) , on a supposé que 2 1 = f 1 2 ( z 2 ) , 22 = f 2 3 ( 2 3 ) , z3 =
f 3 1 ( z 1 ) tandis que f i 2 O f23 O f31 est la transformation identité. Finalement,
si z1 et z2 sont reliés par une transformation homographique, la différentielle
quadratique s’annule comme conséquence de ( 5 2 b , d )
az1z2+bz1+cz2+d=O
u
(52e)
[z1,22]=0
Le birapport de quatre nombres complexes est invariant par transformation homographique. Afin de mesurer de combien une transformation donnée y = f(z) diffère localement d’une telle transformation, comparons les
birapports de quatre points zi et de leurs images. Posant zij = xi - xj, nous
évaluons la quantité
213242
Y13Y42
212243
Y12Y43
Q(~,I/)=---
+
pour des valeurs x; voisines d’un point 2, de la forme zi = 2 t c i . De façon
analogue, nous développons les yi au troisième ordre en t. Un calcul élémentaire
montre que le terme dominant en Q est d’ordre t 2 , et de la forme
IX.1.4
INVARIANCE CONFORME
105
Les propriétés (52b-e) en découlent immédiatement. Observons finalement que
Nous pouvons maintenant passer à l’interprétation de l’équation (50)’
et donc de l’anomalie. A cette fin, effectuons une application conforme du
plan complexe, privé de l’origine, sur une bande périodique dans le plan
u, de largeur
L. La transformation correspondante est donnée par une
exponentielle
I
z = exp(2im/L)
(54)
im u
Re u
-;L
+L
Figure 2: Bande périodique de largeur L dans le plan de la variable u
Par conséquent
et comme ( T p ~ a i i (=~O,
) ) nous trouvons
(Tbaiide(u))= &c(2./L)2
(56)
Ceci nous permet d’interpréter l’anomalie comme un effet Casimir, c’est-àdire un déplacement de l’énergie libre comme conséquence de la géométrie
finie. Cet effet fut à l’origine prédit, puis mesuré, en électrodynamique
quantique où il donne lieu à une force entre conducteurs neutres. Le seul
fait qu’il soit mesurable bien que très faible, démontre que les interactions
électromagnétiques sont à longue portée. De même nous nous attendons
dans le cas présent à un déplacement de l’énergie libre dépendant de L, dû
aux conditions aux limites confinantes. Comme convention de normalisation,
106
INVARIANCE CONFORME
IX.1.4
nous supposons que dans le plan infini l’énergie libre par unité de surface
s’annule au point critique. En incluant le facteur 1/27r1 introduit ci-dessus,
la variation de l’énergie libre totale est donnée par une formule analogue à
(19), soit
où le domaine d’intégration V est la bande infinie. Choisissons en particulier
Srl = S E U ~Sr2 = O , qui correspond à une dilatation horizontale de la bande.
Naturellement ce n’est pas là une transformation conforme (elle est du type
quasi conforme, transformant les cercles en ellipses avec un rapport fixe
des axes). Mais la définition de T p yn’implique en rien une transformation
conforme. Le seul terme qui ne s’annule pas dans ûpSr, est dlSrl = SE, et
TI1 = T ( u )+ T ( a ) .Dans une bande infinie, la quantité In 2 est infinie. Par
invariance par translation, nous nous at tendons cependant à ce qu’il existe
une énergie libre par unité de longueur bien définie, en d’autres termes que
1
F ( L ) = lim - l n Z ( L , M )
M-oo
M
existe, pourvu qu’on impose une condition aux limites supplémentaire dans
la direction longitudinale à une distance M . En supposant que l’énergie libre
par unité de longueur possède une limite indépendante de cette condition
supplémentaire, nous concluons des équations (56)-(58) que
S F ( L ) = SELet donc
dF(L)
27r
= -=c - S E
dL
L
7r
F ( L ) = ‘c6 L
Nous avons utilisé le fait que l’énergie libre FO par unité de longueur
dans le plan infini s’annule. Sinon elle donnerait lieu à une contribution
supplémentaire FOL au membre de droite. De manière équivalente, si l’on
utilise une matrice de transfert, le logarithme de la plus grande valeur propre
X O se comporte au point critique comme
1nXO = FOL + ‘c6 L
7r
(59b)
quand L devient infini. Nous examinerons dans la section 2 la validité
des hypothèses conduisant à l’équation (59). Manifestement si certaines
corrélations croissent avec la distance, comme cela se produit dans des
modèles non unitaires, on s’attend à ce que le résultat ne soit plus valable.
Pour l’instant, supposant que toutes les corrélations décroissent avec la
distance, nous voyons qu’une relation comme (59) donne accès à la valeur
de la charge centrale, ainsi que les études numériques l’ont amplement
IX.1.4
INVARIANCE CONFORME
107
illustré. Par exemple, pour des polymères (modèles O ( n ) ,n +. O) ou pour
la percolation (modèle de Potts à Q-états, avec Q +. l ) , on trouve comme
on s’y attend c = O. Nous verrons que le modèle d’king correspond à c =
le modèle de Potts à 3 états à c = et le champ bosonique libre (modèle
gaussien) à c = 1, pour ne mentionner que ces quelques valeurs.
4
i,
1.5 Algèbre de Virasoro
L’application définie ci-dessus du plan pointé sur une bande périodique
suggère l’utilisation d’un formalisme opératoriel, avec une matrice de transfert 7. Comme cette transformation correspond à l’utilisation de coordonnées polaires dans le plan, ce formalisme a reçu le nom de quantification
radiale. L’évolution dans le teiiips est équivalente aux dilatations, et les va,leurs propres du générateur correspondant sont les poids conformes. Afin
d’alléger les notations, nous absorbons le facteur 2i7r/L dans la définition
de la variable u,de sorte que
D’après cette équation, la propagation s’effectue le long de l’axe réel u.Les
valeurs moyennes dans la bande sont identifiées à des traces de produits
ordonnés d’opérateurs (l’ordre étant pris le long de l’axe des “temps” R e u ) .
Cette procédure permet d’associer à une observable A(u)un opérateur Â(u).
La matrice de transfert est l’analogue de l’exponentielle d’un hamiltonien,
et relie les opérateurs à différentes valeurs de R e u selon
Â( Re u,Im u)= ‘TRe
”Â( O, Im u)TRe
(61)
Les corrélations sont écrites pour une suite décroissante de valeurs de R e u
sous la forme
Si nécessaire, on effectue des soustractions de façon à rendre ces expressions
connexes. Dans un contexte quantique, cette formule n’est autre que celle
de Gell-Mann et Low. Supposons pour simplifier que le modèle soit unitaire.
108
INVARIANCE CONFORME
IX.1.5
Dans l’espace euclidien, cela veut dire que 7 = exp - H , où H est hermitien
et borné inférieurement. Désignons son état fondamental unique par IO), (01
étant le bra conjugué. Dans le cas d’un modèle unitaire, la limite M -f 00
projette sur l’état fondamental si nous supposons que ce dernier correspond
à un point isolé du spectre. Comme la situation considérée implique une
bande de largeur finie, cette supposition paraît réaliste. Nous trouvons donc
Dans le cas d’une observable réelle A, l’opérateur correspondant est hermitien
et les corrélations satisfont à la propriété de positivité par réflexion
Le second argument ü n’a pas été écrit explicitement, mais il est sousentendu. Grâce à l’application exponentielle, nous pouvons exprimer les
translatioiis dans le plan u comme des dilatations dans le plan z (privé
à‘un point), à condition. de tenir compte de la loi de correspondance entre
opérateurs
Abande(U,Ü)
= Âpla*,(Z, Z)zhZh
I1 en résulte que
Dans une application conforme z -+ z’ = z
un champ primaire se transforme selon
+ & g ( z ) , avec g ( z ) analytique,
et l’équation (39) entraîne l’existence d’un opérateur ? ( z ) tel que pour jzll
lz2l
> ... > lznl,
>
IX.1.5
INVARIANCE CONFORME
109
... 6 Â p ( z p ...
) Ân(zn)JO)=
où le contour C entoure tous les points zi, tandis que le contour C' laisse
tous ces points à l'extérieur. Introduisant des contours intermédiaires, nous
voyons que ceci est équivalent à un énoncé opératoriel
Développons maintenant T, tout comme T, en série de Laurent
+W
(71)
n=-w
n=-w
Le facteur z-2 a pour origine la relation (60). Nous substituons le développement (71) dans (70), où g(z) est également développé en série de Laurent.
Identifiant le facteur de chacun de ses coefficients dans les deux membres,
nous obtenons un ensemble de relations de commutation définissant deux
algèbres de Lie de dimension infinie, appelées algèbres de Virasoro
[Lj,
Lrcl
= ( j - k)Lj+k
[Zj, L]= ( j
- k)Ej+rc
+ & c j ( j 2 - 1)6j+rc,o
+ &cj(j2
- l)Sj+k,O
(72)
[Lj,Zk]=O
Ces algèbres furent initialement introduites par Virasoro dans le cadre
du modèle dual de la physique des particules, l'ancêtre de la théorie des
110
INVARIANCE C O N F O R M E
IX.1.5
cordes, avec pour objet d’imposer ce que nous interprétons aujourd’hui
comme l’invariance par reparamétrisation. Du point de vue du plan z ,
l’origine ne joue aucun rôle particulier, et ces opérateurs T et i? pourraient
être développés au voisinage de tout autre point, obtenu comme image de
l’origine par une transformation homographique.
Les formules (72) admettent l’interprétation suivante. Supposons en
premier lieu c = O, et examinons une des deux algèbres équivalentes. On
observe alors que les opérateurs peuvent être réalisés comme opérateurs
différentiels du premier ordre de la forme
Si nous nous restreignons z au cercle IzI = 1, les champs de vecteurs e,
agissent sur des fonctions définies sur ce cercle, et sont les générateurs des
difféomorphismes du cercle unité, c’est-à-dire d’applications bijectives indéfiniment différentiables (ici connexes à l’identité). Le terme supplémentaire
dans (72)’ proportionnel à c, commute avec tous les éléments de l’algèbre.
I1 indique par conséquent une extension de l’algèbre de Lie (73) par une
algèbre unidimensionnelle. Comme cette dernière commute avec tous les
éléments, on parle d’extension centrale, et donc de charge centrale. La situation est analogue au niveau des algèbres de Lie à celle qui prévaut en
mécanique quantique, quand on cherche des représentations à une phase près
d’un groupe de symétries. Par exemple les spins demi-entiers correspondent
à une extension centrale de SO(3) par le groupe à deux éléments 2 2 , sous la
forme de SU2. Un calcul simple montre que la forme indiquée dans l’équation (72) est la seule extension centrale de l’algèbre (73) à un changement
de base près.
ou l o , e*,, engendrent tous une
Les opérateurs Lo, L&ll (Loi
algèbre à trois dimensions, qui n’est autre que l’algèbre de Lie complexe du
groupe conforme global SL(2,C). On notera que le coefficient correspondant
de l’anomalie s’annule. Le générateur LOdes dilatations est diagonal dans la
représentation adjointe [Lo,L-,] = PL-,, avec des valeurs propres entières.
I1 permet de définir une graduation de l’algèbre enveloppante engendrée
par les L,, c’est-à-dire une décomposition en sous-espaces homogènes
correspondant aux valeurs propres de LO.En d’autres termes, L-, agissant
sur un état propre de L o accroît la valeur propre de p .
Le vide est invariant par transformation conforme globale, et il est donc
annihilé par L O , L h l .Comme on suppose que T ( z )10) reste régulier quand
z -+ O (de manière que (OlT(z) quand z + CO), il s’ensuit que l’on a les
propriétés plus fortes
P 2 -1
L, 10) = O
(01 L, = O
P l l
avec des équations analogues pour
E,.
(74)
IX.1.5
INVARIANCE CONFORME
111
(i) Montrer que pour obtenir les relations (74), étant entendu que LO et
L k 1 annihilent 10) et (01,il suffit d’exiger que L2 annihile 10) à droite, ou L - 2
annihile (01 à gauche.
(ii) Comme conséquence de (74), ( O lLpl O ) = O pour tout p . Montrer à
partir des relations de commutation ( 7 2 ) que pour Iz11 > 1221 par exemple on
retrouve l’expression
Dans un modèle unitaire, une observable hermitienne obéit à la relation
Z)t = p
z - 2 q ( Z - ’ ,
2-1)
(75)
Appliquée à T ou T , cette égalité fournit une condition nécessaire pour
qu’une représentation soit unitaire
L2, = L-,
,
LtP = L-,
(76)
L’équation (40) implique, si z1 + 2 2 , ?(21)Â(22) 10) se comporte
comme h. 4z i2Â ( z 2)IO). Définissons l’état Ih, I;) par
I1 s’ensuit que
Lo Ih, 71) = h Ih, E )
P>O
L, Ih, h ) = E , Ih, h ) = O
et les relations conjuguées
Dans une représentation unitaire, le générateur des dilatations (réelles),
LO+ EO et celui des rotations, LO- EO,sont tous deux hermitiens.
Nous en concluons que l’espace des états d’un modèle critique porte
une représentation du produit des algèbres {L,}x { E , } , que nous désignons
par V x
Une telle représentation est en général réductible, contenant des
v.
112
IX.1.5
INVARIANCE CONFORME
états tels que Ih, h ) et leurs descendants, c’est-à-dire des états engendrés
par application d’un produit de Lp et de &,.
Concentrons notre attention sur une de ces algèbres, disons V . Par
isomorphisme, les raisonnements s’appliqueront aussi bien à
Considérons
une représentation possédant un vecteur appelé vecteur de plus haut poids,
c’est-à-dire un état Ih) qui remplit les conditions (77). Nous omettons
La
dans ce qui suit d’expliciter les propriétés analogues relatives à
dénomination vecteur de plus haut poids est empruntée à la théorie des
représentations des algèbres de Lie. Dans le contexte présent, il s’agit plutôt
d’un état fondamental dans un secteur donné. Considérons le “module
de Verma” engendré par Ih) , c’est-à-dire l’espace vectoriel de dimension
infinie engendré par les combinaisons linéaires finies de monômes en L,,
m > O appliqués à Ih) et supposés linéairement indépendants. Cet espace se
décompose en sous-espaces homogènes caractérisés par la valeur propre h+n
de Lo, où n est un entier non négatif, qui sera appelé le niveau. La quantité
h n est aussi parfois appelée poids de l’état correspondant. Ici ce n’est pas
autre chose que le poids conforme d’un champ non primaire, qui crée cet
état quand il est appliqué à l’état vide IO). Quand nous considérons les états
de niveau In),nous pouvons utiliser les relations de commutation (72),ainsi
que les propriétés de l’état Ih) annihilé par L,,p > O, pour montrer qu’ils
se réduisent tous à des combinaisons d’états de base, impliquant seulement
L,, p < O, et ordonnés de façon commode, par exemple des états de la forme
v.
v.
+
De façon analogue dans l’espace conjugué
avec les mêmes contraintes sur les indices. L’espace de ces états, de dimension infinie, fournit manifestement un espace de représentation de l’algèbre
de Virasoro.
L’algèbre de Virasoro est similaire aux algèbres de Kac-Moody définies
comme extensions de dimension infinie d’algèbres de Lie semi-simples (appendice C), qui interviennent dans l’étude des algèbres de courants ainsi
que dans celle des systèmes intégrables de dimension infinie.
Un opérateur Lpt,p’ > O, appliqué à un état tel que I{p} h ) ,diminue son
niveau de p‘. Par conskquent si un produit de tels opérateurs a un degré égal
à n, il produira, s’il est appliqué à [ { p ),h ) un multiple de l’état fonda.mental
Ih ). Nous écrivons
IX.1.5
113
INVARIANCE C O N F O R M E
O
< p1 i P2 i ... 1.Pk
o<p; i P ; - i P q
~ p =: Cpj = n
Les coefficients ( ( p ‘ ) , { P } ) ~pour
, ~ c, h et le niveau n fixés peuvent être
calculés à partir de la seule donnée de l’algèbre de Virasoro et des propriétés
de l’état Ih). Ils forment une matrice indexée par les partitions de l’entier
n, appelée forme contragrédiente et dont on vérifie aisément qu’elle est
symétrique. Dans le cas unitaire, cette forme contragrédiente n’est autre
que la matrice des produits scalaires au niveau n
Nous rappelons que
On obtiendra une représentation unitaire si, et seulement si, à chaque
niveau n, la forme contragrédiente est positive semi-définie. Si elle est définie
positive, le module de Verma lui-même donne une représentation unitaire
irréductible. En revanche si la forme contragrédiente n’est que semi-définie,
c’est qu’il existe des “états nuls” engendrant des sous-espaces invariants. On
devra considérer l’espace quotient pour trouver une représentation unitaire.
Comme pour tout p > O
une condition nécessaire d’unitarité est que l’on ait les inégalités h 2 O et
c 2 O. Nous trouvons donc seulement des poids positifs dans les modèles
unitaires. Les poids négatifs, qui correspondent à des corrélations croissant
avec la distance, ne sont cependant pas exclus dans le cas non unitaire. Nous
avons donc
unitarité
--r.
c 2 O,
h2O
(82)
Dans toute représentation le nombre d’états linéairement indépendants au
niveau n ne peut excéder p ( n ) , nombre de partitions de l’entier n. Si l’on
convient de définir p(0) = p ( 1 ) = 1, la fonction génératrice des partitions
due à Euler s’écrit
00
On suppose IqI < 1. La fonction de Dedekind
q = exp 2ir.r’ jouera un rôle essentiel dans la suite.
Q(T)
= ~ l / ~ ~ P où
(q),
114
INVARIANCE CONFORME
IX.1.5
Pour étudier la forme contragrédiente on va calculer son déterminant
à chaque niveau n (au niveau O c’est 1 par définition). Ces déterminants,
dont l’expression a été obtenue par Kac,
sont manifestement des polynômes en c et h. Ils possèdent la propriété que
det,(c,h) s’annule si et seulement si à un niveau n’ 5 n, il existe une
combinaison linéaire
annihilée par tous les L,,p > O. Si un tel vecteur existe à un niveau n’ 5 n ,
il engendre au niveau n un sous-espace de vecteurs annihilés par les L,,
p > O. Inversement si le déterminant s’annule, certaines de ses colonnes
obéissent à des relations linéaires. Les vecteurs correspondants de la forme
cyp)
L-pl . . . L P p kIh), pi = n sont annihilés par tous les produits de
L,!, C p ! , = n. Un raisonnement par récurrence montre qu’il doit exister
un vecteur singulier de degré n’ 5 n. S’il existe de tels vecteurs singuliers
(ou “nuls”) tels que n’ > O, la représentation de V est réductible. Pour
obtenir une représentation irréductible le sous-espace maximal invariant
engendré par les vecteurs singuliers peut être éliminé en considérant l’action
de l’algèbre de Virasoro dans un espace quotient. Ceci revient à dire que
les champs qui créent ces vecteurs singuliers par application sur l’état du
vide IO), doivent être égalés à zéro. Ceci nous permet de distinguer à c fixé
des valeurs privilégiées, des poids conformes correspondant aux racines des
déterminants de Kac qui sont des polynômes en h.
Ces derniers peuvent être calculés en utilisant les relations de commutation. Les cas triviaux sont
detc,(c,h)= 1
deti(c,h) = 2h
(85)
où l’annulation de detl pour h = O reflète le fait que 10) lui-même est un
vecteur nul. Considérons le cas instructif n = 2 tel que
où les lignes et colonnes sont indexées respectivement par les partitions (2)
et (1’1). En conséquence
det2(c, h) = 2h [16h2
+ 2(c - 5)h + c]
(86b)
On observe que det2 contient detl en facteur. L’information nouvelle est
l’existence de deux nouvelles racines, qui sont données par
IX.1.5
115
INVARIANCE CONFORME
5 - c f J(1 - c)(25 - c)
16
Ces racines sont complexes conjuguées pour c réel compris entre 1 et 25, et
réelles dans les autres cas. On écarte la première possibilité et on examine les
vecteurs singuliers correspondants de niveau 2, c’est-à-dire de poids h* 2.
On peut vérifier directement que le vecteur
h* =
+
Li +
3
Is*) =
(88a)
1)L t l - L-2) Ih)
obéit à
Lo
1%)
= (hi
+ 2)
L,
IS&)
1
4= 0
p
>O
(88b)
Afin de vérifier (88b), nous observons que LI et L2 engendrent, via les
relations de commutation, tous les L,, p > O. Pour la suite il est commode
d’introduire la paramétrisation suivante de la charge centrale, pour tout m
réel, complexe, fini ou infini
c=l-
6
m(m 1)
+
(89)
Les valeurs h& ci-dessus prennent la forme
+
+
[2(m 1) - mI2 - 1
h+ =-m 3 4m
4m(m 1)
m - 2 - [m+i-2m] 2 -1
h- =
4m(m 1)
4(m 1)
+
+
(90)
+
Ce qui précède est formulé dans le langage opératoriel. Nous pouvons
aussi l’exprimer en termes du développement à courte distance d’un champ
primaire A (de poids h ) avec un produit de champs T ( z ) . Afin d’alléger les
notations, nous omettons à nouveau l’argument de A. Les équations (40)
s’interprètent en disant que, lorsque T ( z ) est inséré dans les fonctions de
corrélations, on a le développement à courte distance
A(O)(u)=hA(u)
...
ainsi que
116
INVARIANCE CONFORME
T ( z ) T ( u )=
3C
~
(z-u)4
W u )
+-(.-up
1 dT(u)
++ . ..
( 2 - u ) du
IX.1.5
(91b)
Nous avons donc une correspondance A ( 0 ) H Ih), A(O)(O) H Lo Ih),
A(-’)
H L-, Ih). On peut répéter pour les champs dérivés A(-,) le dévelop(0)
pement à courte distance ci-dessus, définissant A(-Pl?-P?)en correspondance
avec L p P lL-p2 Ih) , et ainsi de suite.
Le champ primaire A , ou A(O) = hA(z) a des propriétés de transformation connues; il en est de même de A(-I)(u) = ûUA(u). I1 est instructif
de déterminer les lois de transformations des champs secondaires ou “descendants’’, afin d’obtenir une nouvelle interprétation des vecteurs singuliers, en
termes des champs correspondants. Rappelons que si A est primaire
I1 est clair que A(-1) ne se transforme pas comme un champ primaire. Pour
obtenir le comportement de A ( - 2 ) , on compare les développements de courte
) , utilisant la loi de transformation (92).
distance de T ( z ’ ) A ( z )et T ‘ ( < ’ ) A ‘ ( < en
Ainsi
Après des calculs assez laborieux, nous trouvons que
IX.1.5
INVARIANCE CONFORME
117
Nous laissons au lecteur courageux le soin de déduire les formules correspondantes pour A(-P1,-Pz-...)!Le moins que l’on puisse dire est que les champs
secondaires ont des lois de transformation assez complexes. Comparons cependant ( 9 3 a ) au comportement de a : A ( z ) correspondant à l’état L z l Ih);nous
avons
Si l’on forme la combinaison
3
x * ( z ) = 2(2h*
+ 1) û : A ( z ) - A ( - 2 ) ( z )
on vérifie sans difficulté que pour chacune des valeurs h* données par (87) ou
(90)
En d’autres termes, les vecteurs singuliers correspondent aux combinaisons
des champs secondaires, provenant du développement à courte distance avec
le tenseur impulsion-énergie, qui se transforment comme des champs primaires
avec un poids augmenté d’un entier. Cette équivalence est utile en ce sens
qu’elle montre que si x est une telle combinaison, exiger que x s’annule est une
condition cohérente (covariante) indépendante du choix de coordonnées. En
termes de représentations, ceci revient à quotienter par les espaces invariants,
obtenant ainsi des représentations irréductibles. Finalement nous verrons que
l’existence de telles conditions entraîne que les fonctions de corrélations du
champ initial satisfont à des équations aux dérivées partielles qui permettent
essentiellement de les déterminer. Naturellement, le poids conforme h associé
doit être choisi comme une racine d’un déterminant de Kac.
Considérons un champ Al tel que hl G h k . Exiger que xk s’annule
entraîne que les fonctions de corrélations impliquant ce champ satisfont à
des équations aux dérivées partielles du second ordre de la forme
obtenues à partir de l’équation (40) en utilisant le développement à courte
distance de T avec Al. De manière analogue on obtiendra les équations
118
IX.1.5
INVARIANCE CONFORME
d’ordre plus élevé lorsqu’on aura affaire à des vecteurs singuliers de niveau
plus élevé. Nous voyons ainsi que la théorie conforme offre la possibilité
de déterminer certaines valeurs remarquables des poids conformes (ou des
exposants critiques) ainsi que les fonctions de corrélations des champs correspondants. Dans ce but, il apparaît donc essentiel d’obtenir une expression
explicite des déterminants de Kac à tout niveau.
Montrer qu’au niveau 3
dets(c, h ) = 48h2 [16h2
+ 2(c - 5)h + c] [3h2+ (C - 7 ) h+ + 21
C
et obtenir les vecteurs singuliers correspondants. Montrer qu’en général det,est un facteur de det,.
1
1.6 Les déterminants de Kac
C’est à Kac que l’on doit l’expression
n
det,(c, h ) = cst x
( h - hT,s)p(n-TS)
(96)
I-.*=1
1<rs<n
où, la charge centrale étant paramétrisée comme indiqué par la relation (89)’
les racines hr,s,indexées par deux entiers positifs T et s, s’écrivent
h,s =
[T(m
+ 1)- smI2 - 1
4m(m
+ 1)
(97)
Une racine hT+ donnée apparaît pour la première fois au niveau n’ = Inf(Ts)
et se propage avec une multiplicité p ( n - n’) au niveau n (la borne inférieure
porte sur l’ensemble des paires T , s donnant la même valeur pour hT+.).On
peut vérifier l’expression (96) pour des petites valeurs de n par un calcul
direct. On note que la paramétrisation c = 1 - 6/m(m 1) est singulière
pour c = 1 ou 25. Ces deux cas exigent un traitement particulier.
La démonstration par Feigin-Fuchs du résultat fondamental (96)’ (97)
est assez complexe, mais intéressante. C’est elle que nous allons reproduire
ci-dessous. Comme les valeurs obtenues pour les poids résolvent essentiellement le problème de la détermination des exposants critiques d’une grande
classe de modèles en deux dimensions, cette preuve mérite d’être présentée
en détail, mais elle peut être omise sans dommage par un lecteur qui le
souhaiterait.
+
il n’est pas difficile d’obtenir le degré de det,(c,h) en tant que
polynôme en h. On se convainc aisément que le monôme de plus haut degré
provient du produit des termes diagonaux dans la forme contragrédiente,
chacun d’entre eux étant le coefficient de Ih) dans l’expression
IX.1.6
119
INVARIANCE CONFORME
cy
de degré
'Yk dans h. Nous avons donc la formule suivante pour le degré
p n du déterminant de Kac de niveau n
La première somme porte que les partitions de n, et a k est ie nombre de fois
qu'un entier k déterminé, 1 5 k 5 n, apparaît dans une telle partition. Nous
1 et écrivons une fonction génératrice, pour IqI < 1 , sous la forme
posons po
m
W
=
p(n')qn'
n'=O
00
qps
r,s=l
=
qn
n=O
[
;
;
:
;
]
p(n - TS)
ce qui est le résultat attendu.
On observera que le coefficient du terme hPn, indépendant de c, omis
dans (96) s'écrit, d'après Coste,
Utilisant leurs notations, nous passons maintenant à la preuve de Feigin
et Fuchs. Elle se décompose en quatre étapes.
(i) On introduit d'abord l'espace vectoriel FA,@des séries de Laurent
(nous posons z = e", en autorisant des puissances arbitraires de z )
de poids -A, c'est-à-dire se transformant selon f(z)
-
f'(<), avec
120
INVARIANCE CONFORME
IX.1.6
dans une application analytique z t-> t. Le prime de f'(<) ne représente pas
bien entendu une dérivée. Choisissons une base f(k)(Z) = z k , et considérons
une transformation infinitésimale = z - 6cz1-j, pour j entier,
<
L'ensemble des générateurs { e j } fournit donc une représentation de l'algèbre
de Lie des difféomorphismes du cercle unité, généralisant les expressions (73).
Pourvu que X A' i = p p' p 1 = 0,p entier, l'intégrale
+ +
+ + +
(103a)
est une forme bilinéaire invariante sur
@ Fxr. De même si X
p - p'
2X'
p 1 = O , la forme contragradiente
+
+ +
+ A' + 1 =
(103b)
est aussi invariante. Considérons maintenant le produit extérieur d'ordre n,
Fxll. Montrons que le déterminant
An
An
définit une application
Fxp 4 FnX-tn(n-l),nri.Pour le voir nous formons
un vecteur à n-composantes fo(z), ..., f n - l ( z ) d'éléments de Fxp évalués en
n points 20, ..., z n - l . Dans une application c* t , on a par hypothèse
detf,!(<j) =
fi
k=l
(%)'
<k
(*)
dtk
detfi(zj)
Si zi = z + c i , et si tous les ~i tendent vers zéro et sont du même ordre, nous
avons
De même ti =
dominants
+ ~i d</dz + ..., de sorte que, en comparant les termes
qui est la propriété requise.
IX.1.6
121
INVARIANCE CONFORME
La fonction constante appartient à Fo.0. I1 s'ensuit, en utilisant (103),
que si
X = (n - 2)(n
+ i)/2n
p
= -1 - p/n
nous en déduisons que chaque fois que n fonctions
l'intégrale y sur le cercle unité
y=
f
A
2inzp+n
d e
I$[
fj
(104a)
appartiennent à FA,^,
t
(104b)
Oik,j<n-l
fournit une quantité invariante. La définition (103a) avec p = O nous permet
de conclure à l'existence d'un élément de
AF-l-h.-i-r.
A
F-(n-i)fn+l)/an,p/n
An
FA,^ correspondant à l'invariant y. I1 suffit pour cela de
le dual de
substituer dans (104b) le développement
dk
+W
-f.(z)=
dzk
q(q-l)...(q-Ic+l)zQ-k
dz'
q=-00
Par conséquent, si P désigne une permutation de n symboles, (-l)p
signature de P, on trouve
xdet
:.
la
.:
n-1
L'expression du dernier déterminant résulte de la formule de Vandermonde. Substituons qi -+ -qi, et rappelons que les vecteurs de base z j
ont été notés Io).Nous aboutissons à la formule
122
INVARIANCE CONFORME
IX.1.6
où ( ,
est la forme bilinéaire (103a) pour p = O . Nous lisons sur ce
développement que l’élément invariant correspondant vn, p , appartenant à
An ~ - ( n - ï ) ( n + 2 ) / 2 n , p / n i
est
r
+m
1
(ii) Dans la seconde étape, nous associons à FA+ un espace de Fock
fermionique et une représentation correspondante de l’algèbre de Virasoro. A
chaque entier i, positif ou négatif, nous faisons correspondre une paire ai,ut
d’opérateurs obéissant aux relations d’anticommutation canoniques usuelles
= 6ij
{ai,.;}
L’état de référence IR) ou “vide” obéit par convention à
220
ai IR) = 0
i<O
ut IR) = O
ce qui veut dire que tous les états à une particule tels que i < O sont occupés,
et tous ceux tels que i 2 O sont vides. Correspondant au choix (107) nous
avons l’ordre de Wick naturel : :, où les opérateurs ai (i 2 O ) ou a l ( i < O )
sont à droite des ai(i < O ) ou a t ( i 2 O ) , en prenant en compte le signe de
la permutation requise pour mettre un monôme donné dans cet ordre. Nous
formons alors deux opérateurs quadratiques, une charge Q et un hamiltonien
H , définis comme suit. Tout d’abord
+m
: akak := E U L a k
Q=
-m
k>O
-X
a k a L
k<O
annihile In) et commiitera avec la représentation de l’algèbre de Virasoro. Pour
un secteur de charge Q = n, il est commode d’introduire un nouvel état de
référence IR,n) (tel que IR,û) e IR)). Cet état est annihilé par les a;(i 2 n )
et les a t ( i < n ) . I1 correspond à l’occupation des états à une particule jusqu’à
(n - 1). Si l’indice est vu comme une énergie, le hamiltonien H s’écrit
-00
k20
k<O
Naturellement, l’état à une particule d’indice k = O ne contribue pas à H , qui
est un opérateur positif et obéit à
H IR, n ) = i n ( n - 1) IR, n )
(110)
IX.1.6
INVARIANCE CONFORME
123
expression valable pour n positif ou négatif. Observons que IR, O ) et IR, 1)
ont la même énergie. Pour tout entier j différent de zéro, nous définissons des
générateurs de l'algèbre de Virasoro, version quantique de (102), à savoir
L'ordre de Wick est ici sans effet, étant donné que k et k - j sont distincts.
Dans le calcul des commutateurs nous utiliserons les identités
[ A B ,Cl = A {B,C } - { A ,C } B
[ A B , C D ]= A { B , C } D - A C { B , D } + { A , C } D B - C { A , D } B
(112)
Les formules ci-dessus pour Q , H et Lj prennent une forme plus compacte
si l'on introduit une paire de champs de Fermi
Alors
Si maintenant j , k et j
j ,k , j
+ k sont tous différents de zéro
+ IC # 0
[ L j ,Lkl = ( j - b)Lj+k
Pour obtenir une expression de LO et de la charge centrale, on calcule pour
j
# O le commutateur suivant
Nous arrivons ici à un point délicat, où il faut être soigneux. Une telle
expression est singulière, et il est déconseillé de faire une translation sur les
indices. Dans un sous-espace de charge fixée &, si l'on agit sur un vecteur
(115)
124
INVARIANCE CONFORME
IX.1.6
d’énergie finie, l’opérateur aiak - a i + j ak+j s’annule pour lk\ suffisamment
grand. Par conséquent, telle qu’elle est écrite, l’expression précédente est bien
définie. Supposant j positif, nous observons que
et donc
Avec
j-1
Cl=j
k=O
j-1
j-1
k2 = i j ( j - 1)(2j - 1)
k = f j ( j- 1)
k=O
k=O
nous définissons dans le secteur de charge Q = n
de telle sorte que
[Lj, L - j ] = 2jLo
+ h C j ( j 2 - 1)
c = - 2 [6A(A
+ 1) + 11
(117)
(118)
Manifestement l’équation (117) est aussi valable pour j négatif. Finalement,
combinant les définitions (11) et (116), nous pouvons vérifier la dernière
relation de commutation de l’algèbre de Virasoro.
[Lo,L j ] = -jL3
(119)
Ceci est un exemple typique de représentation, que nous notons 3 ~ , ~
dans
,,,
le secteur de charge n, exhibant la charge centrale comme une anomalie
quantique. Ici c est uniquement fonction de A et obéit à
.(A)
= c(-1-
A)
L’adjoint de Lj (A, p ) pour X et p réels est tel que
(120)
IX.1.6
125
INVARIANCE CONFORME
La correspondance X + A‘ = -1 - A, p + p’ = p - 1 - 2X, qui laisse la
charge centrale c et la partie c-nombre de Lo invariants, est identique à celle
qui apparaît dans la définition de la forme contragrédiente (103b) pour p = O .
Les représentations 3 ~ et
+F - ~ - A + - ~ - zsont
A donc contragrédientes.
Incidemment, on observe que pour X = 1, qui correspond dans notre
notation aux champs vectoriels (ou, de façon duale, quand A‘ = -1 - X = -2,
à des différentielles quadratiques), la valeur de la charge centrale est c = -26.
Ceci est la valeur cruciale dans la quantification de la corde bosonique, qui
donne l’anomalie du système de fantômes de Fadeev-Popov requise pour
imposer l’invariance par reparamétrisation (voir chapitre XI). Cette anomalie
doit être compensée par la contribution des coordonnées bosoniques libres,
qui ont chacune une charge centrale unité, et ceci conduit à la nécessité de
plongement dans un espace de dimension 26 pour obtenir un modèle cohérent.
Le choix de l’état de référence IR) et la définition correspondante des
états de charge nulle n’avaient rien de nécessaire. L’opérateur de translation
des indices définit une transformation canonique
qui engendre un isomorphisme entre les secteurs de charge nulle et de charge
n. L’effet de cette translation sur l’ordre de Wick n’est cependant pas trivial.
notées simplement
En conséquence, les représentations
et FA,~+,;O,
FA,^+^, sont isomorphes. De fait la quantité p n’apparaissait qu’au travers de
la combinaison p n dans (116), et la charge centrale est indépendante à la
fois de p et n. On vérifie que
+
Lo IR, n)
=hn
Lj p , n ) =O
IR,n)
j>O
Par conséquent FA,^;, admet IR, n ) comme vecteur de poids dominant h,.
Illustrons cette construction sur l’exemple le plus simple, qui correspond
Dans le secteur de charge nulle, pour tout j
àX =p =
-2.
c =1
Ce secteur implique deux types de fermions, de charge opposée et avec
c = 1. On devine donc qu’il existe une théorie fermionique réelle (fermions de
Majorana), possédant un seul type de fermions, qui sera étudiée ultérieurement
Si 2 désigne
dans ce chapitre, à laquelle est associée la charge centrale c =
l’ensemble des entiers, et si l’on définit
i.
126
IX.1.6
INVARIANCE CONFORME
le champ @ est bivalué, mais les combinaisons bilinéaires sont bien définies sur
le cercle unité. Posons
Dans cette expression, le symbole de Wick : : impose d’ordonner les ak,
> O , à droite de ceux ayant k < O , en tenant compte des signes dus aux
permutations. L’état de référence est annihilé par les opérateurs ak, k > O et
k
Lo =
Ck21/2
ka-kak est un opérateur positif.
(iii) Nous prenons maintenant X égal à
A0
=-
(n - l ) ( n
2n
+ 2)
où n est un entier plus grand ou égal à deux, afin de construire une fonction
q
~ comme
~
, dans
~ (105) avec p = p / n . L’opérateur
est tel que
Par conséquent q5’k augmente la charge de nk, et obéit par construction à
ce qui veut dire qu’il engendre un vecteur singulier de l’espace
N F A O , p = p l n + n en
k i utilisant (122).Considéré comme élément de
cet état peut être obtenu en faisant agir sur IR,-nk) l’opérateur
la raison du prime ci-dessus) où
4J=
E
qjk
(c’était
IX.1.6
127
INVARIANCE CONFORME
et satisfait à
[ H , @ ] = k (1 - p - i n ( n + 1) - n 2 k ) 4k
[ O , d k ] = nk4k
(131b)
Posons
P
PO = -
n
Comme H IR, -nk) = i n k ( n k
de charge nulle
+ nk
(132)
+ 1) IR, -nk), le vecteur singulier dans l’état
obéit à
&Is) = O
LO(X0, PO)
j>O
Is) =(ho
+ ek) Is)
(134)
L j ( X 0 , PO) Is) =O
avec xo et PO donnés par (127) et (132), et
e = 1 - p - in2(1+ k )
e et ho désignant
ho = i P O ( P 0 - 2x0 - 1)
Finalement la charge centrale c est donnée par (118), où l’on substitue
A. Comme
(135)
A0
à
L O ( x 0 , P o ) IR) = ho IR)
(136)
la construction de vecteurs singuliers a un sens (c’est-à-dire que Is) f O ) à
condition que !k soit positif, soit
p
< 1 - $2(k
+ 1)
(137)
Nous avons ainsi introduit trois entiers arbitraires n , p , k , de telle sorte que ek
soit toujours entier. I1 en résulte que e est entier, sauf si n est impair et k pair,
auquel cas est demi-entier. Afin d’écarter cette possibilité, nous supposons
n pair.
(iv) Revenons à la preuve de la formule de Kac. Considérons un module de Verma abstrait, de charge centrale c(X0) et de poids dominant ho,
correspondant au vecteur Iho) . Utilisons la notation abrégée { L - j } pour désigner un produit ordonné d’opérateurs L - j . Au vecteur { L - j } Iho) nous faisons
correspondre un des deux kets
{ L - j } Ibo) f { L - j ( X O , P O ) }
{L-j) b o )
5 {L-j(-l-
IR)
X0,PO
- 1 - 2x011 IR)
D’après l’équation (121), le second ket est dual du bra (RI {Lf(Xo,po)},et ho
est invariant dans la substitution correspondante.
128
INVARIANCE CONFORME
IX.1.6
Supposons que le module de Verma possède un vecteur singulier à un
niveau inférieur ou égal à r. Si l’application f, qui préserve la suite des
niveaux, est surjective, FA^,^,, possédera également un tel vecteur singulier. Si
l’application n’est pas surjective, il doit exister dans le secteur de charge nulle
un ket lu),dont l’énergie d’excitation est plus petite ou égale à r, et qui est
orthogonal à l’image de f. I1 s’ensuit que (uI { L - j ( X o , P O ) } 10)= O pour tous
les ensembles L - j tels que E j = r. Par conjugaison, on en conclut que lu) est
~o.
si l’image par f ou
un vecteur singulier pour F - ~ - x o , p o - ~ - 2Inversement,
g admet un vecteur singulier à un niveau 5 r, on voit immédiatement que ceci
doit également être le cas du module abstrait.
Pour X et p arbitraires, considérons la quantité
Le produit bao(X, P ) ~ - ~ , - B ( X , p ) , symétrique en (Y, /3, est aussi invariant dans
la correspondance X -+ - l - X , p 4 p- 1-2X. I1 est donc uniquement fonction
de h (donné par l’équation (116) avec n = O ) , et c (donné par (118)). On trouve
+
+
= -(n - l ) ( n
2 ) / 2 n , p = PO = nk p/n, n pair, et donc
entier, nous venons de voir que le déterminant de Kac
de degré kE doit s’annuler. On vérifie que
Pour X =
A0
e = 1 - p - n 2 ( k + 1)/2
b-k,-e(Xo,po)
=0
En conséquence, le déterminant de niveau kl doit s’annuler sur un nombre
infini de points de la courbe Bk,e(C,h) = O. Cette dernière est irréductible
Par conséquent detkt(c,h) est divisible par Bk,e(c,IC) ou sa racine
si k #
lorsque IC = e, et Bk,k est un carré. 11 s’ensuit que det&(c, h ) admet ~ k , t ( ch,)
comme facteur. Comme un vecteur singulier au niveau r engendre un zéro
d’ordre p ( s - r ) au niveau s 2 r , la quantité
e.
divise det,(c,h)2. On vérifie que les deux expressions ont même degré en h.
En conséquence, et à un facteur indépendant de h près
IX.1.6
129
INVARIANCE CONFORME
Finalement Bk,e est symétrique en k et e, et apparaît donc deux fois dans le
produit (142) pour k # e, tandis que B k , k est un carré
+
De plus, en utilisant la paramétrisation c = 1 - 6 / m ( m l), on voit que
Bk,! = ( h - hk,!)(h - k k )
(143)
avec h k , ! donné par l’équation (97). Ceci permet de prendre la racine carrée
dans (142) et produit la formule de Kac (96).
1.7 Représentations unitaires et minimales
Achevons la discussion des conditions sur c et h requises pour qu’une
représentation soit unitaire, c’est-à-dire telle que
L’3 = L-j
(144)
Supposons que le module (ou espace vectoriel) engendré par un poids
dominant h soit un espace de Hilbert muni d’un produit scalaire qui donne
la forme contragrédiente (79a). Deux situations peuvent se présenter : (i)
soit cette forme est définie positive (ii) soit il existe des vecteurs singuliers,
engendrant des sous-espaces invariants qui doivent être factorisés, l’espace
quotient étant alors tel que la forme résiduelle soit à nouveau définie positive.
Ces conditions sont aussi suffisantes.
Nous avons déjà vu qu’une condition nécessaire d’unitarité est
Dans l’intervalle O < c < 1, Friedan, Qiu et Shenker ont montré que les
seules valeurs compatibles avec l’unitarité sont telles que: (i) c a la forme
(89) avec m entier, m 2 2 ( m = 2 correspond à c = O et à la représentation
triviale) (ii) les poids h sont donnés par les zéros du déterminant de Kac,
les deux entiers T et s prenant un nombre fini de valeurs 1 5 s 5 T 5 m - 1.
En résumé
+
c =1- 6/m(m 1)
m entier 2 2
Si nous utilisons seulement la restriction 1 5 s 5 m, 1 5 T 5 m - 1, chaque
poids hr,sapparaît deux fois, puisque hr3$ hm-r,m+l-s.
Les représentations de ce type sont donc caractérisées par un entier
m >. 3 et un ensemble fini de poids possibles, et donc un ensemble fini de
130
INVARIANCE CONFORME
IX.1.7
dimensions possibles pour les observables fondamentaies, ou primaires. Dans
ce sens nous pouvons appeler les représentations correspondantes minimales.
Les modules de Verma associés possèdent des vecteurs singuliers, c’est-à-dire
des sous-espaces invariants. Pour la même valeur de e, il est ainsi possible
d’introduire des champs appartenant à des représentations de poids h , , , où
T et s sont extérieurs au domaine ci-dessus. Ceux-ci pourraient intervenir
dans la construction d’autres types de modèles, qui ne seront pas envisagés
ici.
I1 est utile d’introduire un tableau des inclusions de sous-espaces invariants, tableau qui nous permet de comprendre le décompte des états
linéairement indépendants qui subsistent à un niveau donné, une fois que
les sous-espaces invariants ont été factorisés. Fixons une valeur de c satisfaisant aux inégalités (145). Feigin et Fuchs ont déterminé l’ensemble des
inclusions entre modules de Verma, représenté sur la figure 3, résultant de
la formule de Kac. Dans cette figure, une flèche pointe du plus grand espace
vers un sous-espace. Les poids correspondants different par des produits
d’entiers. De plus cinq sous-espaces tels que M , N ’ , N ” , P’, P” sont tels que
M contient la somme (qui n’est pas une somme directe) N’ @ N ” , tandis
que l’intersection N’ n N” est égale à la somme P’ @ P”. Pour obtenir la
représentation irréductible dont le poids figure au sommet, avec r et s dans
le domaine défini en (145), on doit factoriser la somme de ses deux premiers
“descendants”. Nous verrons dans la prochaine section des applications de
ces ensembles d’inclusions.
Lorsque c est supérieur à 1, il n’y a pas de contrainte sur la charge
centrale due à l’unitarité. Pour c = 1, il existe à nouveau une forme (plus
simple) de réductibilité (et d’unitarité) chaque fois que h = an2 avec n
entier.
Comme nous ne prétendons pas donner ici une présentation exhaustive,
nous nous limiterons pour l’essentiel à des valeurs de c dans le domaine
c 5 1, conduisant aux exemples les plus simples. Ils incluent de nombreux
modèles, possédant au plus des symétries discrètes pour c < 1.
Dans le cas de la série minimale unitaire, nous illustrons les considérations qui précèdent en montrant sur la figure 4 les trois premiers exemples
de grilles de poids conformes. Les attributions à des modèles concrets
seront justifiées ultérieurement. I1 est intéressant d’observer que l’invariance
conforme à elle seule prédit l’existence de systèmes avec un petit nombre
d’exposants rationnels. Ce qui reste à trouver est la clé de correspondance
dans des exemples spécifiques, ansi que la signification physique des observables.
Les représentations minimales ne sont pas nécessairement unitaires,
ainsi que le démontre l’exemple le plus simple présenté ci-dessous. Naturellement on peut admettre certaines pathologies, comme des corrélations
croissantes, qui doivent recevoir une interprétation appropriée. Ces cas minimaux s’obtiennent en substituant dans la formule c = l - 6/m(m l)
+
IX.1.7
INVARIANCE CONFORME
[m- r , rn
131
+ i - SI
[2m- r , s]
[r
+ m ,m + 1 - SI
[3m- r , m + i - s]
[r
+ 2m, s]
[4m - r , s]
[r
+ 3m,m + I - SI
+ i - s]
[r
+ 4m, s]
[5m- r , m
Figure 3:Inclusions des modules de Verma [T’, s’] correspondant à une
charge centrale c = 1- 6/m(m 1),m 2 3, et hr,,s,= [ ( ~ ’ ( m1)- ~ ’ m- ) ~
1]/4m(m 1).
+
+
+
une valeur de m rationnelle. Par exemple si p et p’, p > p’ sont deux entiers
positifs premiers entre eux, tels que
m = - p’
m+l=- P
(146a)
P-p’
P- p ’
la valeur correspondante de c (qui n’est plus restreinte à être positive) est
donnée par
c = l - 6(P - P’I2
(146b)
Pp’
Les poids conformes des représentations minimales correspondantes prennent la forme
132
IX.1.7
INVARIANCE CONFORME
s=4
s=
s=2d
23
2
1
0
r=l 2
m=3
Ising
f
3
s=l
s=
r=l 2
m=4
3
5
5
r=l 2
3
m=5
4
Potts à 3 états
Ising tricritique
Figure 4: Grille des poids conformes pour les trois premiers exemples de
représentations unitaires minimales.
Pour p,p’ définis comme ci-dessus on peut trouver T O et SO dans le
= 1. I1 s’ensuit que pour p - p’ 2 2,
domaine indiqué tels que (rop il existera des poids négatifs dans la table. Le champ scalaire correspondant
A h o , ~aura
o des corrélations qui croissent avec la distance. Ceci était exclu
dans un cas unitaire. La cohérence de ces modèles minimaux sera étudiée
dans la section 3.
Afin de montrer que ceci n’est pas une possibilité académique, considérons l’exemple suivant dû à Cardy, impliquant un champ scalaire unique,
outre l’opérateur unité (et ses descendants comme le tenseur énergie-moment).
En nous concentrant sur l’algèbre V, nous cherchons une grille à deux cases
(prenant en compte la symétrie indiquée dans (147)). Avec la duplication, ceci
veut dire quatre éléments dans les intervalles 1 5 T 5 p’ - 1, 1 5 s 5 p - 1 tels
que p > p ‘ , et p et p‘ premiers entre eux. L a seule possibilité est une colonne
unique ( r = 1, p’ = 2) de quatre poids ( p = 5, 1 5 s 5 4) égaux deux à deux.
En conséquence nous avons deux poids indépendants, et les valeurs de h et c
sont
c = -22
h = O , -15
5
L’unique champ scalaire non trivial A- 1 - 1 a pour dimension
5 -
5
A quelle théorie des champs en interaction (au point critique) ceci pourrait-il
correspondre? Le seul candidat semble être le modèle scalaire avec un terme
d’interaction en i(p3 avec un couplage cubique imaginaire pur, qui coïncide
avec le modèle continu effectif de la singularité de Lee et Yang. Dans cet
IX.1.7
133
INVARIANCE CONFORME
example, il n’y a pas de symétrie brisée au point critique, mais la longueur de
corrélation diverge, et le modèle n’a aucune chance d’être unitaire. Désignons,
comme de coutume, l’exposant critique de la corrélation à deux points par 17.
I1 s’ensuit que dans ce cas bidimensionnel 17 = 2A =
ce qui est bien une
valeur négative (ainsi les corrélations croissent avec la distance!). L’exposant
O relatif à la singularité de l’aimantation est tel que
-2,
m,
N
(150)
‘h
où h désigne ici la déviation par rapport au champ magnétique critique
(externe). Les lois d’échelle impliquent que
O=-
d-2+17
d+2-17
~
d=2
L - - 1
4-17
‘
(151)
en excellent accord avec les simulations numériques. I1 existe une relation
entre cette partie singulière croissante de l’aimantation et le fait que, après
soustraction, il reste au point critique une corrélation qui croît à grande
distance.
1.8 Caractères de l’algèbre de Virasoro
Pour les applications ultérieures, il est utile de connaître les caractères
des représentations de l’algèbre de Virasoro. Dans une représentation caractérisée par c et par le poids dominant h, ces caractères sont des fonctions
génératrices des nombres d’états linéairement indépendants au niveau n, et
correspondant donc à une valeur propre h f n pour LO. A q fixé, q = exp 2inr
inférieur à un en module ( I m r > O), le caractère apparaît comme la trace
dans la représentation donnée de l’opérateur qLo. En d’autres termes, si
dim(h + n ) est la dimension de l’espace au niveau n on définit
00
~ ( ~ (, Th) =
)
Tr qL0-c/24-
dim(h + n)qn+h-c/24
q = exp 21x7
n=O
(152)
On verra plus loin le rôle du facteur supplémentaire q-c/24 inclus dans cette
définition. Pour des valeurs génériques de c et h, quand la représentation de
poids dominant est telle que le module de Verma correspondant n’a pas de
vecteur singulier, il est clair que
La forme factorisée de P ( q ) montre que la série qui définit x converge
pour tout 141 < 1. Partant de l’équation (83), il n’est pas difficile de montrer
que le terme dominant dans le développement asymptotique de p ( n ) , le nombre
de partitions de R , est (Hardy-Ramanujan)
134
IX.1.8
INVARIANCE CONFORME
La situation est plus intéressante pour les représentations dégénérées,
où le module de Verma contient des sous-espaces invariants. D’après le
diagramme du type indiqué dans la figure 3, et partant d’une expression
telle que celle donnée dans (153), on doit soustraire des termes analogues. A
chacune des étapes intermédiaires, la somme des espaces invariants n’est pas
directe. I1 en résulte que, pour r et s dans la grille conforme, la formule des
caractères des représentations minimales obtenue par Rocha-Caridi s’écrit,
avec X(c,h,,) E x T , S
Dans cette expression, comme dans (146), p et p’ sont des entiers premiers
entre eux tels que p > p’, r varie entre 1 et p‘ - 1, s entre 1 et p - 1, avec
une restriction supplémentaire, par exemple r p - sp’ > O, afin d’éviter un
double comptage. La charge centrale vaut c = 1 - 6(p - ~ ‘ ) ~ / p pOn
’ . obtient
les modèles minimaux unitaires pour p’ = m , p = m + 1, m entier 2 2.
(i) Dans le cas minimal unitaire, la représentation irréductible correspondant à rn = 2 est trivia.le, de dimension 1. Posant x 1 dans la formule (155)
on obtient l’identité (pentagonale) d’Euler
(156)
n=-cc
1
(ii) I1 est possible de présenter l’expression (155) des caractères sous
une forme plus compacte, qui nous sera utile par la suite, en introduisant
la notation suivante. Soit N = 2pp’ un entier pair. Au lieu d’indexer le
caractère par le couple r, s correspondant à hr,6 dans (147), utilisons un entier
X
T P - sp’ modulo N . Observons que si wo
TOP
sop‘ mod N , avec
rop - sop’ = 1 (étant donné que p et p‘ sont premiers entre eux), nous avons
1 mod 2N et woX rp sp’ mod N . Finalement on substitue à P ( q )
la fonction de Dedekind
=
wi
+
+
n<i
03
q(,r) = q 1 / 2 4 ~ ( q ) = q 1 / 2 4
- qn)
1
où nous utilisons comme ci-dessus la notation q = exp 2ia7. La formule (155)
peut alors être récrite
IX.1.8
135
INVARIANCE CONFORME
(158a)
montrant que
Ces caractères peuvent être exprimés à l’aide de fonctions elliptiques. Dans
l’appendice A nous rappelons quelques propriétés des séries 0 de Jacobi qui
sont utiles dans ce contexte.
I1 existe d’autres formules non triviales pour les caractères, correspondant
aux sous-espaces invariants irréductibles inclus dans les modules de Verma
réductibles. On note aussi que pour c = 1 et h = aa2 (a entier), on a une
chaîne linéaire d’inclusions qui conduit au caractère
2. Exemples
Donnons maintenant quelques exemples élémentaires de champs conformes. Nous reprendrons la discussion générale dans la section 3.
2.1 Modèle gaussien
L’exemple le plus simple, et celui qui est en un sens la pierre angulaire
de nombre de réalisations explicites, est le modèle du champ neutre de masse
nulle gaussien, ou libre. L’action correspondante s’écrit, avec p(x) réel
La normalisation est en accord avec notre définition du tenseur impulsionénergie. Avec un signe fixé par l’équation (57)’ ce dernier prend
familière
La fonction à deux points fait intervenir une échelle arbitraire R I qui est un
facteur de coupure infrarouge
136
INVARIANCE CONFORME
IX.2.1
Dans l’expression (161)’ on sous-entend une prescription d’ordre de Wick
afin de donner un sens aux fonctions de corrélation de T , ainsi que nous
le discutons ci-dessous. Le comportement logarithmique des corrélations
du champ ‘p montre que ce dernier ne peut être pris comme un champ
primaire orthodoxe (l’attribution éventuelle de poids conformes serait (0’0)).
En revanche les dérivées de ‘p, ou certaines exponentielles en ‘p, sont
candidats à être des observables. Les corrélations correspondantes auront
un comportement en lois de puissances, et devront être telles que l’échelle
arbitraire R disparaît, ainsi que nous l’avons vu au chapitre IV.
Afin d’obtenir la charge centrale, nous calculons la fonction de corrélation ( T T ) , en omettant les auto-contractions du champ ‘p au même point.
Ceci fournit l’expression attendue
et la quantité complexe conjuguée pour
centrale est égale à l’unité
c=l
( T T ) . Par
conséquent la charge
(164)
Ce résultat explique le choix de la normalisation de la fonction à deux points
qui conduit à la définition de la charge centrale.
La théorie du champ libre permet de comprendre comment l’anomalie
calculée pour une transformation infinitésimale devient la dérivée schwarzienne
dans le cas d’une transformation finie. La structure universelle implique que
le calcul effectué pour c = 1 peut être généralisé en insérant n’importe quelle
valeur de la charge centrale. La prescription de Wick peut être comprise comme
une procédure de soustraction à courte distance, après une séparation des
points correspondant aux arguments de T
expression à insérer dans une fonction de corrélation. Dans la formule ci-dessus,
seule la singularité dominante à courte distance a une importance. Prétendons
maintenant que dans ilne application conforme cp(z,Z) = (p(u,O). Dans le
nouveau système de coordonnées, avec u = f ( z )
Nous avons ajouté et soustrait un terme de telle sorte que la partie entre
(du/dz)2 dans la limite où les points coïncident,
crochets s’identifie à
s(u)
IX.2.1
137
INVARIANCE CONFORME
tandis que le second terme correspond à l’anomalie. Posons
zz=z,
21=2+6,
u12
--212
f’ + $ 6 f f ‘ + ~ 6 2 f f f ’ + . . .
L’anomalie s’écrit
en accord avec l’équation (50) pour c = 1.
En partant du champ cp, nous pouvons définir des familles variées
d’opérateurs, et parmi elles les exponentielles (ordonnées de Wick) eiaq.
La quantité a est analogue à une charge, étant donné que les fonctions
de corrélation prennent la forme de poids de Boltzmann, impliquant des
potentiels de Coulomb classiques (c’est-à-dire logarithmiques en dimension
deux) entre paires de points. De telles corrélations n’ont de sens que si la
charge totale s’annule, ainsi que nous allons bientôt l’expliquer. L’ordre de
Wick implique l’omission des auto-contractions et l’on trouve
Si, au lieu d’utiliser la prescription de Wick, nous avions conservé les
auto-contractions avec un facteur de coupure ultraviolet A = a-’, l’expression
(a / R )* ;” , ce
ci-dessus aurait été multipliée par un produit de facteurs
qui montre que l’ordre de Wick revient à une renormalisation multiplicative
(infinie) de eiap. Cependant ce facteur dépend aussi de l’échelle infrarouge
R. Choisissant de normaliser les opérateurs à une valeur donnée Ro, nous
pouvons étudier la dépendance résiduelle en R de la forme R-”/’, u =
f f j ( Y k = ( C c ~ j )Ainsi
~ . les corrélations sont-elles indépendantes
de R si et seulement si les charges satisfont à la condition de neutralité:
C a j = O. Si cette condition est violée, les corrélations s’annulent à la limite
R -+ CO. Cette discussion montre également que la dimension de eiap est $a2.
n
cja3+xjzk
En particulier
138
IX.2.1
INVARIANCE CONFORME
Ceci veut dire que e‘””, ou encore mieux les formes réelles cos acp et sin acp,
ont les poids conformes
(i) Quand a: est entier, le caractère associé est donné par l’équation (159),
et le module de Verma correspondant admet un vecteur singulier au niveau
a+ 1. Ce niveau est 2, si a = 1,auquel cas h = h. = et la corrélation (166) se
a
1
réduit à C l 2 = ( ~ 1 2 2 1 2 ) - 2 . Ceci est en accord avec l’équation (87), où, pour
= 1, h+ = h- =
Vérifier que l’équation (95) est satisfaite, étant donné
4.
c
que
-c6 2
(21’2,212)
621
=
(-+ --7 c
2
’*
;:
212
an.
(212,
E n )
(ii) Nous avons supposé que le champ ’p prend des valeurs réelles arbitraires. Cependant le lagrangien est invariant par une translation dans l’espace
des champs ‘p --i ‘p cst et par une réflexion ’p + -‘p. Ces propriétés peuvent
être utilisées pour restreindre l’espace des valeurs des champs à des configurations où les points ‘p et ’p 2xp sont identifiés ( p est une constante), ce qui
implique que ‘p prend ses valeurs sur un cercle (de rayon p), comme c’était
le cas pour le modèle XY. Rien n’est changé dans les corrélations entre opérateurs de vertex (les exponentielles), pourvu que nous supposions que les
charges <y soient de la forme a: = n/p. Nous avons aussi la possibilité d’inclure
d’autres opérateurs rnrwspondant à une ligne de frustration, dans le sens où,
lorsque x entoure une cle ses extrémités (un tourbillon), ‘p croît de 2xmp, où
m est un entier. Ces défauts ont été étudiés dans le cas du modèle X Y . La
fonction de corrélation d’une paire (m,-m) de tourbillons localisés aux points
1 et 2 est le rapport d’me fonction de partition frustrée à la fonction de partition usuelle. En faisant sur ’p une translation de ’ p c , où ‘pc est une fonction
multivaluée harmonique (partout sauf aux points sources), ce rapport vaut
exp -S(rpc). Une interprétation analogue peut être donnée pour les corrélations des charges qui different par une fonction harmonique uniforme, avec
des sources en distribution ô concentrées aux points 1 et 2. On peut même
généraliser à une paire d’opérateurs composites (n, m),(-n, -m) avec
+
+
in
P
=+i
(:
+ m p ) in
(=)
2 - 21
- +i
(:
- mp)
in
(-)
E
- E2
2
- 21
(168)
L’existence d’un terme imaginaire entraîne que, dans la translation
terme croisé dans l’action donne (in/p)[‘p(i) -‘p(2)]. Quand on
calcule l’action classique correspondante et que l’on procède aux soustractions
nécessaires, on trouve
‘p -+ ‘p+ ‘pci le
IX.2.1
139
INVARIANCE CONFORME
avec
En conséquence, l’opérateur de vertex généralisé On,m a un spin entier égal
à nm. Le fait que le produit de la charge par la “vorticité” (ou charge
magnétique) soit entier rappelle la propriété analogue déduite par Dirac pour
le mouvement quantique d’une charge ponctuelle dans le champ magnétique
d’un monopôle. Les poids conformes des opérateurs On,m dépendent d’un
paramètre continu p. Ils apparaissent dans la discussion de plusieurs modèles
à c = 1, qui possèdent une ligne continue d’exposants variables, comme le
modèle d’Ashkin-Teller ou le modèle à “six vertex” (voir section 3.6).
De la même façon on peut utiliser la symétrie <p 4 -p pour restreindre
les valeurs du champ au quotient d’un cercle par une réflexion par rapport à
un diamètre.
2.2 Modèle d’Ising
Nous pouvons reformuler le modèle d’king critique présenté au chapitre
II dans le contexte de l’invariance conforme. Nous rappelons que l’action au
point critique est effectivement celle d’un champ de Majorana libre. L’action
et les fonctions de corrélation à deux points s’écrivent
($(a)$(z2)) = v
a 2
($(Zl)4(%))
= 1/z12
Les corrélations sont impaires dans l’échange 1 H 2, en raison de la
statistique de Fermi, l’une est holomorphe, l’autre antiholomorphe. Le
théorème de Noet her fournit l’expression du tenseur impulsion-énergie
avec une prescription d’ordre normal, de sorte que,
Les équations (171) et (173) sont compatibles avec le fait que $ a des poids
O), et $ (O,
Ainsi $ et $ ont-ils des spins demi-entiers, comme on
s’y attendait. L’identité de Ward est en accord avec ces attributions, car il
s’ensuit que
(i,
a).
140
INVARIANCE CONFORME
IX.2.2
La charge centrale est obtenue en calculant la corrélation
I1 est naturel de s’attendre à ce que le modèle soit construit à partir des
représentations minimales (unitaires) de l’algèbre de Virasoro pour c = !j,
c’est-à-dire m = 3. Nous avons vu que la table de Kac fournit les poids O,
$, et nous pouvons identifier les observables de spin entier, en fait zéro,
comme étant celles avec h = L, selon le schéma
hi
La densité d’énergie possède une interprétation simple en termes du
champ de Majorana, tandis que le spin a a une expression non locale en
L’exposant critique r] est donné par la relation
fonction des champs
r] = 2A, =
comme on s’y attendait. La divergence logarithmique de
l’intégrale sur la corrélation énergie-énergie ( E E ) implique que l’exposant
de la chaleur spécifique s’annuie, a = O (à un logarithme près) et v = 1.
Les autres exposants critiques sont donnés par l’analyse standard des lois
d’échelle, comme étant ni = et /3 = En résumé, une fois que la valeur
de la charge centrale c = est connue, l’hypothèse minimale donne les
autres exposants, ainsi qu’un moyen de calculer les corrélations critiques.
On ne gagne pas grand-chose dans le cas présent, où l’intégrabilité (et une
longue histoire) nous a fourni les résultats depuis longtemps. Nous pouvons
en revanche utiliser cette connaissance pour vérifier le formalisme. Mais
la voie est maintenant oiiverte pour l’application du même raisonnement à
d’autres cas, où l’on en sait beaucoup moins, et où la puissance de la théorie
des champs conformes devient évidente.
a,
$,?p.
4
i.
sont les deux solutions h* des équations (87)-(90)
Comme f et
impliquant l’existence de vecteurs singuliers au niveau 2, les fonctions de
4’
IX.2.2
INVARIANCE CONFORME
141
corrélation correspondantes obéissent à des équations aux dérivées partielles
du second ordre. D’après le chapitre II nous savons que
(E(
I
1) ‘. . 4 2 n ) ) = Pf -
(177)
:il2
Prenons comme exemple la fonction à quatre points. Avec
On vérifie que
1
1
212
213
214
Le cas de la fonction de corrélation à quatre spins est plus intéressant, car
ce n’est pas le module carré d’une fonction analytique, mais une combinaison
des solutions indépendantes de l’équation correspondante. Récrivons d’abord
l’expression (178) pour n = 2, avec T : ~= zij Z i j , comme
1
212
213
214
La fonction de corrélation est réelle, symétrique et positive. D’après la condition de factorisation asymptotique
sa normalisation se déduit de celle de la fonction à 2 points, que nous prenons
égale à (a(l)(r(2)) = f i / r : ; * . En utilisant l’invariance globale, et le birapport
142
IX.2.2
INVARIANCE CONFORME
x = -212234
214232
où x prend les valeurs O , 1,
écrivons
00
quand
21
coïncide avec
22, 23
ou
24,
nous
Les puissances dans les préfacteurs sont en accord avec les poids (1/16,1/16)
de u. L’équation prend la forme hypergéométrique
{
x(1 - .)
62
az
+ (4 - z) - + 1
le}
f =O
d z .
Une solution générale est une combinaison de
Nous avons la
même équation pour la dépendance en 2. En conséquence, avec a&& des
constantes
Ignorant la constante multiplicative globale, il nous reste trois constantes à
déterminer à l’aide de la symétrie (et de la réalité) de la solution dans tout
échange ( z i , , ? i ) u ( z j , , ? j ) . On exige aussi l’invariance par monodromie de
la solution, ce qui signifie que la fonction de corrélation soit univaluée. Ceci
peut être vérifié en suivant un chemin qui entoure l’une des singularités, O ,
1, 00. L’analyse de ces contraintes donne a++ = a--, a+- = a-+ = O . En
rétablissant la normalisation, on trouve
Prenant le carré de cette expression, on constate qu’elle est en accord avec le
résultat attendu (178).
2.3 Modèle de Potts à trois états
Le modèle de Potts a été introduit au chapitre IV. Ici nous nous
restreignons au modèle à trois états. Sur un réseau carré la fonction de
partition s’écrit
IX.2.3
143
INVARIANCE CONFORME
Le “spin” O = ei’+’ prend comme valeurs les racines cubiques de l’unité, et
l’exposant est tel que la contribution de spins voisins est bUu,. Le modèle
admet une symétrie globale Z 3 , et obéit à une relation de dualité possédant
pour point fixe
eBc=l+J3
(180)
Plus généralement, pour un modèle à Q-états eoc = 1 + J&. Le cas Q = 2
correspond au modèle d’Ising (à un changement d’échelle près pour ,O).
Pour Q > 4, on sait que le modèle possède une transition du premier ordre,
tandis que pour Q 5 4 la transition est continue. Baxter (1980) a obtenu
deux exposants critiques dans le cas Q = 3
( Y = l3
,O=’
9
(181)
à condition de supposer que le modèle de Potts à trois états est dans la
même classe d’universalité que le modèle des hexagones durs, modèle dont
il a obtenu la solution.
Ce dernier est un modèle de gaz sur réseau, où les “molécules” de
forme hexagonale ont leurs centres aux noeuds d’un réseau triangulaire. Les
hexagones couvrant six triangles élémentaires ne peuvent pas se recouvrir. On
calcule une fonction génératrice pour le nombre de telles configurations. Le
problème admet une symétrie Z 3 , correspondant aux trois sous-réseaux sur
lesquels le gaz peut se “cristalliser”. Comme le modèle des hexagones durs et
le modèle de Potts à trois états admettent tous deux une symétrie Z3 et sont
des modèles “ferromagnétiques” avec des interactions à courte portée, il est
très vraisemblable qu’ils appartiennent à la même classe d’universalité.
Des lois d’échelle vd = 2 - (Y, et
p = i v ( d - 2 + q ) , il s’ensuit
que
+
Le champ réel 2 cos cp = a 0. devrait avoir pour poids conformes (&, &).
De même, l’opérateur thermique (couplé à l’écart à la température critique),
désigné comme ci-dessus par E , a pour dimension A, = $ ( d - (Y/.) = La
théorie des champs conformes devrait donc contenir les champs scalaires
4.
Nous parcourons maintenant les tables de Kac donnant les représentations
unitaires de l’algèbre de Virasoro (figure 4). On constate que pour
144
IX.2.3
INVARIANCE CONFORME
5,
on trouve les deux poids
et
où le second admet un vecteur singulier
au niveau deux.
La table contient bien plus de candidats comme poids conformes, et les
attributions précédentes sont encore provisoires. Un traitement numérique
utilisant la méthode de rubans esquissée dans la section 1.4, confirme la
valeur c =
Des arguments supplémentaires seront présentés dans la
section 3.
2.
Vérifier la cohérence des attributions précédentes en utilisant la fonction
à trois points
( E ( z ~ , ~ ~ ) c o s ( P ( z ~ , Z ~ ) C O S 2( 3P) () Z=~ cst
,
1
Z12hc Z13hc Z232hm-he
x (c.c)
(185)
qui devrait obéir à l’équation différentielle
[
2(2h3+
-
2,3
((21
ho
- zk)2
1
-41
+ z1
- zk
(€(1)COS(P(2)cos(p(3))= o .
Ceci requiert que
condition satisfaite pour he = $, h, =
dans le cas du modèle d’king).
& (de même que h,
=
i, h,
=
&
I1 s’avère que les poids conformes figurant dans la table de Kac pour
m = 5 n’apparaissent pas tous dans le modèle de Potts. Ceci sera discuté
dans la section suivante, où l’on examinera des exigences de nature plus
globale. Ainsi que nous le verrons, la table suivante fournit la correspondance
entre les poids possibles et les champs scalaires primaires
IX.2.3
145
INVARIANCE CONFORME
Seules les rangées avec s = 1, 3 apparaissent dans le modèle. Nous
donnons d’abord la liste des champs scalaires en incluant la dégénérescence (c’est-à-dire le nombre de tels champs primaires indépendants). Par
exemple, on s’attend à ce que le champ de spin ait une dégénérescence égale
à 2.
Ao,o
A 5i ’ 52
AI 7
A:,:
ident it é
énergie
A&&
champ de spin
I
E
X
Y
(T
2
A 23 ’ 2
3
2 tels champs
2 tels champs
(187)
On doit ajouter à cette liste des champs de moment angulaire non nul
(respectivement f 3 et f1)
ce qui engendre une grande diversité d’observables.
I1 est possible de définir une extension du modèle de Potts à Q états à des
valeurs continues de la variable Q entre O et 4. La charge centrale est donnée
par la formule c = 1 - 6/m(m 1), où m et Q sont reliés par
+
a
Q = 4 ~ 0 s ’m+l
(189)
Les cas m = 2, 3, 5 correspondent à la percolation (bien que c = O , on utilise
une suite infinie de représentations non triviales), au modèle d’king et au
modèle de Potts à trois états. Le cas Q = 4 apparaît comme le cas limite où
m --+ 00, c -+ 1. Voir section 3.6.
8
Si l’on tient pour correcte la valeur c = dans le cas Q = 3, on peut, en
suivant Dotsenko, calculer la fonction de corrélation de quatre opérateurs
énergie E. Cette dernière doit satisfaire à un cas particulier de l’équation
(95), à savoir
Posons
146
IX.2.3
INVARIANCE CONFORME
En substituant, nous obtenons à nouveau une équation hypergéométrique
[
x(1- x)-
a l
d2
+ 3 2 2 - 1)-da: - & f(x,?i) = O
8x2
Rappelons que I'kquation hypergéométrique
[
- x)--d2
dx2
+ (y - (1 + a + B)x)-d
1
- aB f(x) = 0
dx
admet pour solution
f(x) = A F ( a , B ; y ; x )
+ B xlF7(1 - x)7-u-8
F(l
- a, 1 -
B; 2 - y; x)
où F est la série de Gauss
-
r(Y)
avec ia notation ( a ) , = r(a
+ n ) / r ( a ) = a ( a + i ) ...(a+ n - 1).
Ici (y = - 8 p = ..-I
5, y =
5'
équation en 3 , on déduit que
-5. Du fait que f(x,z) obéit à la même
Nous voulons à nouveau trouver les constantes
fonction de corrélation soit uniforme. Posons
uij
de telle façon que la
IX.2.3
147
INVARIANCE CONFORME
Dans un prolongement autour d’une boucle fermée évitant les singularités
à 2 = O, 1, 00, le vecteur F est transformé linéairement par une matrice
à coefficients constants. Ces matrices de monodromie sont indépendantes
de déformations continues des chemins à condition d’éviter les singularités.
Elles sont engendrées par deux boucles élémentaires entourant des points
5 = O et z = 1 (la boucle autour de 2 = 00 est équivalente à leur produit).
Appelons go et g1 les actions respectives sur F . On a
Pour obtenir 91, il est commode de transformer F en un vecteur 3 équivalent, adapté à la recherche des solutions régulières et singulières à 2 = 1,
c’est-à-dire
(
3=
F ( a ,p; a
- .)7-a-W(1
+ p + 1 - y; 1-).
- a, 1 - p; 1 + y - a - p; 1 - 2)
)
(199)
De la représentation intégrale (195) on déduit que
Comme
il s’ensuit que
Les deux transformations (198) et (202) deviennent unitaires pour a, p,
y réels et AA’ < O (ce qui est vérifié dans le cas présent) si l’on fait un
changement d’échelle sur les composantes de F suivant
148
INVARIANCE CONFORME
IX.2.3
ce qui conduit à
I1 en résulte que la combinaison (Fil2- I F Z l 2 /AX’ est invariante sous l’action
de go et gl, et par conséquent pour le groupe de monodromie complet. I1
s’ensuit qu’à un facteur multiplicatif près, l’expression finale pour la fonction
de corrélation est
B)
Les deux coefficients sont positifs, puisque r(- et -I?( - f ) sont tous deux
positifs. De plus l’expression complète est symétrique dans ses arguments.
(i) Vérifier la symétrie de la fonction de corrélation dans une permutation
des arguments.
(ii) En appliquant la même procédure dans le cas de corrélations impliquant deux spins et deux énergies, déduire l’expression obtenue elle aussi par
Dotsenko
(cos (p(l)&(2)cos (p(3)€(4)) =
Bien que la méthode soit très puissante, on conçoit que les expressions
explicites deviennent rapidement assez complexes. I1 existe aussi des représentations intégrales qui sont discutées dans la littérature. I1 est néanmoins
réconfortant de voir de tels résultats émerger d’une approche aussi générale.
Ils permettent de vérifier la cohérence de la théorie, en particulier sous la
forme de celle des développements à courte distance.
Plutôt que de poursuivre dans cette direction, ou de présenter d’autres
modèles, nous nous tournons vers l’étude de ces conditions de cohérence,
vues sous l’angle de l’invariance modulaire] en suivant les idées mises en
avant par Cardy.
IX.3
149
INVARIANCE CONFORME
3. Invariance modulaire
Dans cette section nous allons obtenir une classification des classes
d’universalité des modèles minimaux en étudiant les contraintes imposées
par l’invariance modulaire.
3.1 Fonction de partition sur un tore
Dans la section 1.4, nous avons montré la relation entre la charge
centrale et les effets de taille finie (déplacement Casimir de l’énergie libre)
dans une bande périodique. Nous voulons revenir en détail sur ce point.
Rappelons que la matrice de transfert par unité de longueur sur une bande
périodique de largeur L s’écrit
( L+
~ Eo -
kc>
où le facteur exp( i n c / L ) correspond précisément à l’effet mentionné cidessus. La normalisation est telle que l’énergie libre par unité de surface
s’annule à la limite d’un volume infini. Dans un domaine rectangulaire
de taille (L’Ad), en imposant des conditions périodiques sur les bords, la
fonction de partition prend la forme
Les conditions aux limites périodiques entraînent que le domaine possède la
topologie d’un tore, ce qui justifie le titre de cette section. Généralisons la
construction en accompagnant la translation de “temps’’ M par une translation d’“espace” additionnelle (figure 5). Alors que dans le plan l’opérateur Lo + Eo engendre des dilatations, et i(L0 - E O ) des rotations, après
transformation exponentielle ces combinaisons deviennent des générateurs
des translations d’espace et de temps. Si nous imposons des conditions aux
limites périodiques correspondant au parallélogramme de la figure 5b, la
fonction de partition deviendra
où nous avons posé
w1 = L’
~2
q = exp 2im-
=N
+ iM
q = exp -2inT
7
= Wâ/W1
(210)
150
INVARIANCE CONFORME
IX.3.1
N
L
L
Figure 5: ( a ) Un domaine rectangulaire périodique. (b) Un domaine
périodique plus général; utilisant la notation complexe W I et w 2 sont les
générateurs du réseau correspondant tels que lwll = L, 1.121 = dM2+N”.
Nous faisons la convention que ImT > O, de sorte que IqI < 1. L’intérêt de
ce choix de conditions aux limites est de mettre en évidence l’indépendance
des termes correspondants aux variables T et ;i (ou q et rj). Décomposons
l’espace des états en représentations irréductibles du produit des algèbres
(V,
caractérisées par des poids dominants (h,h). A ces représentations
seront associés des opérateurs primaires de même poids. Soit N h , le
~ nombre
de fois où la représentation ( h ,h) apparaît dans cette décomposition. Si le
nombre de représentations irréductibles distinctes est fini (ou dénombrable),
nous pouvons utiliser la définition des caractères conformes donnés par les
équations (152), (155), (158) pour écrire
v),
Les entiers IVh,&sont positifs. De plus l’unicité dé l’état fondamental, ou état
du vide, invariant par les transformations globales (dans le plan le groupe
SL(2,C), sur le tore, les translations), impose la normalisation &,O = 1.
Comme nous utilisons des représentations “réelles”, x , , ~ ( ; i=
) X ~ ~ ( T ) .
Dans un domaine rectangulaire, q = rj = e x p ( - 2 ~ M / L ) , considérons
le cas où M I L -f 00, q -f O. Si nous supposons que tous les opérateurs
primaires ont une dimension positive A = h h > O, nous retrouvons le
comportement limite
+
ainsi que nous l’avions afErmé dans la section 1. Tout état tel que A, =
h h n donnera lieu à une correction relative exponentiellemenmt petite,
exp( -2nA,M/L). Le spectre de la matrice de transfert engendre ainsi
+ +
IX.3.1
151
INVARIANCE CONFORME
l’ensemble des dimensions conformes de la théorie, donné par les rapports
de valeurs propres
Xn/Xo = exp(-27rAn/L)
(213)
qui sont tels que ln(X,/Xo) se comporte en L-l. Cependant, si certains
opérateurs ont une dimension négative, le comportement dominant (212)
sera modifié, comme nous l’avions anticipé dans la section 1.4, et l’on
trouvera
La succession des valeurs propres de la matrice de transfert sera déplacée
de -Ainf
X n / h = exp(-2r(An
- Ainf)/L)
(215)
Ceci montre que l’on doit être prudent dans l’interprétation des résultats
numériques.
Un exemple de ce phénomène est fourni par la singularité de
Ainf =
On prédit (et de fait on observe
Lee et Yang, avec c =
numériquement) que teff = f . Plus généralement dans un modèle minimal
(équation (146) et (147)) caractérisé par une paire ( p , p ‘ ) , on a dans le cas le
plus extrême
-?,
Ainf =
1-(P-P‘I2
2PP‘
-2.
Ceff
6
= 1 - -> O
PP’ -
La fonction de partition dans un domaine périodique obéit à des
contraintes de cohérence globale. D’après l’invariance euclidienne, l’espace
et le temps jouent des rôles symétriques. Nous pouvons les échanger, de telle
sorte que, dans un rectangle de taille L, M , la fonction de partition prend
~
Ni l’une ni l’autre de ces
les formes équivalentes 2 = T r ( 7 ~=) Tr(7~)~.
expressions n’exhibe explicitement cette symétrie, et on conçoit qu’imposer
une telle invariance impose une limitation très forte dans le choix des
coefficients du développement (211).
En termes plus généraux, un tore peut être considéré comme le quotient
du plan complexe par un réseau de translations A, engendré par deux
périodes indépendantes w1 et w2. Un autre choix de périodes fondamentales
w i et w i engendre le même réseau A, pourvu que la relation entre (w1,wz)
et ( w i , w i ) soit linéaire à coefficients entiers dans les deux sens, c’est-àdire inversible et de déterminant un. Ces conditions préservent l’aire ainsi
152
INVARIANCE CONFORME
IX.3.1
que l’orientation d’une cellule fondamentale. Le groupe des transformations
associées est le groupe modulaire SL(2, Z ) . De plus, l’invariance par rotation
et par dilatation entraîne que seul le rapport des poids r = w2/w1 est
la seule variable significative. Les transformations ci-dessus agissent sur
r comme transformations homographiques avec des coefficients entiers et
un déterminant un, les matrices f A étant identifiées. On donne parfois le
nom de groupe modulaire à S L (2 ,2 )/ 2 2 (écrit aussi PSL ( 2 ;Z ) , groupe
projectif linéaire sur les entiers), et la contrainte d’invariance des fonctions
de partition (ou de covariance des fonctions de corrélations sur un tore) est
appelée invariance modulaire.
3.2 Formule limite de Kronecker
Revenons au modèle gaussien, afin de vérifier l’invariance modulaire
dans un cas élémentaire. L’espace des états est l’espace de Fock du champ
libre. Dans une version hamiltonienne, les modes propres correspondent à
un moment quantifié p , prenant des valeurs qui sont des multiples entiers
de 2.ir/L. Les modes de propagation vers la droite correspondent aux valeurs
positives de p,, les modes de propagation vers la gauche à p , négatif. La
condition de périodicité spatiale implique que ces modes sont associés à la
propagation sur un cercle. Nous soustrayons le mode nul (correspondant
à une valeur constante du champ), qui conduirait à un résultat infini, en
effectuant une renormalisation multiplicative de la fonction de partition 2.
Pour chaque mode bosonique, le nombre d’occupation prend des valeurs
entières non négatives, et la charge centrale est c = 1. Nous nous attendons
donc à ce que la fonction de partition soit un produit de facteurs statistiques
de Bose de la forme
en accord avec l’équation (153) pour c = 1, h = O. Nous avons utilisé ici la
définition (157) de la fonction de Dedekind ~ ( 7 ) .
Une preuve directe de (217), susceptible de généralisations ultérieures,
est connue depuis le travail de Kronecker dans les années 1880 dans le contexte de la théorie des nombres. La preuve consiste en une évaluation directe
de l’intégrale de chemin et exhibe un facteur inattendu, qui fait défaut dans
l’expression (217), et qui est essentiel pour l’invariance modulaire. C’est
pour cela que nous n’avons écrit la forme (217) que comme une relation de
proportionnalité.
Appelons ICi les générateurs du réseau dual de A,
IX.3.2
INVARIANCE CONFORME
153
où A = Imw2Wl est l’aire du tore. Les valeurs propres du laplacien sont
données par
En,,,, = ( 2 ~ ) ’Inllc’
+ nzk212
(219)
où les n1,2 sont entiers. La fonction propre normalisée correspondant au
mode nul sur 7 = C/A est cpo = A - + . En omettant ce mode nul, l’intégrale
fonctionnelle exprimant la fonction de partition est formellement égale à
Z1 =ID. Ai6 (Ld’xcpcpo)
=A$’ ,
exp (-$Ld’x(Vcp)’)
1
(220)
-
1 1 . 1 , ~ Ez1,nz
~
Le facteur A i est destiné à rendre le résultat final sans dimension. Dans
l’équation (220), le produit sur les modes est divergent ultraviolet car les
valeurs propres Enl ,n2 ne sont pas bornées. Le prime dans le produit indique
l’omission de la contribution n1 = nz = O. La régularisation (et renormalisation) standard d’un tel produit infini utilise le procédé dit régularisation C.
Cette terminologie a pour origine le prolongement analytique de la fonction
C de Riemann utilisée dans l’étude de la distribution des nombres premiers.
Introduisons la fonction analogue
absolument convergente’ et donc analytique, pour R e s > 1. Comme nous
allons le voir ci-dessous, cette fonction possède un pôle à s = 1, mais admet
un prolongement analytique jusqu’à s = O. En comparant les expressions
(220) et (221), on définit la fonction de partition renormalisée 21 par la
formule
dG
ds
Désignons comme précédemment le rapport w2/w1 par r , et posons 4 =
exp2ii-rr. Pour R e s > 1, nous insérons la définition de Eni,nzdans (221),
ce qui donne l’expression
Zr = A* exp $-(O)
qui possède une propriété d’invariance modulaire explicite. Si nous subcwi, w2 = bwi
awb, et donc r =
stituons dans G(s), w1 = dwi
+
+
154
INVARIANCE CONFORME
+
IX.3.2
+
(UT' b)/(cr' d), a d - bc = 1, on voit immédiatement que G(s) est invariant. Par conséquent le prolongement analytique assure que cette propriété
restera vraie pour 21.
Revenant à (223), le premier terme fait intervenir la fonction C(s) =
Cïm-', qui a un pôle simple de résidu unité à s = 1 et telle que
2C(O) = -1, 2C'(O) = -1n2n. Dans le second terme, la somme sur m
donne une fonction périodique de nr, de période unité. Elle admet donc
un développement en série de Fourier de la forme
dy e2inp(nRe~-y)
[y2
&g:
+
dy e 2 i s p ( n R e ~ - y )
-
1
n2Im r 2 ]
1"
d t ts-ïe-t(y2+n2imT2)
d t ts-3/2e-[tnZ~rnr2+n2(p2/t)-2inpnReT ]
4)
Pour p = O, l'intégrale se réduit à î ( s - lnImr11-28. Nous isolons ce
terme, sommons sur n # O, et utilisons l'équation fonctionnelle pour la
fonction de Riemann
Changeant t en Iap/nImrI t , donne
IX.3.2
155
INVARIANCE CONFORME
2,
La dernière somme double est une fonction entière paire de s et le
membre de droite est donc pair en s + 1- s, ce qui fournit le prolongement
analytique requis de G(s). Comme pour 2 > O
et que C(2) = r 2 / 6 , on trouve au voisinage de s = O
Finalement
G(0) = -1
Remarquant que Jw1J /All2 = i/(Im 7 ) l I 2 , on trouve, d'après l'équation
(222)' la valeur précise de la fonction de partition 21
2
1
1
=
(227)
( I m . > ' i 'I ( M3
qui dif€ère de (217) par le préfacteur (Im T ) - + . Ce facteur est essentiel pour
assurer l'invariance modulaire, qui était en évidence tout au long du calcul.
L'origine de ce facteur tient à la soustraction du mode nul.
1
On déduit de l'équation (227) que lq(~)1(Im T)4 est invariant modulaire.
Pour être précis, l'action des deux générateurs T 4 T 1 et T 4 -7-l du
groupe modulaire sur V ( T ) est donnée par
+
Dans une transformation générale T + 7' = (a7
=
~ ( 7 ' ) EA(CT
+ b)/(cT + d) nous avons donc
+ d )1
2~(7)
(229)
où E A est une racine vingt-quatrième de l'unité. La détermination de ces phases
à partir de la théorie des nombres, qui n'est pas nécessaire ici, est due à Jordan
et Dedekind.
Dans le cas du champ libre, la fonction à deux points peut être aisément
calculée sur le tore. Elle doit satisfaire à
156
IX.3.2
INVARIANCE CONFORME
Le facteur 2~ additionnel dans le membre de droite est en accord avec la
normalisation à courte distance (équation 162) tandis que le terme 1/A
représente la soustraction du mode nul, rendant -A inversible dans le
sous-espace orthogonal. I1 est entendu que la fonction S et la fonction de
corrélation doivent être doublement périodiques. La solution de l’équation
(230) est exprimée en termes d’une des fonctions û (appendice A), que nous
normalisons selon
-00
où, comme précédemment, nous utilisons la notation q = exp(2ir.r) tandis
que y = exp(2irz/wl), et, comme d’habitude, P(q) = nY(1- qn). On
vérifie qu’on a
= exp (--2r
[
(Im ~ 1 2 / w 1 ) ~
Imr
2
(232)
est doublement périodique, symétrique dans
I1 est aisé de montrer que
l’échange 1 H 2, et que son comportement à courte distance est de la forme
r
1
2
-
212212
(233)
I1 sera utile dans la suite de connaître les valeurs r12 quand z12 a des
coordonnées rationnelles .dans la base w1, w2. Soit N , k et e des entiers.
Alors
où
Dk/N,e/N(T) =q
- &(Üe(N-e)/N2-1)
IX.3.2
157
INVARIANCE CONFORME
Par construction D k / N , e / N ( T ) s’annule quand k et e sont tous deux
multiples de N . Vérifier que cette fonction possède les propriétés
Les fonctions D admettent une autre interprétation qui est la suivante.
Revenons au calcul de la fonction de partition du champ libre, mais, au lieu
de supposer le champ doublement périodique, exigeons que, après un cycle
autour de w1 et w 2 , il soit multiplié par une phase (naturellement le champ
est alors complexe). Plus précisément, pour X et 1-1 entiers, nous convenons
we
Les modes propres correspondent à des valeurs propres de la forme
-
(n2
+
6)
k1 +
(n1
+ $) k2 =
{
(n1+
$)
w1+
(n2
+ 6)
w 2 )
(240)
Nous n’avons pas à effectuer la soustraction du mode nul lorsque k ou 1
(ou les deux) sont différents d’un multiple de N . Finalement, au lieu de
calculer la racine carrée du déterminant inverse, nous calculons simplement
le déterminant. Définissant
nous trouvons en répétant les calculs précédents et après un prolongement
analytique
Ainsi D k / N , e / N (T) apparaît-il comme un déterminant renormah6 sur des
modes correspondant à des conditions aux limites du type (239).
(i) Vérifier l’équation (242).
158
INVARIANCE CONFORME
IX.3.2
(ii) Dans le cas du champ libre, obtenir la valeur moyenne (constante)
du tenseur impulsion-énergie sur un tore. En effectuant une déformation
6 x p = 6 ~ p ” x ” ,où 6c est une matrice infinitésimale, nous avons
(Tpy(x))
8 ” z ” = ( T p v ( x ) )68‘” = ( T ( z ) )[ô€’’
où ( T ( z ) )=
- 6c22 + i(6ci2 + 6c21)] + C.C.
(T)est indépendant de z ,
Insérant l’expression (227) de Zi, nous obtenons
La dernière somme semi-convergente doit &re comprise comme une double
limite, où l’on somme d’abord symétriquement sur p , et ensuite sur n.
3.3 Modèle d’Ising
D’après l’expression (171) de l’action dans le cas d’un champ de Fermi
libre, et prenant en compte la statistique antisymétrique, nous obtenons
la fonction de partition sur un tore comme un produit de deux Pfaffiens
sont les opérateurs de Cauchy-Riemann. Cette
Pf(d)Pf(a), où d et
quantité est également la racine carrée du déterminant du laplacien, soit
(det - A ) l j 2 . Cependant, les conditions aux limites doivent être choisies
de façon appropriée. D’après les résultats du chapitre II, les champs 1c,
et $ doivent être antipériodiques le long d’un des générateurs w1, w2 au
moins. Désignons par O ou les conditions périodiques ou antipériodiques,
en accord avec les notations de la sous-section précédente. Nous venons
d’obtenir la valeur de (det -A) comme 1 D k p ~ / ~ ( 7 avec
) 1 ~ ,k, = O, 1.
D’après le chapitre II, il s’ensuit que nous avons
a
fr
Le terme ID0,oI s’annule, ce qui reflète la présence d’un mode nul. Ce résultat
est en accord avec les calculs directs de Kaufmann, Ferdinand et Fisher. On
remarque que partant d’un des termes non nuls dans (244), l’invariance
modulaire requerrerait la présence des deux autres. De fait, d’après les
équations (236) et (237) nous obtenons l’action des transformations T +
T
1 et T --+ - 7 - l . Ces derniers engendrent des permutations sur les trois
déterminants
+
IX.3.3
159
INVARIANCE CONFORME
2 5)
Ceci peut aussi être compris en suivant l’effet du changement de base
(w1,w2) indiqué sur les conditions aux limites correspondantes. I1 en résulte
que la combinaison (244) est invariante modulaire. Les diverses conditions
aux limites qui apparaissent dans cette expression sont appelées “structures
de spin”. Trois d’entre elles contribuent à la fonction de partition.
I1 est maintenant possible de faire le lien avec le développement en caractères, conformément à l’équation (211). Les fonctions D i r c , +s’expriment
naturellement comme des carrés. Définissant
O
O
00
d 2l 1o ( ~ )= qh n ( l
+ qn)
(247)
1
qui obéissent aux relations
1
d+,+(7-)dO,+(.)d+,O(‘)
di,$(‘)
= qiû
+
(248)
= dO,+(r) 16di,o(.)
On reconnaît alors que les caractères
prennent la forme des combinaisons
xc,h,
1
avec c = 5 et h = O,
$
ou
&,
(249a)
160
INVARIANCE CONFORME
- 2I
{
$(1
+$+a)
IX.3.3
p+t)}
- n(1CO
O
+CO
=- 1
[(24k+5)*-1]/48
(Q
-
Q
[(24k+11)2-1]/48
1
(249b)
1
p(q)
+Oo
=-
[(24k-2)’-1]/48
(Q
- Q [(24k+10)z-1]/48
I;=-CO
(249c)
Par conséquent on peut récrire la fonction de partition du modèle d’Ising
comme forme sesquilinéaire dans les caractères correspondants
en accord avec la discussion générale. Cette formule met en évidence le
contenu physique du modèle, avec trois opérateurs primaires, à savoir
l’identité, la densité d’énergie et le spin. La déduction directe confirme la
valeur c = $ de la charge centrale, ansi que les poids conformes (O, O),
et
&) respectivement. L’invariance modulaire est également claire, ainsi
que nous l’avons vu ci-dessus.
(h,
(a, 2)
On peut aussi obtenir les diverses fonctions de corrélations sur le tore.
Considérons d’abord 16:s champs fermioniques. Nous rappelons que dans le plan
avec l’expression complexe conjuguée pour les champs $. En supposant le
champ S) de poids ( $ , O ) , il s’ensuit que sur un ruban périodique, obtenu par
la transformation zplaii = exp(2ia/L)z,,ban, on a l’expression
IX.3.3
161
INVARIANCE CONFORME
-
Cette fonction est antisymétrique dans l'échange z1
2 2 , et antipériodique
$(z + L) = - @ ( z ) (d'où l'indice $). I1 existe cependant une autre possibilité,
impliquant un champ périodique @(z L) = @ ( z )(indice O ) , à savoir
+
Sur un tore, des corrélations analogues satisfaisant à
a1 ($(Zi)@(tZ))
= 4 1 , 2)
(254)
sont distinguées par un double ensemble de conditions périodiques et antipériodiques, lesquelles interdisent l'existence de modes nuls. Les indices k , e
prenant les valeurs O , 1 et k , e n'étant pas simultanément nuls, nous écrivons
Le premier indice i k se réfère au comportement dans la direction w2, le
second
au comportement dans la direction w1. En utilisant la function F ( z )
introduite en (231), et y = exp(2inz/wl), on peut vérifier que les expressions
requises sont
Les facteurs de normalisation s'écrivent
162
INVARIANCE CONFORME
IX.3.3
On retrouve les expressions (252) et (253) dans la limite d’un ruban. Ces
dernières sont appelées fonctions de corrélation avec conditions aux limites de
Neveu-Schwarz et Ramond respectivement, dans le contexte de la théorie des
cordes. On tire de l’équation (255) la fonction de corrélation énergieénergie
sur un tore, somme pondérée de trois termes
Le prime dans la somme indique l’omission du secteur (0,O). Bien que ID0,ol
s’annule, ce secteur périodique-pérodique peut donner des contributions à
d’autres quantités. Nous verrons par exemple dans la section 3.8 que la valeur
moyenne ( E ( z , Z)) est une constante non nulle, qui provient uniquement de ce
secteur
De même ce secteur contribue aux corrélations spin-spin (Di Francesco,
Saleur et Zuber). En utilisant les notations des fonctions 0 (appendice A) nous
avons
de sorte que
et, à un facteur multiplicatif près,
u=2
avec
el(Z,T)
N
2-0
e;(o,T)z, e ; ( o , T ) = 2 n 9 ( ~ ) ~ .
L’expression (261) se comporte à courte distance comme on s’y attend.
On peut aussi se convaincre que la fonction de corrélation est doublement
IX.3.3
163
INVARIANCE CONFORME
périodique. Le point remarquable est que cette fonction est une somme de
E
contributions provenant de quatre secteurs, sous la forme
2, (ou), /
Z,,
où, au numérateur, le secteur doublement périodique (v = 1) donne une
= O. Chacune des quantités
contribution non nulle, en dépit du fait que 2,
partielles 2, (au),,relative à une structure de spin donnée, satisfait à une
équation qui généralise sur un tore l’équation correspondante de Belavin,
Zamolodchikov et Polyakov valable dans le plan et qui a été obtenue par Eguchi
and Ooguri. Pour tout opérateur A associé à une représentation possédant un
vecteur singulier au niveau 2, on a ainsi
c,
qui ont
Ces équations font intervenir les fonctions de Weierstrass p et
respectivement un pôle double et simple à l’origine, ainsi que la constante
QI, ces quantités étant définies par les relations
Notons que C(z,T ) n’est pas doublement périodique et que la constante 01 a
déjà fait son apparition dans l’équation (243). En utilisant les mêmes notations,
la fonction de corrélation ( E ) donnée par l’équation (258) s’écrit
Les fonctions de corrélation d’ordre plus élevé sur un tore peuvent aussi être
obtenues sous forme fermée.
3.4 La classification A-D-E des modèles minimaux
Revenons à la discussion de la section 3.1, et en particulier à l’équation
(211)’ où la fonction de partition est écrite comme une forme sesquilinéaire
dans les caractères de l’algèbre de Virasoro, avec des coefficients entiers
non négatifs. Une telle expression résulte d’une formulation hamiltonienne,
ayant fait choix des axes de temps et d’espace. Cependant un tel choix
164
INVARIANCE CONFORME
IX.3.4
est en fait arbitraire. Dans une transformation modulaire, la fonction de
partition doit être invariante, ce qui conduit à des contraintes sur le contenu
opératoriel des modèles. Dans la sous-section précédente, nous avons montré
par un calcul direct (équation (250)) un exemple typique impliquant une
telle somme de trois termes. En un sens, la fonction de partition gaussienne
(équation (227)) est aussi un cas limite de cette situation. Dans cette
section, nous allons exposer les résultats obtenus en imposant la contrainte
d’invariance modulaire dans le cas général, où la charge centrale prend
la valeur rationnelle c = 1 - 6(p - ~ ’ ) ~ / p pavec
’ , le cas particulier mais
important des modèles unitaires tels que p et p’ soient des entiers consécutifs.
De façon remarquable, une classification complète peut être décrite en des
termes reliés à la classification de Cartan-Killing des algèbres de Lie simples
(de façon spécifique, une sous-famille appelée “simplement lacée”). Cette
même classification A-D-E , où A désigne l’algèbre de Lie des groupes
unitaires, D celle des groupes orthogonaux en dimension paire et E les trois
algèbres de Lie exceptionnelles Ec, E7 et Es, apparaît dans des circonstances
variées, en apparence sans relation. Un autre cas fameux est celui des sousgroupes finis du groupe des rotations tridimensionnelles (à une conjugaison
près).
Le fait que nous puissions obtenir une description complète de tous les
modèles minimaux est, jusqu’à un certain point, tout à fait surprenant.
I1 montre la puissance de l’invariance conforme appliquée aux modèles
critiques bidimensionnels. Bien que toutes les implications de ce résultat
n’aient pas encore été dégagées au moment où nous écrivons ces lignes, nous
savons grâce aux travaux sur les modèles intégrables (Baxter, Andrews et
Forrester, Pasquier) que l’on peut construire des modèles sur réseau qui
correspondent à chacun des comportements critiques prédits. La relation
avec les modèles intégrables n’est cependant pas encore claire. Quoi qu’il
en soit, il est d’une certaine importance d’obtenir, même dans un domaine
restreint, une description complète des classes d’universalité critiques.
Afin de mener à bien le présent programme, nous devons décrire l’action
du groupe modulaire sur les caractères de l’algèbre de Virasoro. Ce groupe
est engendré par les deux transformations
T
S
T-+T+1
T -+ -T-l
(265a)
qui satisfont aux relations
S2 = ( S T ) 3
(265b)
Dans la section 1.8, nous avons montré qu’on peut indexer les représentations par un entier X défini modulo N = 2pp‘. Les caractères sont alors
donnés sous forme compacte par l’équation (158). Rappelons que dans une
transformation modulaire, la fonction de Dedekind, qui apparaît dans les
dénominateurs, se transforme comme indiqué en (228). En utilisant la formule de Poisson
IX.3.4
INVARIANCE CONFORME
165
(266)
on trouve ainsi que
T
(267~)
L’action de la transformation T est diagonale, étant, à une phase près, la
multiplication par exp(2i7rX2/2N), tandis que celle de S n’est autre que la
transformée de Fourier finie sur les entiers modulo N. La transformation de
~ ,, , mais
~
l’égalité x x = X - X restaure la
Fourier a un carré égal à G X , - ~ ~ , ~ N
propriété S2 = I. On vérifie sans peine que les deux transformations (267)
sont compatibles avec la propriété d’antisymétrie x x = - x w o ~Rappelons
.
que wo est donné par wo = rop+sop’ mod.N, avec T O , so tel que rop-s0p’ =
1, identité qui exprime que les entiers p et p’ sont premiers entre eux. Nous
pourrions bien sûr utiliser les symétries de x x pour restreindre la somme du
membre de droite de (267b). Ceci, cependant, masquerait la relation entre
les caractères de l’algèbre de Virasoro et un ensemble de fonctions analogues
qui apparaissent dans l’étude des représentations de l’algèbre de KacMoody Ai1), c’est-à-dire l’algèbre des courants SU(2) locaux. Une classe
intéressante de représentations de poids dominants de l’algèbre de Lie infinie
correspondante est caractérisée par une anomalie (analogue à la charge
centrale), appelée dans ce contexte le niveau, qui est désignée par un entier k ,
prenant les valeurs 0’1,... . Ces représentations de dimension infinie peuvent
être décomposées comme sommes des représentations usuelles de SU(2),
celle de spin le plus petit étant non dégénérée, de dimension X = 2jmin 1.
Nous donnons dans l’appendice C un bref survol de cette théorie. La raison
pour introduire ici les caractères de Kac-Moody SU2 tient à la relation
étroite avec les caractères de l’algèbre de Virasoro. On va voir qu’il existe un
parallèle dans la recherche de fonctions de partition invariantes modulaires.
+
les caractères de l’algèbre A r ) (définis
Nous désignerons par x”xff(~)
dans l’appendice C) pour les distinguer des caractères de l’algèbre de Virasoro qu’on pourrait appeler caractères conformes. Pour une représentation
de niveau k de Ai’), nous posons N = 2( k 2)’ qui est à nouveau un entier
pair. Le caractère s’écrit
+
166
IX.3.4
INVARIANCE CONFORME
Remarquons la ressemblance avec le cas des caractères de Virasoro (équation
(158)), et observons que xXff se prolonge en une fonction périodique impaire
de X (de période N )
Dans le cas présent, le rôle de l’involution X + WOX est joué simplement
par la symétrie X + -A. La similitude se poursuit lorsqu’on considère les
propriétés de transformation modulaire, que l’on doit comparer à (267)
x;ff ( T + 1) = e2ix(X2/2N-i) xxa f f (7)
Xiff(-l/T)
-1
=-
(270~)
e2ixXX’/N
aff
XXt (7-1
(270b)
X‘EZINZ
Ainsi que l’ont suggéré Gepner et Witten, on peut développer un programme
analogue de classification des fonctions de partition de type (211) en termes
des caractères affines au lieu des caractères conformes, en imposant des
conditions analogues sur les coefficients, pourvu que la somme sur X porte
i: = O .
sur un domaine fondamental 1 5 A 5 frN - 1 puisque xgff = x
Dans les deux cas, les solutions invariantes modulaires peuvent être
trouvées en deux étapes. Dans la première étape commune, on recherche
simplement des matrices N x N avec des éléments arbitraires (appelons-les
N ) ,qui commutent avec les deux matrices
où X et A‘, ainsi que les indices de N , portent sur les entiers modulo N .
On trouve que de telles matrices N peuvent être écrites comme des
combinaisons d’un ensemble linéairement indépendant défini comme suit.
Soit S un diviseur positif quelconque de a N , unité incluse, et a le plus
grand commun diviseur de S et 8 = N/26, noté a = (S,8).Manifestement
a2 est un diviseur de SN. Définissons la matrice N x N (Ra)x,x, de sorte
que celle-ci ait des éléments de matrice nuls à moins que a ne divise à la
fois X et A’, auquel cas
( R ~ ) A=
,~J
SX’,wX+CN/a
(272)
cES/aS
L’entier w mod N/a2 est obtenu comme suit. Comme S/a et $/a sont
premiers entre eux, on peut trouver des entiers p et a tels que p S / a - a S / a =
1, alors w = $ / a + aS/a (mod N / a 2 ) .On note que w2 = 1 (mod 2 N /a 2 ) ,
en accord avec le fait que dans la définition (272) X‘/a = wX/a (mod N/cr2).
IX.3.4
INVARIANCE CONFORME
167
On vérifie que 0 6 commute à la fois avec T et S. On peut encore
montrer, comme l’ont fait Gepner et Qiu, que inversement toute matrice
N possédant cette propriété est une combinaison linéaire des matrices 0 6
et que ces dernières sont linéairement indépendantes. On remarque que si
S = $ N , B = 1, Q = I, w = 1, et
=I.
La partie difficile est de trouver la superposition correcte des 0 6 telle
X : ( T ) ( Y ~ ~ ~ ) A X( T~)X, Aqui
I est invariante modulaire, se
que l’expression
réduise, quand elle est sommée sur les caractères fondamentaux (conformes
ou affines), à une combinaison à coefficients non négatifs entiers. La normalisation dans le cas affine requiert que le coefficient de xTaff(~)xYff(~)
soit
l’unité. Dans le cas conforme, le coefficient de l’état fondamental analogue,
correspondant à h = h = O, doit aussi être égal à l’unité. En utilisant la
,~
notation A, ceci correspond à un coefficient unité pour xi-,,( ~ ) x , - (T).
La difficulté provient de I’antisymétrie des caractères dans les involutions
X + w O X ou X + -A respectivement.
Décrivons d’abord la solution pour les fonctions de partition affines, où
nous écrivons la combinaison requise sous la forme
4
Le coefficient prend en compte l’antisymétrie X - X = - X X qui entraîne que
chaque produit X ; X X , est compté deux fois. On démontre que deux séries
infinies et trois solutions exceptionnelles remplissent tous les critères. Pour
être concis, nous écrivons la solution c y 6 s / 6 apparaissant dans (273) en
posant n = N/2, et nous rappelons que 0, agit comme la matrice unité
Quand n est impair, la solution est unique. Quand n est pair, il existe
en général deux solutions distinctes, et trois quand n = 12, 18 ou 30.
La signification de ce résultat apparaît de façon plus claire quand ces
combinaisons invariantes (273)-(274) sont explicitées dans la table I.
On peut alors faire le lien avec la classification A-D-E des algèbres
de Lie simplement lacées (appendice C), en remarquant que les éléments
diagonaux (O, 1 ou 2) dans la matrice (274), ainsi que le montre la table,
sont reliés aux degrés des polynômes invariants fondamentaux de Casimir
de l’algèbre de Lie correspondante. L’algèbre enveloppante d’une algèbre de
Lie simple admet un sous-ensemble de polynômes invariants. Ces derniers
peuvent, à leur tour, être écrits comme des polynômes dans un ensemble
de T d’entre eux, T étant le rang de l’algèbre de Lie. Si l’on soustrait
168
3
x
m
t-
-
+
x
m
-
+
x
+
s
+
x
+
N
<
m
-
-
Y
V
u3
n
xm
V
+
x
x
+
x
*
<
+
x
+
N
x
+
x
u3
n
-
INVARIANCE CONFORME
r3
4
N
s
t
s
+d
@a
Q
$AI
II
r
IX.3.4
IX.3.4
INVARIANCE CONFORME
169
1 au degré de ces polynômes invariants fondamentaux (le premier est
toujours quadratique), les éléments diagonaux ci-dessus indiquent combien
de polynômes de ce degré se trouvent dans cet ensemble. Par exemple, dans
le cas de l’algèbre de Lie Es, nous trouvons dans la table que les invariants de
Casimir ont des degrés 2, 8, 12, 14, 18, 20, 24 et 30. Ces degrés sont parfois
appelés nombres de Coxeter. Ceci fournit la correspondance entre fonctions
de partition et algèbres de Lie. Son origine n’est pas encore entièrement
comprise.
I1 semblerait que nous ayons emprunté une voie buissonnière en classant
ces invariants affines, s’il ne se révélait que la solution du problème conforme
est simplement reliée au précédent. En effet, rappelons que dans ce cas
N = 2pp’. Revenant alors à la notation originelle des poids conformes et au
prix d’un doublement de l’espace des valeurs, il s’avère que nous pouvons
considérer les caractères conformes comme portant une paire d’indices
correspondant à un espace tensoriel de dimension 2p’ x 2p. Les éléments
du commutant de T et S peuvent aussi être considérés comme des produits
R p @ 0 6 et les fonctions de partition correspondantes sont données par une
paire de combinaisons choisies parmi celles qui apparaissent dans l’équation
(274). Le rôle de n est joué successivement par p’ et p . Comme p et
p’ sont premiers entre eux, l’un d’entre eux est nécessairement impair,
l’invariant correspondant étant alors du type A. NOUSobtenons ainsi le
principal résultat de cette section, qui est une classification des fonctions de
partition conformes en deux séries infinies et trois sous-séries exceptionnelles
de modèles minimaux, compatibles avec les exigences d’invariance conforme
et d’invariance modulaire. Les fonctions de partition sont énumérées dans
la table II, où l’on suppose, pour fixer les idées, que p est impair. Dans le
cas particulier unitaire, si m est impair on fera la correspondance p + m,
p’ = m + 1 et si m est pair, p + m + 1, p’ = m. Nous trouvons alors
deux séries infinies et trois paires de modèles exceptionnels. Le facteur $
apparaissant dans la table II reflète la symétrie xT+ = xp~-r,p-s,
quand
nous revenons à l’indexation en termes d’entiers r , s (A = r p - sp’) que
nous avons utilisée dans la table, où chaque invariant est désigné par une
paire d’algèbres de Lie.
L’analyse détaillée de chacun des modèles apparaissant dans la table
sort du cadre de notre discussion. Nous nous contenterons de quelques
remarques. Concentrons d’abord notre attention sur le cas unitaire. Dans la
série ( A - A ) , le premier candidat correspond à m = 3, p = 3, p’ = 4, et donc
dans la présente notation ( A 3 ,A 2 ) . Ceci n’est évidemment rien d’autre que
le modèle d’king. En général dans cette série A-A (appelée série principale),
la fonction de partition s’écrit simplement
qui décrit une généralisation du modèle d’Ising, avec un seul opérateur sca-
170
3 - +
x
U
-?
rrr,
a
-
")
m
4.
t-
4
P)
x
+
x
+
x
+
s
+
?
O)
?
O)
x
+
x
4
+4
x
3 1N
4
+
x
v
'MI;
a
4
2
II
m
3
1N
II
O
a
'
I
"
4
6
V
a
'
II
a
'
I
3
n
y"
V
h
3
4
m
INVARIANCE CONFORME
h
3
I
h
3
3
4
P
I
N
4
+,
s
V
6
V
IX.3.4
IX.3.4
171
INVARIANCE CONFORME
laire Ah,h pour chaque valeur distincte dans la table de Kac. En particulier,
le modèle correspondant à m = 4, c =
est le modèle d’king tricritique.
En générai, la série unitaire A-A décrit l’ensemble de modèles scalaires multicritiques, de degré de plus en plus élevé (appendice A, chapitre V), avec
un lagrangien effectif de la forme
Le cas k = 2 est à nouveau le modèle d’king ( m = 3), et une valeur
de k générale correspond à la valeur m = k
1 . La charge centrale
c = 1 - 6/( k 1)( k 2) tend vers celle du champ bosonique libre (c = 1),
lorsque k
00, en accord avec l’intuition. D’après Zamolodchikov, le
,champ primaire de poids h =
= h2,2 = ;(k + l ) ( k 2) ( k _> 2)
correspond au champ cp. Les puissances plus élevées : pn : ont des poids
h = I;. = hn+1,2+1 = [(n 1)2- 1 ] / 4 ( k+ l ) ( k 2) pour n = 1 , 2, ...,
k - 1 , et h = h = hn-k+2,n-k+l = [(n+ 3)2 - 1]/4(k l ) ( k 2) pour
n = k , . . ., 2k - 2. Le champ : p2”l : s’obtient comme un descendant de cp
sous la forme a& en raison des équations de mouvement. Ainsi que nous
le montrerons dans la section suivante, tous ces modèles sont naturellement
associés à la brisure spontanée d’une symétrie 2 2 .
Quand m = 5 et c = $, on trouve deux possibilités. Dans le modèle multicritique de la série principale, tous les opérateurs primaires sont scalaires,
tandis qu’une deuxième possibilité relève de la série (A, O) (appelons-la série complémentaire), à savoir p = 5, p’ = 6, et donc (A4,O4). En utilisant la
~ ,la notation Xh,, , la fonction de partition correspondante
notation x ~ ,puis
s’écrit
+
+
+
+
+
+
+
+
Si comme on l’a vu plus haut le modèle de Potts à trois états correspond
$ de la charge centrale, il y a plusieurs façons de s’assurer que
(276) est la version correcte. On peut par exemple exiger la présence de deux
correspondant aux deux opérateurs de “spin”
opérateurs de poids
sin cp et cos p. Un autre argument, que l’on décrira dans la prochaine section,
montre que seule l’équation (276) correspond à la brisure d’une symétrie
Z3, comme cela doit être le cas. I1 existe aussi une preuve “microscopique”
quasi directe, utilisant une description en termes d’un gaz de Coulomb,
qui est en accord avec le choix précédent, description que nous discuterons
dans la section 3.6. Nous supposons donc que la fonction de partition (276)
décrit correctement le contenu du modèle de Potts à 3 états et nous notons
l’existence d’opérateurs de moment angulaire f3, f l . A l’exception de la
série principale A-A, on trouve toujours de tels champs tensoriels.
à la valeur
&, &,
172
IX.3.4
INVARIANCE C O N F O R M E
Huse a observé que la série principale A-A était réalisée au point
critique des modèles SOS de Andrews, Baxter et Forrester. Pasquier a
généralisé leur construction de façon à inclure tous les autres cas unitaires
figurant dans la table II.
Naturellement le modèle ip3, ou singularité de Lee et Yang (section
et la fonction
1.7), apparaît dans la table. La charge centrale est c =
de partition est dans la série ( A ,A )
-y
(-44,Al
1
= lXh=Ol
2
+ IXh=-$
l2
(277)
La preuve des résultats de cette section, accompagnée de nombreux
commentaires, figure dans les travaux cités en référence dans les notes.
3.5 Frustrations et symétries discrètes
Supposons que l’une des théories décrites ci-dessus soit la limite critique
d’un modèle sur réseau, avec des interactions entre plus proches voisins
portant sur des variables discrètes ai,j prenant un nombre fini de valeurs.
Supposons de plus qu’un groupe fini G opère globalement sur ces variables
de telle sorte que l’action soit invariante. Quand le réseau est restreint à
un domaine fini de taille L , M , au lieu de considérer des conditions aux
l , a1,j
j
ou bien o i , ~ + =
1 a i , l , comme cela était
limites périodiques ( ~ ~ + =
implicite jusqu’à présent, nous pouvons introduire des conditions aux limites
frustrées sous la forme a ~ + l , =
j g l a l , j , a i , ~ + 1= g * a i , l , où g 1 , 9 2 E G . La
cohérence de ces conditions implique que les éléments g1 et 9 2 commutent.
En prenant ia limite continue, nous avons donc des fonctions de partition
5 ustrées Z,, , g 2 , qui sont maintenant covariantes par le groupe modulaire.
Pour fixer les idées, cherchons dans quelles circonstances G est un groupe
cyclique G 2 / k 2 , les variables discrètes ui,j donnant naissance à un des
champs primaires de poids conforme ( h , h ) . Faisons agir le groupe 2 l k 2
par des phases (correspondant aux représentations unidimensionnelles), de
telle sorte que le champ correspondant uh,h obéisse à la condition
où n1 et
722
sont des ent,iers. D’après la définition de h et
h., nous avons
+
u h , ~ ( z nlwl) = exp [2ir(h - h)nl]u h , h ( z )
(279)
ce qui veut dire que k l / k h - h. mod 1. Prenant kl et k premiers entre
eux, et utilisant les valeurs de h et h. dans la table de Kac d’un modèle
minimal, nous en concluons que k doit diviser 4pp’ ou 4m(m 1) si nous
nous restreignons à des modèles unitaires. Nous obtenons ansi une condition
nécessaire pour que 2lk.2 puisse être considéré comme groupe de symétrie.
+
IX.3.5
173
INVARIANCE CONFORME
Désignons par Z k l , k 2 la fonction de partition correspondant aux conditions
aux limites (278). Elle n’est invariante que pour un sous-groupe du groupe
modulaire qui respecte ces conditions. Considérons en particulier Zk,,o. Si
nous posons T’ = (a7 b)/(c.r d ) , on voit que l’invariance de Zkl ,O requiert
a = d = f l mod k et b = O mod k , pourvu que nous supposions kl
et k premiers entre eux, et une condition de réalité Zk1,0 = Z-~,,O.Ceci
définit un sous-groupe, appelons-le r o ( k ) ,du groupe modulaire complet r.
La condition aux limites frustrée dans la direction w1 ne nous empêche pas
de considérer Zk,,o
comme la trace de la matrice de transfert dans un certain
sous-espace des états, qui peut être décomposé en parties irréductibles pour
la paire d’algèbres de Virasoro. Par conséquent, nous devons aussi trouver
des entiers non négatifs Nh,h tels que
+
+
Cette expression doit être invariante sous l’action de r 0 ( k ) . Admettant
qu’il en soit ainsi, si nous effectuons une transformation conforme arbitraire
y E r sur l’argument de T (et 7 ) ’ on engendre à partir de Zk,,o une fonction
Z ~ , , O ( invariante
~T)
pour le groupe conjugué yr0(k)y-l. Le nombre de telles
y’ si
fonctions est égal au nombre de classes d’équivalence (à droite), y
y‘-ly E r o ( k ) , lui-même égal à
-
dk
= $k2
II
(1-f)
p premier
Le symbole p I k signifie que p divise k. Chacune des fonctions ci-dessus est
invariante par r(k ) , le plus grand sous-groupe commun à tous les y r o(k)y-l.
Ce groupe, appelé sous-groupe principal de congruence (de niveau k ) ,
est un sous-groupe invariant de I?. Le quotient fini r/r(k)est le groupe
modulaire sur les entiers modulo k. Les fonctions Z k 1 , 0 ( Y ~ ) au nombre de
d k correspondent en fait a d’autres conditions aux limites z k ; ,k; = 2 - k ; , - k ; .
Chacune d’entre elles est invariante à gauche par un groupe yr0(k)y-’/r(k)
isomorphe à S / k Z , le groupe de symétrie cyclique. Ces autres fonctions
de partition sont à nouveau des formes sesquilinéaires du type (280)’ où
les coefficients ne sont cependant plus restreints à être des entiers positifs.
Naturellement, dans cette notation, Zo,o est la fonction de partition non
frustrée décrite dans la section précédente. L’indice de r(k)dans I?, ou
l’ordre de I’/l?(k), est kdk.
A titre de vérification, appliquons ces considérations successivement au
modèle d’king et au modèle de Potts à trois états, m = 3 et 5 dans la série
unitaire. Quand k 5 4, le groupe î o ( k ) est engendré par les transformations
T -t T
k et T + T / T 1. Dans le cas du modèle d’Ising, nous nous
+
+
174
IX.3.5
INVARIANCE CONFORME
attendons à un groupe de symétrie S / 2 2 , soit k = 2. Utilisant la notation
x h pour les caractères, la forme la plus générale de la fonction de partition
frustrée &,O est
La première parenthèse est 20,~’
la fonction de partition non frustrée, tandis
que dans le second terme les combinaisons ~ 2 x et
0 ~ 0 x correspondent
4
à des
opérateurs fermioniques primaires. La transformation T + -7-l engendre
Z O ,sous
~ la forme
Dans la limite d’un ruban, les termes dominants de ZOJ et &,O doivent
être identiques, étant donné que le renversement de spins très éloignés ne
devrait pas affecter le comportement aymptotique dominant. Ceci implique
N I N2 = 1. Si de plus nous supposons que N2 # O, pour obtenir une
fonction &,O non triviale, nous voyons que l’on doit avoir Ni = O, N2 = 1.
+
MIL
Comme conséquence, posant T = iM/L, si nous prenons la limite
-+ 00, nous nous attendons à ce que
~l,O/ZO,O= exP(-Mf)
(284)
où f est l’énergie libre d’interface par unité de longueur. Dans un modèle
auto-dual tel que le modèle d’Ising, la dualité relie cette énergie d’interface
au comportement de la fonction de corrélation spin-spin au point critique et
donne pour un système fini de largeur L = luil,f = rq/L. Comparant aux
expressions ci-dessus, on aboutit au résultat bien connu q =
4.
Nous pouvons appliquer le même argument au modèle de Potts à trois
états ( A 4 , 0 4 ) avec m = 5 (voir l’équation (276)). On vérifie que
Z1,O = z2,o = (xo + x3)*
xzj + (xo + x 3 ) x;
est invariant par î 0 ( 3 ) , en accord avec l’existence d’une symétrie 2 / 3 2 de
ce modèle. Cette fonction montre aussi l’existence d’un “pseudo-fermion”
de spin dans ce modèle. Le rapport 21,0/20,0
dans la limite d’un ruban
D’autre part, le calcul
permet de confirmer la valeur de l’exposant 7) =
de 2 0 , 1 donne le comportement des opérateurs primaires relativement au
groupe de symétrie discret. Par exemple dans le cas du modèle de Potts
.i
&.
IX.3.5
175
INVARIANCE CONFORME
2
(285b)
Dans le cas générique de la série principale de modèles ( A ,A ) , on trouve
une généralisation de l’expression (282)
n-1
m
r=l s = l
qui est aussi invariante par r0(2), ce qui indique une symétrie 2 / 2 2 du modèle
restreint SOS, ou modèle multicritique. L’opérateur ayant la dimension la plus
faible dans (286) donne l’énergie libre d’interface
+
+
+
+
+
Lf =2a min(hr,,
hr,m+i-s)
( m - i)(m 3)
=a
4m(m 1)
( m - 2)(m 2)
=a
4m(m 1)
m impair
m pair
La relation Lf = a 7 semble rester valable jusqu’à m = 4, où elle est en accord
du modèle tricritique.
avec la valeur 1) =
&
On peut montrer de même que les deux modèles unitaires exceptionnels
tels que m = 11 ou m = 12, correspondant à l’algèbre de Lie E6, ont aussi
une symétrie 2 / 2 2 . Par exemple pour m = 11
a
En comparant avec 20.0, on peut distinguer grâce à cette expression quels sont
les opérateurs qui sont pairs ou impairs sous l’action du groupe 2 / 2 2 .
Le lecteur est invité à montrer qu’aucun des modèles minimaux n’admet
de symétrie continue, en observant qu’ils ne contiennent pas d’opérateurs de
dimension (1, O) et (O, 1) comme candidats pour les courants (Friedan, Qiu et
Shenker).
3.6 Modèles non minimaux
Nous avons développé ci-dessus l’étude des cas où les opérateurs primaires sont en nombre fini, et où la charge centrale est un nombre rationnel
inférieur à l’unité, les poids conformes appartenant à une table Kac finie.
176
IX.3.6
INVARIANCE CONFORME
I1 existe néanmoins une variété de théories qui violent une ou plusieurs des
conditions ci-dessus. Nous en décrivons maintenant quelques exemples.
Dans la section 2.1, en discutant le modèle gaussien, nous avons observé
qu’au lieu de considérer un champ cp prenant des valeurs réelles arbitraires,
nous pouvions le considérer comme une variable angulaire en identifiant cp
et cp 2np. Ceci nous a conduit à définir (équations (169) et (170)) des
opérateurs
mixtes On,nl(z,Z ) de poids conformes hn,m = a(n/p pm)2,
hn,m = hn,--,’ où n et m sont des entiers relatifs donnant l’intensité de
charges “électriques” et “magnétiques” situées en un point de coordonnées
( z ,Z ) . Considérons maintenant un tel modèle dans la géométrie d’un tore.
Comme cp est une variable angulaire, son graphe peut s’enrouler plusieurs
fois autour du cercle unité, quand on décrit un chemin non contractible sur
un tore. Ces champs sont tels que
+
+
cp(z + kwl
+ k’w2) - cp(z) = 27rp(km + k’m’)
(289)
où la variable Z est omise. Considérons l’intégrale de chemin dans un tel
secteur. Les champs obéissant à la condition (289) peuvent être écrits comme
une superposition cp = pper+ cpciaSs d’un champ fluctuant périodique Vper et
une solution particulière de (289)’ cpclass, linéaire en z , Z , et donc harmonique
L’action est Sp,iriodique + r p 2 Imr - m‘I2 /Im T et la fonction de partition
dans le secteur m, m’ s’écrit
(291a)
où &(T) est la fonction de partition gaussienne donnée par l’équation
(227). Partant de cette définition, il est clair que dans une transformation
modulaire on trouve
(291b)
Ceci montre que le groupe modulaire agit par transformation linéaire sur
les entiers m et m’. Si l’on somme sur les valeurs de m et m‘ avec un
poids constant sur les orbites du groupe, on obtient un invariant modulaire.
Zo,o(~).
Un autre invariant évident
L’exemple le plus simple est &(T)
est obtenu en sommant sur toutes les paires m, m’. Nous multiplions par un
préfacteur p afin de normaliser le comportement à grand T ( q petit) et nous
obtenons
IX.3.6
177
INVARIANCE CONFORME
Posant comme de coutume q = exp 2 i n ~ la
, formule de Poisson appliquée à
la somme sur m’ donne
où les poids h,,,, = a(n/p+mp)2et En,, = hn,-m ne sont autres que ceux
attribués ci-dessus aux opérateurs On,,. Cette expression est appelée fonction de partition coulombienne, en raison des interactions logarithmiques de
paires entre charges électriques et magnétiques. Comparant avec les expressions (292) el (293)’ on voit qu’un facteur p/Im T* a disparu. Pour q petit,
indique que la charge centrale est encore l’unité.
le comportement (q@)-h
Toutes les dimensions An,, = a ( n 2 / p 2 n2p2)sont non négatives et varient continûment avec p, tandis que les moments angulaires &, = nm
sont entiers. Pour une valeur de p générique, qhn.71s/q(T)
est le caractère
d’une représentation irréductible ( c = 1,hn,,) de l’algèbre de Virasoro. I1
est aussi clair que Z ( ~ , T=) Z ( p - l , ~ ) .
Une application de ces résultats concerne le modèle X Y . Rappelons
que le flot de renormalisation conduit la fonction à deux points vers une
limite critique, avec un exposant 77 =
à des corrections logarithmiques
près, qui traduisent la présence d’un opérateur marginal de dimension 2.
Identifions l’opérateur de spin du modèle X Y avec 0 * 1 , 0 de telle sorte que
q = = 2A+1,0. Ceci suggère le choix du paramètre p = 2. Les opérateurs
magnétiques correspondants 0 0 , * 1 ont alors pour dimension 2, ce qui signale
que les champs attachés aux tourbillons deviennent essentiels. Quoi qu’il en
soit, on voit que la fonction de partition Z(2, T ) = Z( T ) est un candidat
pour le modèle S Y au point final de la ligne critique, qui devrait donc avoir
une charge centrale unité.
Une autre possibilité est de considérer <p comme une variable angulaire
de période 2np avec identification des valeurs cp et -cp . Ce type de modèle
quotient (orbifold en anglais) peut être interprété comme suit. On associe à
un tel champ les matrices diagonales {e*iq/P eriv/p} représentant les classes
de conjugaison du groupe SU(2). La fonction de partition correspondante
sur un tore possède trois secteurs supplémentaires. Dans chacun de ces
secteurs le champ change de signe par action d’un des générateurs du réseau.
Le calcul effectué dans le cadre du modèle d’king montre que dans le cas
d’un tel modèle quotient on a
+
a,
4
i,
(294b)
178
INVARIANCE CONFORME
IX.3.6
avec
(294c)
On observe que la combinaison qui figure dans (294a) se simplifie en
Zquot.(P)
=
= zquot.(P-l)
+
[Z(P)+ 22(2) - Z(1)l
(294d)
On décrit ainsi une famille de modèles possédant les mêmes dimensions
variables avec p que précédemment, ainsi bien que certaines dimensions
indépendantes de p. Ces modèles ont été identifiés à ceux de la ligne
critique du modèle d'Ashkin-Teller. Nous renvoyons aux articles originaux
cités dans les notes pour une description de ce modèle impliquant deux
ensembles spins, ai = f l , ri = f l , en interaction. L'action correspondante
est S =
Puaiaj
,&rirj
PUraiajrirj,avec une interaction à quatre
spins. Lorsque ,Burs'annule on trouve deux systèmes d'Ising découplés.
On observe que Zquot.(l)
= Z(2) décrit encore le modèle XY. On peut
se représenter l'ensemble des modèles coulombiens (invariants O(2)) et
des modèles quotients à c = 1 comme l'indique la figure 6. Sur les deux
lignes continues on peut distinguer des points spéciaux correspondant à des
symétries supplémentaires. Ceci est le cas de Z(i), qui décrit un modèle de
symétrie SU(2) x SU(2), ou Z(&), qui coïncide avec un modèle de spineurs
de Dirac avec,
+
+
tandis que ZqUot.(fi)= Z;sing. I1 existe encore de nombreuses autres valeurs
significatives qu'il ne nous est pas possible de décrire ici. En outre Pasquier a
construit trois autres modèles de charge centrale unité qui ne se trouvent pas
sur les lignes continues et qu'on peut faire correspondre aux trois algèbres
de Lie affines exceptionnelles simplement lacées
Ê6 ++(22(3)
+ Z(2) - Z(1))
+ Z ( 3 ) + Z(2) - Z(1))
Ê8 -4 (Z(5)+ Z ( 3 ) + Z(2) - Z(1))
Ê
7
+$
(Z(4)
(296)
IX.3.6
179
INVARIANCE CONFORME
000
Ê,
,
_ _ _ _ __ _ -
1
SU(2)x SU(2)
O
1
fi
Ê,
II*i”,l’
c
01y
A
Ê,
y
*
(2
I
I
I
I
I
a l
Figure 6 : Modèles de charge centrale c = 1. La ligne horizontale se
rapporte aux théories ayant une symétrie O ( 2 ) avec un champ périodique
de période 2ap, et la ligne verticale aux modèles quotients. Les parties en
pointillé sont équivalentes par p
p - l . Les trois points supplémentaires
décrivent trois cas exceptionnels.
-f
On peut aussi utiliser le formalisme coulombien pour engendrer les
fonctions de partition de modèles non minimaux et de charge centrale c < 1,
décrivant le modèle de Potts à Q-états pour Q variant continûment dans
l’intervalle O < Q < 4, et le modèle O ( n )pour n continu variant entre -2 et
2, le domaine où il existe une théorie critique. Ces sytèmes sont définis par
l’intermédiaire de leur développement de haute température. I1 est possible
de trouver une chaîne d’arguments plausibles permettant d’identifier ces
modèles avec des modèles à six vertex intégrables, ou des gaz de Coulomb
soumis à des restrictions spécifiques. Les démonstrations complètes sortent
du cadre de ce chapitre et nous nous bornerons à décrire les résultats.
Pour p dans l’intervalle de 1 à f i ,posons
n = - 2cosap2
eo = f ( p 2 - 1) mod 2
(297a)
de sorte que n varie entre 2 et -2. La fonction de partition correspondante
est donnée par
z(n;
=
2
I
Tp2 lmT - m‘ 2
exp --
(T)
m’.m
4
1m.r
cos [aeo(m’,m)]
(297b)
Dans cette expression (m‘,m)est le plus grand diviseur commun de m’ et
m. D’après la discussion précédente, l’invariant modulaire le plus général
construit à partir d’une superposition de Zmt,, autoriserait une fonction
arbitraire de (m’,m). La démonstration des équations (297) fait intervenir
deux étapes. Dans la première on établit la relation entre les paramètres
180
IX.3.6
INVARIANCE CONFORME
continus n et p. La seconde étape consiste dans l’interprétation de la “charge
de défaut” eo. Comme on l’a indiqué ci-dessus on décrit un modèle avec n
continu par l’intermédiaire d’un développement de haute température sur
réseau. On perd la relation entre la fonction de partition Z et la trace d’une
matrice de transfert. En d’autres termes, en redéveloppant Z ( n ,T) en série
de puissances fractionnaires de q et q , nous n’avons aucune garantie que
les coefficients soient des entiers positifs, sauf dans les cas p2 = 1, $, $
correspondant respectivement à n = 2, 1, O. Pour p2 = 1, eo = O mod 2, le
cosinus dans l’équation (297b) se réduit à l’unité, la fonction de partition
Z ( n = 2 , ~ se
) confond avec Z ( p =
= Z ( p = 2 , ~ ) c’est-à-dire
,
celle
du modèle X Y , comme on s’y attend. De même quand n = 1, l’expression
ci-dessus s’identifie à la fonction de partition du modèle d’king, tandis que
pour n = O, sa valeur est égale à l’unité. Le rôle de eo est de corriger les
facteurs de poids attachés aux boucles non contractibles sur le tore.
Dans la limite d’un ruban, c’est-à-dire quand T 4 +im, le terme
dominant dans la double somme (297b) correspond à m = O, ce qui conduit
au comportement suivant, après sommation sur m’,
3;~)
où on utilise la détermination de eo dans l’intervalle [O, 11, c’est-à-dire
eo = p2 - 1. La charge centrale est donc égale à
(298~)
Paramétrisons c sous la forme usuelle 1- 6/m(m +1). En vertu des équations
( 2 9 7 ~et
) (298u), nous avons
p2
m+l
=m
n=2cos-
7.r
eo=-
m
1
c=l-
m
m(m
+ 1)
(298b)
Vérifions que pour n = 1, où m = 3, nous retrouvons bien le résultat du
nous subdivisons la somme dans (297b) en
modèle d’king. Comme eo =
termes des valeurs de (rn‘,rn) modulo 6
5,
E=
m’,m
(m‘,m)=O mod 6
+;
-;
( m ’ , m ) = f l mod 6
(m’,rn)=fZ mod 6
( m ‘ , m ) = 3mod 6
Chaque terme peut être exprimé comme une fonction de partition coulombienne pour une valeur différente du paramètre p. Par exemple
(m’,m)=O mod 6
IX.3.6
181
INVARIANCE CONFORME
en tenant compte du préfacteur p dans (297b). De la même façon
=;z
($J)
- iZ(3p,7)
( m ’ , m ) = 3 iiiod 6
( m ’ , m ) = f 2 iiiod 6
=z (&, 7)- p
( P , T) -
;z ( $ p , T ) + i Z ( 3 p , T )
(m’,m)=*l iiiod 6
En rassemblant ces résultats, nous voyons que pour eo =
l’équation (297) se réduit à
3 et
p =
f
i
t
I1 n’est pas encore évident à ce point que nous ayons atteint le résultat cherché.
Nous laissons au lecteur le soin de vérifier que c’est bien le cas.
Toutes les fonctions de partition minimales de la table II peuvent être
récrites comme de telles sommes finies de fonctions de partition coulombiennes. On pourra vérifier ce point, ainsi que le fait que, pour n = O, m = 2,
c = 1, eo = la fonction de partition se réduit à l’unité. Diverses quantités
relatives aux polymères peuvent être obtenues dans la limite n + O. Lorsque
n + -2, c’est-à-dire m + 1, on trouve Z ( n = - 2 , ~ )= O, mais la dérivée
en n n’est pas nulle,
a,
On trouve ainsi une fonction de partition fermionique égale au carré de
l’inverse de celle du champ gaussien libre. Ceci est en accord avec la
correspondance entre les modèles bosoniques O ( n ) avec n = -2 et les
modèles fermioniques (complexes).
Le modèle de Potts critique pour Q variant continûment entre O et 4
peut être étudié de manière analogue. On pose
eo =
2
m+l
-
c=l-
La fonction de partition s’écrit alors
6
m(m
+ 1)
(300a)
182
IX.3.6
INVARIANCE CONFORME
On peut examiner les cas particuliers, comme Q = 1, 2 , 3. Dans le dernier
cas, on retrouve la fonction de partition du modèle à 3 états donnée par
l’équation (276). La valeur limite pour m -+ 03, Q --t 4 et c -+ 1 est elle
aussi intéressante, et apparaît sur la figure 6. On remarque que le premier
terme de l’équation (300b) est analogue à la fonction de partition O ( n ) .
3.7 Fonctions de corrélation dans un demi-plan
Nous venons d’explorer en détail des situations géométriques simples,
le plan, le cylindre ou le tore. En un sens, aucune de ces situations ne
met en jeu de véritable effet de bord. Si au contraire on veut étudier un
modèle critique dans un demi-plan, on est réellement confronté à de tels
effets. Avant de passer à la limite continue considérons une régularisation
sur réseau avec des conditions aux limites libres. On peut se convaincre
qu’au point critique ceci revient à exiger l’annulation de l’aimantation à
la frontière. Plus précisément, cette dernière condition est compatible avec
(i) l’annulation des corrélations à grande distance (ii) l’invariance conforme
globale dans le demi-plan supérieur (clest-à-dire l’invariance par le groupe
SL(2,R)) étant donné que le point à l’infini appartient à la frontière.
Le domaine que nous envisageons est donc le demi-plan supérieur
I m z > O. Si l’on ajoute un point à l’infini, ce domaine est conformément
équivalent à l’intérieur du disque unité, et est invariant par les transformations conformes globales réelles de SL(2,R ) / Z 2 , sous forme de transformations homographiques z + z’ = (az P ) / ( r z S), où (Y,B, y, 6 sont
réels et a6 - &,y = 1. La même transformation s’applique donc à la variable 2. En particulier, ce groupe ne contient que des translations et des
dilatations réelles. I1 s’ensuit que même la fonction à deux points devient
non triviale. Son comportement differe suivant les directions parallèles et
perpendiculaires à la frontière. Pour le voir, nous associons à chaque point
du demi-plan supérieur son image symétrique par rapport à l’axe réel. Pour
tout couple de points z1 et 2 2 dans le demi-plan supérieur, et leurs images
41 et 22, on peut former le birapport u,invariant par S L (2 , R ),
+
+
O<u<l
Une transformation conforme globale réelle qui envoie 21, 21,
Zi, 22, Z.,; préserve ce birapport, et est de la forme
2 2 , 22
(301)
sur zi,
IX.3.7
183
INVARIANCE CONFORME
z
(z - 21)(z2 - 22) - (zl - z:)(z; - 2;)
(z - 22)(z2 - 51)
(.I
- 2;)(z; - 2 ; )
+ ZI
(302)
L’invariance globale implique donc que la fonction de corrélation G(1,2) de
deux opérateurs primaires ah,^ satisfasse à la relation
Le groupe SL(2, R)dépend de trois paramètres réels. On peut donc imposer
sur zi et za trois conditions, par exemple d’être imaginaires purs tels que
2;
z; = 2i, c’est-à-dire
+
Par souci de simplicité, prenons le cas d’un champ scalaire, c’est-à-dire tel
que h = h. Nous avons alors, avec z = 2 iy
+
g(u) = iLah
(&,h
(i [1
+ J1-.])A h , h (i [I - m))
(305)
Ainsi il nous reste à determiner une fonction d’une variable réelle g(u).
En dimension supérieure à deux, le sous-groupe du groupe conforme
global qui laisse un demi-espace invariant conduit à un résultat analogue,
où y1 et y2 sont les distances à la frontière et 1x1 - 2 2 1 est remplacé par la
longueur de la composante parallèle du vecteur r1 - r2.
Dans les circonstances présentes, la fonction à deux points est analogue
à la fonction à quatre points dans le plan, avec z1, z2, z3 et z4 remplacés par
z1, 21, z2, 52. I1 y a un doublement similaire pour les corrélations d’ordre
plus élevé. Afin de voir cette relation de façon plus précise, nous examinons
le tenseur impulsion-énergie et exigeons qu’en coordonnées cartésiennes il
n’y ait pas de flot d’impulsion-énergie à travers la frontière. En utilisant des
coordonnées complexes, ceci revient à dire qu’à la frontière T,,(z) = Tzz(z).
Cette relation permet d’étendre T(z) E T,,(z)
analytiquement dans le demiplan inférieur par réflexion
Imz<O
T(z) = T ( z )
(306)
où 2 appartient manifestement au demi-plan supérieur, et le membre de
droite est donc bien défini. Ceci revient à dire que nous utilisons maintenant
184
IX.3.7
INVARIANCE CONFORME
la partie diagonale du produit de deux algèbres de Virasoro. En répétant
le raisonnement de la section 1.3, on arrive à une formule analogue à (40)
(Cardy)
On peut en déduire des conséquences analogues à celles dans le plan, pour
des champs primaires correspondant à des représentations possédant des
vecteurs singuliers, auquel cas nous obtenons des équations différentielles
pour les fonctions de corrélations.
Illustrons ceci sur l’éternel exemple du modèle d’Ising pour la fonction
de corrélation spin-spin. En adaptant les calculs de la section 2.2, on
trouve une équation hypergéométrique qui admet une solution en termes
de radicaux, telle que
+
A condition que a+ a- soit différent de zéro, le comportement à courte
distance pour y1 et y2 finis est celui qui est attendu
Si, au contraire, et à nouveau pour y1 et y2 finis, nous faisons tendre 1x1 - 2 2 )
vers l’infini, nous avons
ce qui veut dire que si a+ # O, la fonction de corrélation tend vers une
constante. Si nous exigeons que dans une telle situation ( ~ 1 ~ 7 2tende
)
vers
zéro, nous sommes obligés de conclure que a+ = O, ce qui veut dire qu’à
une constante multiplicative près
((T102)
cst
=7
(x-2
1
-xi)
1
(YlY2)S
En conséquence, quand
1x1 - 221 + CO
et que y1 et y2 sont finis, on trouve
IX.3.7
185
INVARIANCE CONFORME
(311a)
Notons 711 l’exposant du dénominateur, il vient
711 = 1
(311b)
I1 s’agit là d’un nouveau résultat obtenu grâce à l’invariance conforme.
Le point à l’infini doit être considéré comme faisant partie de la
frontière. L’équation (311a) implique donc par invariance conforme globale
que le champ s’annule sur la frontière. Par exemple
Le membre de droite s’annule bien sur la frontière mais avec une puissance
fractionnaire (la fonction a donc une dérivée infinie).
On peut mettre l’expression complète (310) sous une forme suggestive,
qui peut être comparée à la fonction à quatre points dans le plan. En prenant
le carré de ( 0 ~ 0 2 ) et en posant zij = zi - z j , zij = zi - Z j , on a
(u1.2)
=
2
Z12Z12
( Z l I 222 212 zïz
) (
-
212212
21I z22z12z ï2
)+
(313)
ce qui montre la symétrie dans l’échange simultané 1 H 2, i t* 3 et
l’antisymétrie dans l’échange 1 ++ I ou 2 ++ 2, ce dernier cas étant défini
par prolongement analytique.
Donnons une autre application de cette même situation géométrique
en utilisant la transformation conforme z -+ t
L
t=ylnz
17r
qui envoie le demi-plan supérieur sur une bande O < R e t < ir, avec des
conditions aux limites libres (par opposition aux conditions aux limites
périodiques). Si nous écrivons maintenant t = x
iy, la fonction de
corrélation ci-dessus (élevée au carré) devient
+
+ + iyl - iy2)
+ iyl - iy2)
sin(7r/2L)(xl x2
sin(7r/2L)(xl - 2 2
- (22
-+
-22)
1
(315)
186
INVARIANCE CONFORME
IX.3.7
On remarquera l’invariance par translation dans la direction y, et l’annulation quand x1 ou 2 2 = O ou L.
Nous trouvons aussi, d’après l’équation (50)’ la valeur moyenne (T)
dans ce ruban, en supposant qu’elle s’annule dans le demi-plan. Ainsi, pour
toute charge centrale c
( T )= +/L2
I1 s’ensuit que l’énergie libre par unité de longueur se comporte comme
+
F(L) = FOL &cr/L
(317)
Le coefficient du terme en 1/L est le quart de celui trouvé dans le cas
d’un ruban avec conditions périodiques, où, au lieu de (316)’ nous avions
= icn/L2. Ceci suggère que l’expression (316) résulte de
la substitution L -t 2L. On observera néanmoins que les fonctions de
corrélation ne sont pas faciles à trouver, comme en témoigne l’équation
(315).
3.8 Le voisinage du point critique
Implicitement la connaissance des propriétés critiques devrait nous
permettre de comprendre les propriétés d’un modèle dans tout le domaine
critique, caractérisé par une longueur de corrélation finie, ou, dans le langage
de la physique des particules, par un spectre de masse finie. Des travaux sont
poursuivis dans deux directions. La première direction consiste à obtenir
une meilleure compréhension de la relation entre modèles intégrables et leur
limite invariante conforme. I1 y a de nombreuses indications selon lesquelles
les deux sujets ont beaucoup en commun, si l’on en juge par l’arrièreplan mathématique. La deuxième direction, à savoir l’étude des théories
quantiques des champs massifs continus, est d’importance capitale. Dans
cette section finale, nous présentons quelques observations sur ce sujet.
Revenons aux calculs effectués dans la section 3.2 et examinons la foncobéissant
tion de partition d’un champ complexe massif libre sur un tore I,
aux conditions aux limites (239). Désignons la fonction de partition correspondante par
En modifiant légèrement les calculs effectués dans la section 3.2, nous
trouvons après quelques étapes laborieuses
IX.3.8
187
INVARIANCE CONFORME
où t désigne la quantité
2
Si A = lwll I m r désigne l’aire du tore, $ ( z ) = I”(z)/I’(z) la dérivée
logarithmique de la fonction J? d’Euler, et y = -$(l) la constante d’Euler,
les quantités yelN sont données par
+at4
1’
+oo
dA(1- A)
n=-m
1
+
[ ( n C/N)2 + A P ] +
(321)
On observe l’apparition d’un terme logarithmique, qui disparaît dans la
différence TelN - yo, et qui est fonction de t uniquement. Appliquons le
résultat ci-dessus au cas particulier d’un champ scalaire réel périodique,
auquel cas
Zscalaire
1
= - = exp nIm T
Do0
+at4
x
{E
{
1’
- t + t2 In [4ae-7 (Im r / A ) i ]
dA(1 - A)
00
C ( n 2+ At2)-$
1
(1 - exp(2innRer - 2nImrJ;iL+t“))
n=-oo
Le produit infini est réel et positif. La démonstration montre que Zscalaire est
invariant modulaire, bien qu’exprimé au moyen de variables adaptées à un
188
IX.3.8
INVARIANCE CONFORME
choix de base. La quantité t mesure en unités sans dimensions la déviation
au point critique. On peut interpréter le numérateur exp BnIm T c(t, Im T),
où c ( 0 , I m ~ )= 1, comme définissant une charge centrale dépendant de
l’échelle. L’apparition d’une dépendance en In(1m T / A ) ~dans
/ ~ le coefficient
de t2 reflète la nécessité d’une renormalisation ultraviolette de la chaleur
spécifique, qui est la dérivée seconde par rapport à m. Finalement, le
dénominateur apparaît comme une expression naturelle dans un formalisme
de matrice de transfert, en décomposant le champ en modes propres,
où les moments discrets 2n n/ lull sont associés aux fréquences propres
J(2nn/Jul I)2
m2.En extrayant le mode nul responsable d’une divergence
potentielle, nous retrouvons le résultat critique
+
Appliquons les formules précédentes pour obtenir la fonction de partition
du modèle d’Ising au voisinage du point critique, en introduisant la masse m
proportionnelle à T - T,.D’après le chapitre II nous savons que nous avons
à sommer sur les quatre conditions aux limites périodiques ou antipériodiques. On tiendra compte d’un signe relatif éventuel par un prolongement
analytique en m que nous prenons d’abord positif. On trouve ainsi
c’est-à-dire
+t2 l n 4 -
1
it4
1
dX(l - A)
Y5
n=l
1
[ ( n- $)2
f n=-00
(1 fe
+At72
1
[n2
+ At212
)]
2 i n n R e ~ - 2 ~ I ~ ~ m
(325)
IX.3.8
189
INVARIANCE CONFORME
Les valeurs absolues ont été supprimées, étant donné que tous les produits infinis sont réels positifs, et l’expression se réduit à 24 au point
critique ( m = O). Les seuls termes qui dépendent du signe de t figurent
dans les facteurs exponentiels de
et DO,Oet leurs facteurs relatifs
au mode potentiellement nul. En les combinant nous obtenons un terme
(exp(7rImTt) f exp(-7rImTt)).
Le spectre relativiste des états est celui auquel on s’attend. I1 en
était de même dans le cas scalaire. Non seulement la charge centrale
devient dépendante de l’échelle, mais également les dimensions des divers
opérateurs. Par exemple les opérateurs de spin et de désordre, que l’on ne
pouvait distinguer au point critique, deviennent deux opérateurs distincts
avec des “dimensions” dépendant de l’échelle reliées par dualité, c’est-àdire t ts -t. Ainsi que nous l’avons remarqué, l’apparition d’un terme en
t2 ln(Im.r/A)i dans la charge centrale est une manifestation des propriétés
de renormalisation de l’opérateur $$ de dimension un. Dans une série
perturbative dans le terme de masse, on rencontrera une soustraction
ultraviolette au second ordre, reliée à la divergence logarithmique de la
chaleur spécifique.
L’invariance modulaire n’est pas explicite sur l’équation (325). Mais
un développement en puissances de la variable m fera apparaître cette
invariance de façon très claire. Désignons comme ci-dessus par 2’ et
21 les fonctions de partition critiques des modèles d’king et gaulsien
Dij(0) (avec i, j = O,
en omettant la
respectivement, et soit Dij
combinaison (O, O) car Do0 = O). En développant (325) nous obtenons
il
+ O((mA3)3) (326)
Le terme linéaire en m correspond au fait que la valeur moyenne de
l’opérateur d’énergie ne s’annule pas dans le secteur de spin. Cet effet a été
mentionné précédemment. L’échelle de longueur arbitraire qui apparaît dans
le terme m2 In A4 correspond à une renormalisation additive de la chaleur
spécifique, ainsi que l’on s’y attendait. Finalement, l’existence de termes
impairs aussi bien que pairs en m montre que sur un tore le maximum de la
chaleur spécifique, maximum qui remplace la divergence dans le plan infini,
n’est pas situé à m = O (T = T,)mais dépend du rapport modulaire. On
remarque que la chaleur spécifique contient une contribution entropique due
aux structures de spin fermioniques distinctes.
Ces résultats exacts propres au modèle d’Ising correspondent à l’un des
couplages aux termes essentiels, à savoir la masse. En général on ne peut
traiter le voisinage du point critique que par une méthode perturbative.
190
INVARIANCE CONFORME
IX.3.8
Cependant une telle méthode n’est pas triviale, car elle incorpore la connaissance des propriétés critiques. Afin d’esquisser la procédure, examinons
un système sur un tore, en supposant que l’une des périodes w1 est réelle.
L’évolution dans le temps est régie par un hamiltonien
27r
Ho =-
(Lo + E o -
W1
hc)
(327)
+
La coordonnée sur le tore est écrite u = u1 iu2, et le potentiel est une
somme sur des perturbations locales avec des coefficients de couplage G aux
champs essentiels de dimension inférieure à deux. Par souci de simplicité,
considérons le cas où la somme se réduit iiun terme unique, avec ‘p un champ
primaire scalaire de poids ( h ,h). Restreignons notre attention au calcul de
la charge centrale variable, bien que le formalisme ne soit en rien limité à ce
cas. Soit P l’opérateur moment et 10) l’état fondamental. Au lieu de calculer
la fonction de partition complète, considérons l’élément de matrice suivant,
où T désigne l’opérateur d’ordre dans la variable temporelle u2
20=(01exp{-Im~2H+iPRew2} 10)
I1 est commode de revenir au plan pointé en utilisant
- Ix I <
- 1, et l’ordre sur
L’intégrale porte alors sur un anneau p = e-2x1ri1r<
la direction radiale. I1 est aussi naturel d’employer un coefficient de couplage
sans dimension
2-2h
g = G ( g )
(330)
Dans la discussion précédente nous avions G = m, h = !j, et on utilisait
la variable t au lieu g pour rappeler qu’elle jouait le rôle de température
réduite. Dans le cadre du modèle d’Ising nous pouvons maintenant considérer le cas d’une perturbation magnétique où G joue le rôle du champ
IX.3.8
INVARIANCE CONFORME
191
magnétique et cp celui du spin (h = &). Les couplages essentiels sont tels
que 2 - 2h > O, auquel cas pour G fixé, g croît comme lwll + 00, et la
théorie des perturbations est dangereuse à moins que G + O, afin de maintenir g fini. Ceci est le cas le plus intéressant, car il peut engendrer un flot
vers une classe d'universalité différente. On peut envisager deux possibilités
typiques. Dans la première, la dimension conforme 2h de cp est voisine de 2,
et on peut développer une théorie des perturbations près de la marginalité,
dans le paramètre 2-2h supposé petit. Au contraire, on peut effectuer un développement direct en g. Ce dernier est a priori sûr. Si 2h désigne un nombre
fractionnaire entre O et 2, le comportement ultraviolet est régulier (à l'exception d'une divergence logarithmique au second ordre, quand 2h = 1, ce qui
est le cas rencontré ci-dessus). Les singularités infrarouges sont supprimées
par la géométrie finie, et la série est vraisemblablement convergente, étant
donné que les quantités physiques sont analytiques en g dans les circonstances présentes (cette propriété est manifeste dans l'exemple précédent).
Nous avons uniquement besoin des corrélations de cp au point critique car
on a le développement
Si le hamiltonien H possède un état fondamental pour g # O, nous présumons que In 2IIm.r aura une limite finie quand ImT + +m. Ceci justifie
la définition d'une charge centrale variable selon
C(g) = 12 lim
(332)
P+O
Si nous supposons que les fonctions de corrélation impaires s'annulent dans
le développement (331), ceci veut dire que l'on a la série
C(g) = c
+ g2c2 + g4c4 + . ..
(333)
où le terme d'ordre zéro est la charge centrale usuelle. En insérant la fonction
de corrélation à deux points
(334)
qui normalise le couplage g, on en déduit
r(nf2h)
c2=6cn+h
n=O
n!I'(2h)
O0
1
(
)
2
1
=61
dX Xh-'F(2h, 2h; 1; A)
(335)
192
IX.3.8
INVARIANCE CONFORME
expression qui a un sens pour 2h < 1. I1 est possible de retrouver de cette façon la charge centrale variable du modèle d'king pour une perturbation thermique du type de celle calculée précédemment (à condition de prendre garde
à la singularité logarithmique de Cz),en effectuant des calculs analogues à
tous les ordres. On peut aussi calculer la dimension des opérateurs le long
du flot. Nous laissons au lecteur le soin de poursuivre les calculs dans cette
voie. Un progrès très intéressant serait de trouver des expressions compactes
pour ces quantités au lieu d'un développement en puissances du couplage.
Diverses indications suggèrent que cet espoir n'est pas exclu.
Appendice A: Séries et produits 6 de Jacobi
Nous rassemblons ici quelques formules relatives aux fonctions 6 elliptiques de Jacobi. Elles sont associées à un tore, quotient du plan complexe
par un réseau de translations A engendré par 1 et T tel que ImT > O.
Nous avons posé de façon constante q = e x p 2 im , 141 < 1. On écrit aussi
y = exp2i7rz où z est une variable complexe. Les quatre fonctions 6 de
Jacobi définies par
+m
-CO
+CO
-m
n<1
CO
- q n ) n<1+
03
yqn+l)(l
O
1
+CO
-03
m
1
O
+y-lqn)
1X.A
193
INVARIANCE CONFORME
sont des fonctions entières de z. On établit aisément leur comportement dans
des translations du réseau A, ainsi que la position de leurs zéros. L’égalité
des sommes et des produits est due à l’identité de triple produit de Jacobi.
Cette dernière est la source d’un grand nombre de relations, parmi lesquelles
l’identité pentagonale d’Euler
1
-00
D’autres formules utiles sont (Euler)
1
ainsi que l’identité de produit quintuple de Watson
00
JJ(1 - $)(1 - yqn)(l - y-Iqn-l)(l - &p-1)(1
-y-
q2n-1)
1
-00
La fonction de Dedekind s’écrit
r ] ( T ) = q%l)
(A-5)
La fonction û1 s’annule à l’origine. Si 1’011désigne par le symbole prime la
dérivée par rapport à la variable z , on trouve la relation
1
= ~e,(o,T)e3(o,T)e,(o,~)
= q3(.)
(-4.6)
27r
Les quantités ûi(O,T ) (2 5 i 5 4) sont parfois appelées constantes 8. On a
--o;(o,T)
194
1X.A
INVARIANCE CONFORME
Elles satisfont à l’identité de Riemann
(A.8a)
Cette identité est équivalente à la formule
qui exprime que sur un réseau hypercubique à quatre dimensions C les
centres des hypercubes peuvent être divisés en deux sous-réseaux entiers C*
engendrés par les vecteurs ( i c i , ~ E Z $, ~ 3 , 9 ~ 4avec
)
~i = f l et
~i = f l .
Ces deux sous-réseaux sont reliés par une symétrie par rapport à tout
hyperplan perpendiculaire à un axe de coordonnées, et chacun d’eux est
isométrique au sous-réseau Cililpairc C ( Cinipaircorrespond à une somme
des coordonnées impaire).
Dans l’étude des transformations modulaires on a eu besoin de la
somme de Gauss suivante. Soit w une racine primitive N-ième de l’unité
(w= e2ixIN ), on a la relation
ni
De façon équivalente, quand N O, 1, 2, 3 mod.4, la somme est 1+ i, 1, O,
i respectivement.
Les propriétés de transformation modulaire résultent de la formule de
Poisson. Posons
Si A = f
a
(c
i)
désigne une matrice unimodulaire à éléments entiers on
(A.ll)
1X.A
où
INVARIANCE CONFORME
195
est une racine vingt-quatrième de l’unité.
Les fonctions û permettent de construire des fonctions méromorphes
doublement périodiques en prenant des rapports ou des dérivées. Le prototype en est la fonction de Weierstrass telle que
EA
(A. 14)
qui est une fonction méromorphe paire avec un pôle double à l’origine (ainsi
qu’aux points qui s’en déduisent par translation du réseau), et deux zéros
dans le parallélogramme des périodes. Elle obéit à l’équation différentielle
non linéaire du premier ordre, où le prime désigne la dérivée par rapport à
z , T étant fixé,
+PI2 - p
-
15e4p - 35e6
(-4.15)
avec
(A.16)
Les racines du polynôme cubique du nombre de droite de (A.15) sont, par
symétrie, les valeurs p ( $ ) , ~ ( $ 7 )et’ p ( f ( 1+ T)). Le discriminant de ce
polynôme, multiplié conventionnellement par 24, est relié à la fonction q
Par
196
INVARIANCE CONFORME
1X.A
Appendice B: Algèbre super-conforme
Nous avons vu en diverses circonstances comment des variables commutantes et anticommutantes apparaissent sur un pied d’égalité. Nous décrivons ici une généralisation naturelle des transformations conformes au
plan super-complexe, paramétrisé par une paire de variables J = ( z , B ) et
f ( 5 , où 8 et sont des variables anticommutantes.
Un superchamp analytique fonction de t et 0 uniquement est de la
forme
e),
e
4(J) = Po(.) + BPlb)
(B-1)
L’opérateur de Cauchy-Riemann admet alors une racine carrée naturelle
Par la suite nous écrivons d pour d / d z . L’intégrale de supercontour désigne
tandis qu’une intégrale définie
est telle que
Une fonction super-analytique admet un développement en série de Taylor
Comme
1X.B
197
INVARIANCE CONFORME
le théorème des résidus s’écrit
Les transformations super-conformes sont telles que l’application
satisfasse à
5
-+
5’
(B.ll)
D = D(û’)D’
ce qui signifie que l’opérateur différentiel D se transforme de façon homogène. Ceci n’est pas le cas des transformations super-analytiques générales,
où
D = (Dû’)D’ + [D(z’)- e’D(e’)]DI2
Les transformations super-conformes globales dépendent de trois paramètres
complexes ( Z O , z1, W O ) et de deux paramètres anticommutants &,&. Elles
peuvent s’écrire
6 + 5’
z’ = zo -
wo- eeo
- z1 -
eel
e/ = eo +
e - el
z1 eel
-
(B.12)
-
Ceci définit une extension supersymétrique du groupe SL(2,C). Les transformations super-conformes locales obéissant à (B.11) correspondent à un
champ super-vectoriel v(5) engendré par le super-tenseur impulsion énergie
de telle sorte que
(B.14)
Dans la formule (B.13)’TB(z)
est le tenseur bosonique ordinaire de dimensa contrepartie fermionique de dimension $, où l’on doit
sion 2 et TF(z)
comprendre que la dimension de 8 est celle de 23. Si 4 est un superchamp
primaire de dimension h, nous avons
+
+
Svq5 = [va $ D ( v ) D h(dv)] 4
(B.15)
de sorte que la relation (B.14) est équivalente au développement à courte
distance
198
INVARIANCE CONFORME
1X.B
La charge centrale apparaît dans la formule correspondante pour le produit
ou encore
6,T = [va
+ SD(lJ)D + ;a4 T +
(B.18)
Sous forme finie, les formules de transformations (B.15) et (B.18) prennent
la forme
4(E) = 4 ’ ( E ’ ) ( m 2 h
T(E)= T ‘ ( E ‘ ) ( W 3
+ &c
{E‘, E )
(B.19)
la super-dérivée Schwarzienne étant écrite comme
(B.20)
Dans une transformation super-conforme particulière
{E’, E } se réduit à 8 {z’, z } où {z’, z } est la dérivée Schwarzienne ordinaire.
Le développement de Laurent de T
(B.21)
conduit dans le cadre de la quantification radiale à l’ensemble suivant
de relations de commutation et d’anticommutation (où nous utilisons la
notation [A,BI+ = AB BA pour l’anticommutateur)
+
Dans le développement (B.21) la somme sur les indices des générateurs de
l’algèbre de Virasoro porte sur des entiers, comme dans le cas usuel. Mais
pour les partenaires G;?,il existe deux choix qui définissent ce que l’on
1X.B
INVARIANCE CONFORME
199
appelle le secteur de Neveu-Schwarz (N-S), avec n E 2 + qui conduit à
des champs de spineurs univalués (de même que T F )dans le plan z , ou le
secteur de Ramond (R), avec n E 2 et des champs de fermions bivalués (de
même que T F )dans le plan z. Ces propriétés sont inversées dans un ruban
périodique, en accord avec la formule (B.19) où les champs N-S-fermioniques
sont antipériodiques, et les champs R-fermioniques sont périodiques. On
engendre donc en fait deux algèbres super-conformes distinctes.
Nous nous sommes bornés à la dépendance en des champs. Naturellement on a des propriétés semblables pour la dépendance en (. Pour abréger,
et par abus de langage, nous continuerons à omettre cette dépendance parallèle.
L’opérateur Lo agit comme un hamiltonien, le vide 10) appartenant
au secteur N-S étant annihilé par les cinq générateurs L O ,L*I, Gk1/2 des
transformations globales super-conformes. Les vecteurs de poids dominant
Ih) des secteurs N-S sont alors en correspondance biunivoque avec les
superchamps h ( J ) par Ih) = &(O) 10).
Le secteur R possède la caractéristique additionnelle que Go agit
comme une charge supersymétrique. Ce générateur commute avec LO et
GO = Lo - &c. En général, les états R de poids dominant se présentent
donc en paires lh*) avec Ih-) = Go lh+). On appelle champs de spin les
champs conformes ordinaires O * ( z ) qui échangent les secteurs R et N-S en
engendrant les états Ih*) à partir du vide, O*(O) [O) = Ih*). La condition
Go Ihf) = O entraîne l’existence d’une supersymétrie engendrée par Go dans
le secteur R (en d’autres termes le module de Verma engendré par Ih-) se
découple de la théorie). Ceci n’est possible que si h+ = &c.
Soit F l’opérateur qui compte le nombre de champs fermioniques. La
quantité I? = (-l)F est appelée opérateur de chiralité. Les états R appariés
ont une chiralité opposée, puisque Go anticommute avec r. Les champs de
spin de même chiralité sont relativement locaux. I1 n’en est pas de même
des champs de spin de chiralité opposée.
Restreignons-nous ici à la description de représentations unitaires des
algèbres superconformes. Si c 2 $ et h 2 O, toutes les représentations
fournies par les modules de Verma sont équivalentes à des représentations
unitaires. Cependant quand c <
il n’existe qu’une suite discrète de
représentations unitaires (dégénérées). Elles sont analogues à celles trouvées
dans le cas unitaire pour l’algèbre conforme ordinaire. Soit M un entier
supérieur ou égal à deux, la charge centrale de cette série unitaire discrète
est donnée par
9,
(B.23)
qu’il s’agisse du cas N-S ou du cas R. Les poids appartiennent à la table
finie
200
1X.B
INVARIANCE CONFORME
hT,S
=
+
[ ( M 2)T 8M(M
+ 2)
-4
+k(1-
(B.24)
(-l)T-s)
Ici T - s est pair pour les représentations de l'algèbre N-S et impair pour les
représentations R. Pour M = 2 nous avons la représentation triviale. Quand
M est impair, h = &c n'est pas dans la table, de sorte que la supersymétrie
est brisée dans le secteur R, tandis que pour M pair, hlM,+M+l= &c et
la supersymétrie peut être préservée.
Plus généralement on établit des formules pour les déterminants des
formes contragrédientes, aussi bien que pour les caractères. En particulier
pour les représentations unitaires (B.24), il y a trois types de caractères.
La charge centrale étant sous-entendue, q = e2ilrr,T et s indexant les poids,
nous les désignons par x N S ,g N S , zR
{
)(E:(T)
q { [ 2 n ~ ( ~ + 2 ) + ~ ( ~ + 2 ) - ~ ~ ] z - 4 } / 8 M(Mf2)
=Tr(-l)FqLo
T -s
X E s (7) = Tr qL0
p= 1
T
1- q p
- s G O mod
2
1 mod 2
n=-co
{[211hf(M+2)+l( M + 2 ) - s M ] Z - 4 } / 8 h f ( M + 2 )
-
(B.25)
Une classification des modèles minimaux cohérents (et en particulier des
modèles unitaires) peut être obtenue suivant les raisonnements de la section
3.4 en utilisant l'invariance modulaire sur un tore. Bornons-nous à montrer
ici comment le formalisme se relie à la physique statistique, en rappelant
l'interprétation du premier modèle non trivial de la série de charge centrale
(B.23) correspondant à M = 3 (Friedan, Qiu et Shenker). Ce modèle s'avère
être unique, et coïncider avec celui correspondant à la valeur m = 4 de la
classification conforme ordinaire. Dans les deux cas c =
et les poids
&
1X.B
201
INVARIANCE CONFORME
6 ,a,
possibles dans le cas de l’algèbre de Virasoro étaient (figure 4) h = O,
- et &, tandis que, d’après l’invariance superconforme plus forte, nous
avons hi,^ = O, h2,2 = & dans le secteur NS et h1,2 =
h2,1 = & dans le
secteur R.
Ce modèle s’identifie a u modèle d’king tricritique. En indexant par V
les représentations de l’algèbre de Virasoro, le secteur pair par la symétrie
2 2 est sous-tendu par deux représentations de type N-S
6
&,
(B.26)
tandis que le secteur impair par 2 2 est le secteur R, qui contient des
opérateurs de type magnétique, avec
(B.27)
En insérant le préfacteur habituel q-cf24 dans les caractères, on a la table
de correspondance
Sur un tore de rapport modulaire r , la fonction de partition correspondante
prend la forme
(B.29)
202
1X.B
INVARIANCE CONFORME
Appendice C: Algèbre des courants
La théorie des champs conformes se généralise à des systèmes présentant des symétries continues. Un exemple est fourni par des modèles CJ généralisés, où les champs prennent leurs valeurs dans un groupe de Lie G.
Le lagrangien cinétique est complété par un terme topologique qui permet
la réalisation d’une invariance locale G, x Gz engendrée par une paire de
courants conservés ~ ( z J) (, z ) ( ~=J a J = O). Le tenseur impulsion-énergie
est donné par une expression quadratique en termes des courants, lesquels
ont des poids conformes (1,O) et (0,l) respectivement. Les coefficients de
J et J , dans un développement de Laurent, compris comme des opérateurs, engendrent une paire d’algèbres de Kac-Moody (ou algèbres affines)
commutantes, de dimension infinie. Dans le texte nous avons rencontré les
caractères de l’algèbre SU(2) affine, en discutant la classification A-DE des modèles minimaux. Ceci justifie que nous décrivions ici de façon succincte quelques aspects de la relation entre théorie des groupes et invariance
conforme.
C . l Algèbres de Lie simples
Le lecteur est certainement familier avec la classification de CartanKilling des algèbres de Lie simples à coefficients complexes et leurs représentations de dimension finie. La description qui va suivre peut être complétée
grace à la très vaste littérature sur le sujet, et a pour seul objet de présenter
quelques notations utilisées dans le texte.
Les algèbres de Lie simples se présentent en quatre familles infinies
et cinq cas exceptionnels. Les quatre familles sont réalisées en termes des
transformations infinitésimales correspondant aux groupes classiques de
matrices complexes, suivant la table
e21
Ae
C 2 2 Be
e 2 3 Ce
e 2 4 De
+
groupe linéaire spécial
s L ( e 1)
groupe orthogonal en dimension impaire SO(2.t 1)
groupe symplectique
SP(2l)
groupe orthogonal en dimension paire
SO(2e)
+
e,
La restriction sur le rang le nombre maximal d’éléments commutants
linéairement indépendants, qui engendre une sous-algèbre de Cartan, est
destiné à éviter les isomorphismes en basse dimension, tels que Al BI
CI, Ca
B 2 , D2
Al x A l , 0 3
As. Les cinq cas exceptionnels sont
moins familiers; ce sont les algèbres de Lie Gz, F4, Es, E7, Ea, où l’indice
indique le rang.
Toutes les algèbres de Cartan, c’est-à-dire les algèbres abéliennes maximales, sont conjuguées dans le groupe. Les éléments de l’une d’entre elles,
N
N
-
N
N
IX.C.1
203
INVARIANCE CONFORME
notée I<, peuvent être diagonalisés simultanément dans n’importe quelle représentation, et en particulier dans la représentation adjointe. L’ensemble
de ces valeurs propres sont des éléments dans l’espace dual K * , et sont appelées racines dans le cas de la représentation adjointe. Si e, (un élément
de l’algèbre de Lie) désigne un vecteur propre commun, ceci veut dire que
pour tout k appartenant à K on a
[IC, e,] = (CY Ik) e,
(C-1)
Le fait que l’algèbre de Lie soit simple implique que les racines engendrent
K* . De plus il existe une forme invariante bilinéaire symétrique non singulière, notée ( , ), telle que
( a , b ) = @,a)
(a,b) = O pour tout a + b = O
(C.2)
( [ a ,bl c) = ( a , [b,CI)
7
Les racines se présentent en paires {CY,
-(Y},celles-ci étant les seules proportionnelles à (Y.D’après l’identité de Jacobi, si deux racines CY et p sont telles
que CY + p # O (i) si CY + p est une racine, le crochet [e,, eo] est proportionnel
à ea+O, (ii) si cy + ,B n’est pas une racine, alors [e,,ep] = O. Si CY ,LI = O,
les éléments
+
IC, = [e,,e-,l
-
(e,,e-,)
(C.3)
(al
engendrent K (la correspondance signifie que ( k a ,IC) = (e,, e-,)
avec les e, normalisés de façon telle que
( k a , k a )= 2(e,,e-,)
#0
(cy
\IC))
(C.4)
La restriction de la forme bilinéaire à I< reste non singulière. Le triplet
{e,, e-,, IC,} engendre une algèbre S L ( 2)
[e, , e-,] = IC,
[kY,e*,I = f2e*,
dont une réalisation familière est donnée par des matrices 2 x 2
k a + ( 1O
u)
-1
O )
ainsi qu’une forme bilinéaire induite
(ab
+ be, + ce-,,
uICa
+ be, + ce-,)
= (IC,, IC,)
{u2
+ bc}
(C.5)
204
INVARIANCE CONFORME
IX.C.1
L’élément ep est un état propre de IC,
où Aa,o doit être entier, ce qui résulte des propriétés des représentations
finies de l’algèbre SL,(2) ((7.5) agissant sur les états eo+sal s entier (IC,
est l’analogue de deux fois la composante z du moment angulaire et a par
conséquent des valeurs propres entières). Comme par dualité il découle de
((7.3) et (C.4) que
il est naturel de transférer la forme bilinéaire sur l’espace dual des racines
K* par la formule
(C.10)
auquel cas nous pouvons aussi écrire
(C.11)
Supposant ( a ,P ) # O, les éléments
engendrent une représentation de
SL,(2) qui doit conterir ün élément avec une valeur propre IC, opposée à
celle de ep. Cet élément correspond à
I1 s’ensuit que l’ensemble des racines contient, pour chaque racine
qui s’en déduit par réflexion dans l’hyperplan perpendiculaire à a
0, celle
(C.12)
Ces réflexions engendrent un groupe ponctuel appelé groupe de Weyl. I1
fait le lien entre la théorie des algèbres de Lie simples et la cristallographie.
Le groupe de Weyl agit transitivement sur des ensembles de racines de base
{ a l l . . . ,at}, également appelés racines simples, en termes desquelles toutes
les racines peuvent s’écrire a = Cniai où tous les ni sont des entiers de
même signe (ou zéro). En conséquence le nombre de racines est pair et se
subdivise en racines positives ou négatives (notées a > O ou a < O).
Les 3l éléments Ici IC,,, e{*) f e+,t forment un ensemble de générateurs pour l’algèbre de Lie et obéissent aux relations suivantes (ChevalleySerre)
IX.C.1
INVARIANCE CONFORME
205
((7.13)
La matrice de Cartan
e x e à éléments entiers
(C.14)
caractérise par conséquent complètement l’algèbre à des permutations simultanées des lignes et des colonnes près. Ses éléments diagonaux sont égaux
à 2, et pour i # J , A,, # O implique A,, # O (tous deux étant négatifs).
Les algèbres de Lie simplement lacées A , D ,E sont telles que toutes les
racines sont de même longueur, et en conséquence la matrice de Cartan est
symétrique.
Les éléments non diagonaux non nuls de A,, sont codés dans un
diagramme de Coxeter-Dynkin, où e points sont associés aux racines
simples. Les paires de points {i, J} sont joints par A,,A,, = O, 1 , 2 , 3 lignes.
Si A,, = O, les racines correspondantes sont orthogonales et les réflexions
w, et w, commutent. Si les racines ne sont pas orthogonales (w,w,)~’~J
= 1,
où l’entier m,,, vaut 3, 4 ou 6 selon que i et j sont reliés par 1, 2 ou 3 lignes.
Le diagramme est connexe (dans le cas contraire l’algèbre se scinderait en
une somme directe de sous-algèbres commutantes). La description donnée
ci-dessus caractérise seulement le groupe de Weyl, indépendamment de la
longueur des racines. On montre que soit les racines simples sont de longueur
égale, auquel cas il n’y a pas de lignes multiples dans le diagramme, soit
elles sont divisées en deux groupes, racines longues et racines courtes. Si
A,,AJ, = 1, (a,,a,) = (a,,a,) tandis que si (a,,a,) > (a,,a,) et A,, # O,
alors A,, = -1 et A,, = -2 ou -3. Ainsi il suffit de mettre une flèche sur
les lignes multiples pointant de la racine longue vers la courte. L’ensemble
des diagrammes possible est représenté comme suit
Ae
-----
Be
-----
ce
---------
206
IX.C.1
INVARIANCE CONFORME
E6
T
E8
(C.15)
Les racines { a }engendrent un réseau sur les entiers appelé le réseau des
racines. Les coracines 2 a / ( a ,a ) engendrent un second réseau, isomorphe au
précédent à un facteur d’échelle près, sauf dans les cas Be et Ce où cette
dualité échange les réseaux des racines. Ces deux algèbres ont donc le même
groupe de Weyl.
Le réseau des racines est invariant par le produit semi-direct du groupe
de Weyl et d’un groupe de translation discret. Une description équivalente
est que ce groupe inhomogène est engendré par n 1 réflexions dans les
hyperplans limitant un simplexe (qui est un domaine fondamental). En
prenant l’origine à l’un des sommets, C des hyperplans sont orthogonaux
aux C racines simples, et le (e 1)-ième hyperplan est orthogonal à une
e y i a i = O, yo = 1, avec des coefficients yi
racine a0 donnée par la relation Co
entiers positifs. Ces entiers caractéristiques yi obéissent à plusieurs relations
intéressantes. Leur somme h = Et Ye, appelée nombre de Coxeter, est reliée
à la dimension de l’algèbre de Lie, notée dim, par
+
+
+
dim = C( 1 h )
(C.16)
IX.C.1
INVARIANCE CONFORME
207
de sorte que Ch est pair et égal au nombre de racines. La notation h est
standard, et ne doit évidemment pas être confondue avec celle des poids
conformes. Par ailleurs, le produit des entiers y est relié à la dimension du
groupe de Weyl IWI par l’identité
(C.17)
On définit des quantités analogues relatives aux coracines, et en particulier
un nombre de Coxeter dual, noté g (qui s’identifie à h pour une algèbre
simplement lacée).
Le déterminant de la matrice de Cartan intervient quand on étudie
les représentations irréductibles de dimension finie de l’algèbre de Lie. Ces
dernières sont associées à des points sur le réseau dual (sur les entiers 2)
du réseau des coracines, appelé réseau des poids. Par définition pour chaque
poids q et chaque racine a, 2(q, a ) / ( a a, ) est donc un entier. Le réseau de
poids est lui aussi invariant par le groupe de Weyl et contient comme sousréseau celui des racines, avec un indice égal au déterminant de la matrice
de Cartan. Le réseau des poids est engendré par e poids fondamentaux qi,
1 5 i 5 e, tels que
(C.18)
Ces poids dominants ont un produit scalaire non négatif avec les racines
simples, et chaque poids peut être appliqué sur un poids dominant par un
élément du groupe de Weyl. La somme q, des poids fondamentaux est telle
que
e
q, =
qi =
I
4
a
(C.19)
Cr>O
Les représentations irréductibles de dimension finie possèdent un vecteur de
poids dominant, noté q, vecteur qui est annihilé par les représentants des
e!’). Les poids q, associés aux valeurs propres des générateurs de la sousalgèbre de Cartan (c’est-à-dire que la valeur propre de IC, est 2(a, q,)/(a, a ) )
sont de la forme q - Cpiai, où les pi sont non négatifs. Les poids de la
représentation adjointe sont les racines, et la racine dominante I) = -a0 est
une racine longue.
Les caractères correspondants xs sont donnés par une formule due à
Weyl, et se présentent comme des fonctions d’un vecteur x de dimension C
variant dans le tore de Cartan
208
INVARIANCE CONFORME
IX.C.1
((2.20)
Dans cette formule mult(q’) est la multiplicité du poids q’ dans la représentation, et, dans la somme sur le groupe de Weyl, E ( W ) vaut plus ou moins,
selon la parité de son expression en termes des réflexions génératrices. Le
dénominateur admet une forme factorisée
(C.21)
a>O
Le passage à la limite x
+ O,
donne la dimension de la représentation
(C.22)
L’invariant quadratique de Casimir (à un facteur multiplicatif arbitraire
près) a la forme
(q + q m , q + 9,) - ( s m ,s m ) = (9,q + 2qm)
(C.23)
I1 ne suffit cependant pas à caractériser la représentation quand le rang e
est supérieur à un. Considérons les polynômes dans les composantes des
poids, et parmi eux distinguons ceux qui sont invariants par le groupe de
Weyl comme l’invariant quadratique ci-dessus. Ces derniers peuvent être à
leur tour exprimés comme des polynômes en e polynômes fondamentaux
qui généralisent la forme quadratique (q,q). Leur degré est donné dans la
dernière colonne de la table III. Le degré le plus élevé est le nombre de
Coxeter h, le produit de tous les degrés est l’ordre du groupe de Weyl, et
le double de leur somme est dim(G) e, où dim(G) est la dimension de
l’algèbre de Lie. Si l’on soustrait l’unité à ces degrés (obtenant ce que l’on
appelle des exposants), on retrouve les indices des éléments diagonaux non
nuls (avec leur multiplicité) apparaissant dans les fonctions de partition
invariantes A-D-E discutées dans le texte. La table inclut également une
colonne donnant le nombre de Coxeter dual g, qui est la valeur de l’invariant
de Casimir quadratique (C.23) dans la représentation adjointe, lorsque l’on
normalise à l’unité la racine longue. Rappelons qu’on a h = g pour les
groupes .simplement lacés. Observons au passage qu’on a la formule suivante
due à Freudenthal
+
(C.24)
IX.C.1
209
INVARIANCE CONFORME
où ( ( Y c ~ ( Y ~est
)
le carré de la longueur d’une racine longue. La table inclut
une colonne donnant la dimension de l’algèbre, une autre donnant l’ordre
du groupe de Weyl, et une dernière donnant la structure des quotients du
réseau des poids par le réseau des racines, considérés comme groupes additifs
(l’ordre étant detAij)
On pourrait généraliser la discussion précédente aux algèbres de KacMoody infinies admettant des matrices de Cartan dégénérées, ou de façon
globale à des “groupes de lacets” (c’est-à-dire des applications du cercle
dans un groupe de Lie) et leurs extensions centrales. Nous nous bornerons
à suggérer cette généralisation, en présentant les modèles dits de WessZumino-Witten. Ces derniers sont caractérisés par le fait qu’une symétrie
globale est étendue en symétrie locale (ou symétrie de jauge). On verra que
ces modèles ont une structure reliée à l’invariance conforme.
C.2 Modèles de Wess-Zumino-Witten
Le modèle O non linéaire à deux dimensions est une théorie des champs
massive, asymptotiquement libre, et globalement invariante par un groupe
de symétrie continu. Essayant de trouver un point fixe infrarouge non trivial,
Witten a été conduit, dans le cas où le champ u prend ses valeurs dans
un groupe de Lie compact G, à ajouter un terme topologique qui suggère
perturbativement l’existence d’une telle théorie critique. Afin de simplifier
la discussion, nous supposerons que le groupe de Lie compact possède une
algèbre de Lie simple (qui sera ensuite étendue sur les complexes).
Le terme topologique possède la structure typique d’une anomalie que
l’on rencontre en étudiant un modèle de fermions couplés à un champ de
jauge. Nous n’insisterons pas ici sur cet aspect bien qu’originellement cette
construction bosonique ait eu pour but de trouver une équivalence bosonfermion dans le cas non commutatif.
Le point de départ est l’action du modèle O
X>O
((7.25)
Nous supposons que la quantité u prendses valeurs dans une représentation unitaire fidèle de G et le symbole Tr représente la trace dans cette
représentation, à un facteur approprié près. Comme on a la relation
((7.26)
et que pour u unitaire, u-’a,u est une matrice antihermitienne dans la
représentation de l’algèbre de Lie, on voit que S(O) est positif (le poids de
Boltzmann doit être compris comme exp -S). La même formule montre que
tout ce dont on a réellement besoin est d’une forme invariante bilinéaire sur
l’algèbre de Lie, que l’on peut identifier à la forme unique de ce type (d’où
dim
IWI
C(C+ 2)
(e + l ) !
Poids/Racine
2/(C+ 1 ) 2
q 2 e 1) 2eC!
2/22
C(2C+ 1) 2eC!
2/22
L(2C - 1) 2[-1C!
C pair: 2 / 2 2 x 2 / 2 2
C impair: 2 / 4 2
14
12
id.
52
1152
id.
78
51840
2/32
133 2903040
2/22
248 696 729 600
id.
+
g
degrés des invariants
C + l 2,3, ...,C + i
2C-1 2,4, ...,2C
C + l 2,4, ...,2C
2(C - 1)2,4,. . . ,2(C- l ) , l
4
9
12
18
30
2,6
2,6,8,12
2,5,6,8,9,12
2,6,8,10,12,14,18
2,8,12,14,18,20,24,30
Table III : Données concernant les algèbres de Lie simples.
IX.C.2
INVARIANCE CONFORME
211
la restriction à une algèbre de Lie simple), à un facteur multiplicatif près.
Ainsi
Tr(u-’a,u)(u-’a,u)
(u-laau’ .-laau)
(C.27)
NOUSnormaliserons la forme bilinéaire en convenant que la longueur des
racines longues est prise égale à l’unité. On verra plus bas l’intérêt de ce
choix non conventionnel qui doit être présent à l’esprit, si l’on veut comparer
les expressions qui vont suivre à celles d’autres auteurs.
Dans un système de coordonnées arbitraires, ou dans un espace courbe
de métrique g a b , le lagransen dans ,s’(O) est remplacé par l’expression
invariante conforme +jgubTr(&u-’ûbu). En tout cas il est invariant par
un groupe global de la forme G x G, par la substitution u 4 u-l ainsi que
par toute réflexion dans le cas de la métrique de l’espace euclidien.
Afin de justifier l’addition du terme S ( l ) ,on compactifie l’espace euclidien en une sphère bidimensionnelle que nous désignons ici C2 pour éviter
les confusions (il faut bien entendu tenir compte d’un changement éventuel
u(z)donne une image de
de système de coordonnées). I1 en résulte que 2
C2 dans le groupe, qui peut être déformée continûment en un point (l’énoncé précis est que le deuxième groupe d’homotopie 7r2(G) s’annule), de sorte
que nous pouvons étendre u(x)à une application u(y) de la boule B (l’intérieur de la sphère unité de l’espace tridimensionnel) dans le groupe. Ceci
nous permet d’écrire un second terme
-f
où w est la 1-forme w = u-ldu. Dans la seconde expression, les produits
doivent être compris à la fois comme des produits extérieurs sur les formes
et des produits intérieurs sur les représentants des éléments de l’algèbre de
Lie (ainsi W,,W = [w/\,w] apartient a l’algèbre de Lie).
L’extension de C2 à B n’est pas unique. En recollant deux telles
extensions sur la sphère C2, on voit que la différence entre les valeurs
possibles de S ( l ) est donnée par une intégrale similaire portant sur une
sphère C3, correspondant à un élément d’une classe du troisième groupe
d’homotopie 7r3(G).Dans le cas de groupes de Lie simples, ce dernier admet
un générateur unique et les deux valeurs de S(’) ne peuvent difféEr que par
un multiple de l’intégrale sur ce générateur. La normalisation de Tr ou de la
forme bilinéaire ( , ) est choisie de façon telle que cet arbitraire se réduit à
un multiple entier de 27ri. Cet arbitraire n’affecte donc pas exp --S(’) pourvu
que le coefficient 6 soit un entier. Nous devons donc avoir
212
IX.C.2
INVARIANCE CONFORME
((7.29)
Pour comprendre le sens de cette restriction, consis irons par exemple
un sous-groupe SU(2) dans G et représentons de façon fidèle u sous
la forme expi$a.n où n est un vecteur unitaire sur C2 de coordonnées
(sin O cos ‘p, sin O sin ‘p, cos O), avec O I: 8 < 7r, O 5 ‘p < 27r. Ici a désigne les
matrices de Pauli et $ varie entre O et 7r. Cette paramétrisation utilise bien
sûr le fait que SU(2) est topologiquement équivalent à C3. Tenant compte
de ce que w = u-ldu, un calcul simple donne l’expression
(wA,w,,w) = 6(03, a3) sin2 $d$,
sin8dOAd’p
Le générateur du troisième groupe d’homotopie est donné par l’application
identité C3 + SU(2). Comme
sin2 $d$,,
sin OdBAd’p= 27r 2
nous avons dans ce cas
(C.30)
Le générateur a3 est équivalent à l’élément IC, intervenant dans les équations
(C.5)’((7.6). Pour la cohérence de l’intégrale de chemin, il s’ensuit que la
condition de quantification est que, pour toute racine c y , i k ( k , , k a ) soit un
entier. Mais ( @ , a =
) (ka,ka)= 4/(ICa,ICa). Ainsi pour toute racine a , le
coefficient k dans l’expression (C.28) doit satisfaire à
IC E ( a , a ) 2
(C.31)
La condition la plus forte correspond au cas des racines longues. Nous
avons fixé par convention la normalisation de la forme quadratique de
façon que (ae,ae)= 1, ce qui entraîne que k doit être un entier. Le même
calcul montre que IC pourrait encore être restreint si G n’est pas un groupe
simplement connexe. Par exemple si G est le groupe SO(3) au lieu de SU(2),
le coefficient k doit être pair.
Bien que la 3-forme ( W ~ , W , , W ) soit fermée mais non exacte, nous
pouvons la paramétriser de façon telle qu’elle apparaisse localement comme
la différentielle d’une 2-forme (non uniforme). Pour S U ( 2 ) par exemple nous
pourrions écrire
87r
‘p sin2 $d$A
sin 8dO
IX.C.2
INVARIANCE CONFORME
213
qui est une intégrale non uniforme sur un espace bidimensionnel avec des
singularités à û = O et x .
Nous décidons donc que l'action totale est la somme
s = s(0)+ $1)
((3.32)
et calculons sa variation afin d'obtenir les équations du mouvement classiques
Cette variation ne fait intervenir qu'une intégrale bidimensionnelle. En
utilisant des coordonnées complexes { z , 2 ) , on en déduit
+
(A-' - ak) 8 ( u - ~ ~ u (A-'
)
+ $ k ) d ( u - ' ~ u )= O
((2.34)
Quand le facteur X satisfait à la condition
A=-
4
(C.35)
lkl
nous avons soit 6' (u-ldu) = O si k est positif, soit a (u-ldu)= O si k est
négatif. Prenant k > O pour fixer les idées, une solution classique se factorise
sous la forme
uciass = uï( z ) ~ , '
(z)
(C.36)
Pour cette valeur de A, l'action totale prend la forme
tandis que
S(U+SU) = S ( U )+ k
(~-~S~,d(u-'du))
(C.37b)
Posons ut = ue-tH, où H est un élément de l'algèbre de Lie. En utilisant
les identités précédentes, on peut intégrer S(u,) de zéro à un et obtenir
l'identité remarquable
214
INVARIANCE C O N F O R M E
S(1Lv-l) = S ( u )
+ S(v-1) + IC
s ‘B
- (v-ldv,u-ldu)
IX.C.2
((2.38)
De plus si nous déformons une solution classique ul(t, z)iiZ’(t, 2) de paramètre t variant de t = O à 1 de telle sorte qu’à t = O elle soit l’identité et
qu’à t = 1 elle prenne la valeur ( C . 3 6 ) ,on déduit de l’équation (C.37b) que
l’action reste constante et en fait égale à zéro. L’équation ( C . 3 8 ) montre
alors que, pour le choix particulier X = 4/ lkl, l’action est invariante par le
groupe de jauge G z @ G,
u ( z ,z) 4 u1(z)u(z,
z)Q(z)
(C.39)
La question est maintenant de comprendre comment cette symétrie est
représentée au niveau quantique. Si 1,011 garde X et IC comme paramètres,
un calcul à une boucle montre qu’au premier ordre, la fonction ,LI de CallanSymanzik s’a~iiiuleencore pour X = 4/ Ilcl, tandis qu’elle révèle une anomalie
quantique (un terme de Schwinger) dans les commutateurs des courants
qui engendrent la symétrie (C.39). Plutôt que de chercher à déduire de
l’intégrale de chemin les réponses non perturbatives précises, on peut essayer
de trouver un ensemble cohérent de fonctions de corrélation compatibles,
en utilisant les identités de Ward de l’invariance conforme conjointement à
celles de l’invariance de jauge.
Les courants conservés
J ( 2 ) = $ICudu-l
dJ=O
J ( z ) = $ku-ldu
dJ=O
(C.40)
prennent leurs valeurs dans l’algèbre de Lie et les lois de conservation qui
expriment l’analyticité de J (l’antianalyticité pour J ) ne constituent qu’une
reformulation des équations du mouvement classiques (si nous remarquons
que a J = -u(dJ)u-’). Comme dans le cas du tenseur-impulsion énergie,
ces lois de conservation doivent être comprises pour des insertions dans les
fonctions de corrélation, à des termes de contact près.
Dans une variation infinitésimale du type ( C . 3 9 ) ,où O ( z ) et fi@) sont
des éléments infinitésimaux de l’algèbre de Lie, le champ se transforme selon
u ( z ,2 ) -t u(2,z)- O ( z ) u+ un@)
u-1(2, 2 ) -+ u - y z , 2 ) - n(z)u-l + u-1O(z)
(C.41)
Ces relations sont endendues en termes d’une représentation matricielle
fidèle. A leur tour les courants se transforment selon
((7.42)
rx.c.2
INVARIANCE CONFORME
215
Tenant compte du fait que les courants sont eux-mêmes les générateurs
de transformations de jauge infinitésimales, on interprète ces équations
comme un énoncé concis, équivalent à l’existence de deux algèbres de KacMoody infinies, exactement comme l’équation (47) engendrait les algèbres
de Virasoro. Jusqu’ici J et 7 sont considérés comme des champs classiques
intervenant comme arguments dans des fonctions de corrélation. En d’autres
termes, leurs coefficients dans un développement sur une base de l’algèbre de
Lie sont des quantités commutantes. Si un champ A se transforme suivant
une représentation de G, 8 Gz, l’équation ((7.26)implique que sa variation
infinitésimale s’écrit
SnA(z’, 2’) =
/
( O ( z ) ,J ( z ) )A(z’,2’)
(C.43)
où le contour encercle le point z’. On a évidemment l’analogue pour la
variation SQA. Cette formule est entièrement parallèle à l’équation (41)
correspondant à une transformation infinitésimale de coordonnées. Nous
l’appliquons maintenant à la variation du champ J ( z ) et développons J sur
une base ta de l’algèbre de Lie, avec
(C.44)
Les constantes de structure totalement antisymétriques sont définies par
[ t a , t b ] = ifabctc
(C.45)
Dans une représentation unitaire, les générateurs t sont hermitiens et
coïncident dans le cas de S U ( 2 ) avec $ca.L’équation ((7.43) se traduit
par le développement à courte distance
J ” ( z ) J b ( z ’ )= ‘IC
fia b
( z - 2’)2
+-i ( z - 2’)J C ( z ‘ )+ . . .
(C.46)
où les termes omis représentent des termes réguliers, et on a utilisé l’antisymétrie des constantes de structure. Le premier terme du membre de
droite représente l’anomalie quantique, analogue de la charge centrale pour
l’algèbre de Virasoro. Le développement est en accord avec le caractère
commutatif des coefficients J a ( z ) (c’est-à-dire qu’il est invariant dans un
échange simultané ( a , z ) e ( b , z ’ ) ) .Pour abréger, nous omettons la contrepartie dans la variable 2. La formule (C.46) est complétée par celles donnant
la relation avec le tenseur-impulsion énergie, et exprimant que J ( z ) a pour
poids conformes (1,O)
T (z)T(z’) =
C
2( z - 4
4
+ ( 2 -2z’)2 T(2’) +
1
~
(2
- 2’)
dT( 2 ’ ) + . . . (C.47)
216
INVARIANCE CONFORME
T ( z ) J " ( z ' )=
1
( z - z')2
P(z')+
1
~
(z - z')
aJa(z') + ..
IX.C.2
(C.48)
En utilisant la quantification radiale, on peut définir des opérateurs
correspondants ? ( z ) , j(z), agissant sur les champs conformes, et donc aussi
sur l'espace vectoriel des états. Nous développons ces opérateurs en série
de Laurent de puissances de z et omettons, pour alléger les notations, le
chapeau sur les opérateurs coefficients
Les développements à courte distance sont alors équivalents à l'ensemble
des relations de commutation
Cette dernière équation définit l'algèbre de Kac-Moody, la seule extension
centrale, à équivalence près, de l'algèbre du groupe des lacets [ j g , j & ] =
ifabcjn+m. A nouveau nous sous-entendons les contreparties en 2, correspondant aux mêmes valeurs de k et e. L'unitarité d'une représentation requiert
(J:)+ = JEn
(C.51)
Un champ primaire, créant un état de poids dominant, sera caractérisé par
une paire de poids conformes (h,h) relativement à l'algèbre de Virasoro,
aussi bien que par une paire de représentations de dimension finie (R,'IZ)
pour les algèbres de Lie finies {J,"} , { @ }. Celles-ci peuvent aussi être
indexées par leur poids dominant. Un tel champ évalué à l'origine (et avec
dépendance dans la variable conjuguée), lorsqu'il agit sur le vide, engendre
un état fondamental Ih,R) annihilé par les opérateurs L, et J," pour n
positif.
Compte tenu de la spécificité de modèle, nous nous attendons à ce
que le tenseur impulsion-énergie s'exprime en termes des courants J et que
la charge centrale soit reliée au groupe G et au niveau k . De fait, classiquement le tenseur impulsion-énergie est quadratique dans les courants,
forme suggérée à la fin des années soixante par Sugawara (dans un contexte
fermionique), et élaborée par de nombreux auteurs. Exprimée en termes
d'opérateurs, cette relation s'écrit
T(Z)
1
=-
2x
:
a
P(z)P(z)
:
(C.52)
IX.C.2
INVARIANCE CONFORME
217
pour une valeur appropriée du coefficient x. L’ordre normal requiert que
les opérateurs d’indice n < O soient placés à gauche des opérateurs d’indice
n 2 O. Partant de la forme diagonale du produit scalaire sur l’algèbre de
Lie, l’expression (C.52) est le seul candidat pour un invariant quadratique
(ainsi que T doit l’être). On note l’analogie avec le câs d’un champ scalaire,
où T était proportionnel à ( 3 ~ )I1~est
. ici proportionnel à son équivalent
Tr 3u-ldu.
La constante x intervenant dans (C.52) est fixée par une condition
de cohérence entre algèbres. Pour le voir, appliquons les deux membres de
l’équation à un état de poids dominant J h , R ) où h dénote la plus petite
valeur de Lo. Ne retenons que les termes en z-’. Ceci s’écrit
(C.53)
et donne ce que l’on pourrait appeler un état singulier, si l’on pense en
termes du module engendré par l’ensemble des opérateurs
{ L-n} { J-m} Ih, R). Agissant successivement avec L1 et Ji”,on trouve
Pour utiliser les relations de commutation (C.50)’ nous remarquons que
l’opérateur CbJob JO,agissant dans la représentation irréductible R de poids
dominant qa, donne la valeur correspondante de l’invariant quadratique de
Casimir
+ 2%)
((2.55)
c
7
7
.= (977.7972
tandis que, d’après (C.45)’ la quantité analogue dans la représentation
adjointe est
(C.56)
= (-(Yo,
-a0
+ 2%)
&,,c,
On peut vérifier que c a d j n’est pas autre chose que le nombre de Coxeter
dual (rappelons que (ae,ae) = 1). Revenons aux équations (C.54)’ nous
trouvons
218
IX.C.2
INVARIANCE CONFORME
et par conséquent le facteur de normalisation 22 prend la valeur
(C.57)
22=k+g
tandis que le poids conforme est relié à la représentation
R par
(C.58)
Dans le cas du groupe SU(2), si nous caractérisons la représentation par
son moment angulaire j , sachant que g prend la valeur 2 (ainsi qu’il résulte
de (C.55) en faisant l’identification f a b c -t &abc ou en utilisant la relation
CR = j ( j 1) pour j = 1)’nous avons 22 = IC 2 et h = j ( j l ) / ( k + 2).
La valeur de la charge centrale est obtenue en demandant que l’état
vide soit invariant par le groupe G , et a par conséquent un poids h = O. En
calculant
+
+
+
et en utilisant les règles de commutation de l’algèbre de Kac-Moody, on
trouve en insérant la valeur de x obtenue précédemment
k
c = dim(G)k+g
((7.59)
Ici dim(G) est la dimension de l’algèbre de Lie de G. Dans le cas de SU(2),
on a donc c = 3 k / ( k 2). En général, pour les groupes simplement lacés,
c varie entre le rang du groupe (correspondant à k = 1) et sa dimension
quand k tend vers l’infini.
La construction s’étend sans peine aux algèbres de Lie semi-simples par
produit direct et peut même inclure des facteurs abéliens (avec une valeur
correspondante g = O), et elle coïncide alors avec la théorie du champ libre
compactifié sur un cercle.
I1 existe plusieurs généralisations de la construction précédente. Nous
nous bornerons à décrire ici une observation remarquable faite par Goddard,
Kent et Olive. Supposons que l’algèbre de Lie simple G contienne une sousalgèbre simple H. Soit k le niveau de G (l’entier caractérisant l’anomalie
dans l’équation (C.51~)).
Quand on se restreint à la sous-algèbre, le niveau
peut différer de k dans le rapport de racines longues. En effet si (at,
at) = 1
pour G, la restriction de la forme quadratique à l’algèbre de Lie H donne en
général une valeur fractionnaire pour la normalisation de sa racine longue.
Supposons que les premiers indices au nombre de dim(H) se réfèrent à H .
On a alors les expressions suivantes des tenseurs impulsion4nergie
+
IX.C.2
219
INVARIANCE CONFORME
((7.60)
diin( H )
Par conséquent, les charges centrales correspondantes sont données par
CG
k
= dim(G) -
k
C H = dim(H)-
+ QG
k'
k'
+ gH
((7.61)
où
(C.62)
est plus grand ou égal à k , puisque ( a c , a c ) ~ / ( a e , c . rest
c ) ~un entier. Des
règles de commutation (C.50b),il résulte que L,(G/H) E L,(G) - L,(H)
commute avec les courants de la sous-algèbre H, et donc aussi avec L,(H).
Ainsi l'algèbre de Virasoro relative à G se scinde en deux parties qui
commutent
TG
= TH
+ TG/H
((7.63)
Comme les charges centrales sont additives, on obtient pour le modèle
quotient G f H
Supposons les représentations unitaires. Si CGIH = O, la représentation
correspondante est triviale, et les représentations des algèbres de Virasoro
et de Kac-Moody pour G et H sont équivalentes, en dépit de leur allure
très différente. Ceci conduit à des constructions opératorielles non triviales.
Par exemple si G est un groupe de Lie simplement lacé, si IC = 1, et si H est
le tore abélien maximal (correspondant à la sous-algèbre de Cartan) nous
avons CG = CH = rang de G = e. Ainsi CGIH = O, et nous sommes conduits
à une présentation de la théorie non abélienne en termes de e champs
scalaires périodiques, avec construction associée pour les courants restants
(non diagonaux) en termes des exponentielles de ces champs scalaires.
Une autre application est une construction de la série des représentations minimales unitaires de l'algèbre de Virasoro. Une possibilité est de
considérer l'inclusion G = S p ( 2 ( m- 1))3 Sp(2(m - 2 ) )@ Sp(2) = H , le
niveau original étant k = 1, et le sous-groupe héritant dans ce cas d'un
niveau IC' = k = 1. Nous avons
220
IX.C.2
INVARIANCE CONFORME
CG
CH
(m - 1)(2m - 1)
6
= 2m - 5 m+l
m+l
6
(m - 2)(2m - 3)
1 = 2m - 6 =
m
m
+
=
+
+
et par conséquent
(C.65~)
Une autre possibilité est d’utiliser pour G le groupe SU(2) x SU(2) et pour
H le sous-groupe diagonal SU(2). Dans G, les niveaux des deux facteurs
peuvent être choisis à volonté. Le choix (m - 2 , l ) donne pour H le niveau
( m - 1), et pour la charge centrale
C(SU(2),,,4
3(m - 1)
3(m - 2)
+1m
m+l
6
=Im ( m 1)
xsU(2)l)/sLr(z),,,~l
=
(C.65b)
+
c’est-à-dire une fois de plus la série unitaire minimale.
Ces observations peuvent être utilisées pour compléter la preuve du
théorème de Friedan, Qiu et Shenker, selon lequel les représentations de
Virasoro correspondant aux valeurs de m entier plus grandes ou égales à
deux sont les seules à être unitaires et de charge centrale inférieure à l’unité.
C.3 Représentations et caractères des algèbres de Kac-Moody
Nous pouvons seulement ébaucher ici la théorie des représentations des
algèbres de Kac-Moody. Nous nous limitons aux représentations unitaires,
et montrons d’abord comment l’on retrouve dans un cadre algébrique
le fait que le niveau k doit être entier (par opposition à la déduction
topologique précédente) et quelles sont les restrictions supplémentaires
sur la représentation R de G qui conduisent aux représentations dites
intégrables de l’algèbre de Kac-Moody.
Rappelons que pour l’algèbre de Lie de G dans la représentation
adjointe, le poids dominant est la racine (longue) positive
,$ = -(Yo
(C.66)
Montrons alors que le niveau k est un entier non négatif tel que
(C.67)
IX.C.3
221
INVARIANCE CONFORME
Bien que notre expression soit écrite avec la convention (+,+) = 1,
nous avons rétabli ici une normalisation arbitraire, afin de rappeler que
2($, qR)/(+, +) est un entier non négatif. Pour démontrer cette propriété,
considérons la sous-algèbre SU(2), dans l'algèbre de Kac-Moody, dans la
généralisation évidente de la base de Chevalley-Serre, qui résulte des règles
de commutation
k a , e-,] = -2e1, a
[ k g ,ef] = 2ef
[ O
-1
Ceci montre que les générateurs
peuvent jouer le rôle de
,ea,e-,
respectivement, car ils interviennent comme générateurs de SU(2) dans les
équations (C.56).La représentation de l'algèbre de Kac-Moody peut être
décomposée en états de poids définis pour la sous-algèbre { J t } , qui satisfont
à
Pour tout q dans cette décomposition, la quantité k - 2 ( a , q ) doit être
un entier. Appliquons ceci & la racine dominante a = -a0 = et tenons
compte de (+, $J) = 1. Nous trouvons que k - 2(+, q)/($J, +) doit être entier,
et donc que k est aussi entier. De plus si l'état de poids dominant correspond
à une représentation R avec un poids dominant q R , nous devons avoir
+
-a
e,
lsn) = 0
Dans le cas d'une représentation unitaire, (e;")'
= ea,. En conséquence
Ainsi k 2 2(a,qR)et la condition la plus restrictive provient de la racine
dominante $J normalisée à l'unité, ce qui conduit à la restriction (C.67) sur
les représentations R possibles.
222
INVARIANCE CONFORME
IX.C.3
Prenons par exemple SU(2), nous avons (q,qR)/(q,
+) = j moment
angulaire entier ou demi-entier. I1 s’ensuit que pour l’algèbre de KacMoody correspondante, notée Ai’), k doit être un entier non négatif tel
que k 2 2 j 2 O.
Nous conclurons cet appendice en décrivant les caractères des représentations unitaires des algèbres de Kac-Moody. Elles sont dérivées des
modules formés de l’ensemble des états obtenus par action d’un produit
d’opérateurs Z , ( n > O) sur un état de poids dominant IqR) et ses partenaires, donnant une représentation R du groupe de Lie fini sous-jacent
G.
Rappelons que nous avons une représentation associée de l’algèbre de
Virasoro caractérisée par les valeurs
k
c = dim(G) -
(C.68)
k+g
de
la
charge
centrale
et
du
poids
conforme
h, où
CR = (qn,q R 2q,) . Naturellement nous choisissons pour le niveau k
un entier.
Comme dans le cas de dimension finie, le caractère est une fonction
génératrice des multiplicités des poids de G , intervenant à un degré n dans
une décomposition sur des états diagonalisant la sous-algèbre de Cartan de
{J,”} . Ecrivons ces multiplicités sous la forme mult,(q), et notons que la
valeur correspondante de l’opérateur de graduation LOest h, = h n.
Si x est un vecteur arbitraire dans l’espace des racines de dimension e,
et si T est un nombre complexe dans le demi-plan supérieur, définissons le
caractère par la formule
+
+
(C.69)
où la somme sur q porte sur le réseau des poids de l’algèbre de Lie finie
de G. Nous avons inclus un facteur exp(-&2in~c), comme dans le texte,
de telle sorte que si on les applique au cas x = O, les formules précédentes
deviennent
x ~ , k ( OT,) = TrR,k exp 2 i n ~(Lo - &c)
(C.70)
L’expression de Weyl-Kac des caractères (qui généralise l’équation ((7.20))
donne x comme un rapport de deux sommes sur le groupe de Weyl (fini) de
G, selon
IX.C.3
INVARIANCE CONFORME
223
où, comme ci-dessus, q, est la somme des poids fondamentaux (égale à la
demi-somme sur les racines positives) et les fonctions 0 généralisées sont
Dans cette formule C représente le réseau engendré sur les entiers par les
racines longues, et s’identifie pour des groupes simplement lacés au réseau
des racines. Nous avons rétabli une normalisation arbitraire pour la forme
quadratique invariante. Naturellement lorsque k = O et R est l’identité, x
se réduit à l’unité.
I1 existe une forme factorisée pour le dénominateur dans l’équation
(C.71)’ analogue à l’équation (C.21)’ qui conduit à des identités remarquables sur les fonctions 0, généralisant l’identité de triple produit de Jacobi
(appendice A). Insérant la définition (C.72) dans (C.71)’ et divisant par un
facteur commun égal à la quantité Gq,,, (x)apparaissant dans la formule de
Weyl, nous obtenons plus explicitement
(C.73)
En particularisant cette formule à la valeur x = O, et en désignant par dim,
la dimension de la représentation R de poids dominant q , on trouve
((2.74)
SU(2). Cette algèbre
Comme cas particulier, considérons le cas où G
possède une unique paire de racines fa,C est le réseau des racines aZ,
le nombre de Coxeter dual est g = 2, et q, = $a. Alors qn = 2 j( $ a ) ,
qR
q, = ( 2 j
l ) ( $ a ) et y = p a où p prend des valeurs entières.
Finalement dimqR ( k g)y = 2 j + 1 + 2(k 2)p. Le caractère s’écrit
+
+
+ +
+
224
INVARIANCE CONFORME
IX.C.3
Posant comme dans la section (3.4)
N = 2 ( k + 2)
X=2j+1
(C.76)
on voit que cette expression coïncide avec celle donnée par l’équation (268)
où nous avons utilisé l’identité de Jacobi pour obtenir la seconde égalité.
La construction de Goddard, Kent et Olive des représentations de
la série unitaire minimale se traduit en une identité entre caractères de
l’algèbre de Lie affine de SU(2) et de l’algèbre de Virasoro. Pour E = O ou
+,cette relation s’écrit
où le prime signifie que la somme porte sur les valeurs de j’ telles que
j - j’ est entier si E = O, et demi-entier si E =
En particularisant pour
x = O, et en utilisant comme dans (C.76) la notation (A,N),ceci s’écrit
pour 15 X 5 m - 1 et 2~ = O ou 1
8.
Notes
Une première discussion du rôle de l’invariance conforme est due à
A.M. Polyakov, JETP Lett. 12, 381 (1970). L’algèbre de Lie infinie qui
lui est associée dans le cas bidimensionnel a été introduite dans le cas
des modèles duaux par M.A. Virasoro Phys. Rev. D1, 2933 (1970). On
1X.Notes
INVARIANCE CONFORME
225
trouve dans le livre de I.T. Todorov, M.C. Mintchev et V.B. Petkova,
Conformal Invariance in Quantum Field Theory, Pubblicazione della classe
di scienze della scuola normale superiore, Pisa (1978) des informations
complémentaires sur des tentatives antérieures de formuler des théories
invariantes conformes cohérentes. Les articles fondamentaux à l’origine des
applications présentées ici sont ceux de A.A. Belavin, A.M. Polyakov, et
A.B. Zamolodchikov, J. Stat. Phys. 34, 763 (1984) et Nucl. Phys. B241,
333 (1984).
L’ouvrage collectif Vertex Operators in Mathematics and Physics
édité par J. Lepowsky, S. Mandelstam et I.M. Singer, Springer Verlag,
New York (1985) contient plusieurs contributions, parmi lesquelles celle de
D. Friedan, Z. Qiu et S. Shenker sur les représentations unitaires des algèbres de Virasoro et superconformes, et leurs applications à la physique,
et celle de A. Rocha Caridi sur les caractères correspondants.
La formule du déterminant de Kac est annoncée par V.G. Kac, Springer
Lecture Notes in Physics 94, 441 (1979). Nous avons suivi la démonstration
de B.L. Feigin et D.B. Fuchs dans Funct. Anal. et Appl. 16, 114 (1984), 17,
241 (1983).
Les articles de V.S. Dotsenko, Nucl. Phys. B235 [FS il] 54 (1984) et
du même auteur avec V.A. Fateev, Nucl. Phys. B240 [FS12] 312 (1984) et
B251 [FS 131 691 (1985) traitent des modèles minimaux et des fonctions
de corrélations.
La fonction de partition du modèle d’king sur un tore a été obtenue
dans le travail de Ferdinand et Fisher, cité au chapitre II. La relation entre la
charge centrale et l’effet Casimir sur un ruban est discutée par H.W.J. Blote,
J.L. Cardy, M.P. Nightingale, Phys. Rev. Lett. 56, 742 (1986) et I. Affleck,
Phys. Rev. Lett. 56, 746 (1986).
J.L. Cardy a écrit un article de revue sur les applications statistiques de
l’invariance conforme dans la série de Domb et Lebowitz, vol. 11 Academic
Press, New York (1986). Quelques-unes de ses contributions importantes
sont J. Phys. A17, L385 (1984), Nucl. Phys. B270 [FS 161 186 (1986)
sur l’invariance modulaire, Nucl. Phys. B240 [FS 121 514 (1984) sur la
géométrie semi-infinie, Phys. Rev. Lett. 54, 1354 (1985) sur la singularité
de Lee et Yang. Les conséquences de l’invariance d’échelle dans ce cas avaient
déjà été discutées par M.E. Fisher, Phys. Rev. Lett. 40, 1610 (1978).
L’interprétation de la série principale des modèles minimaux dans le cas
unitaire par D.A. Huse, Phys. Rev. B30, 3908 (1984) repose sur le travail
de R.J. Baxter, J. Phys. A13, L61 (1980) et G.E. Andrews, R.J. Baxter
et P.J. Forrester, J. Stat. Phys. 35, 193 (1984). Sur ce sujet, voir aussi
A.B. Zamolodchikov, Sow. J. Nucl. Phys. 44, 529 (1986).
La théorie des champs sur un tore est présentée dans un travail commun
avec J.B. Zuber dans Nucl. Phys. B275 [FS 171 580 (1986) tandis que la
classification A-D-E des modèles minimaux, énoncée comme une conjecture
dans un travail avec A. Cappelli et J.B. Zuber, Nucl. Phys. B280 [FS 181
226
INVARIANCE CONFORME
1X.Notes
445 (1987), a été démontrée par ces mêmes auteurs dans Comm. Math. Phys.
113, 1 (1987), et indépendamment par A. Kato, Mod. Phys. Lett. A2, 585
(1987). Une relation importante avec les caractères affines est discutée par
D. Gepner and E. Witten, Nucl. Phys. B278, 493 (1986), D. Gepner, Nucl.
Phys. B287, 111 (1987), et une pièce du puzzle prouvée par D. Gepner et
Z. Qiu, Nucl. Phys. B285 [FS 191 423 (1987) dans le cadre d’une discussion
plus large. Un travail ultérieur dans la ligne des modèles intégrables est dû
à V. Pasquier, Nucl. Phys B285 [FS19], 162 (1987).
T. Eguchi et H. Ooguri ont généralisé les équations de Belavin-Polyakov-Zamolodchikov à des surfaces de Riemann de genre arbitraire dans
Nucl. Phys. B282, 308 (1987). Des formules explicites pour les fonctions de
corrélation du modèle d’king ont été obtenues par P. Di Francesco, H. Saleur
et J.-B. Zuber, Nucl. Phys. B290 [FS20], 527 (1987).
Frustrations et symétries sont étudiées par G. von Gehlen, V. Rittenberg, J. Phys. A19 L625 (1986), J.-B. Zuber, Phys. Lett. B176, 127 (1986)
et J.L. Cardy, Nucl. Phys. B275 [FS 171 200 (1986).
Les modèles d’Ashkin-Teller (J. Ashkin et E. Teller, Phys. Rev. 64,
178 (1943)), de Potts, et les modèles à six et huit vertex sont présentés
dans le livre de R.J. Baxter, Exactly Solved Models in Statistical Mechanics,
Academic Press, New York (1982). L’interprétation des modèles statistiques
en termes de gaz de Coulomb est l’objet d’une revue de B. Nienhuis, J.
Stat. Phys. 34, 731 (1984), où l’on trouvera des références aux contributions
originales. En particulier les opérateurs combinés charge-monopole et leurs
corrélations apparaissent dans le travail de L.P. Kadanoff et A.C. Brown,
Ann. Phys. (New York) 121, 318 (1979). Leur étude dans le contexte
conforme se trouve dans P. Di Francesco, H. Saleur et J.B. Zuber, J. Stat.
Phys. 49, 57 (1987), S.K. Yang, Nucl. Phys. B285 [FS19] 183 (1987),
S.K. Yang et H.B. Zheng, Nucl. Phys. B285 [FS19] 410 (1987).
Les déviations à la criticalité sont examinées par A.B. Zamolodchikov
JETP Letters 43, 730 (1986) et dans le travail de l’un des auteurs avec
H. Saleur, J. Stat. Phys. 48, 449 (1987).
Une référence aux fonctions elliptiques et modulaires, qui inclut les
formules limites de Kronecker, est A. Weil Elliptic Functions according to
Eisenstein and Kronecker, Springer Verlag, Berlin (1976).
Le traitement des fermions dans le contexte de l’invariance conforme
trouve son origine dans le travail de P. Ramond, Phys. Rev. D3,2415 (1971)
et A. Neveu et J.H. Schwarz, Nucl. Phys. B31, 86 (1971). Pour la théorie
des champs superconforme et ses applications à la physique statistique,
on se reportera à la contribution de D. Friedan, Z. Qiu et S. Shenker
dans le livre Vertex Operators in Mathematics and Physics déjà cité, et
à leur article Phys. Lett. 151B, 37 (1985), ainsi qu’à M.A. Bershadsky,
V.G. Knizhnik, M.G. Teitelman, ibid. 31 (1985), et H. Eichenherr, ibid. 26
(1985). P. Goddard, A. Kent et D. Olive, Comm. Math. Phys. 103, 105
(1986) et A. Meurman et A. Rocha-Caridi, Comm. Math. Phys. 107, 263
IX .Notes
INVARIANCE CONFORME
227
(1986) discutent la construction des caractères. La classification des modèles
minimaux superconformes est explorée par D. Kastor, Nucl. Phys. B280
[FS 181 304 (1987), Y. Matsuo et S. Yahikozawa, Phys. Lett. 178B, 211
(1986), et A. Cappelli, Phys. Lett. 185B, 82 (1987).
Les modèles de l’appendice C sont décrits par A. Polyakov et P.B. Wiegmann, Phys. Lett. B131, 121 (1983), et E. Witten, Comm. Math. Phys.
92, 455 (1984). La structure conforme est élaborée par V. Knizhnik et
A.B. Zamolodchikov, Nucl. Phys. B247, 83 (1984), D. Gepner et E. Witten, Nucl. Phys. B278, 493 (1986), P. Goddard et D. Olive, Int. J. of Mod.
Phys. A l , 303 (1983); ce dernier article passe en revue les algèbres de Lie
et de Kac-Moody. La théorie des algèbres de Lie est décrite dans nombre
de livres, parmi lesquels J.P. Serre Algèbres de Lie semi-simples complexes,
Benjamin, New York (1966) et J.E. Humphreys Introduction to Lie Algebras
und Representation Theory, Springer Verlag, Heidelberg (1972). Les algèbres
de Kac-Moody et leurs représentations sont présentées par V.G. Kac Infinite Dimensional Lie Algebras, 2ème édition, Cambridge University Press
(1985), qui contient de nombreuses références à la littérature mathématique.
Finalement, il est bon de rappeler qu’une théorie des champs en termes de
courants fut proposée par H. Sugawara, Phys. Rev. 170, 1659 (1968) et
développée par de nombreux auteurs, comme une partie de l’algèbre des
courants, avec des résultats qui anticipaient plusieurs de ceux décrits dans
le présent chapitre, comme en témoigne l’article de R. Dashen et Y. Frishman, Phys. Rev. D11, 2781 (1975).
Parmi les développements importants qui ne sont pas couverts ici figurent l’étude des corrélations de courants et leurs remarquables propriétés
de monodromie, ainsi que la relation entre les constructions bosonique et
et fermionique. L’invariance conforme des théories des champs bidimensionnelles a des applications importantes pour la théorie des cordes, un aspect
qui sera brièvement décrit au chapitre XI.
CHAPITRE X
SYSTEMES DESORDONNES
ET METHODES FERMIONIQUES
Les systèmes réels présentent des défauts de types variés. I1 est donc
important d’examiner leur effet sur les résultats obtenus dans les cas purs.
Dans la dernière section de ce chapitre, nous présentons le critère de Harris
qui permet d’estimer si un faible désordre perturbe un système critique. A un
niveau plus fondamental, on peut également chercher à mettre en évidence
de nouveaux phénomènes intrinsèquement liés à la présence de défauts. Par
exemple, la dynamique des dislocations dans un cristal peut expliquer la
transition solide-liquide. De même dans l’étude du modèle X Y , nous avons
été conduits à analyser le rôle des tourbillons. Les potentiels aléatoires dus
aux impuretés produisent la localisation des fonctions d’ondes (Anderson,
1958)’ propriété qui est liée à la transition isolant-conducteur. La localisation apparaît aussi dans des circonstances classiques mettant en jeu des
ondes optiques ou acoustiques. Ce sujet a suscité une intense activité. On
ne peut toutefois pas prétendre à une compréhension complète à l’heure
actuelle même si le cas d’un faible désordre est bien maîtrisé grâce à des arguments de groupe de renormalisation. L’influence des champs magnétiques
a ouvert un nouveau domaine de recherche lié à l’effet Hall quantique. Les
systèmes magnétiques à interactions aléatoires etjou frustrées ont aussi stimulé des développements très originaux. On s’attend à trouver une phase
verre de spin où les moments magnétiques sont figés dans des directions
aléatoires, ainsi qu’une pléthore d’états métastables ou “vallées’’ dans les
valeurs de l’énergie libre. Les applications des méthodes développées pour
traiter les verres de spin vont des réseaux de neurones aux supraconducteurs
à haute température récemment découverts, en passant par les problèmes
d’optimisation. Cette liste illustre la diversité du sujet.
L’archétype des systèmes désordonnés reste la théorie des matrices
aléatoires élaborée par Wigner et Dyson dans l’étude des spectres nucléaires
à laquelle nous consacrons un ample paragraphe. Plus généralement dans ce
chapitre, nous présentons des illustrations simples des méthodes de théorie
des champs, et tout particulièrement de l’utilisation de variables anticommutantes. Ces morceaux choisis inciteront peut-être le lecteur intéressé à
poursuivre l’étude de cette branche importante de la physique statistique.
230
SYSTEMES DESORDONNES
x.l
1. Modèles unidimensionnels
1.1 Le potentiel aléatoire gaussien
Considérons le hamiltonien d’une particule quantique se déplaçant sur
une droite en présence d’un potentiel aléatoire ayant une distribution gaussienne. Une méthode ingénieuse due à Halperin (1965) permet d’obtenir
le spectre. I1 est intéressant de comparer ce résultat exact à celui fourni
par la méthode heuristique des répliques qui est généralement utilisée dans
ce contexte. Nous rencontrerons dans cette étude un exemple élémentaire
de supersymétrie, dite symétrie BRS (Becchi-Rouet-Stora). Cette dernière
apparaît dans le traitement des systèmes contraints et fut initialement formulée dans la quantification des théories de jauge. Outre les spectres on est,
bien sûr, intéressé par diverses autres propriétés de ces systèmes comme la
structure des fonctions d’ondes ou la moyenne de produits de fonctions de
Green (afin d’obtenir des coefficients de transport). Malheureusement, ces
questions sont en général très délicates et on ne connaît pas de solution
analytique. Cependant un modèle désordonné discrétisé nous permettra de
montrer, en toute généralité, que les fonctions d’ondes sont localisées à une
dimension. Cette propriété est vérifiée dès que la partie aléatoire du hamiltonien ne présente pas de corrélations à longue portée. A première vue,
nous semblons alors confrontés à un paradoxe. D’une part, nous obtenons un
spectre moyen continu mais d’autre part, la présence de fonctions d’ondes
localisées, donc normalisables, entraîne d’ordinaire un spectre discret. I1 est
en fait vraisemblable que outre une partie discrète et une partie continue, le
spectre de tels systèmes désordonnés contient génériquement une partie singulière, phénomène peu familier dans le cadre des applications élémentaires
de la mécanique quantique. Notons que des propriétés similaires apparaissent lorsque le hamiltonien d’un système possède plusieurs périodes incommensurables. Ce serait, par exemple, le cas pour le spectre d’une particule
dans un quasicristal.
Soit donc le hamiltonien
H =
Ti2
2m
a2 + V ( x )
ax2
où V est un potentiel aléatoire, de valeur moyenne nulle, et n’ayant aucune
corrélation entre points distincts. I1 s’agit certes d’un cas extrême mais
qui a le mérite, comme nous l’avons signalé ci-dessus, de permettre un
traitement exact. I1 faut ici distinguer les moyennes quantiques, notées avec
des parenthèses, des moyennes sur le désordre, notées à l’aide de crochets.
Le potentiel est décrit par un processus gaussien centré dont nous écrivons
la fonction de corrélation sous la forme
x.l.l
231
SYSTEMES DESORDONNES
Plus précisément, on obtient toutes les moyennes à l’aide de la fonction
génératrice
(exp i
/
dxg(x)V(x)) = exp - i D
/
dzg2(x)
(3)
où g(z) est une fonction de carré intégrable.
Nous allons chercher à calculer la moyenne sur le désordre de la fonction
de Green à points coïncidants. Pour z complexe, introduisons la quantité
L’invariance par translation (et réflexion), après moyenne sur le désordre,
montre que le résultat ne dépend pas du point x. Dans la limite où z tend
vers l’axe réel, la partie imaginaire de G(z) donne la densité moyenne de
niveaux d’énergie par unité de longueur, le nombre total de niveaux étant
proportionnel à la taille du système. Précisément plaçons le système dans
une boîte de longueur L avec conditions aux limites périodiques. Alors p(E),
la moyenne sur le désordre de la densité de niveau, est donnée à la limite
thermodynamique ( L + co) par
1
p ( E ) = Im-G(E - io) = ((x IS(E - H)I x))
(5)
n-
Le nombre moyen de niveaux par unité de longueur, qui ont une énergie
inférieure à E, s’écrit alors
Comme le potentiel n’est pas borné, nous nous attendons à un spectre
variant de -00 à +co. I1 est commode d’introduire des unités réduites pour
les longueurs et les énergies en posant
v = A-2v
x=T
h
A 3
m2
H
=z
A-2H
= A-2 (-LA
2
+V )
(7)
(V(z)V(y)) = 6( 3 - y)
E =A-2E
Dans la suite, nous omettrons d’indiquer les barres. Dans ces nouvelles
unités D et m/h2 prennent une valeur unité.
A très haute énergie, le potentiel est négligeable. I1 est donc vraisemblable que le nombre total d’états par unité de longueur tende vers sa limite
classique (un état par cellule AxAp/27r)
232
x.l.l
SYSTEMES DESORDONNES
&
i
Efm
En revanche le comportement à E
résultera de l'expression exacte.
-+ -00
est beaucoup moins intuitif et
1.2 Equation de Fokker-Planck
Soit V une configuration du potentiel, $ la fonction d'onde correspondant à l'énergie E , solution de l'équation de Schrodinger. Cette dernière est
donc une fonctionnelle de V. Sa dérivée logarithmique f vérifie une équation
de Ricatti du premier ordre
Lorsque l'on interprète la coordonnée spatiale x comme une variable d'évolution, une analogie apparaît avec le mouvement brownien.
Nous voulons exploiter l'indépendance des valeurs du potentiel évalué
en des points distincts. Soit P(<,x) la densité de probabilité de f ( x )
1
27r
P(<,x) = (6(f(x) - I))
= - /dae-'"t
(eiaf(z))
(10)
En dérivant par rapport à x la valeur moyenne du membre de droite et en
utilisant l'équation (9)' on obtient
( f z ( x ) + 2E - 2V(z))ei"f(")
La propriété caractéristique de la distribution gaussienne (3) nous donne
avec D = 1,
En utilisant cet te expression dans la formule ci-dessus, on trouve
Intégrons maintenant l'équation de Ricatti pour des valeurs croissantes de
x, en partant de la valeur de f en un point xo, que nous faisons tendre vers
x.1.2
233
SYSTEMES DESORDONNES
-00.
I1 est clair que f(z) ne dépend que des valeurs de V pour y
la fonction retardée définie par
et s’annulant pour y
condition
< z. Soit
> z. D’après l’équation (9) cette quantité satisfait à la
dont une solution est donnée par
Lorsque y t z,
r(z,y) tend vers la limite apparemment mal définie
r(z,
=2qo)
(15)
Cette difficulté apparaît fréquemment dans ce type de problème. Pour la
surmonter en préservant la symétrie z + -2, on peut discrétiser le modèle
ou bien désingulariser la fonction de corrélation V - V en remplaçant la
distribution 6 par une approximation u,(x-y) où u, est une fonction paire,
positive, très piquée autour de l’origine, d’intégrale unité et tendant vers
S quand E tend vers zéro. Cela revient à remplacer le facteur û(z - y)
uE(z’)dz’ et û(0) par
u,(z’)dz’. En
dans (14) par l’intégrale J:iy
conséquence e(o) est remplacée par
moyenne entre û(-O) et û(+O), et
donc 6f(z)/ôV(z) = ï ( z , z) = 1. Compte tenu de cette interprétation, nous
obtenons en intégrant l’équation (il)par rapport à la variable a l’équation
de Fokker-Planck pour la distribution P ( [ ,x)
i,
SOoo
où E joue le rôle de la variable de configuration et x celui du temps.
L’équation implique la conservation de la probabilité totale J d[P(t, z)
pourvu que P décroisse à E grand.
Pour 2 tendant vers l’infini, P tend vers un processus stationnaire
limx+oo P(<,z) = p ( t ) vérifiant
2
($+ 2E +
at
234
SYSTEMES DESORDONNES
x.1.2
Ainsi p ( t ) décrit une distribution de la dérivée logarithmique t = $ I / $
indépendante de x. En intégrant l’équation (17) par rapport à 6, nous
obtenons
La constante po est déterminée par la condition de normalisation
qui implique
Nous voulons obtenir la relation entre p(E) et la densité spectrale p ( E ) .Dans
ce but, réintroduisons la boîte avec x E (O, L). Etant donné une valeur Eo
pour f (O) demandons que f ( L ) = EL. Nous obtenons un spectre discret E l ,
E2, . . .. Nous faisons alors tendre L vers l’infini et trouvons
On s’attend à ce que la limite du membre de droite soit finie. D’après
l’équation (9)on a
-(af
.
BE
= O) = O
Si nous remplaçons dans cette équation d f / d E par la fonction g(x) définie
par la relation
nous obtenons
Ainsi
et
x.1.2
SYSTEMES DESORDONNES
235
Notons que df / d E est négatif. En conséquence, la quantité
est reliée à la densité spectrale par
En procédant comme précédemment pour P ( [ ,z) on montre sans peine que
D’après l’équation ( 2 4 ) , P ( [ , z )se comporte comme zp(E) pour z grand,
positif. Le membre de gauche de cette équation tend donc vers p ( E ) si
z + +m, indépendamment de E. Multiplions les deux membres par ~ ( - 5 )
et intégrons sur E. En tenant compte de la normalisation de p ( < ) , nous
obtenons
Une intégration par parties montre grâce à ( 1 7 ) que le second terme
s’annule et nous obtenons la relation cherchée entre la densité spectrale
et la probabilité p(E)
P(E) = 2
/
dEP(OP(-E)
(25)
On peut en fait déduire une formule plus explicite de l’équation (18).
Dérivant cette dernière par rapport à E , on obtient
& = 2--d a p + (E2 + 2 E ) a?,
d E + 2p
~IE a t a ~
Multiplions les deux membres par p ( [ ) et intégrons par rapport à [ en
utilisant (18) et la condition de normalisation de p . On trouve
236
SYSTEMES DESORDONNES
x.1.2
I1 s’ensuit que
Po = N ( E )
En insérant cette relation dans (18)’ nous voyons que N ( E ) est déterminé
par les conditions
L’équation (27) n’est autre que la transformée de Fourier de l’équation
d’Airy. En tenant compte de la condition sur le comportement asymptotique, sa solution s’écrit
La normalisation implique que
Choisissons - q comme variable d’intégration. Nous parvenons à l’expression finale de N ( E ) - l sous forme d’une intégrale
Quand E + 00, le terme en u3 peut être négligé par rapport à E u , et nous
retrouvons le résultat semi-classique attendu comme l’indique l’équation (8).
La méthode du col permet aussi d’estimer l’intégrale lorsque E -+ -00 et
fournit l’estimation
I1 n’est pas surprenant de trouver que N ( E ) tende vers zéro rapidement
quand E + -00. Toutefois, le comportement précis est moins prévisible.
On parle parfois à propos de ces densités exponentiellement petites de
“queue de distribution de Lifshitz”. Le comportement de N ( E ) est indiqué
sur la figure 1. Observons que Jz/(E)-l est une fonction entière dont le
développement s’écrit
N(E)-l =
7
100
3G
(-2.3*E)ny (2n6+ 1)
n!
x.1.2
SYSTEMES DESORDONNES
237
Figure 1 : Densité d’états intégrée par unité de longueur pour un
potentiel aléatoire gaussien.
I1 est instructif de retrouver l’équation de Fokker Planck (16) en utilisant
un raisonnement valable pour des systèmes plus généraux. Poursuivons l’analogie qui consiste à considérer x comme une variable temporelle. Récrivons alors
l’équation (9) sous la forme
V(x)= E
+ i (a,
af + f ’)
Pour obtenir la probabilité E‘(<, x;<O, xo), on insère cette relation comme une
contrainte dans la distribution de V. Nous obtenons ainsi une représentation
de P comme une intégrale fonctionnelle
<
L’intégration sur porte sur les fonctions vérifiant <(xo) = <O, et <(x) = 5.
Si on suppose l’application
c) V
bijective, on peut évaluer le jacobien
J = IVV/V<I a une constante près
<
238
SYSTEMES DESORDONNES
x.1.2
où (d/dz)-l doit être compris comme la fonction de Green retardée ro(z, y)
vérifiant a/azïo(z, y) = 6(z - y), soit îo(x,y) = û(x - y). Ainsi
Comme la distribution ï o est retardée, seul le premier terme du développement
en série du logarithme donne une contribution non nulle. Nous avons déjà
examiné le problème posé par la quantité mal définie ïo(y, y) = û(0) et conclu
En conséquence, nous obtenons
que sa valeur devait être prise égale à
i.
J
= JO exp
dyt
(33)
Nous remplaçons alors J par sa valeur dans l’expression (32) et absorbons
JO dans la normalisation de l’intégrale fonctionnelle. Nous intégrons sur V en
utilisant la distribution 6. Utilisant la notation pour d</dy, nous obtenons
i
L’intégrale fonctionnelle qui reste à effectuer est une expression familière de
l’amplitude de transition euclidienne d’une particule quantique fictive décrite
soumise au potentiel (
E ) * -t. Cette
par la coordonnée <, de masse
interprétation entraîne que P doit satisfaire à une équation de Schrodinger de
la forme
4,
On peut remplacer l’expression (30) par l’équation
i it2+
x.1.2
SYSTEMES DESORDONNES
qui s’identifie à l’équation de Fokker-Planck ( 1 6 ) . Au passage nous avons aussi
obtenu une représentation de la solution par une intégrale fonctionnelle et
trouvé un lien naturel entre la dynamique quantique euclidienne et la théorie
probabiliste du mouvement brownien.
Profitons de cet exemple pour faire quelques remarques concernant le
traitement du jacobien. Dans le cas précédent, nous avons pu le calculer explicitement. Cette situation n’est bien entendu pas la règle, mais le traitement
que nous allons développer ci-dessous indique qu’il est possible de poursuivre
les calculs assez loin en l’absence d’une expression pour J. I1 s’agit en fait de
remplacer le jacobien J par l’intégrale fonctionnelle d’un poids de Boltzmann
bien choisi. Supposons le changement de variables V ci 5 bien défini. C’est
l’hypothèse cruciale qui, hélas, n’est pas toujours réalisée dans des situations
plus complexes. Si cette hypothèse est vérifiée, le jacobien ne s’annule pas
et la valeur absolue peut être omise, c’est-à-dire que J peut être considéré
comme un déterminant. I1 admet donc une représentation par une intégrale
fonctionnelle sur des variables anticommutantes S, et $
La contribution des fermions à l’action s’écrit
Nous obtenons alors un lagrangien effectif
Dans une variation arbitraire de
5, S,, $ il vient
Cette quantité s’annule pour
où 6a est une variable anticommutante, comme si Letf était supersymétrique.
Ceci est l’exemple annoncé de la symétrie BRS qui apparaît lorsqu’une contrainte est introduite dans une intégrale fonctionnelle, avec le jacobien associé,
239
240
x.1.2
SYSTEMES DESORDONNES
celui-ci étant écrit comme une intégrale gaussienne sur des variables de Grassmann. Dans notre exemple la contrainte est fournie par l’équation dynamique
(9).
La structure des variations (11) nous permet de définir un opérateur de
dérivation s tel que, pour toute fonctionnelle A des champs, on ait
85
=$
s 4 = (ici+ t 2 )+ E )
s* = O
L’opérateur s échange les champs bosoniques et fermioniques et par itération
s2t
=O
s2$
=O
(43)
Ainsi s est nilpotent (de carré nul) dès que vérifie les équations du mouvement ( i d / d z E ) 11, = O . Par référence à la théorie de la diffusion, on parle,
un peu improprement, de condition de couche de masse. Dans certaines applications, il est avantageux de définir un opérateur réellement nilpotent, par
exemple dans le contexte de la renormalisation où l’on voudrait caractériser
les contretermes par la propriété d’invariance sA = O. On saura alors a priori
que tout A de la forme SU vérifie cette condition et, dans certains cas, on
obtiendra ainsi la solution la plus générale. Pour s’assurer que s2 = O , on
utilise une représentation des distributions 6 en transformée de Fourier pour
imposer les contraintes. Cela revient à ajouter au lagrangien un terme avec un
champ multiplicateur de Lagrange a, initialement imaginaire pur, et à ne pas
effectuer l’intégrale sur V. Le nouveau lagrangien effectif s’écrit alors
$J
+
Len =iv”+a(:(i+52)+E-V)+4(’-+t)*
d
da:
Sa variation
6 L e=
~ (V - a)6V
+ 6a (ici+ 5’) + E - V )
s’annule pour
et l’opérateur s devient
s$ = Q
s<=*
s*=o
sa=o
sv=o
I1 est alors tel que s2 = O . Sous cette nouvelle forme, la définition de s ne
dépend pas des contraintes. Celles-ci sont en fait codées dans le lagrangien
effectif. La supersymétrie cachée de l’équation de Fokker-Planck n’a bien
entendu de sens que dans le langage des intégrales fonctionnelles.
X.1.3
SYSTEMES DESORDONNES
241
1.3 La méthode des répliques
La méthode des répliques est destinée, comme nous allons le voir,
à permettre l’évaluation de moyennes comme celle de la résolvante (4).
Remplaçons l’argument complexe z par E-io avec E réel, quantité que nous
notons simplement E , en sous-entendant la partie imaginaire infinitésimale
négative. Nous écrivons aussi G ( E ) pour ((x I[H - E]-’I x)). Si, au lieu
d’opérateurs agissant sur un espace de dimension infinie, nous traitions des
matrices de dimension finie, la quantité dont il s’agit de trouver la moyenne
serait le rapport d’un mineur au déterminant de la matrice. Le potentiel
aléatoire apparaît ainsi à la fois au numérateur et au dénominateur et
conduit en général à des calculs inextricables. Nous cherchons un moyen
de contourner cette difficulté.
Interprétons tout d’abord ( H - E)-l comme le propagateur d’un champ
scalaire auxiliaire. En utilisant l’invariance par translation de la moyenne
sur le désordre, nous écrivons
G ( E )= L-03
lim
(1
L -‘L
d z (x 1
H2
-1
E x))
Le facteur i dans l’exposant est choisi en accord avec la prescription E - io
pour assurer la convergence de l’intégrale. Apparemment nous n’avons pas
beaucoup progressé car il nous faut toujours prendre la moyenne d’un
logarithme. Remarquons cependant que si n est une variable continue
a
-Zn
dn
-f
n-0
In Z
(45)
Pour tout entier n, Zn est la fonction de partition de n répliques, identiques
et indépendantes. Elles contiennent le même potentiel aléatoire, lequel
apparaît linéairement dans l’action. Cette propriété nous permet d’effectuer
explicitement la moyenne sur la distribution gaussienne de ce dernier. Si le
prolongement analytique en n a un sens, il fournit alors le résultat désiré
242
X.1.3
SYSTEMES DESORDONNES
(44). Cette méthode repose sur l’existence de ce prolongement analytique. I1
est donc intéressant de confronter les conséquences de cette hypothèse avec
les résultats précédents. Notons que l’utilisation de la méthode des répliques
dans l’étude des milieux désordonnés a des traits communs avec la technique
utilisée dans la physique des polymères.
Soit donc un champ à n composantes (bien sûr n est initialement un
entier). Nous avons
2 d
d
G ( E )= lim -- lim L-+W L dE n-+O d n
L’action s’écrit
avec le lagrangien
C(@) = + ( d a y + (V - E ) @
(48)
Nous obtenons sans difficulté la moyenne sur V pour tout n puisqu’il s’agit
d’une intégrale gaussienne. Nous supposons que le résultat conserve un sens
pour n arbitraire. Ainsi
G(E)= lim
L-00
2 d
lim
L dE n-+O d n
--
e n p i l i L da: [$(a@)’- E @
-:L
+ $(a’)’
1
(49)
En dimension supérieure à un, une expression similaire conduirait à une
variante de la théorie ‘p4. Par chance, à une dimension, nous pouvons
nous ramener à un problème de Schrodinger de la manière suivante. Pour
L -00, i
nous nous attendons à ce que l’intégrale de chemin possède un
terme dominant de la forme
exp -$iLe(n)
(50)
où e(.) désigne l’énergie de l’état fondamental d’une équation de Schrodinger associée. Les variables de configuration % sont les coordonnées dans un
espace à n dimensions, et a: est encore une fois interprété comme un temps.
Ainsi
X.1.3
243
SYSTEMES DESORDONNES
= {-A@
e(.)$(@)
+ 2E@’
-
i(@’))”)$(a)
(51)
Comme le potentiel est complexe, la notion d’énergie du fondamental
implique un abus de langage. Si e(.) admet un prolongement analytique,
on s’attend à un développement
e ( n ) = ne0 + n2e1 + . . .
tandis que
d
G ( E )= -i-eo(E)
dE
d
-Reeo
dE
(E)
(53)
Supposons que eo(E) s’annule quand E + -m. Nous obtenons ainsi la
densité de niveaux intégrée par unité de longueur en termes du coefficient
du terme dominant
1
N(E) = -Reeo(E)
(54)
7r
Pour tout n nous demandons que l’état fondamental soit invariant par le
groupe de symétrie des répliques, ici O ( n ) . L’apparition d’une symétrie
entre les répliques est a priori tout à fait naturelle. Dans ce contexte
unidimensionnel, on n’attend pas de brisure de cette symétrie. Utilisons
à la place du champ vectoriel @, la variable scalaire
q=
(55)
2
et récrivons l’équation (51) en développant chaque quantité en puissances
de n, ce qui explicite le prolongement analytique dans cette variable. En
particulier, nous écrivons $ = $0 + n$i + . . . , et
{n
i
+ ne0 + n‘el + ...
I
+ nG1 + -..) =
2q
{
a2
-@
+ 2 E - 2iq
I
($0
+ n$1+
avec pour conséquence le système d’équations
d2
{ -dq2
I$}
=O
+2E-2iq
{eo
+
$O
=2q{
...
d2
-@
f 2 E - 2iq
I
$1
244
X.1.3
SYSTEMES DESORDONNES
Nous cherchons une solution + O ( q ) bornée au voisinage de l’origine, ainsi que
sa dérivée, et tendant vers zéro à l’infini. La deuxième équation entraîne que
eo est l’opposé de la dérivée logarithmique de $0 à l’origine
La première équation du système (57) admet un prolongement pour q
sous réserve de poser
+0(-4)
< O,
(59)
= +O(Q)*
condition qui est compatible avec l’équation. Nous normalisons la solution
en imposant la condition
=1
(60)
qui assure la continuité à l’origine. En tenant compte des équations (54)
et (58)’ la discontinuité de la dérivée de $0 à l’origine produit un terme
inhomogène. Dans l’équation vérifiée par le prolongement de +O à l’ensemble
des valeurs réelles de la variable
+O@)
nous reconnaissons la transformée de Fourier de l’équation (27) en posant
La condition $o(O) = 1 équivaut à demander que l’intégrale de p ( J ) soit
l’unité. L’équation (59) entraîne que p ( c ) est réel (et positif) et l’équation
(61) se traduit par une équation du premier ordre pour p ( < )
($+ 2 E + 2-d<
d,
p(<) =N(E)
<
Ainsi à la limite n + O , les variables q = $a2et sont conjuguées, et
$o(q), p ( < ) sont reliées par une transformation de Fourier, résultat plutôt
surprenant pour lequel nous n’avons pas d’interprétation simple. Nous
concluons que dans cet exemple, l’emploi de la méthode de répliques est
pleinement justifié.
(i) Calculer Imeo(E) et montrer que
d
G ( E ) = - i-eo(E)
dE
=$
(& #)
-
- iap(E)
X.1.3
SYSTEMES DESORDONNES
L a solution $o(q) de l’équation (57) pour O < q
est un point stationnaire de l’action effective
Si nous substituons
nous obtenons
$0 à 1) et
< 00,
normalisée à $ 0 ( 0 ) = 1,
si nous intégrons par parties le terme cinétique,
La dérivée deo(E)/dE est égale à la dérivée partielle de S(7) par rapport à E
évaluée pour 17 = $0
La partie réelle de cette équation équivaut à
qui est la formule (25). Appliquons maintenant le théorème du viriel sous la
où les valeurs à q = O sont en fait des limites quand q -+ +O. Comme
$0(0)~= 1, et (d$o(0)/dq)2 = e:, une intégration par parties montre que
la dernière intégrale vaut -ideo(E)/dE d’après (67). Ainsi
. de0
i-+eg=2E
dE
qui est la relation désirée entre la partie réelle de eo(E) (c’est-à-dire v , V ( E ) )
et sa partie imaginaire. En prenant la partie imaginaire de deux membres,
nous obtenons
dN +
- 2NImeo = O
dE
qui est la relation (64).
245
246
X.1.3
SYSTEMES DESORDONNES
(ii) Exprimer H ( E ) à l’aide des deux solutions indépendantes AZ(x) et
B i ( z ) de l’équation d‘Airy
d2u
,322 = xu
et montrer que
23
N(E)=
{
n2 A i ( - 2 + E ) 2
(71)
+ Bi(-23E)2
(iii) Montrer que le second coefficient e i ( E ) dans le développement ( 5 2 )
de e ( n ) est donné par
et que sa valeur permet d’estimer les fluctuations du spectre autour de sa
moyenne p ( E ) . Plus précisément, dans une boîte de taille L , où L -+ CO,
définissons le nombre de niveaux vL(E)dE d’énergie entre E , E d E . Nous
avons
+
avec
‘J
e o ( E ) = lim : dE’p(E’) ln(E‘ - E
€-+O
1
e l ( E ) = € ; lim
-+O
2i~S”E;dE:.(E;,E:)ln(Ei
+ ie)
-E+iai)ln(E2-E+isz)
(74)
où nous prenons la branche principale du logarithme avec la coupure le long
de l’axe réel négatif. En particulier pour E -t +CO
e1 N
-1
+-+...9
-
4(2E)
16(23)5
(75)
1.4 Réseau aléatoire unidimensionnel
Comme second exemple, nous allons étudier le laplacien sur un réseau
aléatoire unidimensionnel. De tels réseaux ont été introduits en dimension
quelconque pour rétablir des symétries continues en moyenne tout en conservant un facteur de coupure ultraviolet. Nous renvoyons le lecteur au chapitre XI pour une discussion détaillée. Ici nous n’introduisons un tel réseau
X.1.4
SYSTEMES DESORDONNES
247
aléatoire qu’en tant qu’exemple élémentaire de système désordonné discret à
une dimension. Ce modèle est une variante de celui des chaînes harmoniques
aléatoires introduites et étudiées par Dyson (1953).
Considérons un ensemble de N points choisis au hasard et indépendamment dans un intervalle de longueur L avec une probabilité uniforme. Dans
la limite où N et L tendent vers l’infini à densité S = l/a = N / L fixée,
les intervalles successifs e entre points consécutifs deviennent des variables
indépendantes obéissant à une loi de Poisson
de
p(e)de = -,Pela
a
Nous utiliserons dans la suite l’échelle de longueur microscopique a comme
unité de longueur, de sorte que nous poserons 6-l = a = 1. Les N points
engendrent un réseau et nous définissons le laplacien d’un champ scalaire ‘p
défini sur les sites du réseau par la relation
(Ap)n =
Vn+i - P n - p n - Pn-i
en
en-i
(77)
Nous nous intéressons au spectre des valeurs propres R 2 O telles que
(A
+R)p =O
(78)
Soit p(R)dR la densité spectrale par unité de longueur, c’est-à-dire par site
dans les unités employées. Elle vérifie la condition de normalisation
1”
dRp(S1) = 1
(79)
qui traduit le fait que pour N sites, à conditions aux limites données,
l’opérateur possède N valeurs propres. Cette propriété reflète l’existence
d’un facteur de coupure aux courtes distances et implique une décroissance
suffisamment rapide de la densité spectrale à R grand. Contrairement au cas
d’un réseau régulier, le spectre n’est pas borné. Nous verrons que la queue
de la distribution p à grand R provient d’états localisés autour de régions
(improbables) où les distances entre les points du réseau sont anormalement
faibles.
Nous pouvons en fait transformer le problème pour le ramener à celui
d’un réseau régulier avec un potentiel aléatoire. Définissons les quantités
Qn
=
P n + i - Pn
en
où Qn correspond au gradient du champ p. Ces quantités vérifient alors
1’équation
Q n + i - 2Qn
+ Qn-i
= -WQn
(81)
248
SYSTEMES DESORDONNES
X.1.4
qui est une équation de Schrodinger à énergie nulle sur un réseau régulier
avec un potentiel -Ren, où R joue le rôle d’une constante de couplage.
Posons provisoirement
(82)
w=-R
Pour w réel et positif, nous sommes sûrement hors du spectre, de sorte que
les solutions croissent exponentiellement
Qn
w>O
N
n-cc
On a omis un éventuel préfacteur dans (83) car il est sans importance dans
la suite.
Le facteur y(w) est appelé exposant de Lyapounov par référence à
l’étude des instabilités dans les systèmes dynamiques classiques (comme
précédemment, n peut être interprété comme un temps). La connaissance
de y(w) nous permet d’obtenir la densité spectrale. Supposons que Qn soit
donné en deux points consécutifs, par exemple n = O et n = -1. Résolvons
l’équation ((81) par itération. On en déduit que pour n > O, Qn est un
polynôme de degré n en w. Pour n grand, les racines de ce polynôme tendant
vers l’opposé des valeurs propres R
Ainsi
y(w) =
LW
dRp(R) ln(w
+ 0)
p(R) =-1 lim Im-(-0
dy
TE-++O
- iE)
dw
La seconde formule (85) suppose implicitement un prolongement analytique
de la fonction y(w), jusqu’au bord d’une coupure le long de l’axe réel
négatif. Comme précédemment, nous transformons l’équation linéaire aux
différences finies du second ordre (81) en une équation non linéaire mais du
premier ordre, analogue discret de l’équation de Ricatti. En remplaçant R
par -w, on pose
R, =-Qn+i
Qn
~,=2+we,--
1
Rn-i
On déduit de (83) que R, se comporte comme expy(w) pour n + KI pour
une configuration donnée des {e,}. Ainsi, en moyenne,
X.1.4
SYSTEMES DESORDONNES
249
y(w) = lim (lnR,)
n-+m
1
p(R) = -1mT
d
lim (In R,)
dwn-+Ca
w=-n-ie
Tirons également de l’équation (86) une représentation intégrale pour
la probabilité Pn(Rn)dRn que cette quantité prenne la valeur R, à dRn
près, supposant donnée la valeur initiale Ro (nous choisissons Ro = 1 pour
fixer les idées). I1 suffit pour cela d’observer que Rn-l ne dépend que des
. .. qui sont indépendantes de Nous obtenons donc
variables e,-,,
un analogue discret de l’équation de Fokker-Planck
en.
(88)
La condition Ro = 1 et la restriction w > O entraînent que le support de P,
est inclus dans l’intervalle [l,CO].
Supposons que P, tende vers une distribution asymptotique pour
n -+ CO. Cette distribution est alors donnée par la solution stationnaire
P(R)
=lm lm
dR‘P(R‘)
1
1
O
W
(89)
W
Le raisonnement qui nous a conduits à l’équation précédente ne dépend
pas de l’expression explicite de la loi de probabilité pour la longueur des
intervalles pourvu que ces derniers soient des variables indépendantes. La
résolution de (89) est rendue délicate par la présence de la fonction 8 sous
le signe d’intégration. Si l’on parvient à tirer P ( R ) de l’équation (89) on
obtiendra l’exposant de Lyapounov à l’aide de la relation
y(w) =
iw
d R P ( R ) In R
(90)
Bien entendu P dépend du paramètre w. Plutôt que de chercher une
solution complète de l’équation (89)’ il est intéressant de développer diverses
méthodes d’approximation (qui ont un champ d’application plus vaste).
Trouver yo(@) et po(S2) en l’absence de désordre, c’est-à-dire quand
les variables e,, âu lieu d’être aléatoires, sont fixées à la valeur 1. Ainsi
P ( R ) = 6(R - A) où A est la plus grande racine de l’équation à laquelle
se réduit (86)
250
X.1.4
SYSTEMES DESORDONNES
A2 - ( 2
+ w)A + 1 = O
A=1
+SU+
I
(w+ $ u 2 )
(91)
I1 en résulte que
1
PO(R)
=z
1
-
["(1-$R)]2
1
*-O
1
[1+$2+.'.]
I
2x02
O
<R <4
(92)
Nous allons considérer deux limites complémentaires. La première est
celle d'un faible désordre, la seconde celle des hautes fréquences. Si nous
faisons l'hypothèse que les variables e, fluctuent peu, nous nous attendons
à une approximation valable aux grandes longueurs d'onde, donc aux basses
fréquences, les moins sensibles au désordre local. A cet effet, introduisons le
paramètre X tel que
e,
R,
(e,) + Xz,
=A, exp (AB, + X2C, + X3D, + X4E, +
= (en)
+ A (e, - (a,))
=
. -)
(93)
de sorte que ( 2 , ) = O . Si IZ -+ 00, A, tend vers la valeur A donnée par
(C) . . ., les valeurs
l'équation (91). Avec ces définitions et en notant (B),
moyennes de B,, C,, . . ., on a
y ( w ) = yo(w)
+ x ( B )+ X2 ( C )+ ...
(94)
On posera à la fin des calculs X = 1. Substituons l'expression (93) (avec A,
remplacé par A ) dans l'équation (86). En utilisant (91)' on obtient
A2 [exp (AB, + X2C,
+ ...) - 11 =
X ( A - 1)2z, - [exp - (ABnw1
+ X2CnW1
+.
.) - 11 (95)
Identifiant les puissances successives de A, on déduit les relations de récurrence suivantes
..
qui montrent l'utilité des développements lorsque A - 1 est très petit, c'està-dire w lui-même petit. Posons
X.1.4
251
SYSTEMES DESORDONNES
y=-
A-1
A+lZ
(97)
On a alors
(i) Obtenir les équations (98).
(ii) Montrer que si l’on écrit
où les termes suivants impliquent des produits de deux moyennes de puissances
de la variable aléatoire y ou plus.
(iii) Vérifier que les termes les plus singuliers en A - 1 dans les contributions du cinquième et sixième ordre sont
3
( F ) =(Y2)
A2 - 1
(G)
+...
(Y3)
(A2 - i)2
(Y3y
+ .. .
Nous tirons de ces expressions le comportement de y(w) pour w tendant
vers zéro. Comme
A - l = w z 1+
$
~
+
6
~ 92
+...
(103)
nous avons jusqu’à l’ordre w2 inclus
y(w) = W ; -
+&w2
+
[16 (2’) - 8 (z4) + 24 ( z 2 ) > +
” 24 ( z 2 ) (z3) - 15
iw
(2’)
- &wa
[16 - 16 (z3) 15 (z’)’]
+O(ua) (104)
252
X.1.4
SYSTEMES DESORDONNES
Spécialisons maintenant ces expressions au cas d’une distribution poissonnienne, et posons X = 1. On a dans ce cas
(2)
=1
(z3) = 2
(z4) = 9
...
Par prolongement analytique
Re?(-R - iE) = i R
1
Imy(-R - i&)
+ AR2+ O p 3 )
+o ( R ~ )
(106)
La correction dominante à la densité spectrale moyenne est donc
Cette méthode systématique permet théoriquement de calculer des
termes d’ordre plus élevés dans le développement de p(R). La comparaison
entre (107) et (92) est instructive. Dans les deux cas, le terme dominant est
la densité de niveaux du laplacien dans le continu. La première correction
est de signe opposé et seize fois plus petite dans le cas d’un réseau aléatoire.
Ainsi, même à une dimension, le spectre d’un réseau aléatoire fournit une
bien meilleure approximation du spectre continu à basse fréquence que celui
du réseau régulier.
Les équations (104) et (106) mettent aussi en lumière un phénomène
nouveau et intéressant. Dans le cas d’un réseau régulier, le prolongement
analytique y(-R - iE) est imaginaire pur lorsque E tend vers zéro pour des
valeurs de R positives. Dans le cas d’un réseau aléatoire, il apparaît aussi
une partie réelle positive. Cette quantité s’interprète naturellement comme
l’inverse d’une longueur de localisation finie. Ainsi, avec une probabilité
unité, lorsque R appartient au spectre, les fonctions propres sont non
seulement oscillantes mais décroissent exponentiellement. Le comportement
de cette longueur de localisation à R faible est de la forme
8
L(R) = R -
+ + O(R)
Naturellement L(R) devient infini lorsque R t O. Ceci exprime que la
localisation disparaît à la limite continue.
L’expression de la longueur de localisation nous donne une règle empirique pour trouver le domaine de validité de l’approximation de faible
désordre. Cette dernière a un sens pourvu que la longueur de localisation
soit grande devant la distance moyenne (e,) entre les points. Remarquons
enfin que les intervalles e, pouvant être aléatoirement petits, le spectre n’est
pas borné.
X.1.4
253
SYSTEMES DESORDONNES
Pour les hautes fréquences, nous avons besoin d’une méthode différente.
La discussion précédente suggère que lorsque s1 tend vers l’infini, les états
sont fortement localisés, de sorte que l’exposant y est déterminé par de petits
groupes de sites. Pour w grand, traduisons cette propriété en tronquant le
développement de R, en fraction continue, développement qu’on obtient à
partir de l’équation (86),
1
R, = 2 + we, 2
+ wen-l
-
(109)
1
2
+ wen-l - . . .
Nous factorisons 2 +we, et prenons la moyenne de In R, sur la distribution
de Poisson. Si y = 0.57722.. . désigne la constante d’Euler, nous obtenons
(142 +we)) = In2
+
Le)
-
(2
In !jw- y
+ - - - (”*+’
w
2.2!
w
(2)3-...](110)
3.3! w
Posons
C = e7 = 1.78107.et observons que pour p 2 1
On obtient ainsi
Le dernier terme, qui est le premier où apparaît la distribution de trois
intervalles successifs, est d’ordre (In w ) ~ / et
w~
négligeable dans un calcul à
l’ordre w - ~Nous
. trouvons donc dans la limite des hautes fréquences
w
2
w
+ 1)
c + -w (in 2c
-1
W2 [(in % - il2+ r] - 41 + û
y(w)=ln
-
où la constante 77 est donnée par
( [el3)
254
SYSTEMES DESORDONNES
M
..
17 =
1
Nous concluons que pour R
I d
T dR
p ( ~ =) --Imy(-R
1
477n2(n + 1 ) 2
-+
cc
-
- ic)
= 0.13070..
a-00
-&
2
4
R2
R3
[
R
]+
- + - In - -
2c
[(in&-1)2+17-4-~2
1
+...
(115)
Les logarithmes apparaissant dans ces expressions sont dus à ce que la
distribution de probabilités p(C) a une limite finie à l’origine. Pour R grand,
la longueur de localisation tend vers zéro comme l / In R, justifiant ainsi la
méthode. Au prix de calculs plus lourds, on peut obtenir d’autres termes
dans ce développement asymptotique.
Nous comparons les résultats ci-dessus à ceux d’une simulation numérique sur la figure 2. Observons que le comportement de p ( 0 ) en 2/R2 à
l’infini est en accord avec le fait que p(R) soit intégrable.
(i) Nous n’avons pas utilisé toute l’information contenue dans (89). On
peut en fait extraire de cette dernière une solution analytique. A cet effet,
posons
P(R)dR = p(x)dx
R = l + C l
2 2 0
(116)
Utilisant cette notation, nous avons
wx2p(x) =
1-
1
(117)
Sup(0,z-1)
1-
et
d x p(x) = 1
Pour x dans l’intervalle (0,l) on a ainsi
1
012<1
P(X) =
1
exp - wx
où a est une constante positive déterminée par la condition de normalisation
(118)
(119)
X.1.4
SYSTEMES DESORDONNES
255
Figure 2 : ( a ) Comparaison des développements à SZ petit ou grand
(courbes continues) avec les données d’une simulation numérique (pointillés)
pour la densité d’états intégrée. ( b ) Comparaison analogue pour l’inverse
de la longueur de corrélation. ( c ) La densité d’états dans le continu (ligne
continue), sur un réseau régulier (line brisée) et sur un réseau aléatoire (ligne
pointillée).
Pour obtenir p(x) lorsque x
définie par la relation
2 1, nous substituons à
p(x) la fonction q(x)
256
X.1.4
SYSTEMES DESORDONNES
Ainsi q(z) vaut 1 pour O
intégro-différentielle
5
I
<
1 et est en général solution de l’équation
qui montre que q(z) est déterminée dans l’intervalle n
valeurs sur O 5 I < n. Précisément on a
5
I
< n + 1 par
ses
La fonction q(z) est donc positive et décroissante. Elle se comporte comme
/r(z)à l’infini. De plus
wl-x
n=l
Déduire l’expression y ( w ) et retrouver son développement à haute fréquence.
Exprimer la solution de l’équation (122) en utilisant une transformée de
Laplace.
(ii) Obtenir les résultats précédents par la méthode des répliques.
2. Gaz bidimensionnel d’électrons en présence d’un
champ magnétique
2.1 Niveaux de Landau
-
L’effet Hall quantique
Nous allons illustrer l’utilisation des variables anticommutantes sur un
exemple inspiré de l’effet Hall quantique. Cet effet correspond à l’existence
de plateaux dans la conductivité Hall en fonction d’un fort champ magnétique à température suffisamment basse. Expérimentalement, les électrons sont piégés dans une couche bidimensionnelle. La quantification de
la conductivité Hall s’accompagne d’une chute brutale de la résistance longitudinale (ou de la conductance comme on le verra), les effets dissipatifs
disparaissant au centre des plateaux.
Rappelons quelques résultats élémentaires relatifs à un gaz d’électrons
(charge e, masse m ) sans interactions, contraints à se déplacer dans le
plan (x,y)en présence d’un champ magnétique transverse B. Les niveaux
d’énergie sont quantifiés et fortement dégénérés (Landau). Choisissons un
potentiel vecteur de la forme
choix de jauge dit symétrique. Le hamiltonien s’écrit
x.2.1
Ho = -(p
1
2m
257
SYSTEMES DESORDONNES
- eA)’ = --”
2m
[(a, + $.y>
+ (a,
-~
’1
B x ) (126)
Convenons pour simplifier que la charge soit positive et introduisons des
variables X et Y sans dimension
(127a)
Remplaçons la donnée du champ magnétique par celle de la fréquence de
Larmor
w=-
eB
2m
(127b)
Le hamiltonien prend alors la forme
=hw
[(-a + $) (à + $ 2 ) + +]
où 1,011 a introduit une notation complexe
a- = - a
a=- a
z=X+iY
az
az
Les opérateurs
vérifient les relations de commutation bosoniques
[a,at] = 1
(131)
e = O, 1,2’.. .
(132)
[a,a] = [ U t ’ a+] = O
En conséquence, le spectre de Landau s’écrit
Et = hw
(e+ a)
A la limite thermodynamique ce spectre est infiniment dégénéré, l’espace
propre associé à l’énergie Et étant engendré par les fonctions d’onde
I , m = 0 , 1 , 2,...
Les fonctions d’onde du niveau fondamental vérifient
(133)
258
SYSTEMES DESORDONNES
x.2.1
et on a une base orthonormale de solutions qui s’écrit
zrn
e-t~/2
= --
m = O, 1’2,. . *
Jmr&
(134)
Ces fonctions engendrent l’espace de Bargmann-Fock de fonctions entières
après factorisation de e - i Z Z / f i G u0,o (cf chapitre II). Nous absorbons ce
facteur dans la définition de la mesure de sorte que
d2z
dp(z) = -e-’’
(135)
7r
où d2z = dRe z dIm z .
(i) Donner l’expression explicite des fonctions
définies par l’équation
(133).
(ii) Examiner la signification du nombre quantique m. Quelles sont
les conséquences de l’invariance par translation et par rotation? On tiendra
compte des changements de jauge correspondants.
~
à une distribution de
(iii) Montrer que pour m grand, U O , correspond
probabilité concentrée dans une couronne de largeur A(?) E f i autour du
rayon moyen r2 = m
1e-(~2-m)2/2m
e-r’T2m
Iu0,m12 =
~
am!
N
m-oo
a
&GE
(136)
En déduire que le nombre d’états du niveau fondamental, dans un disque
circulaire d’aire A = a R 2 ,est donné asymptotiquement par le rapport du flux
B A au quantum de flux cpo = h / e
N = -e B A
2ah
(137)
si on revient aux unités de départ. Ce résultat est en fait indépendant du choix
de la base et de la forme du contour pour N grand. Son interprétation est claire.
Le flux magnétique à travers l’aire A multiplié par la charge électrique est le
produit de N par la constante de Planck h. De manière équivalente, 2 a N est
l’augmentation (1/2n) $(e/fL)A. d x de la phase de la fonction d’onde quand
on parcourt la frontière de l’échantillon. Montrer que ces résultats s’étendent
au cas des niveaux excités.
Le point important est la dégénérescence macroscopique des niveaux
de Landau en l’absence d’interactions, dès que la longueur caractéristique
x.2.1
259
SYSTEMES DESORDONNES
d%/eB (qui est la racine carrée de l'aire associée au flux élémentaire 90)est
petite devant la taille du système (c'est-à-dire quand N donné par l'équation
(137) est grand). Cette dégénérescence donne lieu à des effets non triviaux.
Considérons une situation idéale où nous négligeons toute interaction
des électrons entre eux et avec le substrat. Nous ignorons également les contributions des spins électroniques que l'on suppose alignés le long du champ
magnétique intense. Enfin, nous supposons le mouvement confiné dans un
plan. Introduisons un champ électrique infinitésimal E parallèlement à ce
plan (donc orthogonal au champ magnétique B ) . Classiquement, ce champ
peut être compensé par un mouvement uniforme du gaz d'électrons à une
vitesse v choisie de manière à annuler la force de Lorentz e ( E v A B ) .
Cet effet purement cinématique est indépendant de la charge. La vitesse
correspondant e
+
v=-
EAB
B2
engendre un courant de Hall donné par
j H = env =
en
-E
B2
AB
(139)
où n est la densité (superficielle) de charge. Ce courant ne donne lieu à
aucun effet dissipatif (jH.E = O). En notation matricielle
où ZH est la matrice de conductivité (ici antidiagonale)
Nous ajoutons un terme ohmique phénoménologique diagonal a 0 pour tenir
compte des impuretés et des interactions. La matrice de conductivité totale
est donc
et son inverse, la résistivité, s'écrit
Dans la limite où a 0 est négligeable, nous avons un paradoxe apparent : ozz
et pzz tendent simultanément vers zéro.
Considérons le cas où le potentiel chimique est situé entre deux niveaux
de Landau, ce qui signifie que les niveaux de nombre quantique C = O, 1,
260
x.2.1
SYSTEMES DESORDONNES
. . ., L sont totalement remplis et les autres sont vides. D’après l’équation
(137)’ la densité électronique est
eB
n = -(L
2nfi
+ 1)
I1 s’ensuit que la constante de Hall, le terme antidiagonal
quantifié selon
(144)
OH
=
gZy,est
Soit 5 la section transverse de l’échantillon, et I le courant longitudinal total.
En ignorant les effets de bord, la densité de courant est j = I / < ,tandis que si
VHest la différence de potentiel transverse, le champ électrique E = v H / [ .
Finalement, indépendamment de la géométrie et de tout autre paramètre
Ces valeurs sont les plateaux de l’effet Hall quantique (entier). En fait on
observe aussi d’autres plateaux pour des valeurs fractionnaires du nombre
d’occupation des niveaux de Landau et on pense qu’ils sont dus aux
interactions entre les électrons.
L’effet Hall quantique, manifestation spectaculaire de la mécanique
quantique à l’échelle macroscopique, tire une partie de son importance du
fait qu’il implique des constantes fondamentales et peut permettre une
détermination extrêmement précise de ces dernières. Ceci tient à ce que
l’on observe que les valeurs (146) ne sont pas modifiées par la présence
d’impuretés variées ou par l’effet d’une température finie mais faible, et
sont mesurées avec une étonnante précision. La description ci-dessus est bien
sûr quelque peu caricaturale. Naïvement, on pourrait penser qu’un certain
nombre d’états sont localisés par différentes sortes de défauts - impuretés ... - et donc ne contribuent pas à la conductivité. Des arguments
de topologie et d’invariance de jauge montrent que le domaine de validité
de (146) s’étend au-delà du cas idéal et s’applique aux situations réelles
moyennant certaines hypothèses (cf appendice -4).Cependant, la largeur
des plateaus dépend des conditions expérimentales et une théorie complète
doit pouvoir aussi expliquer le comportement observé.
Nous étudierons ici seulement l’effet des impuretés sur la densité d’état
(Wegner 1983). I1 apparaît que le problème admet une solution analytique
intéressante.
2.2 Spectre à une particule en présence d’impuretés
Cherchons à décrire l’effet des impuretés sur les niveaux de Landau.
En pratique, nous nous limiterons au cas du niveau fondamental C = O, et à
x.2.2
261
SYSTEMES DESORDONNES
celui d’un champ magnétique suffisamment intense, pour pouvoir ignorer les
excitations, l’écart fLw entre les niveaux étant supposé beaucoup plus grand
que les perturbations considérées. On prendra pour modèle des impuretés
un potentiel aléatoire V(x) ajouté au hamiltonien (126). En utilisant les
unités réduites définies en (127)’ nous écrivons
H=Ho+V
(147)
On suppose les corrélations du potentiel à courte portée et même, à la
limite, de portée négligeable. L’origine des énergies est choisie en général en
demandant que
bien que, dans certains cas, il soit plus commode d’ignorer cette condition.
Notre hypothèse de localité sur les corrélations se traduit sur la fonctionnelle
caractéristique par l’expression
(exp -i
1
d 2 x a ( x ) V ( x ) ) = exp
1
d2zg(cu(x))
(149)
La fonction g ( a ) s’interprète comme la transformée de Fourier de la distribution de potentiel en un site
expg(a) =
1
dVP(V)eëiav
Ainsi un bruit gaussien correspond à
(i) Un modèle poissonnien d’impuretés aléatoires est décrit par une
densité uniforme p de centres diffuseurs de portée nulle (Friedberg et Luttinger,
1975). La densité de probabilité de trouver N centres aux points XI, . . ., X N
dans un domaine d’aire A est donnée par
l‘(xi,. . . , X N ) = eëPdpN/N!
Le potentiel d’intensité X s’écrit
N
V(x) = x
S(X
i=l
Montrer qu’il en résulte que
- Xi)
(153)
262
x.2.2
SYSTEMES DESORDONNES
(ii) Une distribution lorentzienne de potentiel
X
P ( V )= -
I
7r (V2
+ X2)
correspond à une fonction g non analytique
Comme précédemment, nous obtenons la densité spectrale moyenne par
unité de surface à l’aide de la résolvante
Cette résolvante est représentée par une intégrale fonctionnelle sur un champ
complexe cp selon
zJD(cpp)cp(x’)p(x’)expiJdZxp(E+io1
H)cp (158)
où le facteur de normalisation s’écrit
2=
J
D(cpp)expi
J
d 2 x p ( E+ io - H)cp
(159)
Ces notations abrégées anticipent sur le fait que l’action effective est l’intégrale d’une densité locale. Dans la suite, la partie imaginaire infinitésimale
de l’énergie sera sous-entendue. Elle est en accord avec le choix de signe
dans l’exponentielle. Au lieu d’utiliser la méthode des répliques pour effectuer la moyenne sur le désordre, nous exposerons une autre méthode qui
paraît plus satisfaisante mathématiquement. A cet effet, nous représentons
2-l’ qui n’est autre que d et ( E - H ) , par une intégrale fonctionnelle sur un
champ fermionique complexe auxiliaire ($,
4)
2-’ = det(E - H ) = /D($q)expi/d’x$(E
-
H)$
(160)
On peut interpréter l’introduction de telles variables fermioniques en notant
qu’un tel champ complexe est équivalent à la soustraction de deux degrés
de liberté bosoniques.
En conséquence
x.2.2
263
SYSTEMES DESORDONNES
Sous cette forme, nous pouvons calculer la moyenne sur V grâce à l’équation (149) en choisissant a(x) = p(x>cp(x) $ ( x ) $ ( x ) . Cependant avant
d’effectuer cette opération, nous introduisons l’approximation qui consiste
à négliger les transitions induites par le potentiel entre niveaux de Landau distincts. Ainsi dans l’intégrale (161)’ les seuls états qui contribuent
correspondent au niveau fondamental. Cela revient à n’intégrer que sur les
champs ‘p et vérifiant les conditions
+
+
Ainsi
c p = e -1~ ”- u ( z )
+ = e-;Zz
v(z)
(163)
où u (bosonique) et v (fermionique) sont holomorphes en z (fi et fi sont
antiholomorphes). Nous n’avons pas inclus de facteur T - ~ dans
/ ~ (163) pour
préserver la symétrie entre les intégrales bosoniques et fermioniques. Le
jacobien correspondant à ce choix de base vaut l’unité car les contributions
des bosons compensent celles des fermions. Après moyenne sur V , nous
obtenons donc
où l’action S s’écrit
S=
I
d2zeëZZ{i&(fiu + fiv)
+ y(e-”(fiu
+Vu))}
(165)
Utiliser l’invariance par translation (accompagnée d’une transformation
de jauge) pour montrer que, dans l’approximation où on ne conserve que le
niveau de Landau fondamental, toute la dépendance spatiale de la résolvante
moyenne peut être factorisée sous la forme
264
x.2.2
SYSTEMES DESORDONNES
tandis que
est indépendant de x.
L'action S est supersymétrique. Pour le voir, introduisons outre des
coordonnées commutantes z , z,deux coordonnées 8, anticommutantes
normalisées de telle sorte que
e
J dûdëe-eë = ï / r
(168~)
afin de maintenir le parallèle avec
/d2ze-"'
(168b)
=T
Nous définissons un super-champ holomorphe 4 (et son conjugué (p antiholomorphe) comme une fonction de z et 0 qui traite u et v sur un pied
d'égalité
Ainsi
Le premier terme est invariant par les "rotations" dans le super-espace,
rotations qui contiennent aussi bien des transformations ne mélangeant pas
z et e que des transformations qui s'écrivent sous forme infinitésimale
se = zw
se = zw
sz = we
sz = ew
+
Ces transformations laissent la forme quadratique zZ û e invariante. Ici
( w , W)est considéré comme un paramètre anticommutant infinitésimal. Fait
remarquable, le deuxième terme de l'action (170) est lui aussi invariant.
Pour le voir, supposons que g(a) admette un développement en série
M
gnan
=
n=l
Notons que g(0) est nul comme conséquence de la normalisation de la loi de
probabilité du potentiel. Si on ne dispose pas d'un développement comme
x.2.2
SYSTEMES DESORDONNES
265
(172)' on approchera g ( a ) par des fonctions régulières. Nous avons ainsi une
série de termes d'interaction de la forme
Par un calcul explicite on montre qu'on a l'identité suivante
[T
/
dSd8e-0ëd;q5] - -T
n
/
dûdeeëneë(d;q5)n
(174)
Etablir la relation (174).
'Introduisons la fonction h ( a ) ,associée à g(a)par
m
h ( a )=
%Y"
n=l
n
=
JO"
(175)
où la propriété g(0) = O est cruciale pour assurer que h ( a ) est bien défini.
Avec cette notation, l'action s'écrit
qui est explicitement invariante dans les rotations du super-espace. Cette
propriété est à l'origine des simplifications spectaculaires qui vont apparaître
dans le calcul de l'intégrale fonctionnelle.
En utilisant l'invariance par translation dans le super-espace telle que
montrer que
( 4 ( z , e ) 4 ( z f , e f ) )= Cexp{zz'
+e#}
où C est la quantité, indépendante de la position, que nous voulons calculer
Noter que l'équation (177) signifie qu'on a
(177)
266
x.2.2
SYSTEMES DESORDONNES
Nous évaluerons la fonction à deux points (q5$), dans un développement perturbatif qui utilisera au mieux le formalisme supersymétrique
holomorphe. Le propagateur est l’inverse de l’opérateur apparaissant dans
la partie quadratique de l’action. Pour toute fonction super-holomorphe,
nous avons l’identité
e’) =
f(z’,
s
d2zdf3d8f(z, e) exp { z‘Z
+ 0’8 - Z Z - 6’8}
(180)
qui généralise le noyau reproducteur de l’espace de Bargmann. Nous en
déduisons que le propagateur est proportionnel à exp(z’z 0’8). Les interactions proviennent du second terme de l’action (176). Un vertex d’ordre
2n contient un facteur gaussien exp -n { Z Z e#} . Illustrons les règles de
Feynman par le calcul de la contribution à une boucle à la valeur moyenne
(4$) (figure 3).
+
+
Figure 3 : Contribution à une boucle à la valeur moyenne ($$).
Dans le cas d’un bruit blanc gaussien
g(a) = -+wd
le calcul fait apparaître
(i) le produit de trois propagateurs
( i / ~ &exp
) ~ { zf
h(a)= -awa2
(181)
+ ea + <(+ ww + <z’+ wë’}
(ii) un facteur de vertex
-rw exp -2 { <(
+ WG}
(iii) un facteur de symétrie égal à l’unité (le champ est complexe),
(iv) enfin une intégrale sur les variables et w, qui conduit à
<
(-Tw) exp { zz’
x
/
+ eë’}
d2<dwdGexp{ -(< - z ) ( f - z’)- (W - @)(a
- el)}
(182)
x.2.2
267
SYSTEMES DESORDONNES
Nous obtenons le préfacteur exponentiel attendu qui contient toute la
dépendance dans les variables externes. I1 reste à effectuer l’intégrale gaussienne sur le super-espace. Sa valeur est égale à l’unité. Cela provient d’une
compensation parfaite entre un déterminant bosonique et un déterminant
fermionique qui, en vertu de la symétrie entre les variables z et 8, sont
identiques. Ici nous retrouvons les intégrales précédentes
s
d2<exp
--<t
=
7r
s
dwdW exp -wW = 1f n
(183)
Le phénomène observé sur cet exemple se produit à tous les ordres. La
combinaison des facteurs de vertex et des propagateurs conduit à des intégrales gaussiennes sur le super-espace. I1 apparaît des termes linéaires et
,quadratiques dans l’exponentielle. Une fois le préfacteur at tendu factorisé,
il ne reste qu’une intégrale gaussienne supersymétrique qui comme précédemment, et pour les mêmes raisons, vaut l’unité. En clair, tout diagramme
donne exp(z.2 + 88’) multiplié par un facteur que l’on obtiendrait dans une
théorie à zéro dimension. La réduction dimensionnelle, d + d - 2 , est caractéristique de la supersymétrie sous-jacente dans ces questions. Elle fut
observée pour la première fois par Parisi et Sourlas dans un contexte différent (section 5).
La conclusion de cette discussion est que nous obtenons l’expression
suivante pour la moyenne de la résolvante
La quantité considérée est le quotient de deux intégrales, chacune portant
sur le plan complexe de la variable 9. Rappelons que E = E - ihw. Comme
dt exp 7r {iEt
+ h(t)}
(185)
on obtient explicitement la densité d’états sous la forme
où g ( a ) , définie par l’équation (150), représente l’effet du désordre local.
A titre d’illustration, nous allons évaluer l’expression (186) pour les
différents exemples introduits plus haut. Le lecteur vérifiera les intégrales
correspondantes. Nous réintroduisons également le facteur dimensionné
268
x.2.2
SYSTEMES DESORDONNES
eB
K=TL
qui jusqu’ici était pris égal à l’unité.
(i) Bruit blanc gaussien (figure 4)
g ( a ) = - w z1a
v=
2
K
2
p(E)= - T2
1‘
(187)
;
;
w K2
( E - ;tiw>
eV2
+ (2r-i :s
dzex2)2
I
1
1
1
I
2.0
1.0
O
1.0
2.0
-
Figure 4 : Courbe de la densité d’états normalisée p ( E ) / p ( O ) en
fonction de v dans le cas d’un bruit gaussien (équation (188)).
Le nombre total d’états est s d E p ( E ) = K 2 / 2 r . A grande énergie, p ( E )
décroît comme
en accord avec une analyse semi-classique. Au centre de la bande, v
nous avons
+
O,
qui ressemble à une gaussienne mais plus aplatie.
(ii) Distribution poissonnienne de centres diffuseurs à courte portée
(figure 5)
g ( a ) = p(eëixa - i)
21r
v = -(E
-
ihw)
XK2
K2
1
p ( E ) = -ImF(v)
F ( v ) = dv In
[l“
7rX
{
d t exp ivt - f
21r
f = - (191)
1’
$(l - e-ia)}]
x.2.2
269
SYSTEMEÇ DESORDONNES
Nous avons supposé que le paramètre A, qui décrit l’intensité du potentiel,
était positif. Le nombre f sans dimension mesure la densité d’impuretés par
unité d’aire embrassant un quantum de flux.
On observe des singularités quand f prend des valeurs entières comme
indiqué sur la figure 5 qui représente la densité d’états intégrée. Le spectre
correspond à des valeurs v > O. Quand v + O, nous trouvons
(1 - f)6(v)
1
B(f)vf-2
+ A(f)v-f + .. .
+...
+ . ..
O < f 2
(192)
Evaluer les constantes apparaissant dans les développements asymptotiques singuliers ci-dessus
O < f < l
Le phénomène le plus frappant se produit pour O < f < 1, où une
fraction 1- f des états du niveau de Landau fondamental n’est pas affectée
par la présence des centres diffuseurs. Comme le montre la figure 5, la densité
d’états présente des singularités plus faibles aux autres valeurs entières de
U.
(iii) Distribution lorentzienne (équations (155)-( 156)).
La densité d’états est, comme P ( V ) ,une lorentzienne
La discussion précédente, même si elle conduit à des résultats plutôt
intéressants concernant la densité d’états, ne fournit cependant pas d’éléments pour expliquer la robustesse des paliers de l’effet Hall quantique. Elle
ne clarifie pas non plus ce que l’on doit entendre par localisation en présence
d’un champ magnétique.
270
SYSTEMES DESORDONNES
x.3
Figure 5 : la densité d’états intégrée du modèle poissonnien pour
différentes valeurs de la densité d’impuretés f. (u) f = ( b ) f = 1 (c)
f = a2 .
3. Matrices aléatoires
Wigner, Dyson et d’autres ont suggéré de comparer le spectre de systèmes complexes comme des noyaux lourds, avec ceux de hamiltoniens
aléatoires, possédant des distributions aussi générales que possible, compte
tenu des symétries. Le principe fondamental est que ces lois soient invariantes par un groupe de transformation, tenant à la structure de l’espace
de Hilbert des états. Ce groupe est soit le groupe unitaire, soit le groupe
orthogonal réel quand on impose une condition de réalité (comme la symétrie par renversement du temps) ou bien le groupe unitaire symplectique.
x.3
271
SYSTEMES DESORDONNES
Si on introduit des hypothèses supplémentaires ad hoc comme l’indépendance statistique des éléments de matrice dans n’importe quelle base, la loi
de probabilité est déterminée à un facteur multiplicatif près. Certaines propriétés caractéristiques de ces ensembles statistiques, en particulier l’écart
entre niveaux successifs, donnent une représentation très fidèle du nombre
de spectres observés depuis ceux des atomes et noyaux jusqu’à la distribution des zéros non triviaux de la fonction zeta de Riemann. A vrai dire on
ne possède pas de bonne théorie qui explique cet accord. Ces observations
suggèrent une certaine forme d’universalité spécifique aux systèmes discrets,
dont le mécanisme n’est pas encore totalement compris.
3.1 Loi du demi-cercle
Nous entreprenons notre étude par l’exemple le plus simple. I1 concerne
des matrices hermitiennes N x N . Les éléments de matrice vérifient Hij =
H;i pour 1 5 i , j 5 N . Nous nous intéressons à la limite N 4 CO. Sous les
hypothèses mentionnées plus haut, la loi de distribution est une gaussienne
N
P ( H ) d H = cst exp - { $ p N Tr H2}
dHii
i=l
n
d ReH, d ImH,
l<i<j<N
(195)
Le préfacteur est déterminé par la normalisation. L’introduction du facteur
N dans l’exponentielle fait que la limite N + CO peut être étudiée à ,O fixé.
Ce point sera justifié plus bas. L’ensemble statistique décrit par (195) est
l’ensemble gaussien unitaire. Nous voulons analyser la distribution p(A)dA
des valeurs propres, où A est la matrice réelle, diagonale, des valeurs propres,
H étant diagonalisée à l’aide d’une matrice unitaire U
H = UtAU
(196)
Pour fixer les idées, nous supposons que U est unimodulaire; il reste
cependant encore N - 1 phases indéterminées. Pour exprimer la distribution
p(A)dA à partir de p ( H ) d H , nous développons H au voisinage d’une
matrice diagonale A en écrivant U sous la forme U = I + iSK, où SK
est une matrice infinitésimale hermitienne de trace nulle. Au premier ordre
H = A i [A, SKI . Nous introduisons cette paramétrisation dans (195) et
calculons le jacobien associé. En séparant l’intégrale sur le groupe spécial
unitaire, nous obtenons
+
p(A)dA = cst
n
l<i<j<N
r
(Xi - Xj)2exp
N
l
n
dXi
(197)
Montrer que dans le cas orthogonal réel, la distribution des valeurs
propres s’écrit
272
X.3.1
SYSTEMES DESORDONNES
tandis que pour le groupe unitaire symplectique on a
Dans tous les cas, nous nous intéressons aux propriétés asymptotiques
de ces distributions quand la taille N des matrices tend vers l'infini. Les expressions ci-dessus suggèrent une interprétation en termes d'un gaz coulombien unidimensionnel avec des interactions logarithmiques entre particules.
Définissons en général la fonction de partition
Les valeurs a = 1 , 2 , 4 correspondent respectivement au cas orthogonal
unitaire et symplectique. Le calcul de Z(a,B) donne la normalisation de
la distribution p(A)dA. Remarquons que a > O correspond à un potentiel
répulsif à courte distance.
Plutôt que d'essayer de calculer Z explicitement, nous allons obtenir
son comportement asymptotique en utilisant la méthode du col. Ordonnons
les Xi par valeurs croissantes comme indiqué en (200) et introduisons une
variable x = i/N qui prend ses valeurs en des points équidistants dans
l'intervalle [O, 11. Pour N grand, x tend vers une variable continue et
1
-
F(X.)
l<i<N
1
=JO
(
F X
-Nl<i<N
(2)
-
1
dxF(X(x)) =
s_,
+O0
d MX ) F( X)
Cette relation définit une densité p(A) de valeurs propres telle que
(201)
X.3.1
273
SYSTEMES DESORDONNES
L’action prend la forme
dX i X 2 p ( X ) - ;a
dXdX‘p(X)p(X‘) In IX - A’[
(203)
Le point stationnaire en p nous donne une approximation thermodynamique
pour Z ainsi que pour la distribution de valeurs propres. Introduisant un
multiplicateur de Lagrange pour tenir compte de la contrainte de normalisation (202)’ nous obtenons
où nous supposons que X appartient au support de p(X). La condition
de normalisation suggère que ce support est borné. Dans la suite, nous
chercherons donc une solution de ce type. En dérivant les deux membres de
l’équation (204) par rapport à X nous obtenons
où le signe devant l’intégrale signifie qu’il faut prendre une partie principale
et où X appartient toujours au support de p . I1 est commode d’introduire
une fonction F ( z ) analytique hors de ce support et se comportant comme
z-l à l’infini
D’après l’équation (205)’ quand z tend vers X appartenant au support de
p avec une partie imaginaire infinitésimale positive, F ( X io) tend vers
2X/Xi - irp(X), tandis que, hors du support de p , F(X)est réel. I1 est clair
que ImF(z) < O pour Imz > O. Les ensembles statistiques considérés sont
invariants dans la symétrie H c) - H , de telle sorte que p(X) = p(-A).
I1 existe alors une seule fonction vérifiant toutes les propriétés ci-dessus,
analytique dans un plan coupé le long du segment [-A,, XO]; elle s’écrit
+
F(z)=
2
z
+
J
q
=
2[.- J 3 - q
Ag
(207)
La distribution asymptotique cherchée, de support [-Xo, Xo], est alors
’/ ;
p(X) = - 1 - TAO
274
X.3.1
SYSTEMES DESORDONNES
Elle ne dépend que du rapport alp. Dans une échelle bien choisie, elle est
indépendante de l’ensemble statistique considéré, qu’il s’agisse des valeurs
a = 1, 2 ou 4. Le choix du facteur N dans le poids de Boltzmann initial
avait pour objet de conduire à cette loi limite, appelée loi du demi-cercle
de Wigner pour des raisons évidentes. On a en effet
(i) Vérifier que la distribution (208) est bien normalisée.
(ii) Montrer que l’équation du col (204) est vérifiée et calculer Z(a,B).
Partant de l’équation (205) et intégrant dans l’intervalle [-Xo, XO] on obtient
l’équation (204) avec une constante donnée par
<
où $(x) est la dérivée logarithmique de la fonction r(z) d’Euler
00
n=O
n+x
4)= -y+2 In 3
y étant la constante d’Euler. I1 s’ensuit que $(2) = 1-y et $J(
Ainsi
<=In(%)
Si on néglige les fluctuations autour du col, la fonction de partition vaut donc
3.2 Méthode fermionique
Reprenons la discussion précédente et montrons encore une fois qu’on
peut utiliser des variables anticommutantes de manière efficace, conformément au thème général de ce chapitre. Nous considérons comme précédemment la moyenne de la résolvante ( z - H ) - l pour l’ensemble unitaire ( a = 2,
X i = 4/p). Posons
X.3.2
275
SYSTEMES DESORDONNES
(2iia)
La structure du membre de droite résulte de l’invariance par transformation
unitaire. Ainsi N F ( z ) est la valeur moyenne de la trace, ce qui s’exprime
comme
1
(211b)
+io)
nPour Imz > O, nous écrivons F ( z ) comme la valeur moyenne du propagateur
d’un champ scalaire libre complexe à N composantes (y,Cp). Le dénominateur associé est représenté par une intégrale de Grassmann sur un champ
fermionique lui aussi à N composantes (+,q). En conséquence
p(X) = --ImF(X
(P. cp (exp i
{a.- H)cp + $(z - W $ } )
D’après l’équation (197)’ dans l’ensemble unitaire gaussien nous avons
1
(exp-iTr(HK)) = exp--TrK2
2PN
Nous appliquons cette identité à la matrice
en sorte que
1
--
2PN
[(cp. d2- ( 4 .+I2 + 2 ( 4 . cp)(Cp.
$11)
I1 est commode d’introduire une représentation du terme quartique
qui permet d’effectuer l’intégrale fermionique sous la forme
(214)
276
SYSTEMES DESORDONNES
X.3.2
et
det M = ( p - iz)N-l
On obtient ainsi l'expression suivante
iz p . 'p - $ - ( p a1
PN
Passons en coordonnées polaires pour les variables
angulaire
~
'p
p -) i ,~ B N p 2 }
(215)
et utilisons l'intégrale
Nous en tirons la représentation suivante, valable pour tout N , en termes
d'une intégrale double
(.-> S_, d p l m duuN(p iz)N-l
- iz + L)exp {izu
1
BN
F ( z ) = -3
2i P N
+m
(p
-
- sj?;y;v2-
;PNp'}
(217)
Une des deux intégrales peut être effectuée sous forme fermée. Nous nous
contenterons d'observer que pour N + CO, on peut utiliser la méthode du
col. Nous laissons au lecteur le soin de vérifier que l'on obtient
qui coïncide avec le résultat (207) pour a = 2 et A i = 4/P. La méthode
fermionique présente l'avantage de donner accès aux corrections à la méthode du col et en particulier d'examiner les queues exponentielles dans la
distribution des niveaux.
X.3.2
277
SYSTEMES DESORDONNES
(i) Obtenir les queues exponentielles de la distribution des niveaux.
(ii) En utilisant la méthode fermionique, trouver la valeur asymptotique
de
3.3 Espacements des niveaux
La loi du demi-cercle ne décrit pas la plupart des spectres de manière
réaliste. En revanche la distribution des écarts entre niveaux prédite par
les ensembles gaussiens semble avoir un domaine de validité beaucoup plus
large. Nous n’examinerons en détail que le cas unitaire, les deux autres étant
laissés en exercice au lecteur.
Reprenons la loi de probabilité des niveaux ( a = 2)
L’échelle a été choisie de telle sorte que, à /3 fixé, les niveaux restent
dans un intervalle fixé quand N + CO, avec une probabilité unité. En
conséquence l’écart entre les niveaux est d’ordre N-’ . Si nous voulons que
cette distribution ait une moyenne fixée (indépendante de N ) , nous devons
multiplier les niveaux par un facteur N .
Soit x(X) la fonction caractéristique de l’intervalle [XO, X i ]
Ainsi, 1- x est la fonction caractéristique du complémentaire de l’intervalle
[Ao, Xi]. La quantité
E(Ao, X i ) =
1n
[dXj(l - x(Xj)]p(Xi . . . , X , N )
(221)
iLj<N
est la probabilité de ne trouver aucun niveau dans l’intervalle [A, XI].
combinaison linéaire
La
278
x.3.3
SYSTEMES DESORDONNES
donne la probabilité de ne trouver aucun niveau entre A0 et A1 sachant qu'il
y en a au moins un dans [A, - ~ A o A,,] ainsi que dans [Al, A 1 6x11. Dans
la limite où 6x0 et 6x1 tendent simultanément vers zéro, on aura, avec une
probabilité unité, au moins un niveau en A0 et au moins un en A l . Supposons
que, dans des unités appropriées, E(Ao,A1) ne dépende que de Al - A0 et
non de la demi-somme + ( A 0 A i ) lorsque N + m. On peut alors prendre
ce point $(A0
A l ) au centre du spectre pour simplifier. Nous voyons que
+
+
+
A2
est la probabilité de trouver deux niveaux successifs à la distance A1 - Ao.
Le point important est qu'il s'agit de niveaux successifs. En effet, on peut
également étudier la distribution de probabilité de deux niveaux quelconques
et il est probable que son comportement à courte distance coïncide avec celui
de l'écart entre niveaux successifs. Toutefois les deux quantités ne sont pas
reliées à grande distance.
Pour calculer E(A0, Ai), nous utilisons à nouveau une analogie entre
la loi de probabilité (219) et un gaz de fermions à une dimension dans un
potentiel harmonique. Soulignons que ces fermions ne sont pas reliés à ceux
qui apparaissaient dans la section précédente (3.2). En fait p(A1'.. . ,)A,
est le carré du module d'une fonction d'onde antisymétrique
où n/-' est une constante de normalisation. La fonction d'onde .JI est un
déterminant de Slater obtenu à partir des N premières fonctions propres
d'un oscillateur harmonique. Celles-ci vérifient
a=-
Donc
Jz
' (&A+--
a)
' ")
(224)
x.3.3
SYSTEMES DESORDONNES
279
Ainsi nous trouvons
En conséquence p(X1, .. . , A N ) est donnée par
et vérifie la condition de normalisation souhaitée
Retrouver la fonction de partition Z ( a = 2 , p ) en utilisant l'expression
ci-dessus.
Passons au calcul de E ( X 0 , X l ) . Comme (1 - x ( X ) ) ~ = 1 - x(X), si on
pose
E(Xo,Xi) =
/n
1
d X j z ldetd(h)12
l<j<N
En développant le déterminant et en effectuant l'intégration, on trouve
280
SYSTEMES DESORDONNES
x.3.3
Gaudin a remarqué que si on restreint le noyau de Darboux-Christoffel
à l’intervalle [A, A l ] , et si on considère ses N valeurs propres E et vecteurs
propres cp dans le sous-espace engendré par les fonctions +j(A), l’équation
aux vecteurs propres
(233~)
peut être récrite
(233b)
où l’on a posé cp = CO<j<N-l
cpj$j(A). L’équation caractéristique est alors
_ _
et E(Xo,A,) s’exprime en fonction des valeurs propres
produit
E(AO’A1)
(1 - 5s)
=
Es sous la forme d’un
(235)
l<s<N
Nous cherchons donc la valeur asymptotique du noyau ICN(X,A’) quand
N est grand. On l’obtient en utilisant une approximation semi-classique
pour les fonctions +j(A). Nous nous restreignons à un domaine de largeur
1/N autour de l’origine et rappelons que K = $,BN est d’ordre N . Dans
l’équation vérifiée par +N (A)
nous pouvons négliger K2A2 (d’ordre l) comparé à K ( 2 N + l) (d’ordre N 2 ) .
Ainsi, pour A(2NK)+fini et N
03, nous trouvons que
-f
x.3.3
281
SYSTEMES DESORDONNES
On peut facilement calculer + N ( O ) et +h(O)à partir des définitions (225).
Pour N impair, d m + N + 1 ( 0 ) - f i + N - 1 ( 0 ) = O et
En reportant ces valeurs dans la définition (232)’ on trouve le développement
asymptotique de K N valable près de l’origine
K:N(X’X’)
-
sin [ ( ~ N K ) +-( xXI)]
N-03
7T(X
- A‘)
(238)
D’après l’équation (208)’ la densité de niveaux au centre de la distribution
est p(0) = 2/7rX0 où
= 4//3 = 4N/PN. En conséquence
où D est l’espacement moyen entre deux niveaux consécutifs. Nous pouvons
ainsi récrire la forme asymptotique du noyau K , fonction de X - A’
1 sin [T(X - X‘/D)]
K(X,X‘) = -
D (A.[
- X’/D)]
On choisit désormais D comme unité en posant
X=DX
(241)
Notons p(x) les fonctions propres de K: dans un intervalle - k t 5 x 5 ft
( t > O). Nous avons ainsi l’équation aux valeurs propres
Le noyau est pair, ce qui entraîne que l’on peut décomposer les fonctions
propres en fonctions paires ‘p(f)(z) et impaires cpf-)(z). Dans les deux cas,
avec E = f l
L’identité
282
x.3.3
SYSTEMES DESORDONNES
sin a(x
+ 2’)
+
exp 2i7rxx”lt
exp 2iax”x’lt
di
Jz
(244)
+
montre que le noyau sin a ( x x’)/a(x x‘) est le carré du noyau exponentiel
t - 3 exp 2inxx‘lt dans l’intervalle
5 x 5 f t . Nous pouvons donc prendre
pour p(€)(x) un vecteur propre de ce noyau exponentiel correspondant aux
valeurs propres &y(+) ou iJzy(-)
-it
Nous avons la relation
Par un changement de variable,
x = fty
<P(*)(Z)
= F‘*)(y)
(247)
le système ci-dessus s’écrit
et
(249)
s=l
E ( t ) =E(+)(tp4-1 ( t )
Les y sont également des fonctions de t. Ce paramètre est l’écart entre les
valeurs propres (de la matrice aléatoire originelle) en unités relatives. Dans
ces unités, la relation (222) entre E ( t ) et q ( t ) reste valable. Les équations aux
valeurs propres (248) apparaissent dans d’autres contextes, en particulier en
théorie de la communication.
Pour résumer, dans le système d’unités défini par 2 = X/D, avec le
noyau lCt(a:,x‘) = sinn(a: - x‘)/n(a: - a:’) restreint à l’intervalle
nous avons
[-it,it],
x.3.3
283
SYSTEMES DESORDONNES
E ( t ) = det(1 - l c t ) = exp -
OÛ
TrKt
7
1
q(t)
(250)
d2E(t)
=
7
Pour t petit, nous pouvons développer T r K t en puissances de t , le terme
dominant étant t n ,
Ainsi
E ( t ) =1- t
+ k7r2t4 - k7r4t6 + &7rV + O(t'0)
+
q ( t ) =$(7rt)2 - & , r t ) 4 &(7rt)û
+ O(P)
(252)
Le comportement de q ( t ) en t2 pour t petit reflète la présence du facteur
répulsif à courte distance pour les valeurs propres, comme le montre la loi
de probabilité (219). La convergence du développement (252) est limitée par
le premier zéro du détermina.nt E ( t ) .
(i) Le résultat correspondant pour l'ensemble gaussien orthogonal est
donné par E ( + ) @ )(équation (249)) avec le développement
Notons que comme prévu, q ( + ) ( t ) est linéaire a t petit.
(ii) Montrer que pour t
-+
00
et trouver les préfacteurs.
La compréhension des propriétés d'universalité de la loi des écarts est
un problème ouvert. De même on ne sait pas s'il existe des systèmes qui
présentent des déviations intéressantes.
284
SYSTEMES DESORDONNES
x.4
4. Approximation planaire
L’étude des ensembles gaussiens de matrices aléatoires est un cas
particulier des théories des champs à valeurs dans un ensemble de matrices,
lorsque la taille N des matrices croît indéfiniment. Par analogie avec le
modèle vectoriel à n composantes dans la limite n grand, on s’attend a
priori à des simplifications significatives dans la limite N -t m. Cette idée
est due à t’Hooft (1974) dans le contexte des théories de jauge. La discussion
de ces simplifications montre que l’on est amené à considérer un nouveau
développement perturbatif, de nature topologique, dont le terme dominant
est donné par la resommation de tous les graphes de Feynmann qu’on peut
dessiner sur un plan (ou sur une sphère par compactification). Ceci justifie
le terme d’approximation planaire. Bien que ce sujet semble assez éloigné
de celui de ce chapitre, il constitue une extension naturelle des méthodes
utilisées pour les ensembles gaussiens, et il conduit à une évaluation du
nombre de triangulations aléatoires des surfaces, établissant par ce biais un
lien avec un autre aspect de l’étude des systèmes désordonnés (cf chapitre
XI). Nous nous limiterons à des considérations en basse dimension, ce qui
permet de montrer les phénomènes intéressants et de résoudre quelques
problèmes d’analyse combinatoire.
4.1 Analyse combinatoire
Considérons un champ scalaire matriciel noté M ( x ) . I1 s’agit d’une
matrice N x N hermitienne. Un lagrangien invariant par l’action adjointe
du groupe unitaire S U ( N ) s’écrit sous la forme
L = i Tr 8, M a , M
+ i Tr M 2 +
g p N 1 - i PTr M p
(255)
P
Nous justifierons plus tard le choix du facteur N 1 - i p pour le couplage
d’ordre p. Montrons que, à constantes de couplage fixées, seuls les graphes
planaires survivent dans le développement perturbatif à la limite N -+ cm.
Ici la partie importante des règles de Feynman est celle qui reflète la nature
matricielle du champ. Les autres éléments sont familiers : propagateurs,
intégrales, . . .. I1 est commode de représenter les propagateurs du champ
M par des lignes doubles avec des orientations opposées, associées à chaque
indice. Etudions la dépendance en N d’un graphe ayant P propagateurs et
V p vertex de type p V = & c p V p ) . Pour simplifier, nous ne considérons
que des graphes connexes vide-vide. Si on compte chaque propagateur deux
fois, on compte p fois chaque vertex, donc
(
2P = cpvp
(256)
31P
De plus, chacune des B boucles internes peut être considérée comme une
face d’une surface polyédrale orientée. En recollant ces faces le long des
X.4.1
SYSTEMES DESORDONNES
285
propagateurs, on obtient une surface fermée, connexe, orientable qui vérifie
la formule d’Euler
x = 2 - 2H = V - P + B
(257)
où x est la caractéristique d’Euler et H dénote ici le genre (pour éviter
toute confusion avec les constantes de couplage g p ) . Après sommation sur
les indices internes, chaque boucle produit un facteur N , de telle sorte que,
outre les facteurs usuels, la contribution d’un graphe contient le produit
II
3
( g p ~ l - : ~ ) v I ’NB =
I
Igp
(35p
9
)
~ 2 - 2 H
(258)
A la limite N m, la contribution dominante à l’énergie libre (la fonctionnelle génératrice des diagrammes vide-vide connexes) provient des graphes
tracés sur une surface de genre nul (x= 2, H = O ) , c’est-à-dire des graphes
planaires. Les corrections d’ordre N P 2 proviennent des graphes tracés sur
un tore etc... Le raisonnement ci-dessus peut être généralisé au cas où des
sources sont présentes à condition qu’elles soient affectées de puissances de
N convenables.
Nous posons
--f
1
E ( g ) = - lim -F(g) = - lim Z N ( g )
(259)
N-CC N 2
N-CC
A titre d’exemple, limitons-nous à une théorie en ‘p4 (94 g), et énumérons
les poids associés aux premiers graphes planaires, jusqu’à l’ordre g 3
Etendre les considérations précédentes a u lagrangien quartique
C = T r û p A ll a p M i + T r M M t
+ <YSTrMMtlL.ln/lt
2N
(261~)
avec
a=1
cy
=2
a =4
All orthogonale réelle
hf hermitienne
A4 complexe
(2616)
286
X.4.1
SYSTEMES DESORDONNES
Les groupes de symétrie correspondants sont S O ( N ) , S U ( N ) et S U ( N ) x
S U ( N ) . Les termes dominants sont les mêmes dans les trois cas, mais la
dépendance en N des corrections varie avec le type de matrice envisagé.
Dans le cas à zéro dimension, on ignore la dépendance dans la variable
de configuration. Ainsi E ( g ) est une fonction génératrice des facteurs combinatoires comme ceux donnés par l’équation (260). La méthode utilisée
dans la section précédente s’étend au cas présent. Nous exposons le calcul
dans le cas d’une interaction quartique, mais on peut plus généralement
traiter le cas d’une interaction polynômiale quelconque même non bornée
inférieurement. A une constante de normalisation indépendante de g près,
nous avons
exp - N 2 E ( g ) = cst
=
1n
IsisN
J d M exp - { i Tr M 2 + 9
Tr &I4}
N
dXi
II
(Xi - Xj)2exp-
i <i <j <N
l<i<N
N
où { X i } désignent les N valeurs propres réelles de la matrice hermitienne
M . La méthode du col donne
avec la condition de stationnarité
(263b)
Ordonnons les valeurs propres et, dans la limite N grand, substituons à
cette suite discrète la fonction continue telle que X i = f i X ( î / N ) . Ceci
nous conduit à l’approximation suivante
Nous définissons la densité normalisée de valeurs propres u(X) par
dx = u(X)dX
X.4.1
SYSTEMES DESORDONNES
287
où u(X) est positive, paire, de support inclus dans un intervalle [-2a, 2a] et
vérifiant
f2a
1= L ‘ d x = [ 2 a
dXu(X)
Ainsi
La fonction analytique
2a
F ( z )= [ 2 a
dPU(P)
(267a)
est définie dans le plan complexe privé de la coupure [-2a,2a]. Elle est
impaire, réelle sur l’axe réel privé du segment [-2a, 2a], et se comporte en
z-l quand z tend vers l’infini. De plus, elle vérifie
F(X f io) = $A
+ 2gX3
inu(X)
- 2 a 5 X 5 2a
(267b)
L’unique fonction F possédant ces propriétés s’écrit
~ ( z=) fz+ 2gz3 - (S + 4ga2 + 2gz2) Jzz-4az
(268)
Le facteur devant la racine carrée assure une décroissance de F ( z ) en z-l à
l’infini pourvu que
12ga4 + a2 - i = O
(269)
Pour g petit, on peut développer a2 en série convergente
249
= 1 - 12g
+ 2(12g)2 - 5( 12g)3+ ...
(270)
Dans l’équation (268), la racine carrée est choisie positive pour z réel,
z 2 2a. La discontinuité de F le long de la coupure donne une expression
pour .(A) qui généralise la loi du demi-cercle
En revenant à (264), on trouve E(g) sous la forme
288
SYSTEMES DESORDONNES
X.4.1
Tenant compte de l’expression de a’ comme fonction de g on aboutit à la
série
=2g - 18g’
+ 288g3 - 6048g4 + . .
en accord avec les premiers termes donnés en (260).
A la différence du développement perturbatif complet , l’approximation
planaire produit une série convergente, donc analytique, dans un voisinage
du point de couplage nul g = O. La singularité la plus proche provient de
l’expression de a2(g). Elle est située sur le demi-axe réel négatif, à une valeur
g --.AL
c
-
(274)
48
Ceci permet d’obtenir le comportement asymptotique des coefficients de la
série (273)
(i) La même méthode fournit des expressions pour les fonctions de Green
à l’approximation planaire. Ainsi
LZu
+2a
G z p ( g ) = (TrM2p) =
dXu(X)XZP
Les valeurs moyennes des puissances impaires sont évidemment nulles. De
l’équation
on tire
(2P)!
-~
p ! ( p - l)!
2
k=O
(2k
+ P - I)!
(-12g)k
+ + l)!
k!(k p
De même, on peut engendrer les fonctions de Green connexes, définies par
récurrence par les relations
(277)
X.4.1
289
SYSTEMES DESORDONNES
et on trouve
(3p - 1)!3l-F
G2p(g) = (p - 1)!(2p - l)!
2
p=l
+
(-12g)'(2IC
p - l)!
(IC - p + l)!(k 2p)!
(279)
+
Finalement, si on exprime les fonctions de corrélations une-particule-irréductibles (les fonctions de vertex) par
ï z = [G;]-l
-r4
=G4 [G;Ip4
-r6
=GE [G;]l-6
-rs =Gg [G;]-'
(280a)
- 3 [G4I2[G;Ip7
- 8GSG4 [G;]-'
+ 12 [G4I3 [G;]-lo
...
leur fonction génératrice (l'analogue de l'énergie libre exprimée en fonction de
l'aimantation après une transformation de Legendre)
00
(280b)
p=l
vérifie l'équation algébrique
+ r)2+ g a 4 r ( i + r - r2/& - a2(2+ a 2 ) +
3 2 ( i -2)(i
=O
(280c)
dont on déduit le développement en puissances de g.
(ii) On peut aussi étudier systématiquement les corrections à l'approximation planaire. Cela revient à compter les diagrammes tracés sur un tore, un
double-tore, etc. Notons les contributions correspondantes E1 (g), Ez(g), . . ..
Dans le cas hermitien ( a = Z), nous avons
Pour obtenir les termes successifs du développement on utilise le comportement aux grands ordres des polynômes orthogonaux relativement à la me(g/N)X4). Ces polynômes généralisent les polynômes de
sure dX exp -( ;A2
Hermite qui figuraient dans la section précédente. On est alors conduit aux
expressions
+
290
SYSTEMES DESORDONNES
X.4.1
=A in(2 - a 2 )
Ei(g)
I (I -a2)3
Ez(g) =---(82
6! (2 - u 2 ) 5
+ 21a2 - 3a4)
...
où a2 est toujours donné par l’équation (270). Pour E H ( g ) , on peut montrer
que le terme dominant est de la forme
(iii) Nous avons discuté ci-dessus le cas d’une interaction quartique mais
la méthode s’étend à n’importe quelle interaction polynômiale et en particulier
à un terme cubique. Afin de donner un sens à l’intégrale fonctionnelle, on peut
supposer que la constante de couplage est imaginaire pure. Dans ce cas les
résultats sont intéressants pour les applications aux triangulations des surfaces,
après une transformation de dualité. Esquissons brièvement les calculs. On
souhaite évaluer, à N grand, l’intégrale suivante
exp - N 2 E ( g ) =
II
dXi
(Xi
- Xj)2exp-
l<i<j<N
’
1
;
N
Utilisons la méthode du col avec
Xi
=f
i x
(i)
dXw(X) = 2dx
Nous obtenons les équations
2a
5 X 5 2b
l:
dXv(X) = 2
Dans le cas présent le support de .(A) est dissymétrique sauf à la limite g + O.
La fonction F ( z ) ayant .(A) comme discontinuité le long de la coupure [2a, 2b],
réelle hors de cet intervalle et se comportant en 2/2 à l’infini, s’écrit
Posons
(T
= 3g(a + b )
X.4.1
291
SYSTEMES DESORDONNES
Le comportement de F à l’infini donne la condition
18g2
+ u( 1 + u ) (1+ 20) = O
.=-:Em
l
(72g2)k r ( + ( 3 k - 1))
r (S(k+i))
k!
En conséquence
E(g) - E ( 0 ) = -
+ + + 4 in(i + 2u)
+
) ~
u(3u2 60 2)
3( 1 O ) ( 1 2 ~
+
Toutes ces expressions sont analytiques au voisinage de l’origine. La première
singularité se trouve à
La fonction génératrice des fonctions de Green connexes
+(j)= 1
+
m
jpGp
(291a)
1
obéit à l’équation
(291b)
On peut aussi modifier les fonctions de Green en éliminant les contributions
des tadpoles correspondant à G I = G i . A cet effet, on introduit un terme
X i dans l’action. On fixe alors la valeur du
linéaire supplémentaire p
paramètre p de manière à annuler la fonction à un point. La quantité modifiée
$ satisfait à
3942
+( j
- 3g)4
- j ( 1- pj
+j 2 ) = O
(292a)
où g est relié à p par
(292b)
4
En éliminant 7, on obtient une expression pour en terme de graphes ayant
E lignes externes et V sommets (les autres caractéristiques topologiques étant
fixées par la condition de planarité et le fait que les sommets sont trivalents)
292
SYSTEMES DESORDONNES
X.4.1
En résumé, dans le cas combinatoire d'une théorie des champs à zéro
dimension, la méthode fournit des équations algébriques qui donnent accès
au développement en puissances de g. I1 serait extrêmement intéressant de
poursuivre ce programme dans des cas plus réalistes. Malheureusement, cela
n'a pu être totalement réalisé, sauf en un sens phénoménologique, excepté
dans le cas à une dimension, c'est-à-dire pour la mécanique quantique.
4.2 Approximation planaire en mécanique quantique
En général, les graphes ayant une topologie donnée doivent être pondérés par des intégrales de Feynman non triviales. I1 est donc tout à fait remarquable que l'on puisse obtenir des expressions explicites à l'approximation
planaire dans le cas unidimensionnel où le propagateur vaut (p2+ l)-' ( p
est un moment réel). Considérons ainsi un ensemble de N 2 oscillateurs anharmoniques couplés de telle sorte que les variables de configuration soient
les N 2 coefficients d'une matrice N x Ar hermitienne et que le hamiltonien
soit invariant par l'action du groupe S U ( N ) . Nous cherchons donc l'énergie
de l'état fondamental d'un système décrit par le hamiltonien
H=-SA+V
9
V ='2 Tr h12+ Tr M4
N
On pourrait aussi bien étudier des potentiels plus généraux. Pour l'état
fondamental nous avons
HS, = N 2 E ( g ) q
(295)
et la fonction d'onde 11, est invariante par les transformations unitaires
q(121)= ?$(rr+AlU)
+
Ainsi
est une fonction symétrique des valeurs propres de A l , ce
qui rappelle la séparation en variables angulaires et radiales dans d'autres
problèmes. On a 1L S, ({A,}) et
X.4.2
293
SYSTEMES DESORDONNES
Remplaçons la fonction symétrique
notée 4,définie par
+ ({A,})
par une fonction antisymétrique
qui décrit un ensemble de fermions libres dans un potentiel quartique (dans
notre exemple). L’équation (296) nous donne par la méthode variationnelle
l’équation de Schrodinger suivante pour qfJ
Le facteur 1/N dans le potentiel assure un comportement correct à la limite
ili -+ m. Le passage aux coordonnées polaires {A,} n’engendre pas de
termes supplémentaires dans le potentiel mais cette propriété ne subsiste pas
lorsque l’on étudie d’autres ensembles de matrices. L’antisymétrie de 4 est
l’analogue des conditions aux limites à l’origine dans le cas des coordonnées
polaires usuelles. *Appelons el < e2 < e3 < . . . les énergies successives
relatives au harniltoriien 5 une particule
et soit f?F l’énergie tlii riiveau de Frirnii, c’est-à-dire celle du niveau occupé
de plus haute 6ncrgic. Nous avons
lil,
N =
H(e,.. - e k )
1<h
-
Ces expressions sont esactes pour tout K.En fait, il serait plus approprié d’écrire EN(^) pour N fini car le comportement E N ( g ) N 2 E ( g )ne
00. Bien entendu les quantités e h ne sont
s‘applique q i i ’ i la limitc N
en général pa5 connucs cxactcrricrit. Heureusement, puisqu’on ne s’intéresse
--f
294
ÇYSTEMEÇ DESORDONNES
X.4.2
qu’à la limite N grand, seuls les états très excités contribuent à l’expression
dominante de N 2 E ( g ) .L’approximation semi-classique est alors suffisante.
Nous pouvons remplacer les sommes finies par des intégrales sur l’espace
des phases classique et nous obtenons
Intégrons sur la variable p et effectuons un changement d’échelle sur X et
eF de la forme fix, e F + N E . Nous obtenons une paire d’équations qui
donnent la solution sous forme paramétrique
I1 s’agit en fait d’intégrales elliptiques. La seconde équation exprime que
E ( g ) est indépendant de E à g fixé. Ces équations sont un exemple frappant
des simplifications qui apparaissent à l’approximation planaire.
En éliminant E, nous obtenons pour E ( g ) une fonction analytique au
voisinage de l’origine. Ceci semble contredire les propriétés de la solution
exacte pour laquelle le point g = O est une singularité essentielle provenant
de l’instabilité par effet tunnel à g < O . Dans l’approximation planaire, la
singularité la plus proche de l’origine apparaît pour une valeur négative du
couplage telle que le niveau de Fermi atteigne le maximum du potentiel
Jz
gc = -%
(303)
On ne s’attend pas en principe à ce que l’approximation planaire donne
de très bon résultats à N fini et donc a fortiori pour N = 1. Le tableau
suivant montre des résultats numériques (dus à Hioe et Montroll 1975)
pour l’oscillateur anharmonique (noté EeXacte)
comparés au résultat de
l’approximation planaire. L’accord est étonnamment bon sur une large plage
de couplages
X.4.2
295
SYSTEMES DESORDONNES
9
Eoianaire
Eexacte
0.01
0.1
0.5
1.0
50
1000
0.505
0.547
0.651
0.740
2.217
5.915
0.507
0.559
0.696
0.804
2.500
6.694
(304)
Pour g grand, l’accord est moins satisfaisant. Le comportement asymptotique de l’approximation planaire déduit de l’équation (302) est donné par
(305)
tandis que la solution exacte se comporte comme
5. Système de spins en interactions aléatoires
Pour terminer, nous présentons encore deux applications des variables
anticommutantes aux systèmes désordonnés. La première est due à Parisi
et Sourlas et concerne un système de spins soumis à un champ magnétique
aléatoire. Même si 1’011 n’accède pas ainsi à une compréhension quantitative
complète de ce système au voisinage de sa dimension critique supérieure, on
peut expliquer simplement une propriété observée perturbativement. Nous
allons ainsi relier le comportement d’un système désordonné à celui d’un
système pur en dimension inférieure.
Dans la deuxième sous-section, nous présentons les résultats de Dotsenko et Dotsenko relatifs à une situation opposée. I1 s’agit d’un cas où le
désordre a un effet marginal d’après le critère de Harris. Nous examinerons
plus précisément l’effet d’un faible désordre au voisinage du point critique
à deux dimensions. Malgré certaines critiques, la méthode d’analyse et les
résultats sont intéressants. Ces difficultés reflètent une fois de plus les subtilités inhérentes aux systèmes désordonnés.
5.1 Champ extérieur aléatoire et transmutation
dimensionnelle
Considérons un modèle d’king, que nous approximons à la limite
continue par un modèle (p4 couplé à un champ aléatoire extérieur gaussien.
296
X.5.1
SYSTEMES DESORDONNES
Les quantités physiques sont des moyennes sur le désordre. La moyenne
thermique sera notée ici ( 4 ) et la moyenne sur le désordre par (A). Si h
désigne le champ magnétique, l’énergie libre s’écrit
F ( h ) =ln/Dcpexp-/ddx{C(x)
F=
s
D h F ( h )exp -$
/
+ h(x)p(x)}
(307)
ddxh2(x)
où
C(x) = + ( d d 2+ V(cp)
v = +m2cp2+ sip4
(308)
La méthode des répliques remplace le calcul de F par celui de la moyenne
Z ( h ) n loù Z ( h ) est la fonction de partition, à la limite où n tend vers zéro.
Dans le développement perturbatif les termes les plus divergents à la limite
infra-rouge correspondent aux graphes où apparaît le plus grand nombre
d’insertions de h2. En resommant ces contributions on démontre q e ( h )
est alors dominée par l’approximation de champ moyen tandis que F ( h ) est
obtenue par la moyenne de cette approximation sur le désordre. Introduisons
le champ moyen cph, solution de l’équation
-A‘P/L(x)
+ V’(Ph(X)) + h(x) = 0
(309)
Dans cette approximation, la fonction à deux points est donnée par
S (-Acp(x)
+ V‘(cp(x))+ h(x)) exp -$
/
ddxh2(x)(310)
X
Dans la seconde expression, nous avons utilisé la définition de c p h ( x ) déduite
de l’équation de champ moyen. Le produit de fonctions 6 est accompagné
d’un jacobien qui est la valeur absolue du déterminant des dérivées secondes
de l’action par rapport à cp(x). Si la correspondance entre h et cp était
V”(cp))
biunivoque, on pourrait oublier la valeur absolue car det(-A
ne s’annulerait jamais. On suppose implicitement cette propriété dans la
théorie perturbative et nous ferons de même ici, sans justification sérieuse,
dans la resommation des logarithmes dominants. De nombreux systèmes
désordonnés (comme les verres de spin) sont tels que l’approximation de
champ moyen se revèle d’une telle complexité que même cette hypothèse
apparaît injustifiée.
+
X.5.1
297
SYSTEMES DESORDONNES
Nous suivrons donc Parisi et Sourlas en ignorant le signe de valeur
absolue pour le déterminant et nous en analyserons les conséquences. Ce
déterminant s’exprime à son tour comme une intégrale sur des variables
de Grassmann et le produit de fonctions 6 comme une intégrale d’une
exponentielle sur un champ auxiliaire imaginaire pur a ( x ) . Ceci conduit
à la représentation
,Nous nous attendons à ce que le lagrangien effectif possède une symétrie
BRS. Soit ü un paramètre infinitésimal anticommutant et E un vecteur à d
dimensions. La transformation en question est du type A + A SA pour
A = (cp, $, $, a ) ,avec 6A = ÜsA
+
scp = - E.X$
s+ =O
=2&.a$
s a =&.Xa
+ 2E.dcp
(312)
La variation de l’action est l’intégrale d’une dérivée totale
S
s
ddXLeR(X)= 2ü
I
ddx&.d{$ [-Acp
+ V’(cp)]}
(313)
qui s’annule pourvu que la quantité entre crochets tende vers zéro à l’infini.
Montrer que
Comment modifier le formalisme pour avoir s2 = O ?
Introduisons alors un super-champ @ fonction de x et de deux variables
anticommuantes e et ë
@(x,e, 8) = V(X)
+ ë+(x) + $(x)e + eëa(x)
(315)
Nous choisissons la normalisation des intégrales de sorte que
/
dëdû
=1
Dans le super-espace, le laplacien est défini par
aa
a, = a+ ae
ae
7-
(317)
298
SYSTEMES DESORDONNES
X.5.1
où les dérivées agissent à gauche. On constate que l’action effective dans
l’intégrale fonctionnelle (311) prend la forme
Seff= /ddxd$dû {-$@As@ + V ( @ ) }
= / d d x {$(-A
+ V”(p))$ + a(-Acp + V’(p)) - ; a 2 }
(318)
Nous laissons le soin au lecteur de vérifier cette identité surprenante à
première vue. Elle entraîne l’invariance par rotation dans le super-espace.
L’introduction de deux coordonnées grassmanniennes entraîne la propriété suivante. Tout se passe comme si on diminuait la dimension de l’espace
Rd de deux unités dans les intégrales des quantités invariantes par rotation.
Pour le voir, considérons une intégrale dans l’espace (x,û,$) et soit f une
fonction à décroissance suffisamment rapide à l’infini. Considérons alors l’intégrale
/
Iddxdëdûf(x2 + O$)
7r
1
= -Ir
1
ddxfr(x2)
Passons en coordonnées polaires avec x2 = r2 et Sd = 27rid/ï(;d) l’aire
de la sphère unité dans l’espace à d dimensions. Nous obtenons pour d > 2
après une intégration par parties
qui confirme l’affirmation pour des intégrales simples. Le lecteur intéressé
montrera que ce résultat s’étend à plusieurs variables et produit la réduction
dimensionnelle de deux unités que l’on observe perturbativement, laquelle
apparaît justifiée par cette analyse globale. La conclusion de Parisi et Sourlas
est que le modèle supersymétrique à d dimensions est équivalent à une
théorie purement bosonique en d - 2 dimensions. En ce qui concerne le
modèle de spins en champ aléatoire que nous venons d’analyser, ce résultat
s’applique au mieux au voisinage de la dimension critique supérieure (c’està-dire six pour le système désordonné, équivalent à une théorie 9”).
Le
comportement à plus basse dimension n’est pas bien compris et nous ne
pousserons pas plus loin son étude.
5.2 Modèle d’Ising bidimensionnel désordonné
Examinons finalement un effet marginal du désordre sur le comportement critique. Considérons un système au voisinage du point critique.
X.5.2
SYSTEMES DESORDONNES
299
Notons 0 l’écart à la température critique. La contribution d’un opérateur
local essentiel K de dimension A 5 d a la forme
SS =
I
ddq(x)K(x)
où g est une constante de couplage de dimension L A - d . En l’absence de
perturbation, la longueur de corrélation E se comporte en e-”. L’analyse
dimensionnelle suggère que si g est non nul, la partie singulière de l’énergie
libre par unité de volume est de la forme
L’exposant IC positif
IC = ~ ( -dA)
(322)
caractérise la transition entre deux comportements distincts. La fonction f
est régulière A l’origine (c’est ce qui nous a fait extraire le facteur e2-,).
Dans le cas où g est un champ aléatoire figé, on supposera que la partie
singulière de l’énergie libre totale prend une forme généralisant l’équation
(321)
où ‘p est une fonctionnelle régulière au voisinage de zéro. Supposons en outre
que g(x) soit de moyenne nulle. Nous avons approximativement
In z(e,g(x)) = e2-a’po
//
+ +e2-a-2k
d d ~ l d ~ 2 g ( ~ l ) g ( ~ 2 )x2)
~ 2+.
( x.l.,
(324)
Si l’intégrale du membre de droite est bien définie, l’effet dominant du
désordre doit être d’ordre û2-a-2k avec un exposant plus petit que celui
du système pur. L’argument ci-dessus devient douteux dès que
ou, en utilisant la relation 2 - Q = ud,
A<
id
(325b)
comme l’indiquerait un développement perturbatif. L’inégalité précédente
fournit le critère de Harris (1974). Un faible désordre ne modifie pas le
comportement dominant si cette inégalité est satisfaite.
I1 est donc intéressant de considérer une situation marginale où A = i d .
Le modèle d’Ising bidimensionnel avec fluctuation des couplages nous donne
300
X.5.2
SYSTEMES DESORDONNES
un exemple de cette situation. L’opérateur K est ici l’opérateur énergie de
dimension A = 1. La marginalité du désordre se traduit par le fait que la
théorie des champs associée est juste renormalisable. Comme l’ont montré
Dotsenko et Dotsenko, ce modèle, introduit dans un tout autre contexte
par Gross et Neveu, est asymptotiquement libre dans le régime infrarouge,
domaine qui nous intéresse. Même si certains aspects du raisonnement qui
va suivre restent sujets à controverse, en particulier l’utilisation délicate
de la méthode des répliques, la théorie des champs correspondante est
particulièrement intéressante.
Nous nous plaçons dans la théorie critique continue qui s’exprime en
terme d’un champ de Majorana réel avec un terme de masse aléatoire m ( x )
de moyenne nulle. Nous cherchons la moyenne du logarithme de la fonction
de partition Z M (où l’indice M fait référence à Majorana)
(326~)
(3268)
Parmi les différentes méthodes d’analyse, nous choisissons de suivre celle
due i Shankar qui a le mérite de montrer succinctement le phénomène
principal. Comme nous nous bornerons à étudier l’effet du désordre sur
l’énergie libre, nous pouvons multiplier cette dernière par 2, ce qui revient
à élever Zn: au carre pour obtenir un modèle fermionique complexe qui
introduit une symétrie O(2). Notons ($I,&) , ( $ 2 , q 2 ) les deux copies du
champ de Majorana et définissons le champ de Dirac
U. =
(41 - i42,+1 - $2)
Un facteur c3 a été inclus dans la définition de l’adjoint
l’opérateur de Dirac s’écrit
=
(+; &)
(327)
de telle sorte que
(328)
Nous utiliserons indifféremment les notations x,(z,z)ou même z pour
désigner les coordonnées d’un point. Ainsi
2s
Z D = Zizf =
D(u,ii)exp-So
(329a)
(329b)
X.5.2
30 1
SYSTEMES DESORDONNES
L’indice m rappelle que l’opérateur de Dirac contient un terme de masse
variable. Le calcul de Z D est en principe immédiat puisque c’est le déterminant de l’opérateur D,. Comme d’habitude les modes voisins des modes
nuls posent un problème. Nous supposerons qu’ils ne compromettent pas le
traitement qui va suivre. C’est le point faible de cette méthode.
Avant d’effectuer la moyenne sur le désordre, rappelons les formules de
bosonisation pour le champ de Dirac (chapitre II). Elles proviennent de la
symétrie O(2) entre les copies des champs de Majorana, ou en termes du
champ de Dirac complexe, de l’invariance par la transformation
Le théorème de Noether nous fournit un courant conservé
(331~)
a z j z+ dZj2 = O
(331b)
Dans la théorie de masse nulle, nous pouvons exprimer les courants en
fonction d’un champ scalaire libre de masse nulle cp, par les relations
j” =4241
+
hap
j Z=
+
-ha9
(332)
Ces formules signifient que les fonctions de corrélation calculées dans les
théories des champs correspondantes sont égales.
Rappelons que pour m = O , avec a et b désignant les points xa et
xb
Nous vérifions que les fonctions à deux points sont bien égales
Vérifier l’égalité des corrélations d’ordre supérieur.
Le champ aléatoire m(x) est couplé à l’opérateur énergie qui peut également
s’exprimer sous forme bosonique
302
SYSTEMES DESORDONNES
X.5.2
Le facteur de coupure ultraviolet A = a-l, qui spécifie la dimension relative
des opérateurs, compense l’absence d’ordre normal
Un des avantages de cette formulation réside dans l’existence d’une
expression locale pour l’aimantation (ou spin) en fonction du champ bosonique
alors que son expression fermionique est non locale. En effet le produit des
variables de spin ulu2 relatives aux deux copies correspond alors à
u1u2 + &A$
sin (p/&
(335)
ce qui permet de calculer le carré des corrélations sous forme bosonique. Le
facteur A i rappelle la dimension du champ et remédie à l’absence d’ordre
normal.
Nous sommes maintenant prêts à prendre la moyenne sur m(x). Supposons que m(x) fluctue autour d’une valeur moyenne m. Au lieu de calculer
la moyenne de In ZM (ou In 2;) évaluons plutôt la chaleur spécifique à
m = O. I1 suffit de dériver deux fois la moyenne sur m(x) et de poser m = O.
Ceci implique l’intégrale de la fonction à deux points de l’opérateur énergie
E , c’est-à-dire la moyenne de
3
(E(x)E(x’))= Zgl
I
D(cp)A2COS & p ( x )cos &‘p(x’) exp -SB
(336a)
(336b)
‘J
Sg)= n.
d2xm(x)ACOS h
c
p
(336c)
Pour abréger nous écrirons : cos acp : pour Aff2I2cos a’p. I1 nous faut encore
préciser la distribution de probabilité de la variable m(x). Le seul cas
analytiquement soluble est celui de la distribution gaussienne
O ( m )=
J d2xm2(x)
+ J ’DmO(m(x))
J ~m
+ J d2xm2(x)
exp -(1/2g2)
exp -
(337a)
c’est-à-dire telle que
m(21)m(x2) = 92 6( 2 ) (Xi - x2)
(337b)
où g2 caractérise l’intensité du désordre. Nous avons le choix entre deux
possibilités pour calculer la moyenne. D’une part, nous pouvons introduire
X.5.2
SYSTEMES DESORDONNES
303
n répliques du champ bosonique, puis faire tendre n vers zéro, ou d’autre
part, introduire un partenaire fermionique. Les résultats sont les mêmes et
nous choisissons la première méthode. En conséquence
(E(x)E(x’))= lim
n+O
/
D(cp) : cos f i q ’ :: cos fi$ : exp -S(cp)
(338a)
L’indice de réplique c varie de 1 à n. Si nous avions effectué un calcul
analogue en partant de l’action de Dirac, nous aurions obtenu le modèle
de Gross-Neveu avec une symétrie û(2n). Cette invariance n’apparaît pas
explicitement dans la version bosonique. L’action complète avec uc, üc et
m(x) est la plus simple sur laquelle on puisse étudier complètement la
renormalisation. Quoi qu’il en soit, l’équation (338) indique que nous avons
une théorie renormalisable, mis à part la question de la limite n -+ O.
I1 est clair que nous devons en analyser le comportement infra-rouge et
en particulier celui de la constante de couplage g2 effective qui représente
l’effet du désordre. Le modèle de Gross-Neveu admet une solution exacte à
n = 1. Dans ce cas, le comportement critique est l’un de ceux examinés au
chapitre IX. La charge centrale est égale à 1et les exposants critiques varient
continûment en fonction de g. Remarquons en effet que d’après les équations
(332) et (333), nous avons, pour un champ de Dirac, une expression formelle
du carré du courant
l’t.z-’-
23 3
-
- 2+2+1+1+2
=
a
(&+l
+42+2)2
(339)
En termes bosoniques, ceci entraîne la correspondance suivante
-acpacp
(:cos2 Jz(P :)
2
H
(340)
valable pour les insertions dans les fonctions de corrélation. On peut aussi
vérifier cette équivalence par une analyse soigneuse de la renormalisation du
modèle qui montre que les termes diagonaux dans le lagrangien d’interaction
(338b) peuvent être remplacés par un terme cinétique modifé
(341)
Quand le nombre de composantes n est égal à l’unité, cette action décrit
manifestement un champ scalaire libre de masse nulle où le champ est
1
multiplié par un facteur (1 + g2/27r) a . Cette modification en apparence
304
X.5.2
SYSTEMES DESORDONNES
innocente modifie la dimension de tout opérateur de la forme K , =: cos a(p :,
de A, = +a2en A,(g) = $ a2 ( 1 + g2/2n)-l, ce qui se traduit par des
exposants variant continûment avec g. Pour une valeur de n arbitraire, la
fonction p doit s'annuler à n = 1, ce qui signifie qu'elle contient au moins un
facteur ( n- 1). Comme nous allons le voir, ce facteur apparaît à la première
puissance, ce qui entraîne que p(g) change de signe quand n - 1 s'annule.
En conséquence, au voisinage de g = O les propriétés à longue et à courte
distance s'échangent quand n traverse la valeur un. Alors que pour n > 1, le
modèle est asymptotiquement libre à courte distance et présente une brisure
spontanée d'une symétrie discrète engendrant dynamiquement une masse
fermionique, nous avons le comportement opposé de liberté asymptotique
infrarouge pour n < 1, ce qui est la situation favorable dans le cas présent.
Effectuons maintenant les calculs nécessaires. Grâce aux remarques
précédentes et à la forme (341) de l'action, nous pouvons effectuer une
renormalisation finie des champs en posant
(I + 97274
pC= Cp"
(342)
Définissons
et rappelons que la prescription d'ordre normal des exponentielles implique
une puissance appropriée de A. Nous sommes ainsi conduits à l'action
Plus précisément, nous aurions dû introduire une échelle de masse arbitraire
p pour normaliser la puissance supplémentaire de A, qui à l'ordre dominant
en g2 doit être interprétée comme (A/p)1-1/(1+gz/2r)
1+(g2/2n) ln(A/p).
Cette première renormalisation ne suffit pourtant pas à rendre toutes les
fonctions de corrélation finies, en particulier la fonction à deux points de
l'opérateur énergie (338). Un contreterme supplémentaire est nécessaire
: cosaCp" :: c o sa g d : bien que nous ayons
pour l'opérateur produit CcZd
déjà introduit une renormalisation pour les facteurs individuels. D'après
(344), la dimension de l'interaction a été décalée de 2 à 2/(1+ g2/27r). Ceci
doit être compris perturbativement en g 2 , et n'est justifié qu'a posteriori
quand on se sera convaincu que seule la limite g2 -+ O présente un intérêt.
-
X.5.2
305
SYSTEMES DESORDONNES
Pour voir apparaître les divergences supplémentaires, il suffit
d'examiner le développement perturbatif de la fonction E E . Nous pouvons
effectuer ce calcul de deux manières différentes dont la comparaison est
révélatrice. Ou bien nous utilisons la forme (344), le champ et le théorème
de Wick, mais cela demande de distinguer entre composantes diagonales et
non diagonales de
Ou bien nous revenons à l'expression (338b), plus
symétrique, impliquant le champ cp, et c'est seulement après avoir calculé le
premier contreterme non trivial que nous éliminons les interactions diagonales.
En effet, pour n # 1, la valeur de g 2 qui apparaît dans la correspondance entre
<p et @ est affectée par la renormalisation. Nous préférons exposer le traitement
non symétrique et nous engageons le lecteur à utiliser l'autre méthode ou bien
encore à revenir à la formulation fermionique. Bien que nous nous intéressions
aux termes non diagonaux de ( E ) , il est instructif de mener en parallèle le
calcul pour les termes diagonaux. Ecrivons
+
€a , ~ i - i / ( 1 + 9 ~ / 2 = ) , p
Ea = :
(345)
:
Avant de prendre la limite n
O , les moyennes qui apparaissent sont
( E a ( x 1 ) E b ( x 2 ) )et il est plus simple d'écrire les règles de Feynman directement dans l'espace de configuration avec
-f
(E"(Xl)Eb(X2))= s a b f ( x l- x 2 )
Prenons a
1
f ( x )= 2 1x1a2
(346)
# b et calculons les contributions successives
+...
Le facteur ( n - 2 ) est typique des corrélations non diagonales comme on le voit
sur l'équation (344). Une soustraction élimine la divergence supplémentaire, si
nous posons
qui provient de l'intégrale divergente logarithmiquement
(347)
306
SYSTEMES DESORDONNES
X.5.2
A l’ordre dominant en g;,
Les deux contributions ont conspiré pour transformer le facteur n - 2 en n - 1
comme prévu. Par comparaison dans le cas des fonctions diagonales, un terme
similaire (proportionnel à n - 1 cette fois) est compensé par des contretermes
diagonaux supplémentaires dans l’action. Ces derniers sont nécessaires pour
maintenir la valeur correcte de la constante de couplage dans la relation entre
<pet (p.
Ainsi à l’ordre dominant, le flot de groupe de renormalisation au
voisinage de g = O s’écrit
A-g(A)
d
dA
G
P(g(A)) = -(n - 1)-g 3 ( N
2T
(350)
ce qui entraîne la liberté asymptotique ultraviolette pour n > 1. Pour n < 1,
la conclusion est inversée. A grande distance la constante de couplage g
effective décroît et la théorie de perturbation devient appropriée.
Le coefficient de g5 dans p ( g ) est lui aussi universel. D’après Wetzel,
on a
B ( 9 ) = -(n
-
(351)
et le terme en g5 s’annule égaiement pour n = 1.
La situation est similaire à celle de la théorie ‘p4 en quatre dimensions
analysée au chapitre V: section 4.2. Nous pouvons adapter la discussion de
cette section et en particulier l’équation (V.248)’ où l’on calcule la chaleur
spécifique, c’est-à-dire l’intégrale de (338a). Le terme le plus singulier
provient à nouveau de la pa,rtie inhomogène appelée b(g) au chapitre V.
A l’ordre le plus bas, c’est une constante indépendante de g proportionnelle
à la divergence logarithmique de l’intégrale d2x ( E ( x ) E ( O ) ) ~ relative au
système pur. Le terme singulier de la chaleur spécifique noté r o , 2 au chapitre
V sera désigné ici c(û,9).I1 s’écrit
où l est une échelle de longueur infrarouge, mesurée en unité de la maille
a de réseau et choisie de manière à pouvoir négliger le terme homogène de
(V.248). Cela signifie que à l’échelle l , la variable de température û ( l ) est
d’ordre 8 0 , où ûo est finie. Or û ( l ) = û l à l’ordre le plus bas puisque v = 1
X.5.2
307
SYSTEMES DESORDONNES
pour le système pur, ce qui entraîne e N ûo/û. Pour calculer c ( û , g ) nous
avons besoin de g ( l ) , solution de (350) pour n = O, ce qui nous donne
(353)
et de la dimension anormale y2(g) qu’on peut tirer de la renormalisation
multiplicative de l’opérateur E
(354)
Ainsi, en remplaçant b ( g ) par b(0) nous obtenons
Les intégrations sont immédiates et on en tire
cst
(356)
qui est le résultat surprenant, obtenu par Dotsenko et Dotsenko. I1 montre
qu’il subsiste une singularité très faible en In In l / û , lorsque 6 devient
exponentiellement petit, 8 5 exp-n/g2. Cet effet subtil ne peut être
obtenu par un développement de faible désordre. L’observation directe de
cette singularité donnerait une confirmation spectaculaire des méthodes de
groupe de renormalisation.
La version bosonique ne donne pas accès à la moyenne de la fonction
de corrélation à deux spins. On peut pourtant montrer, en suivant Shankar
et en utilisant des arguments de groupe de renormalisation analogues à ceux
développés ci-dessous, que la moyenne du carré de cette fonction au point
critique est de la forme
avec des corrections logarithmiques typiques d’une théorie asymptotiquement
libre au comportement en 1~1-4 du système pur. Comme on a l’inégalité
ceci implique que
308
X.5.2
SYSTEMES DESORDONNES
L’équation (357) rappelle la propriété analogue du modèle X Y à l’extrémité
de la ligne critique (IV.184),le rôle du désordre étant joué par les tourbillons.
Cependant le facteur logarithmique qui apparaît dans le membre de droite
de l’inégalité (358) pourrait disparaître dans un traitement plus approfondi.
Le lecteur intéressé pourra analyser les moyennes des carrés des fonctions de
corrélation de spin d’ordre plus élevé.
Appendice A : L a conductivité de Hall en tant
qu’invariant topologique
Nous décrirons dans cet appendice un argument dû à Laughlin sur
la quantification de la constante de Hall pour un système à N corps en
interaction couplés minimalement. Cet argument relie cette quantification
à un invariant topologique. Nous suivrons la présentation due à Avron
et Seiler. L’idée consiste à relier la topologie non triviale de l’appareil
expérimental destiné à mesurer ou à produire le potentiel de Hall aux
propriétés d’invariance de jauge et de périodicité des fonctions d’onde quand
on fait varier les flux magnétiques par multiples du quantum cpo = h / e . La
relation avec un invariant topologique implique une insensibilité à de petites
variations dues à des impuretés ou défauts de toutes sortes, qui expliquerait
la robustesse de l’effet observé.
Considérons un hamiltonien à N corps Ho qui prend en compte le
champ magnétique extérieur (intense et fixe), les interactions entre les
particules et avec un fond (éventuellement aléatoire). Nous nous plaçons à
basse température afin d’ignorer tout effet thermique, l’hypothèse essentielle
étant que, en l’absence de courant et de voltage, le système est dans un
état pur non dégénéré. Nous pouvons alors introduire une différence de
potentiel Hall très faible et mesurer un courant dans le circuit principal
comme l’indique la figure 6 .
Le hamiltonien Ho inclut un potentiel vecteur A0 dont le rotationnel est
le champ intense B (de circulation nulle autour de Cl et C2 comme indiqué
sur la figure). Pour prendre en compte le générateur et obtenir une variable
conjuguée du courant 12,nous ajoutons à A. un terme cp1Al ~ Z Atel
Z
que
+
donc tel que le potentiel total vérifie
(A.2a)
X.A
SYSTEMES DESORDONNES
309
-B
Figure 6 : L’appareillage de Hall, spires et sources comprises. On
remplace ces dernières par des flux magnétiques variables.
D’après les équations de Maxwell, si
tromotrice dans la boucle
(pl
-
hl
‘pl
varie, il apparaît une force élec-
dx.E = -Vi
(A.2b)
Le flux ‘pl est introduit adiabatiquement jusqu’à un régime linéaire correspondant à une valeur VI très faible. On a donc grossièrement (pl = -tVl,
ou d’une manière plus correcte à des temps négatifs, (pl = -V1evt/q pour q
tendant vers zéro.
Si A désigne la somme A0 + p1Al + p2A2, un hamiltonien typique
sera de la forme
H =
P
1 h
-2m
( - Vip
- eA(xp))’
+ V({x})
Si nous introduisons deux coupures pour rendre l’espace de phase connexe, Al et A2 peuvent être considérés dans une jauge convenable comme
des gradients de fonctions ill et il2, telles que il, augmente d’une unité
pour un tour de long de Ca. Dans ce domaine simplement connexe, nous
pouvons, par une transformation de jauge, ramener A à A0 et H à H o ,
au prix d’écrire = exp[ie/hC((plill (p2h2)]$Io.La fonction d’onde $0
est discontinue et s’accroît d’un facteur exp[iecp,/h] quand x p traverse la
coupure correspondante. Nous voyons alors que le problème est périodique
lorsque les flux sont augmentés d’un quantum h/e, et HO (avec les conditions aux limites) définit un système de mécanique quantique doublement
périodique dans les paramètres ( p l , 9 2 . Avant toute transformation de jauge,
l’opérateur densité de courant est une somme
+
310
X.A
SYSTEMES DESORDONNES
J =e c v p=
P
jp
v p= m
P
tL
(;VP
i
-eA(xp)
et
L'hypothèse de la théorie à un corps (correspondant à des particules
indépendantes) qui consiste à dire que le niveau de Fermi est situé dans
un intervalle entre deux niveaux de Landau est remplacée ici par celle que
le système est dans un état pur non dégénéré I$) que nous supposerons
normalisé. En conséquence
En exprimant A , comme le gradient de Ra et en tenant compte de la
conservation du courant, il ne nous reste qu'une contribution de bord qui
provient de la discontinuité de A,,
Ceci fournit une première justification pour l'introduction du flux 9 2
permettant de calculer le courant I2 comme une réponse. La fonction d'onde
$ vérifie une équation de Schrodinger dépendant du temps, et en utilisant
pl = -tVi par souci de simplicité, nous obtenons
d
I$) = H(cp1, P2) I$>
(A.5)
891
En dérivant cette équation par rapport à cp2, et en prenant le produit
I$)
scalaire avec le bra conjugué ($1, nous obtenons en remplaçant ($1
par I2
-inv1-
E
La conductivité de Hall définie par la relation
12
= aHV1
est alors donnée par une formule de type de Kubo, qui s'écrit
(A.6)
X.A
SYSTEMES DESORDONNES
311
Plutôt que de calculer les dérivées puis de prendre les limites Vi (et donc
9 2 tendant vers zéro, on convient de remplacer cette expression par
sa moyenne sur les flux dans un intervalle [O, (pol. Cette moyenne est justifiée
par la petitesse du quantum de Aux cpo devant les flux macroscopiques. Ceci
nous permet d’utiliser une approximation adiabatique à l’ordre dominant
pour Vi infinitésimal. Cette approximation entraîne que si $ est initialement
vecteur propre du hamiltonien H fonction de (p, il le demeure (à une phase
près bien entendu). I1 est naturel de prendre cet état comme étant l’état
fondamental (normalisé)
pl) et
H ( 9 i ’ 9 2 ) In((P1,’P2))
= E(cpl,(p2)Ifl((pl’(P2))
(A4
où la valeur propre est doublement périodique de période cpo. Ainsi dans
l’équation (A.7)’ nous approximons le premier terme du membre de droite
par d/d(p:, ($IHI+) N d/d(p2E((pl,cp2)dont la moyenne est nulle et nous
identifions la conductivité de Hall avec l’expression
En utilisant une notation compacte pour la 2-forme intégrée sur le tore 7
dans l’espace des flux, on peut encore écrire
où P est le projecteur sur I$) approximé à l’ordre dominant par 1R)(RI,
projecteur sur l’état fondamental. Ces deux projecteurs sont indépendants
de la phase de cet état.
Les propriétés physiques sont doublement périodiques dans les flux mais
ce n’est pas le cas du hamiltonien, ni de l’état R. Par un accroissement
de yo7 H est transformé en un opérateur équivalent à une transformation
unitaire près. Pour y remédier, nous effectuons une transformation de jauge
(unitaire) sur les états, qui revient à utiliser A, = VA, en introduisant des
coupures dans l’espace physique. Ainsi, avec
(A.ll)
IO) =UIRo)
le hamiltonien H devient Ho avec conditions aux limites périodiques dans
La situation est similaire à celle de la physique des
l’espace (p pour 1%).
312
SYSTEMES DESORDONNES
X.A
solides pour les ondes de Bloch dans un potentiel périodique, p jouant le
rôle de quasi-impulsion. Nous avons alors P = UPoUt. Cette transformation
affecte l’intégrand de l’équation (A.lO) par l’addition d’une dérivée totale
qui ne contribue pas à l’intégrale. Comme POest maintenant périodique,
cela montre que la définition de ( ( T H ) est raisonnable car périodique en p.
I1 en résulte aussi, comme nous allons le voir, sous réserve de la validité
de l’hypotèse de non-dégénérescence, que c’est un entier en unité de e 2 / h .
Nous omettrons dorénavant l’indice zéro, étant entendu que P(p) est un
projecteur régulier doublement périodique et de rang unité. Le théorème
stipule que l’intégrale
K = I2i7r
/L T r d PP d P
(A.12)
est un invariant topologique de valeur entière. Un résultat classique de von
Neumann et Wigner assure que la condition de croisement de deux niveaux
est en général de codimension trois, c’est-à-dire qu’il faut au moins un espace
à trois paramètres. A champ extérieur fixé, pl et p2 ne permettent donc
pas de dégénérescence en général. Pour expliquer l’effet Hall fractionnaire,
on devrait considérer un état dégénéré pour généraliser l’argument qui va
suivre. Nous nous limiterons ici au cas de l’effet Hall entier et à l’hypothèse
de non-dégénérescence. L’invariant K est analogue à certaines expressions
qui apparaissent dans les théories de jauge et peut s’interpréter comme
l’intégrale de la courbure d’un certain espace fibré.
Pour conclure cet appendice, nous allons montrer que K est bien un
entier. Considérons un lacet paramétrisé par la variable s dans l’espace des
flux et introduisons l’équation d’évolution
d
(A.13)
avec P ( s ) P ( p l ( s ) , p 2 ( s ) ) ,pa(s+ 1) = pa(s).Le membre de droite étant
antihermitien, l’évolution le long de ce lacet est unitaire. Si P(O)lX(O)) =
IX(O)), il en résulte que I X ( s ) ) demeure un vecteur propre de P de valeur
propre unité. I1 en est de même pour l’espace orthogonal complémentaire
correspondant à la valeur propre zéro. Sous ces hypothèses après un tour
complet IX(1)) = e’C(r)lX(O)).La phase eit(r) est une phase dite de Berry
introduite dans son étude des invariants adiabatiques. Pour la calculer,
rappelons que le long du lacet P = 1O)(RI, où s2 est l’état fondamental
de HO qui présente des discontinuités aux coupures. Par conséquent
En insérant cette relation dans l’équation (A.13)’ nous voyons que la
projection (s2lX) vérifie
X.A
313
ÇYÇTEMEÇ DESORDONNES
(A.14)
avec IX(O)), IX(1)) tous deux proportionnels à IR((pl(O), (p~(0))).Ainsi la
phase est donnée par
(A.15)
Si on choisit maintenant y homotope au lacet trivial sur le tore 7,
il définit deux régions Si et Sz. L’intégrale curviligne s’écrit alors de deux
manières distinctes comme intégrale de surface. Grâce à l’hypothèse de nondégénérescence, on peut exprimer ces intégrales à l’aide du projecteur P
exp/(dRlR) = exp
Y
/LI
Tr d P P d P = exp
/12
TrdPPdP
(A.16)
Si y est contracté en un point ainsi que Si, les deux premières intégrales se
réduisent à l’unité, ce qui entraîne que K est un entier, comme on l’avait
annoncé.
On peut objecter à cette discussion que la définition de la conductivité
de Hall n’implique pas nécessairement une moyenne. Mais ceci est compensé
par la grande généralité de l’argument fondé uniquement sur la géométrie
du dispositif et l’invariance de jauge en mécanique quantique. Finalement,
mentionnons que les phases de Berry comme celle introduite plus haut
apparaissent dans de nombreuses circonstances où intervient la topologie
de l’espace des paramètres d’un système quantique (ou de tout système
admettant un principe de superposition).
Notes
La localisation des fonctions d’ondes due au désordre fait l’objet d’un
papier classique de P.W. Anderson Phys. Rev. 109,1492 (1958). Le lecteur
trouvera d’abondantes références aux travaux qui ont suivi dans le cours
de D. Thouless publié dans l’ouvrage Ill Condensed Matter, Les Houches,
R. Balian, R. Maynard et G. Toulouse éditeurs, North Holland (1979) et les
articles de D. Thouless, E. Abrahams et F. Wegner dans Common Trends
in Particle and Condensed Matter Physics. E. Brézin, J.-L. Gervais, et
G . Toulouse éds. Phys. Reports 67 (1980).
L’analyse du potentiel aléatoire gaussien est due à B. Halperin, Phys.
Rev. A139, 104 (1965). Pour les problèmes de diffusion à une dimension on
consultera l’article de revue de S. Alexander, J. Bernasconi, W.R. Schneider
et R. Orbach, Rev. Mod. Phys. 53, 175 (1981). Un autre cas exactement
314
SYSTEMES DESORDONNES
X.Notes
soluble est traité par J.P. Bouchaud, A. Comtet, A. Georges, P. Le Doussal,
Europhys. Lett. 3, 653 (1987).
La méthode des répliques a été introduite par S.F. Edwards et P.W. Anderson, J. Phys. F5, 965 (1975). La supersymétrie qui apparaît lorsque
l’on représente les jacobiens des sytèmes contraints par des intégrales de
Grassmann fut d’abord observée dans les théories de jauge par C. Becchi, A. Rouet, et R. Stora. On en trouve un exposé dans Renormalization
Theory, G. Vel0 et A.S. Wightman éditeurs, Reidel, Dordrecht (1976).
L’étude du spectre des chaînes d’oscillateurs aléatoires est due à
F.J. Dyson, Phys. Rev. 92, 1331 (1953) et D.J. Thouless, J. Phys. C5,
77 (1972). B. Derrida et R. Orbach, Phys. Rev. B27, 4694 (1983) discutent
le développement à faible désordre. L’exemple présenté dans le texte est extrait d’un article écrit en collaboration avec E.J. Gardner and B. Derrida,
J. Phys. A17, 1093 (1984).
Pour une revue sur l’effet Hall quantique, voir K. von Klitzing, Rev.
Mod. Phys. 58, 519 (1986) et The Quantum Hall Effect, R.E. Prange et
S.M. Girvin éditeurs, Springer Verlag, New York (1987). Le calcul du spectre
en champ magnétique intense en présence d’un potentiel aléatoire est dû à
F . Wegner, 2. Phys. B51, 279 (1983). La généralisation présentée dans le
texte est issue d’une collaboration avec E. Brézin et D. Gross, Nucl. Phys.
B235 [FS 111, 24 (1984). La quantification de la conductivité Hall comme
conséquence de l’invariance de jauge est discutée dans R.B. Laughlin, Phys.
Rev. B23, 5632 (1981). Nous suivons dans l’appendice A l’argument dû à
J.E. Avron et R. Seiler, Phys. Rev. Lett. 54, 259 (1985). C’est à M.V. Berry,
Proc. Roy. Soc. London A392, 45 (1984) qu’on doit une étude des phases
qui apparaissent parmi les invariants adiabatiques.
Les ensembles de matrices aléatoires ont été introduits et étudiés par
E.P. Wigner, F.J. Dyson, M.L. Mehta, M. Gaudin et d’autres auteurs. On
trouvera une étude détaillée dans l’ouvrage de M.L. Mehta Random matrices and the statistical theory of energy levels, Academic Press, New York
(1967). Pour l’utilisation dans ce contexte de variables anticommutantes, on
consultera l’article d’E. Brézin dans les comptes rendus de la 8ème rencontre
de Sitges, L. Garrido éditeur, Lecture Notes in Physics 216, 115, Springer,
Berlin (1985).
L’approximation planaire est due à G. ’t Hooft, Nucl. Phys. B72, 461
(1974) ibid, B75, 461 (1974). Les aspects algébriques ont été analysés par
J. Koplik, A. Neveu et S. Nussinov, Nucl. Phys. B123, 109 (1977). Notre
présentation s’inspire d’un travail en collaboration avec E. Brézin, G. Parisi
et J.-B. Zuber, Comm. Math. Phys. 59, 35 (1978) ainsi qu’avec D. Bessis
et J.-B. Zuber, Adv. in Appl. Math. 1, 109 (1980).
Le comportement d’un système de spins en champ aléatoire est analysé
par Y. Imry et S.K. Ma, Phys. Rev. Lett. 35, 1399 (1975). La réduction
dimensionnelle et le rôle de la supersymétrie ont été démontrés par G. Parisi
et N. Sourlas, Phys. Rev. Lett. 43, 744 (1979). K.B. Efetov, Adv. in Phys.
X.Notes
SYSTEMES DESORDONNES
315
32,53 (1983) passe en revue les applications des variables anticommutantes
aux systèmes désordonnés.
A.B. Harris, J. Phys. C7,1671 (1974) donne un critère caractérisant
l’effet d’un faible désordre sur une transition continue. Vi.S. Dotsenko et
VIS. Dotsenko Adv. in Phys. 32, 129 (1983) ont étudié le cas du modèle
d’Ising bidimensionnel. Nous nous sommes inspirés du travail postérieur de
R. Shankar, Phys. Rev. Lett. 58,2466 (1987). La théorie des champs sousjacente est due à D.J. Gross et A. Neveu, Phys. Rev. D10,3235 (1974).
Pour la renormalisation à deux boucles de ce modèle, voir W. Wetzel, Phys.
Lett. 153B,297 (1985).
CHAPITRE XI
GEOMETRIE ALEATOIRE
De nombreux modèles statistiques font intervenir des éléments géométriques aléatoires. On peut en citer des exemples empruntés à la théorie
des liquides, des membranes, des polymères, des défauts dans les structures
ordonnées, des microémulsions, des interfaces ... Les théories de jauge font
intervenir des surfaces aléatoires, ainsi que les théories de champs fondées
sur des objets étendus comme les cordes, et la théorie quantique de la gravitation nécessite une généralisation à des variétés de dimension supérieure.
On a vu que la théorie quantique locale des champs a des liens étroits avec
celle des chemins aléatoires. On peut alors se poser la question de trouver
un modèle universel, généralisant celui des courbes browniennes, décrivant
des variétés browniennes et en premier lieu des surfaces de ce type (Polyakov (1981)). Malgré de nombreux efforts en ce sens, on n’a pas obtenu à ce
jour un tel archétype universel. Mais ce problème a suscité des études qui
ont mis à jour des structures mathématiques très intéressantes. Nous nous
bornerons ci-dessous à une présentation succincte du sujet.
Dans la première section nous discutons les réseaux aléatoires dans
l’espace euclidien. Christ, Friedberg et Lee (1982) ont suggéré que si on
substituait de tels réseaux aux réseaux réguliers dans l’étude de divers modèles, la moyenne sur le désordre engendrerait une invariance de translation
(et de rotation) continue, tout en préservant un facteur de coupure à courte
distance. Le formalisme pourrait s’étendre à d’autres types de variétés mais
nous ne nous y engagerons pas. Et nous nous abstiendrons de développer
l’analyse des modèles standards sur de tels réseaux en observant que même
la théorie des champs libres y soulève de délicats problèmes typiques des
milieux désordonnés. Certaines des méthodes qui s’appliquent dans ce cadre
peuvent être utiles dans l’étude des liquides ou des verres.
La seconde section est consacrée aux surfaces aléatoires, à la fois dans
un contexte discret ainsi que directement dans une version continue. C’est
alors qu’apparaît la question de l’invariance par reparamétrisation, analogue
à la covariance générale de la théorie de la gravitation. Nous nous heurtons
alors à l’anomalie quantique correspondante qui a déjà été discutée à propos
de l’invariance conforme au chapitre IX. Nous décrivons en détail le modèle
continu de Polyakov, la dimension magique 26, ainsi qu’un analogue discret,
relié comme on le verra à la théorie quantique planaire.
318
GEOMETRIE ALEATOIRE
XI.1
1. Réseaux aléatoires
La géométrie aléatoire appartient à une tradition mathématique respectable, comme en témoigne le célèbre problème de l’aiguille de Buffon. On
en trouve un exposé classique dans un ouvrage de Santal0 sous le nom de
géométrie intégrale. Au début des années soixante, Berna1 envisage l’application des empilements aléatoires de sphères à la description des fonctions
de structure des liquides. Ici nous présentons un sujet voisin, celui des réseaux poissoniens dont nous étudions les propriétés locales. Comme il a été
mentionné ci-dessus, ces réseaux permettent de conserver un facteur de coupure ultraviolet tout en maintenant en apparence des invariances continues
de translation et de rotation, en supposant que les quantités extensives possèdent une propriété d’“auto-moyennage” , terme barbare qui, comme en
thermodynamique, implique qu’un grand système typique réalise, avec un
poids égal, toutes les configurations locales possibles. La description de ces
réseaux nous offre l’occasion d’introduire en termes élémentaires un certain
nombre de concepts d’intérêt topologique et géométrique. En outre l’étude
de modèle sur ces structures est une introduction naturelle à la théorie des
champs sur un espace courbe quelconque, en ce sens que l’utilisation d’un
réseau arbitraire est une analogue discret du choix d’un système quelconque
de coordonnées en géométrie continue.
1.1 Réseaux poissonniens et statistique locale
Choisissons N points au hasard
de l’espace euclidien à d dimensions
uniforme. Considérons la limite où N
tendant vers l’espace tout entier) tout
N
-+
00,
R
-+
00,
indépendamment dans une région
de volume R, avec une probabilité
et R tendent vers l’infini (la région
en maintenant la densité fixe
N/R
-+
p = a-d
(1)
La quantité a = p - l / d joue le rôle de longueur élémentaire. Nous utiliserons
des unités telles que a = 1, donc p = 1 . Comme on l’a vu au chapitre X,
si la dimension d est égale à 1, les points peuvent être ordonnés, de telle
sorte que les intervalles C entre points successifs deviennent des variables
indépendantes à la limite avec une distribution
Ceci justifie le nom de réseau poissonnien.
Considérons le cas bidimensionnel. La généralisation en dimension plus
élevée ne présentera pas de difficulté. La construction qui va suivre est due
à Dirichlet et Voronoi. Associons à chaque point Mi du réseau la cellule Ci
formée des points du plan dont la distance à Mi est inférieure ou égale à
celle de tout autre point du réseau Mj,j # i. La cellule Ci est un polygone
convexe fermé, comme intersection de demi-plans. Pous chaque paire i, j
XI.1.1
319
GEOMETRIE ALEATOIRE
l’intersection Ci n Cj est soit vide, soit un segment de la médiatrice du
segment MiMj qui appartient à la frontière de Ci comme de Ci. Dans
ce cas nous disons que la paire ( M i , M j ) est une paire de voisins. Nous
appelons qi le nombre de coordination local, c’est-à-dire le nombre de voisins
de Mi, ou encore le nombre de côtés de la cellule Ci. Si pour un triplet
i # j # IC, l’intersection Ci n Cj n Ck est non vide, c’est un sommet de
chacune des cellules correspondantes, centre du cercle circonscrit au triangle
( M i ,M j , M k ) que nous appelons 2-simplexe élémentaire comme le segment
( M i ,M j ) était un 1-simplexe élémentaire. Le plan est alors pavé de tels 2simplexes comme il était pavé de cellules Ci. Les deux ensembles sont en
relation de dualité.
Soit NO= N le nombre de points Mi, égal au nombre de cellules, Ni le
nombre de liens entre voisins et N2 le nombre de 2-simplexes égal au nombre
de sommets des cellules. Nous avons la relation d’Euler
No - Ni
+ N2 = x
(3)
où la caractéristique x (2 pour la sphère, O pour le tore...) n’est pas extensive,
c’est-à-dire dans la limite de volume infini x / N -t O. En coupant le plan le
long du bord des cellules nous obtenons NOmorceaux (les cellules) possédant
2Nl = C i q i arêtes et 3N2 sommets. Comme chaque cellule a autant de
sommets que d’arêtes (ceci constituant la relation d’Euler à une dimension)
nous trouvons
(4)
No=Cl
i
De la sorte, si nous définissons le nombre de coordination moyen selon
les relations précédentes impliquent que
ni = 6
Ni
lim - = 3
NO
N2
lim - = 2
NO
De manière équivalente, si na désigne le nombre moyen de a-simplexes
q)
incidents sur un O-simplexe (un point du réseau) (de sorte que ni
on a
n1
= 122 = 6
(7)
Le cas bidimensionnel a ceci de particulier que les relations ( 6 ) et (7)
sont vérifiées localement pour le réseau triangulaire régulier. On peut
320
XI.1.1
GEOMETRIE ALEATOIRE
donc considérer de façon imagée qu’un réseau aléatoire bidimensionnel est
équivalent topologiquement à un réseau triangulaire possédant des défauts.
Ces derniers sont assimilés aux points où le nombre de coordination local
diffère de six et sont porteurs de l’analogue d’une “charge” (le défaut à six)
dont la somme totale est nulle en vertu des relations (6).
Introduisons à présent des propriétés métriques. Nous utiliserons les
notations
eij = distance entre les voisins ( M i ,Adj)
C i jk
= aire du simplexe
(Mi,
Adj ,Mk)
(eij) = el
(lijk)
= .e2
De manière analogue nous posons
oi = aire de la cellule
Ci
(Ci)= ~2
oij = longueur de l’arête perpendiculaire au lien (ij) ( u i j ) = u1
La densité de points étant égale à l’unité par convention, nous avons
u2 = 1
e,
=
(8)
Le calcul de e, et o1 est plus complexe et le type de raisonnement typique
des problèmes de réseaux aléatoires. Désignons par (i, j , k) un 2-simplexe et
soit O le sommet dual commun aux cellules Ci,Cj ,CI,.Le cercle I? de rayon R
centré en O est circonscrit au triangle (z,j,k) (figure 1).Par construction, il
ne peut y avoir d’autre point du réseau à l’intérieur de î , car pour C # i, j , k
la distance lOMlI est supérieure ou égale à IOMil, IOMjl, and 1OMkI.
Figure 1: La construction de Dirichlet-Voronoi en dimension 2.
XI.1.1
GEOMETRIE ALEATOIRE
321
Etant donné un point A41 appartenant au réseau, la probabilité que
deux autres points M2 et M3, situés dans les aires infinitésimales d2x2 et
d223 respectivement, forment un simplexe élémentaire est donc
d p = - 1x S ( N - l ) ( N - 2 ) ~
722
où le facteur de normalisation nT1 intervient puisqu'il y a n 2 2-simplexes
incidents en moyenne en un point donné, le terme !j(N - 1)(N- 2) compte
le nombre de choix de paires parmi les N - 1 points restants, tandis
que le dernier facteur exprime la probabilité que les N - 3 autres points
appartiennent à l'extérieur du cercle r. A la limite N + CO' la densité de
probabilité cherchée
dp = L12e - 7 i R 2
d222d223
(9)
a une expression qui rappelle la distribution de Poisson (2).
Utilisant pour paramètres le rayon R du cercle circonscrit et les
angles polaires 91, 9 2 , 9 3 de OM1, OM2, OM3, tels que
vérifier que la densité de probabilité (9) est correctement normalisée
Pour obtenir e l , la distance moyenne entre voisins, nous calculons la
moyenne de lM1M2[ = 2R lsin $ ( ( p a - pi)l avec pour poids dp, c'est-à-dire
avec pour résultat
32
9T
Ci = - =
1.1317684
322
XI.1.1
GEOMETRIE ALEATOIRE
(i) La procédure employée ci-dessus qui consiste à calculer le côté moyen
d’un simplexe et à l’égaler à la distance moyenne entre voisins est justifiée par
le fait que chaque lien appartient à deux simplexes et deux seulement. Ainsi
on a
el
=-Ce..
-Ni
1
liens
2N1
eij
triangles T &,ES
=-3N2 x moyenne d’un côté d’un triangle
2Ni
et 3N2/2N + 1. A trois dimensions le nombre de tétraèdres possédant
une arête commune n’est pas une constante, de sorte que la moyenne d’une
arête d’un tétraèdre n’est pas égale à la distance moyenne entre voisins. Le
raisonnement précédent ne s’applique alors qu’au calcul de l’aire moyenne
d’une face triangulaire. A défaut d’une autre méthode, les quantités dénotées
ci-dessous t , i , en dimension arbitraire d seront en fait les moyennes des
éléments correspondants d’un simplexe typique.
(ii) La quantité e1 obtenue ci-dessus pour un réseau aléatoire est à
comparer à la quantité correspondante d’un réseau triangulaire régulier de
même densité, à savoir 2 3 3 - * = 1.0745699, montrant comme on s’y attendait
qu’un réseau aléatoire est un peu plus lâche.
(iii) A l’aide de la densité de probabilité (9) vérifier que e 2 est égal à $
comme il se doit, tandis que sa variance relative est relativement grande
Meijering a obtenu le périmètre moyen d’une cellule à l’aide d’un
ingénieux raisonnement. Soit M un point du réseau. Attachons à tout
autre point Mk la médiatrice A, du segment M M k . Le nombre de ces
médiatrices à distance comprise entre r et r d r est égal au nombre de
points Mk à distance comprise entre 2r et 2r 2dr, c’est-à-dire 8nrdr. La
fraction de longueur d’une telle droite à distance comprise entre R et R t- d R
est (R2 - r2)-i2RdR (figure 2). La longueur totale moyenne, candidate à
appartenir à la frontière de la cellule à distance R à d R près, est obtenue
en intégrant le produit de ces deux facteurs en r entre les bornes O et R, à
savoir
+
+
167rRdR
1 dlT7
rdr
= 16rR2dR
Un élément de cette longueur appartient effectivement à la frontière de
la cellule entourant M si le cercle de rayon R I centré sur l’élément de
longueur (et passant donc par M) ne contient aucun point du réseau dans
XI.1.1
323
GEOMETRIE ALEATOIRE
M
Figure 2 : Construction géométrique intervenant dans l'argument de
Meijering.
Dimension
du
simplexe
Nombre
Nombre moyen
incidents
par site
O
No = N
no = 1
1
Ni = 3 N
2
N2
n1 = 6
122 = 6
= 2N
Taille
moyenne
Taille
moyenne
(dual)
tl=g
e2
=
+
u2 = 1
g 1 = -2
3
Table I : Moyennes locales pour un réseau aléatoire bidimensionnel de
densité unité.
son intérieur, ce qui a pour probabilité e-XR2.Donc la fraction du périmètre
de la cellule à distance R à d R près est
16rR2ëRR2dR
En intégrant sur R nous obtenons le périmètre moyen
P = i6r
1"
R2e-"R2dR = 4
(11)
Comme chaque cellule a en moyenne six côtés, nous trouvons
01
= 72j
(12)
à comparer avec la valeur 233-4 = 0.62204032 pour un réseau triangulaire
régulier. La table I rassemble ces résultats sur les moyennes de quantités
locales pour un réseau bidimensionnel.
324
GEOMETRIE ALEATOIRE
XI.1.1
I1 est possible d’écrire une expression analytique intégrale pour la probabilité p , de trouver une cellule à n côtés. Soit MO a l’origine du système
de coordonnées l’un des points du réseau et Mi,. . ., M , de coordonnées XI,
. . ., x,, ses voisins. Soit A l’aire de l’union des cercles centrés en Mi,. . ., M n i
et passant par MO. Enfin notons x( M i , . . . , M,) une fonction caractéristique
qui vaut 1 si les médiatrices des segments ( M o , M i ) engendrent un polygone
convexe à n côtés et O autrement. Alors
En effectuant numériquement l’intégration on obtient les valeurs figurant dans
n p , = 6 soit aussi la
la table II. Bien que la valeur moyenne q =
plus probable avec une fréquence approximative de trente pour cent, d’autres
nombres de coordination apparaissent avec une fréquence appréciable. Pour n
grand, p,, décroît très rapidement selon une loi de la forme nWali, où le
coefficient a est compris entre 1 et 2. La figure 3 donne une représentation
graphique de l’histogramme correspondant.
I
n
3
4
5
6
7
8
9
10
20
35
50
I
Pn
(1.127 f 0.008)10-2
(1.077 h O.OO1l)lO-l
0.258 I-t 0.002
0.294 zk 0.003
0.198 A= 0.003
0.090 0.020
(2.88 0.07)10-2
(6.95 f 0.20)10-3
(1.5 f 0.8)10-13
3.6.10-40
1.5.10-73
Table II : Distribution de probabilité p n d’observer une cellule à n côtés.
On peut étudier encore la distance moyenne A, d’un point du réseau à la
frontière de la cellule à n-côtés à laquelle il appartient, et l’aire moyenne A ,
de cette cellule. On constate que A , est approximativement linéaire en n, de
in+constante, pour n grand, comme si la cellule croissait dans
la forme A ,
un milieu “hostile”. Le rapport A,/Ai semble converger vers T , suggérant qu’à
certains égards une très grande cellule se comporte comme un cercle.
N
La construction de Dirichlet et Voronoi se généralise en dimension
supérieure. Donnons quelques détails à trois dimensions. Soit NO = N le
XI.1.1
325
GEOMETRIE ALEATOIRE
3
1
5
6
7
8
9
1
0
n
Figure 3 : Histogramme représentant les probabilités p,.
nombre de points, Ni d’arêtes, N2 de triangles et N3 de tétraèdres. La
caractéristique d’Euler s’annule en dimension impaire, de sorte que
No
-
Ni
+ N2
-
N3 = O
(14)
Chaque triangle est commun à deux tétraèdres, et il y a quatre triangles sur
la frontière d’un tétraèdre, ce qui se traduit par
Si n, désigne comme précédemment le nombre moyen de simplexes de type
u incidents en un point du réseau
Les propriétés topologiques à elles seules impliquent que
ne laissant subsister qu’une seule inconnue, 723 par exemple. La probabilité
de trouver un tétraèdre avec un sommet Ml à l’origine des coordonnées et
trois autres M2, M 3 , A44 en x2, x3, x4 à d3xi près s’écrit
où R désigne le rayon de la sphère circonscrite au tétraèdre. Ainsi
326
XI.1.1
GEOMETRIE ALEATOIRE
Pour évaluer cette intégrale on fait choix de variables d’intégration appropriées. Soit O le centre de la sphère circonscrite et u1, u2, us, u4 des vecteurs
unitaires portés par OMl, OM2, OM3 et 0M4. Appelons R3w le volume
du tétraèdre tel que
le signe étant choisi pour rendre w positif. Alors
n
4
1
d3xi = RawdRd2û~d2û2d2Û3d2û~
3! 2 = 2
-
où d2û est la mesure sur la sphère. On trouve alors que
n3
= 72n (w)
où (w)est la moyenne sphérique
4
(23)
i=l
Nous donnerons ci-dessous (équation (36)) la généralisation à d-dimensions
de cette intégrale. Cette formule appliquée à d = 3 fournit
n3
n1 = 2
I=
gr2= 27.0709.. .
+ gr2= 15.53546...
n2 = %a2 = 40.6064.. .
(24)
où nous avons utilisé l’équation (17). Une autre façon d’exprimer ce résultat
est d’écrire dans la limite N + m
N2/N =
48
2
Ni/N = 1
+ 24
2
(25)
Bien entendu ces fréquences ne correspondent à aucun réseau régulier.
Le volume moyen d’un tétraèdre en unités naturelles est l’inverse de
rapport N3/N, c’est-à-dire
XI.1.1
327
GEOMETRIE ALEATOIRE
De la densité de probabilité (18) on déduit l'aire moyenne d'un triangle
et la longueur moyenne d'une arête (avec les restrictions exposées ci-dessus)
En ce qui concerne le réseau dual ~3 = 1. L'argument de Meijering
donne l'aire moyenne de la frontière d'une cellule sous la forme
aire moyenne de la frontière =
d'où il s'ensuit u2 en divisant par
(F)';r($)
= 5.821
(29)
n1
Ces données sont rassemblées dans la table III tandis que la table IV présente
les résultats analogues en dimension quatre.
Le nombre de coordination moyen croît très vite avec la dimension. I1
= 37.778 à quatre dimensions à comparer à la valeur 8
est déjà égal à
pour un réseau hypercubique régulier.
y
Les calculs précédents sont déjà assez ardus. Très peu de résultats
sont connus en dimension générique d. Donnonsen quelques-uns ci-dessous.
que d
(i) Comme chaque (d - 1)-simplexe est commun à deux d-simplexes et
1 tels ( d - 1)-simplexes bordent un d-simplexe, on a
+
2Nd-i = (d $- 1)Nd
nd-1
= $dnd
(31)
La relation d'Euler appliquée à la frontière d'une cellule, homéomorphe à une
sphère, s'exprime sous la forme
Plus généralement, si n k , m ( k > m , ( n k , o
simplexes incidents sur un m-simplexe, on a
nk)
désigne le nombre de k-
d
(-1)k-m-I
k=m+l
De manière équivalente, comme
nl;,m = 1 - (-1)
d-ni
(33)
328
al
x
d
d
al
O
al
+
-E
2
-i
O
l-l
vi
.3
z
42
fi
O
8
P
n
a,
CI
CI
3
u..
3
3
M
E
z
v1
al
I?
3
3
.3
al
B i
.4
2fi
GEOMETRIE ALEATOIRE
cùm
XI.1.1
XI.1.1
GEOMETRIE ALEATOIRE
nk,m =
2
k=m
329
( k + l)!
NI,
( k - m ) ! ( m l)! Nm
+
+
( k I)!
( - l ) d - k N k = Nm
( k - m ) ! ( m l)!
+
Le cas m = d est trivial. Les équations pour m = d - 1 et d - 2 donnent
une information équivalente et ainsi de suite. Ainsi les équations (35) laissent
subsister 2 d - 1 (d pair) ou $(d - 1) (d impair) inconnues parmi les quantités
N I I N , . . ., N d / N . En dimension deux, les identités topologiques sont suffisantes pour calculer ces fréquences, en dimension trois et quatre il reste une
inconnue, etc ...
(ii) Passons au calcul de n d , le nombre moyen de d-simplexes incidents
en un point. Généralisant l'expression (11) on obtient en général
où V est le volume de la sphère circonscrite au d-simplexe (xi = O,x2,
. . . ,x,j+l) dont nous notons R le rayon. Ainsi V = d-l RdSd où Sd est l'aire
de la sphère unité
Prenant l'origine au centre de la sphère avec û1,. . ., ûd+l des vecteurs unitaires
le long de OM1, . . ., OMd+1 et Wd désignant la généralisation évidente de
l'expression (20) relative au cas tridimensionnel, on trouve
où (wd)est la moyenne d'un déterminant (d
+ 1) x (d + 1)
+
Les indices a , p varient de O à d, A,o = 1 ûa . ûo, et l'intégration est
sur des vecteurs unitaires à d
1 dimensions. Pour un simplexe régulier
+
ûa.ûo = 6 , ~- (1 -6,p)/d
et wreg = [d!dfd]
-1
(1 +d)i(l+d).Les extrémités
des d vecteurs û i , . . . , û d sont les sommets d'un (d - 1)-simplexe de volume
A dans un hyperplan à une distance h de l'extrémité de ÛO et w = hA/d.
Soit Û un vecteur unitaire le long de la normale à cet hyperplan avec deux
orientations possibles. En général
(34)
(35)
330
GEOMETRJE ALEATOIRE
d
J
f ( c i ,..., Cd)fldd-'Ûk
1
=
J
XI.1.1
d
idd-'û(d-
i)!Afldd-lÛk
1
Posons Ûk = cosûkû +sin û k 9 k où Yk est un vecteur unitaire à ( d - 1) dimen~ Yarguments
k.
des
sions orthogonal à 0 , et dd-'ûk = ~ i n û k - ~ d c o s û ~ d ~ -Les
fonctions 6 sont cosûk - cos&, k 2 2, et contraignent Û a être orthogonal à
tous les 9 k . Nous substituons f
hA/d et observons que A = sinûd-lwd-1.
Effectuant l'intégrale sur ûo, on a
où le dernier rapport provient de la moyenne sur la hauteur h. Ainsi
Développons le déterminant d x d comme une somme sur un produit de cycles
et observons que chaque cycle donne une contribution factorisée. Utilisons les
propriétés
On obtient
Groupons les termes ayant même décomposition cyclique. Soit aie 2 O le
= d. Le nombre
nombre de cycles de longueur e, de telle sorte que
de partitions ayant cette décomposition cyclique est
Cela,
XI.1.1
331
GEOMETRIE ALEATOlRE
d!
n(=,
eatat!
et leur signature est (-l)p = (-l)Ee(e-l)af.
Ainsi
t
=coefficient de td dans
(1
+ t ) (1 + E)
d-1
-
1
(d - l)d-l
En combinant ces informations nous obtenons
En conséquence
Asymptotiquement pour d grand
2 1
1
-e4 ( 2 ~ d ) 2~ di
N
nd d-ca
(37)
Le volume moyen d'un d-simplexe est
ed
d+1
=nd
Une généralisation des raisonnements présentés en basse dimension donne aussi
"l'aire'' moyenne P de la frontière d'une cellule
p = 2d+l
'r
d
(2 -
1)
d
1
r(d-i)
2-1jd
[r ( i d + 111
En divisant par n d - 1 donné par les équations (31) et (36) nous obtenons la
quantité e d - 1
(39)
332
GEOMETRIE ALEATOIRE
XI.1.1
Jusqu’ici nous n’avons étudié que des moyennes locales. Bien que les
points du réseau soient choisis au hasard indépendamment, la construction
de Dirichlet engendre des corrélations à grande distance, dont il serait
intéressant d’obtenir une estimation. Ceci est un problème difficile dont on
ne semble pas connaître la solution. Un sujet voisin concerne les empilements
aléatoires, en particulier de sphères.
Illustrons la puissance des arguments élémentaires de topologie
combinatoire, analogues à ceux employés ci-dessus, en décrivant les cinq
polyèdres réguliers tridimensionnels (encore appelés solides platoniciens). Un
sous-groupe fini de rotations agit transitivement par des permutations des No
sommets, N i arêtes et N2 faces, ce qui signifie que les éléments de chaque
classe sont tous équivalents. Soit q le nombre de coordination, c’est-à-dire le
nombre de sommets voisins d’un sommet donné et ïj le nombre d’arêtes de
chaque face. Chaque arête est commune à deux faces et joint deux sommets
et la caractéristique d’Euler x vaut 2, ce qui s’écrit
ou encore
Ceci eviraîne que (4 - q ) N o
+ (4 - ïj)N2 = 8, de sorte que q ou ïj est inférieur
à 4. Comme chacun d’eux est supérieur ou égal à 3 (sinon on ne peut avoir
de solide) on en déduit que les faces sont des triangles (6 = 3) ou que chaque
sommet a trois voisins ( q = 3). Les relations précédentes impliquent en outre
que (6 - q)No = 12 2(ïj - 3)N2, qui montre que q ne peut prendre que les
valeurs 3,4 et 5 puisque le membre de droite est supérieur ou égal à 12. I1 en
est de même pour 4.. Donc on a q = 3 et 4 = 3 , 4 , 5 ou 6 = 3 et q = 3 , 4 ou 5
avec une complète dualité. On tire encore des expressions ci-dessus la valeur
de l’entier
+
Pour q = 3 et 6 = 3 , 4 , 5 (ou ïj = 3 et q = 3 , 4 , 5 ) on trouve respectivement
N1 = 6, 12, 3 0 ; ceci conduit à la table suivante des cinq polyèdres réguliers.
Dans la première colonne nous donnonS.la description des faces (correspondant
à la valeur ïj pour le nombre de leurs côtés) et nous indiquons dans la dernière
colonne l’ordre du groupe de rotations propres laissant le solide invariant et
égal à 2N1 puisqu’il agit transitivement sur les arêtes orientées, comme on s’en
assure aisément.
Le lecteur peut-il étendre ces arguments en dimension plus grande?
XI.1.1
333
GEOMETRIE ALEATOIRE
Faces
4 triangles
-
-
Ni
N2
4
Ordre du
- - groupe de rotations
6
4
12
3
6
12
8
24
4
8
12
6
24
3
12
30
20
60
5
20
30
12
60
-
-
ii
No
3
-
(Tétraèdre)
8 triangles
(Octaèdre)
6 carrés
(Cube ou hexaèdre)
20 triangles
(Icosaèdre)
12 pentagones
(Dodécaèdre)
-
Table V : Polyèdres réguliers à trois dimensions.
Si on ajoute à la liste précédente de groupes finis de rotations les deux
séries infinies de groupes cycliques et diédraux, on retrouve la classification
A-D-E, rencontrée dans la section 3-4 du chapitre IX.
1.2 Equations des champs discrétisées
Nous voulons maintenant utiliser un réseau aléatoire pour y étudier un
modèle statistique ou de théorie des champs faisant appel aux propriétés
métriques associées aux points, aux liens ... En réalité nous avons obtenu
deux réseaux. Le premier est un réseau simplicial L correspondant aux O,
1, 2, ... simplexes. Un @simplexe est un point i (et nous posons ti i),un
1-simplexe est un lien joignant deux voisins (ij) à la distance t i , = t j i et
orthogonal à l’hyperplan de la face commune à deux cellules voisines, etc.
dimensions. Nous
Le réseau dual est constitué de cellules à d, d - 1,
appelons i la cellule à d-dimensions à laquelle appartient i et notons oi son
(hyper-) volume, ( i , j ) désigne ainsi la cellule à ( d - 1) dimensions duale du
lien (ij) et commune aux cellules i et j , d’“aire” uij, et ainsi de suite.
Nous définissons les O-formes comme les fonctions définies sur les sites,
i + vi.De manière analogue FIest l’ensemble de 1-formes antisymétriques
définies sur les liens orientés, cpij = -‘pji. En généralisant cette notion
F2 est composé des 2-formes antisymétriques attachées aux 2-simplexes
pijk = - p j i k - ... , et ainsi de suite. En parallèle soit Fd l’ensemble
des d-densités, c’est-à-dire les fonctions $i associées aux cellules i supposées
orientées. L’ensemble des (d- 1)-densités $ ; j , définies sur les (d- 1)-cellules
orientées, constitue Fd-1,et a h s i de suite. Les orientations de la cellule
(ij. . .) et du simplexe dual sont choisies de manière compatible, c’est-à-dire
que leur produit est unité.
334
GEOMETRIE ALEATOIRE
XI. 1.2
Les formes cpi, cpij, c p i j k , . . . peuvent être considérées comme la restriction au réseau de champs scalaire, vectoriel, tensoriel, ... définis dans l’espace
continu sous-jacent selon la correspondance
I1 existe une notion naturelle de dualité entre les espaces vectoriels 3pet
Avec cp dans FP,
$ dans F d - p , nous avons
Fd-p.
p=o
p=l
p=2
...
Les factorielles en dénominateur compensent la multiplicité intervenant dans
les sommes qui s’étendent sur les sites, les paires ordonnées de voisins, les
triplets ordonnés de voisins, etc. On pourrait étendre cette dualité exprimée
ici pour des quantités réelles en une forme sesquilinéaire pour des quantités
complexes au prix d’une modification inessentielle. La dualité elle-même
peut être transformée en une identification de la forme
e z j k ...p i j k
q i j k ...
(43)
... = a i j k ...
où l’on n’entend évidemment pas de sommation sur les indices répétés. Pour
tout p, ceci entraîne entre les dimensions la relation
Le facteur dimensionnel est le volume d’une cellule pour p = O. Pour
p = 1, c’est d fois la somme des volumes de deux pyramides de sommets
i et j respectivement et de base aij, et ainsi de suite. Nous écrivons la
correspondance (43) $ = (p ou cp = I).
XI.1.2
GEOMETRIE ALEATOIRE
335
Ceci nous permet de définir sur FP un terme de potentiel quadratique
(ou terme de masse) de la forme
soit explicitement
p=o
i
p=l
p=2
...
Pour construire un terme cinétique nous avons besoin des analogues discrets
du gradient et de la divergence ainsi que leur généralisation. Pour ce faire,
définissons l'opérateur d (l'analogue de la différentielle extérieure) comme
une application linéaire de FP dans Fp+l (donnant zéro sur 3 d ) telle que
Evidemment le carré de cet opérateur est nul
d2 = O
tandis que d'après (42) son transformé
d applique Fp dans F p + l
(48)
d'après
(49)
Explicitement
336
XI.1.2
GEOMETRIE ALEATOIRE
et
22
(52)
=0
L’opérateur divergence d* s’obtient alors en ramenant d à agir sur les espaces
3pgrâce à la correspondance (43) d’après le diagramme commutatif
dusté
3 P
d*
-
Fd-p
1
dueté
3p-1
1
Fd-pfl
0
(53)
Par exemple d* applique 3; dans 30.
Nous partons de cpij et appliquons la
correspondance (43) qui fournit +ij = @ i j = e i j u i j c p i j . Agissant avec d nous
obtenons
et revenant à 3 0 ’ toujours grâce à la relation (43), nous trouvons
dont on voit que c’est bien l’analogue discret de la divergence. Par exemple
on interprète aisément l’équation (54) comme la loi de Gauss qui égale le
flux du champ électrique à l’intégrale de la densité de charge. On a encore
d*2 = 0
-
(55)
et d* annihile 3 0 . On pourrait de même construire un opérateur d* lui aussi
nilpotent.
Nous sommes alors en mesure de définir un terme cinétique dans une
action en écrivant
En particulier pour les scalaires et les vecteurs
XI.1.2
GEOMETRIE ALEATOIRE
337
Comme dans la théorie continue la dimension de K est
[KI = [pI2[ l ~ n g u e u r ] ~ - ~
(58)
Pour décrire des champs libres de masse nulle, nous utilisons le terme
cinétique comme action. Les équations des champs classiques sont alors
obtenues en considérant les extrema de K sous la forme
6K =
(.16p) = O
ce qui se traduit par
d*dp = O
(59)
L’opérateur d*d a la dimension de l’inverse du carré d’une longueur et
applique 3pdans Fp.
Considérons d’abord le cas scalaire. Comme d*FO = O, nous pouvons
remplacer d”d par (d*d + dd*) = (d + d * ) 2 = -A , où A est le laplacien
agissant sur les scalaires, tel que
La quantité sans dimension positive
peut s’interpréter comme la probabilité d’effectuer un saut du site i à un
site voisin j. Elle satisfait à
Pj,i =
1
j
Ainsi
Montrer que les fonctions
rpj
=a
+ k.xj
où k est un vecteur constant, sont harmoniques, c’est-à-dire qu’elles satisfont
à
(64)
338
GEOMETRIE ALEATOIRE
XI.1.2
Lorsque p 2 1, les équations des champs (59) ne sont pas équivalentes à
l’équation de Laplace, pas plus que les équations de Maxwell (qui correspondent au cas p = 1) pour le quadripotentiel n’entraînent que les composantes
de ce dernier soient harmoniques, sauf choix de jauge particulier. I1 existe ici
aussi une invariance de jauge de la forme p + p’ dp“. Ainsi pour p = 1,
nous explicitons l’équation (59) sous la forme
+
Si on imagine que
continu A,(x)
<pij
est la restriction au réseau d’un champ vectoriel
montrer que l’équation (66) s’interprète comme une version discrétisée des
équations de Maxwell
OU
Fpu = a,Au - &A,. Dans le continu on a donc
Plus généralement le laplacien est défini pour tout tenseur antisymétrique dans
la version discrète comme
-A = d*d
+ dd* = (d + d*)’
(67)
Ainsi -A s’exprime comme le carré d’un opérateur dit de Dirac-Kahler qui
{<pi, vij, C p i j k , . . .} de formes de tous les degrés
agit sur des ensembles @
possibles, opérateur de la forme
On a suggéré d’utiliser cette équation comme substitut à l’équation de Dirac
sur un réseau, bien que les propriétés de transformation de @ ne correspondent
pas à celle d’un spineur.
I1 est bien entendu possible d’étudier sur un réseau aléatoire d’autres
types d’équations. On a par exemple envisagé une approche numérique des
théories de jauge quadridimensionnelles sur de tels réseaux. La tâche apparaît formidable. Même les modèles bidimensionnels présentent de sérieuses
XI.1.2
GEOMETRIE ALEATOIRE
339
difficultés, qui proviennent en partie de l'interaction entre le désordre géométrique ou topologique et la dynamique intrinsèque. A priori deux échelles
de longueur sont en compétition. En tout cas l'objectif est de comprendre
comment les symétries continues sont approchées à grande échelle.
1.3 Spectre du laplacien
L'exemple le plus simple de comparaison entre le comportement d'un
système dynamique sur un réseau aléatoire ou régulier est fourni par l'étude
du spectre du laplacien donné par les équations (60) et (63). Nous avons
déjà discuté le cas unidimensionnel au chapitre X, section 1.4. Considérons
maintenant quelques propriétés générales en dimension quelconque. Un
obstacle majeur est qu'il n'est pas possible d'utiliser l'analyse de Fourier.
Considérons un volume grand mais fini contenant N sites et soient qda)
et w, les fonctions propres et valeurs propres du laplacien. Les fonctions
propres sont normalisées selon
Une fonction arbitraire, telle que
admet un développement de la forme
a
tel que
a
Les fonctions p(") qui jouent ici le rôle des ondes planes et les valeurs
propres wa demeurent des quantités stochastiques. Nous nous intéressons
à leur valeur la plus probable ou plutôt à leur valeur moyenne.
Lorsque le nombre de sites N tend vers l'infini, l'indice (Y prenant N
valeurs, soit Np(w) le nombre de valeurs propres dans un intervalle dw
autour de w . Par définition
Dans la limite thermodynamique à densité de points fixée, on s'attend
à ce que p(w) tende vers la densité de valeurs propres la plus probable.
Nous allons chercher à déterminer le comportement de p(w) dans les deux
340
GEOMETRIE ALEATOIRE
XI. 1.3
régions des faibles et des grandes valeurs de w . Lorsque w -+ O, si on peut
approximer les fonctions propres par des ondes planes à grande échelle, on
s’attend à ce que dwp(w) N ddk/(27r)d avec w = k 2 , c’est-à-dire
Pour se convaincre que cet te estimation est raisonnable, nous envisageons
l’argument suivant. Etudions l’action du laplacien sur les fonctions
cpi(k) = e x p i k . x i
(75)
Considérons les quantités locales
Pour k petit, wi(k) est d’ordre k2, d’après les équations (64) et (65). La
quantité
s’interprète comme la valeur moyenne de l’opérateur (-A) dans l’état cp(k).
Lorsque N --> 00, il n’existe pas de direction priviligiée dans le réseau, de
sorte qu’il est légitime de prendre la moyenne de (77) sur les directions du
vecteur d’onde k
00
1 r ( i d ) e2s-1
22s s! I?( i d s)
k2’
w(k) = X(-l)s-l-s=l
+
où la dernière moyenne signifie
et peut être évaluée à l’aide de la méthode de Meijering exposée à la section
1.1. Le résultat est que
2d
dn 2
w(k) = --]LI’( 1 + i d ) 2
s=l
XI.1.3
GEOMETRIE ALEATOIRE
341
Cette expression compliquée se simplifie en dimension d = 1 ou 2 où elle se
réduit à
où I o ( z )est la fonction de Bessel modifiée
-
Dans tous les cas w ( k ) se comporte comme k2 pour k petit. Ceci renforce
la plausibilité de l’estimation (74). Le même calcul pour k2 quelconque
nous permet aussi dedéduire une conclusion intéressante. En dimension 1
nous observons que w ( k ) n’est pas borné, ce qui prouve que le support
-(w)
n’est pas borné non plus. Cependant en dimension supérieure
est borné lorsque k2 tend vers l’infini. Par exemple pour d = 2,
w ( k ) + 27r( 1 - l / Ikl +. . En général, cette limite s’obtient en négligeant
le terme oscillant dans la moyenne (76)
e
)
.
-
lim w ( k ) = 7rd
k-ca
r ( 2 - 2/d)
+
[ï(l i d ) ]2’d
ce qui permet d’affirmer que le support spectral de -A s’étend au moins
jusqu’à cette valeur.
Pour w petit et en dimension assez grande, il est très vraisemblable
que les fonctions propres sont étendues, avec probabilité unité. A l’autre
extrême, pour w grand, nous nous attendons à des états localisés. Un
argument très grossier, fondé sur cette hypothèse, fournit une estimation
de p ( w ) pour w tendant vers l’infini. E,n considérant la forme du laplacien
donné par (60) ou (63), on constate que ce sont les liens “faibles”, où la
quantité u i j / C i j est très grande, qui jouent un rôle important pour localiser
les fonctions d’onde. Imaginons que l’un de ces termes u i j / C i j est, de manière
très improbable, exceptionnellement grand en raison du fait que les points
i et j sont très voisins. Une approximation très violente consiste à supposer
qu’il correspond à cette situation une fonction propre cp essentiellement
concentrée sur les deux sites voisins i et j de telle sorte que
Ainsi
342
GEOMETRIE ALEATOIRE
XI.1.3
en supposant évidemment que le membre de droite est très grand (avec
une très faible probabilité). Comme i et j sont très proches nous pouvons
considérer à la limite que les deux cellules voisines constituent une partition
d’une cellule unique C,par un plan médiateur d’un segment infinitésimal
(ij) de longueur I!, la coupant en deux parties de volumes respectifs (T+et
O-, et ayant à l’intérieur de C une aire (TO. Alors
w
- ($+ $)
1
?“O
(86b)
où p(C)d4 se comporte comme Sdtd-ldI!. Dans (86b)la moyenne est a la fois
sur la cellule C et sur la distribution du plan médiateur. On trouve ainsi
I1 ne faut pas prendre trop au sérieux le coefficient numérique, mais la loi
de décroissance en puissance est en accord avec la normalisation de p(w),
équation (73)’ et est bien vérifiée lorsque d = 1. Bien entendu l’existence
d’une telle queue de distribution est spécifique d’un réseau aléatoire et
n’a pas d’analogue dans le cas d’un réseau régulier. L’argument précédent
implique que son existence est due à la présence d’états localisés. I1 existe
donc vraisemblablement un seuil de localisation w, dont la détermination
n’est pas aisée sauf en dimension 1 où w, = O. On ne connaît même
pas la dimension critique inférieure (peut être d = 2) telle que w, devienne
positif.
(i) Montrer qu’on déduit de l’équation (83) la règle de somme
lm
[w
î ( 2 - 2/d)
dwp(w)w = a d
+ $41 2 / d
Ceci est infini pour d = 1 en raison d’une divergence logarithmique à w grand
en accord avec l’estimation (87), et croît finalement comme d pour d grand en
raison de la petitesse de p ( w ) pour w très petit ou w très grand.
(ii) Obtenir l’inégalité
XI.1.3
GEOMETRIE ALEATOIRE
343
où q est le nombre de coordination moyen. Montrer que cette inégalité devient
une égalité pour un réseau régulier. Comme q croît très rapidement avec d pour
un réseau aléatoire et que p ( u ) tend à être très piqué, il est vraisemblable que
(89) devient asymptotiquement une égalité.
2. Surfaces aléatoires
Nous ne nous étendrons pas à nouveau sur les raisons qui justifient
l’intérêt porté à l’étude des surfaces aléatoires. Comme nous l’avons déj à mentionné une formulation fondamentale suffisamment élémentaire fait
toujours défaut. La présentation donnée ci-dessous sera donc nécessairement
fragmentaire. Nous devons d’abord donner une définition appropriée du mot
surface puisque cette notion implique divers degrés de structure internes et
externes. En premier lieu, nous avons des propriétés topologiques comme la
connexité, l’orientabilité, la classe caractéristique d’Euler, le nombre de frontières.. . La généralisation en dimension plus élevée entraînerait l’utilisation
du langage des groupes d’homologie et de cohomologie si on fait en outre
l’hypothèse d’une structure différentiable. Nous avons ensuite les propriétés
métriques, le transport parallèle et la courbure associée ainsi que les généralisations à d’autres espaces fibrés et leur connexion. On peut aussi étudier
des structures complexes. Au-delà des structures intrinsèques on peut encore
envisager les plongements des surfaces dans d’autres variétés, en pratique
surtout les espaces euclidiens (ou minkovskien). Un cas important est celui
des interfaces, généralement dans R3 bien entendu.
L’existence de frontières non triviales est un aspect important de la
différence entre surfaces et courbes. Un exemple typique est le probleme de
Plateau qui consiste à trouver les surfaces minimales bordées par une courbe
donnée. Citons encore les problèmes posés par les boucles de Wilson dans
les théories de jauge.
Une autre question qui n’était pas mise au premier plan dans le cas
des courbes, où elle aurait pourtant pu se poser, est celle de l’invariance
par reparamétrisation, appelée encore covariance générale en théorie de la
gravitation. Un problème associé est celui d’engendrer une surface selon un
processus dynamique. Une courbe peut être considérée comme la trajectoire
d’un point sans structure évoluant au cours du temps. Mais une surface est
engendrée par une courbe (encore dite une corde) impliquant un nombre
infini de degrés de liberté (d’où le nom de “théorie des champs de cordes”
en usage courant dans la littérature anglo-saxonne. I1 est vrai que son
équivalent en français a une résonance un peu étrange.)
En résumé, le concept de surface ouvre un domaine très large de
questions mathématiques et physiques. Nous entreprendrons cette étude
par la considération des variétés bidimensionelles linéaires par morceaux,
ou surfaces triangulées.
344
GEOMETRIE ALEATOIRE
XI.2.1
2.1 Surfaces triangulées
Soit une assemblée de triangles euclidiens (donc équipés d’une métrique
plate) et des relations d’incidence compatibles entre leurs côtés (avec identification correspondante des sommets). Ceci implique évidemment l’égalité
des longueurs pour les côtés identifiés. Pour simplifier nous supposons l’assemblage obtenu, variété différentiable sauf peut-être aux sommets, connexe
sans frontière et orientable. Sa topologie est alors décrite par la caractéristique d’Euler x = 2 - 2g où g (que nous notions par commodité H au
chapitre X, section 4) est le genre ou nombre d’anses. Les relations d’incidences permettent de définir la notion de paires de voisins, arête ou lien, et
celle de 2-simplexes (les triangles initiaux). La construction permet le calcul
des distances. Si comme précédemment No, NI et N2 désignent les nombres
de sommets, d’arêtes et de triangles (tous supposés finis), ils obéissent aux
relations
en sorte que en termes de N
E
No et
x on a
No =N
NI =3(N - x)
N2 =2(N - x)
Nous discuterons ci-dessous la question des triangulations inéquivalentes et
leur poids statistique.
Une façon pratique de procéder à la construction précédente est de
choisir un modèle, ou espace des paramètres, fixe, surface triangulée connexe
et orientable, d’appliquer ses N sommets dans l’espace euclidien Rd et
d’interpoler linéairement entre les images des paires de voisins. Ceci produit
dans l’espace cible une autre surface triangulée (peut-être avec des auto.
intersections). De manière équivalente nous pouvons considérer que cette
application engendre une autre métrique sur le modèle original. Par exemple
nous pouvons partir d’une triangulation régulière d’une partie finie du plan
euclidien avec identification des bords pour aboutir à un tore (g = 1) et
considérer diverses applications dans Rd.I1 y a bien entendu de nombreuses
autres façons d’engendrer des surfaces linéaires par morceaux, par exemple
celles rencontrées au chapitre VI dans l’étude des champs de jauge, comme
collections de plaquettes d’un réseau régulier avec des règles d’assemblage
définies.
Les triangles sont euclidiens, de sorte que leurs angles intérieurs 81,
Ba, O3 ont pour somme T. Pour chaque triangle nous avons donc 1 =
(8, 6%-tû 3 ) / r , avec chaque angle 8 compris entre O et 7ii. En prenant
la somme de l’unité sur tous les triangles nous obtenons N2, mais nous
pouvons en substituant l’identité précédente proceder à cette somme en
deux temps, à savoir pour chaque sommet faire la somme des angles 8 relatifs
+
XI.2.1
345
GEOMETRI E ALE A’ïOI R E
aux triangles incidents sur ce sommet (appelons-la 6&)’puis dans un second
temps faire la somme sur les sommets. Ainsi 1V;L = C,8,/n. D’après (90)
ceci est encore égal à 2N - 2x = -2x + 2Cz1. L’identification produit la
relation
qui est la version discrète de la formule de Gauss-nonnet en termes des
angles de défaut 2n - 6. Lorsque l’angle de défaut s’annule à un sommet,
les triangles incidents peuvent être assemblés dans l’espace plan et le terme
correspondant ne contribue pas à x. On a donc l’interprétation suivante :
angle de défaut frustration par rapport à une situation plane e courbure.
Une courbure positive correspond à un angle de défaut positif (6i < 23~)’
une courbure négative à un angle de défaut négatif (2n < 6i) et a une
“surabondance” de matière localement.
Ceci s’interprète bien dans l’exemple d’une sphère de rayon T et de
, produit des inverses des rayons principaux, tous les deux
courbure R = l / ~ ’ le
ogaux & T dans ce cas. Pour un triangle sphérique d’angles intérieurs 0 1 , a’, ~ 3
l’aire A est donnée par R A = (a1 +a:!t a 3 - 7r). L’angle total dont tourne un
vecteur tangent dans une circumnavigation autour d i i triangle (en arrondissant
les angles au sommet) est 19 = (7r - ai) ( T - a 2 ) (7r - a ~ =) 27r - R A ,
soit RA = 2.rr - 6’ l’angle de défaut total. S u r la surface triarigulée la courbure
est concentrée aux sommets avec R A tendant vers une limite finie lorsque A
tend vers zéro, de sorte que R tend à avoir une singularité en fonction 6 aux
sommets. Avec la normalisation précédente (qui peut différer dc celle employée
dans d’autres textes) il s’ensuit que la formule de Gauss-Bonnet s’écrit
+
,
+
dans ia version continue, avec x = 2 pour une sphkre ou R = T-’
et A = ~
T
T
~
.
Dans le cas des surfaces la courburc cst une quantité scalaire. Dans la
version (91) il y a une dissymétrie entre courbure positive (l’angle de déficit
étant majoré par 2n avec B = O) et courbure négative qui n’est pas bornée
inférieurement (6 prenant des valeurs aussi grandes qu’on le veut).
On peut se proposer d’étudier la généralisation a u x variétés linéaires par
morceaux de dimension plus grande que deux, o ù des simplexes à d dimension
remplacent les triangles. La caractéristique d’lluler x = No - N i N z - N3+. . .
demeure un invariant topologique. i<n effet, ajouter u n soniniet produit la
substitution NO + NO 1, N i
NI
N2
N- t Cz+i, ...,
Nd + Nd
C:+, - 1. Ceci entraîne y + x ( 1 - i)<l+’ = y. On aimerait
pouvoir généraliser la relation (91) en reliant, y ailx propriétés métriques,
de telle sorte qu’on obtienne u n c limite définie ila lirriitt: ct~ntiiiueet qu’en
+
+
+
-
+ <i+l,
+
-
346
<:ISOkiI<TRIE ALEATOIRE
XI.2.1
outre les régions où 15:s simplexes s’assemblent sans frustration dans l’espace
euclidien ne donnent aucune contribution à x, comme c’était le cas lorsque
d = 2. Ce problème n’est dans l’état des choses que partiellement résolu.
Considérons un p-simplexe de la triangulation incident en un sommet
donné et arrondissons l’“angle solide” correspondant jusqu’à lui faire épouser une forme sphPrique occupant une fraction p ( P ) de l’“aire” de la sphère
unité notée ici Sp-i (c’est-à-dire à ( p - 1) dimensions dans un espace y
dimensionnel). Le cas d’un simplexe unidimensionnel (p = l ) , un lien, correspond à la sphère So, réduite à deux points. On convient alors de prendre
p(’) = $. Pour un sommet ( p = O ) on choisit p(O) = 1. Si on fait la somme
des p ( P ) sur les p 1 sommets du psimplexe on obtient l’unité. La somme de
qu’on peut écrire, en sommant d’abord les
l’unité sur les ysimplexes est A’,,,
p ( p ) relatifs à ctiaque sommet, somme qu’on note p:’)
+
puis sur les sorrirnets i
D’ou l’expressioii de la c;ir;ictéristique d’Euler
d
=
7X ( - l ) p p , ( p )
I
,=O
Lorsque d = 2 nous retrouvons la formule (91), mais en dimension plus élevée,
cette expression ne permet pas de voir que les régions plates ne donnent aucune
contribution. I1 est possible de réexprimer (93) en termes des angles intérieurs,
mais en tout cas la relation avec une intégrale d’une forme définie à l’aide du
tenseur de courbure n’est pas apparente (Cheeger, Müller et Schrader).
Nous notons aussi ici que Regge a donné une forme discrète pour l’action
quadri-dimensionnelle de Hilbert-Einstein pour la gravitation. Dans le cas
d’un complexe simplicial tel que ceux envisagés ci-dessus cette expression
prend la forme
généralisant l’équation (92). La somme porte s u r les 2-simplexes (des triangles)
d’aire a2 et O est la somme des “angles diédraux” des quadri-simplexes
s’articulant s u r le triangle en question. I1 faut une analyse fine (Feinberg,
Friedberg, Lee et Ren) pour se convaincre que par passage à la limite continue
on obtient à un facteur prhs l’expression classique
(93)
XI.2.1
GEOM ETRI E A L EA'I'OIRE
347
Revenant aux surfaces triangulées, équipées de leurs propriétés métriques, nous pouvons aisément généraliser les équations de champs développées dans le cadre des réseaux aléatoires. Dans la suite nous nous bornerons
pour l'essentiel aux champs libres de masse nulle. Si la surface était différentiable, décrite localement à l'aide de paramètres a' et < y 2 et d'une métrique
définie positive gab(a) telle que g = det g a b , et gab l'inverse de gab, nous
écririons l'action sous la forme invariante
s=
J
d2fffiigab(ff)8npdbp
(94)
Nous supposons pour simplifier que la surface est sans bord, et observons
qu'en général il est nécessaire d'introduire un recouvrement par plusieurs
ouverts portant les systèmes de coordonnées indiqüés afin d'obtenir l'expression de l'intégrale ci-dessus. Si au lieu de prendre des valeurs dans R,
'p décrit une application de la surface dans une variété riemannienne ddimensionnelle M , possédant des coordonnées locales pp et une métrique
GFu('p),
on écrit l'action sous la forme
décrivant un modèle (T de type général. Dans le cas particulier où M coïncide
avec l'espace euclidien Rd,muni de la métrique Gpu('p)= bWu7l'action (95)
se ramène à la somme de d copies de l'action scalaire (94).
Considérons d'abord l'action à une composante et étendons sa définition à une surface triangulée, linéaire par morceaux. Sur chaque triangle
ayant des sommets de coordonnées x1 x2,x3 introduisons des coordonnées
barycent riques
Si cp prend la valeur
'pi. aux
sommets nous le prolongeons par linéarité selon
q ( a )= ct 1$01
+
<y2+%
+ a"'p3
(97)
définissant ainsi une extension harmonique naturelle à l'intérieur du triangle.
Calculant alors l'action (94) comme une somme sur les triangles, nous
trouvons
Sdiscret
=
['pZ(x3
- xk)
+ v,(xk
+
- x,) cp~(x,
- xl)la/ l Z 3 k
(98)
(vk)
La somme porte sur les triangles d'aire
par la formule
e,,,
reliée & la longueur des côtés
348
GEOMETRIE ALEATOIRE
XI.2.1
L’action est invariante par les translations, rotations et accroissements
constants du champ. Dans la suite nous omettrons le suffixe discret, le
contexte permettant de reconnaître quand il s’agit de surfaces triangulées.
En dépit du fait que la notion de dualité semble faire défaut a priori, il
est possible de donner à l’expression (98) une forme semblable à celle obtenue
dans le cas d’un réseau aléatoire plan (équation (57a)).
Les quantités e, = 1, e13,et P2:k ont des définitions évidentes, la seconde
étant la longueur du côté (23) et la troisième l’aire du triangle ( i j l c ) comme
ci-dessus. Définissons mp3k = 1,O,], O,, correspondant à un réseau dual virtuel
de la façon suivante. Considérons un triangle particulier et notons le (1,2,3)
avec pour angles intérieurs aux sommets 81,&,û3 compris entre O et 7r. La
contribution correspondante à l’action (98) est alors
Les coefficients sont algébriques mais par construction la somme est positive.
Soit p le rayon du cercle de centre O circonscrit au triangle. Nous avons
Figure 4 : Construction des quantités duales.
où pcosûi est la distance algébrique de O au côté jlc (positif si i et O sont du
même côté de la corde (jlc)). Seuls deux triangles (2321) et (2392) possèdent
,
en commun le côté (23). Nous définissons alors la quantité algébrique ~ 2 3 la
XI.2.1
349
GEOMETRIE ALEATOIRE
longueur du lien virtuel dual à (23), comme la somme des quantités p l cosBi,
et p2 cos Bi, relatives à ces deux triangles
uij
= p i cos Bii
+ p z cos Bi,
(101)
En conséquence le coefficient de (pi - ( ~ jdans
) ~ l'action peut s'écrire $ u ; j / e i j .
Ceci est bien en accord avec la définition dans le cas d'un réseau plan et produit
l'expression
La positivité de l'action entraîne l'inégalité
I1 reste à définir les quantités ui, aires des cellules i virtuelles, qui ont à
. . - A , où A est l'aire totale. Un
satisfaire à l'identité ci'i = c ( i j k ) e1Jk
choix naturel vérifiant cette condition est le suivant
j(i)
qui se réduit dans le cas plan à l'aire de la cellule de Dirichlet Voronoi. Dans le
contexte présent certains des ui peuvent cependant être négatifs. On observera
des côtés
que la construction est bien définie si on connaît les longueurs
des triangles. Donc tout ce qui est requis est la donnée des triangles possédant
une métrique et des relations d'incidence entre côtés, indépendamment de tout
plongement global.
Ayant ainsi défini les quantités e et O il est possible d'étendre la définition
des opérateurs d et d' donnée aux équations (47), (53) et (54) avec la
restriction évidente qu'on a affaire à des variétés à deux dimensions. Ainsi
(104a)
et
(104b)
Le laplacien scalaire s'écrit
350
XI.2.1
GEOMETRIE ALEATOIRE
I1 nous permet en l’absence de termes de bord de récrire les équations (98) et
(102) sous la forme
i
Sur une surface compacte connexe, l’action est positive et finie dès lors
que ‘p n’est pas une constante, comme il résulte immédiatement de (98). Ceci
entraîne que les seules fonctions harmoniques sont des constantes et -A est
un opérateur non négatif. Pour des champs pseudo-scalaires, l’action, analogue
mais distincte de (102), est
où ( i j k i ) et ( i j k p ) sont les deux triangles qui ont en commun le côté (ij). Au
moins dans le cas où tous les uij sont positifs, la surface étant orientable, la
seule fonction pseudo-scalaire harmonique est un multiple constant de q i j k ,
le tenseur totalement antisymétrique d’orientation prenant des valeurs f l sur
chaque triangle.
Pour les champs vectoriels, montrons que I’harmonicité est équivalente à
l’annulation simultanée du rotationnel et de la divergence
[(dd’
+ d*d)’plij = O * { (d‘p)ijk = O , (d*’p)i = O }
(108)
En effet si ‘pij est harmonique, +i = (d*<p)i satisfait d*d+ = d*dd*<p =
-d*2d’p = O , de sorte que +i est une constante donnée par
+
la dernière égalité résultant de I’antisymétrie <p;j = - < p j i . Ainsi = O et nous
avons la seconde égalité dans le second membre de (108). En conséquence
de q i j k . A
d’d‘p = O , de sorte que d<p est harmonique, donc un multiple
nouveau
$J
4
où la dernière égalité résulte de l’addition des deux contributions relatives à
un terme yoij. Ainsi = O et l’équivalence (108) est démontrée.
Le dénombrement des champs vectoriels harmoniques linéairement indépendants donne une relation topologique classique. I1 y a a priori N i composantes linéairement indépendantes. (108) implique ( N o - 1) ( N z - 1) condiui(d*cp)i = O . II n’y a donc
tions puisque
eijkqijk(d’p)ijk = O et
4
ci
+
XI.2.1
35 1
GEOMETRIE ALEATOIRE
+
que Ni - NO - N2
2 = 2 - x = 2 9 champs de vecteurs harmoniques linéairement indépendants. Rappelons que le même résultat s’applique dans
le cas continu et que lorsqu’on s’est donné en plus une structure complexe,
ceci correspond à l’existence de g champs de vecteurs holomorphes ou de mai
nière équivalente à l’existence de g différentielles abéliennes de première espèce
(c’est-à-dire holomorphes).
2.2 Anomalie conforme et action de Liouville
Etant donné une surface compacte, connexe, sans bord, avec sa structure métrique, nous voulons passer de la théorie des champs classiques de
masse nulle à sa version quantique. Ceci revient à utiliser dans le cas discret
l’exponentielle de l’action scalaire (102) comme poids de Boltzmann dans
une intégrale de chemin sur le champ ‘pi. Pour l’instant nous supposons la
géométrie donnée et telle que la surface soit suffisamment régulière pour que
les quantités (T soient toutes positives.
Nous allons définir l’intégrale gaussienne de telle sorte que le résultat
de l’intégration soit proportionnel à la quantité [det’( -A)] -1’2 où le prime
implique l’omission du mode nul, ce qui équivaut à évaluer le déterminant
dans l’espace orthogonal au sous-espace unidimensionnel des champs constants relativement à la norme carrée Ciui’ps.I1 est entendu que les valeurs
‘pi sont réelles. Pour une surface triangulée par un nombre fini de triangles
l’opérateur -A est représentable par une matrice N x N , avec N = NO le
nombre de sommets.
Soient E l , ..., EN-^ les valeurs propres positives de -A et EO =
O l’unique valeur propre nulle correspondant à ‘p = Cste. L’ensemble
correspondant de fonctions propres orthonormalisées est noté ‘p(O), ‘p(l),
. . ., cp(N-l). Si on développe cp sur cette base
(n)
Pi =
CnVi
(110)
O<_n<_N-l
on vérifie que
Nous définissons la fonction de partition Z selon
z=
1
[det’( -A)]
-
1
(nr-1E,)
Les fonctions propres réelles normalisées satisfont à
li
352
GEOMETRIE ALEATOIRE
XI.2.2
(113)
i
Les ai étant positifs il s'ensuit que
O
\ O
/
i
et
On peut alors récrire la définition (112) sous forme de l'intégrale
intégrale qui pourrait être aisément généralisée pour inclure un terme de
source de la forme Ci J,cpi OU Ci aijivi.
On ne peut guère espérer aller plus loin dans le cas d'une surface triangulée tout au moins lorsqu'il s'agit d'expressions exactes. Cependant si
on fait l'hypothèse, peut-être un peu optimiste, qu'au prix d'une renormalisation, l'intégrale discrète est une approximation valable d'une théorie
continue sur une surface régulière, avec une action de type (94)'il est possible d'obtenir des informations plus intéressantes. En effet dans le cadre
continu nous observons que l'absence de terme de masse implique dans le
cas classique que l'action possède une invariance conforme, en ce sens que la
combinaison f i g a b reste invariante si on effectue un changement d'échelle
local de la forme gab((Y) --f p 2 ( a ) g a b ( a ) .Le facteur qui affecte localement
les longueurs est donc p(a). Bien que cette invariance soit vérifiée au niveau classique, elle est brisée au niveau quantique et conduit à l'anomalie
conforme amplement discutée dans le cadre du chapitre IX.
A deux dimensions, il est toujours possible dans le voisinage d'un point,
homéomorphe à l'intérieur d'un disque, de trouver un choix de coordonnées
tel qu'une métrique arbitraire prenne la forme
Par exemple, sur l'hémisphère nord d'une sphère de rayon r, une projection
stéréographique produit pour le carré de l'élément de longueur
XI.2.2
GEOMETRIE ALEATOIRE
353
Dans un tel voisinage, les coordonnées elles-mêmes sont des fonctions harmoniques comme dans le cas plan (d’où le nom de coordonnées thermiques parfois
employé par référence à l’équation de la chaleur qui se réduit à l’équation de
Laplace dans le cas statique). La courbure R (= T-’ pour la sphère) est donnée
Par
où A est le laplacien dans l’espace courbe et A0 le laplacien dans l’espace
plat relatif à gab’ G 6ab. Si dans chaque ouvert de coordonnées on utilise des
coordonnées thermiques, le facteur p disparaît dans l’expression de l’action,
mais pas dans celle du laplacien, évidemment.
Dans le cas continu et pour une surface compacte, le spectre du
laplacien est discret et l’on peut toujours utiliser un développement du
type (110) mais s’étendant cependant à un ensemble infini dénombrable
de fonctions propres. L’expression de la fonction de partition, (det’ - A ) - + ,
requiert alors des soustractions. Si nous les ignorons dans un premier temps
nous pouvons écrire formellement pour une variation de l’énergie libre
Le mode nul est toujours donné par l’équation (115).
Portons notre attention sur une variation relative à un changement
conforme infinitésimal de la forme gab + (1 26&)g,bi où 6~varie de point à
point. Ceci induit une variation des valeurs propres et des fonctions propres
et pour un champ ~ ( adonné,
)
une variation des composantes C, de son
développement. Par hypothèse, la quantité
EnCi est cependant invariante en raison de l’invariance conforme de l’action. Ainsi dans l’expression (120) la variation ne provient que du jacobien de la transformation
Cn -+ Cn 6Cn. Comme on a omis le mode nul, on obtient
+
+
bin2 =
L’invariance du champ
Comme
nous avons
‘p
( (Cabc,
-))
asco
ac, aco
Oo
--
entraîne que
354
GEOMETRIE ALEATOIRE
XI.2.2
et
Ainsi on obtient
La moyenne gaussienne qui intervenait dans l'équation (121) a disparu,
la variation étant indépendante des variables d'intégration. Cependant la
quantité E=,"
[p(n)]2
est infinie en raison de la présence d'un nombre infini
de modes, lié à l'emploi de la théorie continue. I1 s'agit là d'une divergence
ultraviolette. Au lieu d'employer ici la régularisation nous utiliserons un
2
procédé équivalent qui consiste à substituer à
[p(n)(a)]le noyau de
la chaleur à points coïncidents U ( s ;a , a )
E=,"
Cette méthode a été suggérée par Fujikawa dans de nombreuses circonstances similaires. En général le noyau de la chaleur est symétrique, de la
forme
La distribution invariante 6 satisfait à
Ainsi nous avons
XI.2.2
355
GEOMETRJE ALEATOIRE
et nous nous intéressons au comportement à s petit. Nous nous attendons à
trouver des termes singuliers proportionnels à s-l dans ce cas bidimensionnel sans frontière (en présence d’une frontière on s’attend à une contribution
supplémentaire en s-*) qu’il faudra soustraire pour obtenir la partie finie
cherchée. Dans l’espace euclidien
et Ueuclidieii(S;a , a ) = 1/(4ns) indépendamment de a , en raison de l’invariance par translation. Dans un espace courbe, si R(a)désigne la courbure,
l’analyse dimensionnelle suggère une expression de la forme
puisque s a pour dimension une longueur au carré et R l’inverse d’une
longueur au carré de sorte que X doit être une constante universelle. I1 suffit
donc de connaître l’expression du noyau de la chaleur pour une variété
courbe quelconque, une sphère de rayon T par exemple, pour en déduire la
valeur de la constante A.
Utilisant la métrique (118) sur une sphère au voisinage du point de
coordonnées cy1 = cy2 = O , on en déduit aisément le noyau de la chaleur dans
ce cas
Donc
1
Ucourbe(S;0,CY) = - [I 4-iR(a)S 44TS
*
*]
(129)
Pour une métrique localement de la forme (117), il résulte de l’équation
(119) que
356
GEOMETRIE ALEATOIRE
XI.2.2
Pour ce choix de métrique, nous avons g = p4, et donc aôg/g = ôlnp. En
portant ces expressions dans la forme régularisée (126)’ nous obtenons en
négligeant les termes qui s’annulent avec s,
- i l n -A
A0
+ -/d2ap21np(-Alnp)]
l
2 4 ~
(131)
Le développement à temps court (129) du noyau de la chaleur
peut être généralisé au cas où les points sont très voisins, sans nécessairement
coïncider, sous la forme
où d a o est la distance géodésique de a: à B. Le facteur (47rs)-l s’interprète
dans le cas plat comme l’inverse de l’aire d’un cercle de rayon retf = 2 6 .
Ceci est en accord avec le fait que U est une densité de probabilité pour un
mouvement brownien. Sur une surface courbe (courbure R), un cercle de même
I
rayon infinitésimal a pour aire aR-’2(1 - cosû) où û = R2ren = 2R3&,
soit une aire 4as (1 - !jRs + . . .) . Ceci donne l’interprétation de la correction
dominante dans l’équation (129). Le lecteur peut-il généraliser cet argument
(i) pour inclure la seconde correction dans l’équation (132) (ii) pour étendre
la formule à une variété à d dimensions.
Le terme infini, proportionnel à s-l dans l’équation (131)’ doit être
renormalisé et remplacé par un terme fini avec un coefficient arbitraire de
dimension [ l ~ n g u e u r l -. ~Le moyen le plus sûr de rendre l’argument plausible
est de confiner la variation infinitésimale d’échelle à un domaine à support
compact relatif à un ouvert de coordonnées.
I1 faut être prudent dans le maniement des expressions obtenues cidessus, qui doivent être utilisées en tenant compte correctement des conditions
aux limites. Par exemple en enlevant un point à une sphère, considérons le
système de coordonnées correspondant à l’élément de longueur (118). Bien
que l’intégrale suivante
sn2
d2a:p21np(-Alnp) E
sn2
d2aInp(-Aolnp)
soit finie, celle qu’on déduirait d’une intégration par parties
ne l’est pas. En général comme -A In p = R, il est clair que si l’intégrale de
R n’est pas nulle, c’est-à-dire si la caractéristique d’Euler n’est pas nulle, il
résulte de
XI.2.2
357
GEOMETRIE ALEATOIRE
1
x=2n
1
d2ap2R
(133)
que la quantité In p possède nécessairement des singularités. Pour éviter cette
difficulté on pourrait se restreindre à la topologie d'un tore (x = O) qui admet
bien une métrique euclidienne.
La conclusion est donc que l'invariance conforme classique de la théorie
des champs libres de masse nulle ne peut être maintenue au niveau quantique. Dans ce cas l'énergie libre normalisée dépend du facteur d'échelle
local sous la forme valable pour une surface compacte
d2ap2 [In p( -A In p )
+ p2]
(134)
Nous avons introduit une aire arbitraire A0 pour rendre 2 sans dimension,
et une échelle de masse p elle aussi arbitraire tenant compte du fait que
J d 2 a p 2 = A. Le second terme du membre de droite de l'équation (134)
est appelé l'action de Liouville, et le résultat précédent est dû à Polyakov
(1981). Le terme indépendant de l'échelle p peut lui aussi nécessiter une
renormalisation. Nous y reviendrons par la suite.
L'équation (134) se traduit par une anomalie relativement à l'invariance
d'échelle de la forme
où dA = d 2 a& est l'élément d'aire infinitésimal invariant, et la métrique
est transformée selon gab -+ e26*g,b.
On peut encore donner de l'action de Liouville une expression équivalente obtenue de la façon suivante. Soit G(a,P) la fonction de Green
soustraite sur la surface
A l'aide de cette définition on a
Si pour simplifier nous supposons que ?I s'annule,
011a
alors
358
GEOMETRIE ALEATOIRE
XI.2.2
Cette expression se prête à une discrétisation simple (toujours pour
x
= O ) . Le second terme est proportionnel à l’aire. Quant au premier nous
procédons à l’identification
d A R - + q i = (I-$)
de sorte que
telle que
(139)
ci
qi = O . Définissons une fonction de Green discrète massive
Alors le premier terme du membre de droite dans l’équation (138) peut
s’interpréter pour une surface triangulée comme
i,3
Le mode nul qui apparaît dans la limite m2 + O est sans conséquence
puisque
qi = O . Cette action non locale rappelle celle d’un gaz coulombien
bidimensionnel où les charges seraient remplacées par la courbure locale.
ci
2.3 Sommes sur des surfaces régulières
Nous allons poursuivre en présentant le modèle de Polyakov pour les
surfaces aléatoires, modèle qui sert de fondement à la théorie des cordes.
Nous ne discuterons pas ici les applications à une unification des interactions
(incluant la gravitation) en physique des particules, unification qui justifie
bien entendu les efforts déployés dans l’élaboration de cette théorie.
Le résultat suprenant de l’analyse qui va suivre est que 26 est une
borne supérieure à la dimension d’un espace de plongement pour lequel
les expressions obtenues gardent un sens. Dans cette dimension magique
le modèle quantique jouit d’une invariance de reparamétrisation (et d’une
invariance conforme). Ceci est le cas de la version commutante (ou bosonique) présentée ci-dessous et deviendrait d = 10 dans le cas d’une version
généralisée incluant des degrés de liberté anticommutants (fermioniques).
D’ailleurs cette extension pourrait avoir son intérêt en physique statistique,
car il y a quelque espoir d’interpréter certains modèles tridimensionnels, et
parmi eux le modèle d’king en termes de surfaces aléatoires fermioniques
en utilisant leur version de jauge duale.
XI.2.3
GEOMETRIE ALEATOIRE
359
Malheureusement pour poursuivre cette étude dans le cas continu, il
est nécessaire d’introduire des outils mathématiques assez complexes. I1 est
suggéré au lecteur, qui n’a pas la familiarité voulue, mais qui est intéressé par
ces questions, de se reporter aux revues citées dans les notes, en particulier
celles de Friedan et d’Alvarez qui ont développé le travail de Polyakov et
qui décrivent en détail le bagage mathématique nécessaire.
Dans le cas continu on a vu que pour un chemin aléatoire il était plus
expédient d’utiliser comme action non la longueur de la trajectoire mais une
action quadratique dans la vitesse
où r est un paramètre le long de la courbe, le temps propre dans le cas
relativiste ou la longueur selon la métrique induite sur la trajectoire par
celle de l’espace ambiant. Bien que cette expression ne soit pas invariante
de reparamétrisation, on pourrait la généraliser en introduisant une fonction
monotone T = f ( s ) et formuler l’intégrale de chemin de manière qu’après
un “choix de jauge” l’action reprenne la forme (142).
Dans le cas de surfaces plongées dans Rd,on désire aussi remplacer
l’action de Naumb-Goto (proportionnelle à l’aire calculée avec la métrique
induite) par une forme quadratique analogue à (142). Au lieu de fixer une
métrique spécifique, Polyakov a suggéré par analogie avec la gravitation
quantique de faire la moyenne sur toutes les métriques possibles définissant
l’élément de longueur infinitésimale
L’intégrale de chemin prend alors la forme
z=
Ag
topologies
(144)
La quantité A0 s’interprète comme une activité (nue) conjuguée à la caractéristique x donnée par (133). Le terme proportionnel à l’aire A = / d 2 a Jg ,
calculée avec la métrique g, nous laisse la possibilité d’absorber une quantité
similaire avec un coefficient infini par une renormalisation adaptée.
La fonctionnelle du vide (144) n’implique qu’une somme sur des surfaces compactes orientables pour la simplicité et nous nous restreindrons
encore à des surfaces connexes. Si cela n’était pas le cas on devrait vraisemblablement inclure des facteurs combinatoires. Les d champs correspondant
aux composantes X p ( a ) engendrent une application de la surface dans Rd
et la partie principale de l’action s’écrit
360
GEOMETRIE ALEATOIRE
XI.2.3
Bien entendu on pourrait prendre pour espace cible une variété à d dimension de métrique G,,(X) comme on l’a mentionné plus haut (équation (95)).
Nous ne le ferons pas ici.
L’action quadratique (145) est semblable à celle du cas unidimensionnel, avec en outre les facteurs géométriques appropriés, g = det gab et gab
l’inverse de gab. Elle possède trois types d’invariance.
(i) Invariance de reparamétrisation, accompagnée bien entendu par le
changement correspondant de métrique.
(ii) Changement d’échelle de la métrique gab + p2gab, où p2 peut dépendre du point sur la surface. La combinaison f ig a b reste alors inchangée
et on parle d’invariance de Weyl ou invariance conforme. La transformation
change les longueurs mais ne modifie pas les angles. Les métriques qui se
déduisent les unes des autres par un tel changement d’échelle sont dites appartenir à la même classe conforme. Si on considère uniquement son effet
sur la métrique on constate alors qu’une reparamétrisation peut s’interpréter en partie comme un changement d’échelle. Cette remarque jouera son
rôle dans la suite.
(iii) Enfin l’action est aussi invariante lorsqu’on agit sur X par une
transformation du groupe euclidien. Les translations constituent la partie
dangereux de ce groupe (c’est-à-dire conduisant potentiellement à des
facteurs infinis). On s’en affranchira en traitant à part le mouvement du
centre de masse, ou mode constant.
Inversement si on ajoute à l’action (145) les termes conjugués à In&
et pz on obtient la forme la plus générale n’impliquant X que par l’intermédiaire de ses dérivées, renormalisable et compatible avec ces invariances.
Une échelle de longueur physique dans l’espace cible est absorbée dans la
définition de X.
Cherchons à donner un sens à l’expression formelle (144) et plus précisément à chaque terme de cette somme individuellement. On raisonne
donc désormais à topologie fixée. L’objectif est d’extraire un facteur correspondant au “volume”, bien entendu infini, du groupe des changements
de coordonnées différentiables, dit encore groupe des difféomorphismes. Ceci
revient à fixer la jauge, tout en désirant conserver les bénéfices de l’invariance de jauge. On va voir que la théorie quantique ne permet de maintenir
l’invariance conforme (lorsque la valeur renormalisée de p2 est nulle) que
lorsque la dimension vaut 26 comme on l’a annoncé ci-dessus.
Lorsque p i s’annule, les équations du mouvement obtenues par variation
successive de gab et .Y@ s’écrivent
XI.2.3
361
GEOMETRIE ALEATOIRE
Nous reconnaissons en (146) l’annulation du tenseur impulsion-énergie symétrique et de trace nulle, qui entraîne que gab est proportionnel à la métrique
d a X p & X r induite par l’espace euclidien sur la surface. Les champs coordonnées Xp doivent alors être harmoniques par rapport à cette métrique.
Ceci est en fait la condition à laquelle satisfont les surfaces minimales (c’està-dire les surfaces qui minimisent l’aire localement). Si on utilise ces équations
dans l’expression de l’action on obtient l’aire totale. I1 est clair que ceci prendrait un sens plus précis dans le cas de surfaces à bord fixé.
E,
Rappelons une propriété énoncée ci-dessus (équation (117)) selon laquelle au prix d’un changement de coordonnées toute métrique peut être
rendue diagonale au voisinage d’un point. On peut même s’assurer que le
facteur conforme est l’unité en ce point et que son gradient s’y annule. Une
propriété supplémentaire est que dans chaque classe conforme il existe une
métrique go de courbure constante. Ceci revient à dire qu’étant donné la
métrique 9, il existe une fonction $ de telle sorte qu’en écrivant g = e2*g0,
90 soit de courbure constante Ro. D’après (119) ceci revient à trouver une
solution de l’équation de Liouville classique
-A$ = R - e-2* Ro
(148)
Le lecteur se rappelle que la théorie de l’uniformisation des surfaces de
Riemann compactes implique que dans le cas où x = O un tore s’obtient comme
le quotient du plan complexe par un réseau de translations, tandis que si x < O
la surface s’interprète comme le quotient du demi-plan complexe supérieur
par un sous-groupe discret de S L ( 2 R ) . Une métrique de référence de courbure
constante est dzdz, ou dzdE/(Imz)2 dans les deux cas respectivement. Nous
avons présenté le cas de la sphère précédemment. Pour vérifier l’assertion,
utilisons des coordonnées complexes z = ( Y I + i d , E = ai-io2. Une métrique
générale s’écrit ds2 = gzzdz2 gzzdZ2 2g,ïdzdE, (grï = G, g r ï = & z )
avec les conditions de positivité gzï > g z r g ï ï , gzz > O . Posons
+
+
(149a)
La positivité se traduit par X
> O,
< 1, et la métrique
s’écrit
362
XI.2.3
GEOMETRIE ALEATOIRE
ds2 = X Idz
+ pdZI2
(149b)
On cherche alors un changement de coordonnées régulier u = u ( z , Z ) , 21 =
u ( z , Z ) tel que dans les nouvelles coordonnées la métrique prenne la forme
(anti) diagonale ds2 O: dud21. I1 faut bien entendu prêter attention à l’invariance selon le groupe crystallographique. D’après ce qui précède ceci revient
à résoudre l’équation de Beltrami auf ôZ = p auf 6’2.
Considérons alors un terme particulier dans la somme (144). Cherchons
à fixer la jauge sachant que g est conformément équivalent à une métrique
go donnée, de courbure constante (c’est-à-dire g = e2$goi variable). Pour
cela étudions les variations 6 g au voisinage de g. On peut définir une norme
au carré sur les déformations
+
qui se généralise naturellement aux autres champs tensoriels. Ceci fournit un
élément de volume D g par analogie avec les variétés riemanniennes au prix
d’une extension à un nombre infini de variables. Notons que cette définition
implique la métrique g. La variation 6g peut alors s’écrire comme la somme
de deux termes orthogonaux selon (150)’ un terme 6h de trace nulle et un
terme proportionnel à g lui-même (proportionnel à la trace)
Sg = 2Svg
+ Sh
(151)
La propriété d’orthogonalité implique que Dg se factorise au voisinage de g
en
D g = VvDh
(152)
où chacun des facteurs est indépendant de la paramétrisation. On voudrait
que cette factorisation corresponde respectivement à l’intégration sur le
facteur conforme et sur le groupe de reparamétrisation agissant sur la
métrique de référence go. Pour cela voyons comment agit un changement
de coordonnées infinitésimal. On a
soit
où nous avons défini le champ de vecteur infinitésimal covariant
XI.2.3
GEOMETRIE ALEATOIRE
363
associé à la reparamétrisation et D désigne la dérivée covariante impliquant
le symbole de Riemann-Christoffel r
On évitera cette débauche d’indices tensoriels en choisissant judicieusement
la métrique de référence. Par changement d’échelle on a
a$gab = 26’$gab
(156)
+
S$)g avec la décomposition orthogonale (151)
Comparons la somme (6,
et observons que ceci revient à soustraire sa trace à 6,g. Ainsi
que nous écrivons
où Pl est un opérateur différentiel du premier ordre qui applique les champs
de vecteurs (d’où l’indice 1) dans les champs de tenseurs symétriques de
trace nulle. Nous remplaçons alors les variables ‘p et h par ’$ (associé au
facteur conforme) et v qui représente l’effet des changements de coordonnées en prenant garde au fait que ce changement de variables introduit un
déterminant jacobien fonctionnel (le déterminant de Faddeev-Popov correspondant)
(1594
Le jacobien a la forme
Comme seule nous intéresse la valeur absolue de ce déterminant nous
utilisons au lieu de det Pl la quantité positive (det P!Pl)i où l’opérateur
Pi Pl a l’avantage d’appliquer champs de vecteurs sur champs de vecteurs.
Ainsi
364
GEOMETRIE ALEATOIRE
+Y
V p V h = V$Vv det Pl Pl
XI.2.3
(159b)
On pourrait représenter le déterminant comme une intégrale grassmannienne sur des champs de “fantômes”. Cette technique familière est utile dans
la théorie des champs de cordes, pour donner une forme compacte au développement (144) qui s’interprète alors comme série perturbative d’une théorie
quantique putative. Cette analogie met en parallèle les diagrammes de Feynman tracés à l’aide de lignes et ceux qui interviennent ici représentables à
l’aide de surfaces. L’intégrale grassmannienne, analogue à celle sur les champs
X, prend une forme plus simple lorsqu’on utilise des variables complexes, mettant en évidence l’invariance conforme. Nous laissons le soin au lecteur d’établir
son expression.
Pour définir la mesure Vu,nous utilisons une norme sur les champs de
vecteurs qui a la propriété d’être indépendante du représentant g à l’intérieur
de la classe conforme, c’est-à-dire de la variable $, et qui s’écrit par analogie
avec (150)
L’intégrale (formelle et infinie) J Vu s’interprète alors comme le “volume”
du groupe de reparamétrisation.
I1 nous faut prêter attention au fait que l’opérateur Pl peut avoir des
modes nuls, c’est-à-dire annuler certains champs de vecteurs (dits champs
de Killing conformes) qui correspondent aux reparamétrisations laissant la
métrique invariante à un facteur près. En effet l’intégrale sur ce sous-espace
est déjà incluse dans l’intégrale sur 11. Pour éviter un double comptage et
définir un jacobien positif (det’P?Pl)*, nous devons donc intégrer v sur
l’espace orthogonal au sous-espace de dimension finie des modes nuls. Ceci
a l’inconvénient que l’intégrale résultante ne représente qu’une partie du
“volume” du groupe de reparamétrisation. Observons finalement que nous
avons admis implicitement jusqu’ici que toute variation infinitésimale de
métrique est de la forme (6+ 6,) g. Ceci n’est pas toujours le cas et il nous
faut examiner la question indépendamment. I1 n’y a pas de problème en ce
qui concerne la partie concernant la trace. En revanche il faut se demander
si toute variation de trace nulle 6h appartient à l’image de l’opérateur P i .
I1 n’en est pas ainsi en général et pour x 5 O cette image est orthogonale
à un sous espace de dimension finie, dont nous noterons la mesure V h M ,
qui est appelé l’espace de Teichmüller ou espace des modules. A la vérité
les variations de ce type appartiennent à l’espace tangent à l’espace de
Teichmüller qui lui-même est un recouvrement de l’espace des modules
dont la structure globale est relativement complexe. Nous avons donc plus
précisément
+
XI.2.3
GEOMETRIE ALEATOIRE
365
‘PlPl)‘
(1594
2)g = DhMDVLD$ (det
où le prime indique qu’on doit prendre le déterminant dans l’espace orthogonal aux modes nuls.
Exprimons la série (144) comme une somme sur des contributions
relatives à des topologies distinctes
z=czx
X
Un terme de cette série s’écrit alors
e-’;
Sd2&&(det’PlP1)’
(det’ [-A])-’d
(161)
Nous avons effectué l’intégrale sur les champs X, en séparant la contribution
des modes nuls de translation normalisés C[ (d’où le prime dans l’écriture
du déterminant du laplacien, calculé bien entendu à l’aide de la métrique 9).
Comme toutes les quantités sont invariantes par reparamétrisation, l’intégrale J Du* se factorise et nous l’omettons purement et simplement à titre
de première renormalisation multiplicative de 2,. L’intégrale restante demeure cependant formelle car bien entendu les déterminants sont encore mal
définis. Ce faisant nous suivons la tradition heuristique des physiciens qui
partent d’expressions infinies dépourvues de sens pour aboutir aux quantités renormalisées bien définies, plutôt qu’en introduisant axiomatiquement
le produit final qui obscurcirait la démarche. A ce point le lecteur pourrait
s’inquiéter (et nous partageons son inquiétude) de ce que les contributions
correspondant à des topologies différentes pourraient correspondre à des intégrales distinctes sur le groupe de reparamétrisation. Ceci signifie qu’à ce
stade la façon de combiner les différents Z, en une somme unique demeure
un problème ouvert.
Nous devons maintenant nous préoccuper de la définition des déterminants et de l’intégration sur l’espace des modules. D’après la section 2.2
nous nous attendons à voir réapparaître l’action de Liouville donnant la
dépendance en $. Ceci nous entraîne à faire un détour par une discussion
assez technique qui a son propre intérêt et qui généralise notre discussion
précédente un peu schématique du champ libre scalaire de masse nulle.
Dans l’étude des déterminants figurant dans l’équation (161) nous continuerons à utiliser les coordonnées complexes z = a1 ia2,2 = al - ia2. La
métrique s’écrit g = e2$go, et nous prendrons une métrique de référence go de
+
366
XI.2.3
GEOMETRIE ALEATOIRE
la forme ds2 = e2iodzdZ, correspondant à une courbure constante. Ainsi seul
gzf est non nui et positif et gz” = .:9;
Considérons des transformations analytiques (donc conformes, c’est le
point clé) agissant sur des tenseurs ayant aussi bien des indices covariants
que contravariants. La métrique g nous permet de monter ou d’abaisser ces
indices (sa loi de transformation est bien entendu gzïdzdE = gLZdz’dZ’) de
sorte que nous pouvons nous limiter à des indices covariants par exemple,
auquel cas (cf chapitre IX) la transformation des tenseurs est caractérisée
par le fait que th,hdzhdZhsoit invariant. Les suffixes h , h, tous deux entiers
ici, désignent respectivement les nombres d’indices du type I et du type Z.
Lorsqu’on n’envisage que des changements de coordonnées analytiques, la loi
de transformation des tenseurs se simplifie en ce sens que th,ï, est simplement
multiplié par un facteur. I1 est en fait plus commode ici de substituer aux h
indices covariants un nombre égal d’indices z contravariants. Nous notons
alors le tenseur th = (gzZ)ht h , h et sa loi de transformation s’écrit
Pour se conformer à l’usage courant dans ce contexte nous adopterons une
convention opposée à celle du chapitre IX en désignant par n (et non s) la
différence h- h (s = -n). A R. fixé (positif ou négatif) l’ensemble des quantités
tensorielles (à une seule “composante”) qui se transforme selon la loi (162) sera
noté 7“.
Les opérateurs qui nous intéressent, tels -A et Pi, appliquent des
tenseurs symétriques de trace nulle sur d’autres tenseurs du même type. A
deux dimensions et raisonnant sur les réels de tels tenseurs n’ont que deux
composantes indépendantes.
Pour s’en assurer dans le cadre de la géométrie euclidienne, associons à
un tel tenseur le polynôme homogène Pn(z, y) =
T
i
i...,2 2 ...z k Y k’
zk+k,=n
+
qui possède a priori n 1 coefficients indépendants. Le tenseur est symétrique
si le laplacien usuel û 2 / û x 2 + d 2 / b y 2agissant sur Pn donne zéro. Ceci entraîne
l’annulation d’un polynôme homogène de degré R. - 2, c’est-à-dire n - 1
conditions si n >_ 2 (ou zéro si n = O ou l), laissant ainsi deux coefficients
t - ( z iy)”. Si
indépendants arbitraires tels que Pn(z,y)= t+(z - iy)”
le tenseur est réel, t+ et t - sont complexes conjugués. L’argument s’étend
sans difficulté dans l’espace courbe. En coordonnées complexes l’une des
composantes appartient à I n ,appelons-la t , tandis que la seconde composante
E aurait n indices Z contravariants conformément à la convention ci-dessus.
Cette composante est multipliée par (gzz)n, le résultat appartenant ainsi à
I-”.
L’ensemble des tenseurs (réels) symétriques de trace nulle de rang n
peut donc être considéré comme appartenant à In@ I - n ,sous la forme
+
T
+
{ t , (gzr)” E }
où il est entendu que t E I”.On notera Sn le sous-espace de I n@7-n
obtenu
(163)
XI.2.3
367
GEOMETRIE ALEATOIRE
comme ci-dessus à partir d'un tenseur réel, laissant de côté le cas plus simple
n = O, où l'on n'a qu'une seule composante. En utilisant la forme particulière
de la métrique on construit les deux composantes de la dérivée covariante D z
et D , (en y ajoutant un suffixe n si nécessaire)
On déduit du carré de la norme
lltl12 =
J
d2q/5(gzz)nft
(165a)
un produit scalaire invariant, comme on le vérifie aisément.
a
Essentiellement D' est équivalent à l'opérateur
à une décoration près
et les facteurs qui interviennent dans la définition de D, sont là pour effectuer
le passage de D z à D, lorsque ces opérateurs agissent sur l'espace tensoriel
voulu. Nous étendons la norme à Sn de manière que si T s'écrit comme en
(163) on ait
(T1,7'2) =
J
d2ciJg(grz)n (zit2
+ t1z2)
(165b)
L'opérateur adjoint de D z agit de In+' dans F ,
et on vérifie que
I1 y a maintenant deux définitions possibles du. laplacien agissant sur 'Tn.
Ou bien nous montons un degré dans l'échelle des n à l'aide de D z et nous
redescendons avec D , , ou nous faisons les opérations dans l'ordre opposé. D'où
les deux opérateurs ai+'
Le facteur 2 est inclus pour que la définition coïncide avec le laplacien usuel
dans l'espace plat (si Laplace avait vécu assez longtemps, il aurait à coup sûr
changé le signe dans la définition de son opérateur pour le rendre positif!). Ces
opérateurs sont positifs semi-définis.
Dans l'espace Sn,les opérateurs agissent sur les deux composantes
conjuguées
368
XI.2.3
GEOMETRIE ALEATOIRE
La notation est choisie de telle sorte que Pl et P i sont les opérateurs
intervenant dans la formule (161). Les laplaciens associés agissant sur S sont
alors
Pour la suite il est important de noter la relation suivante entre les spectres
des opérateurs P i Pn et Pn PL (en particulier pour n = 1). Ces opérateurs sont
tous deux non négatifs mais peuvent avoir des modes nuls qui engendrent leur
noyau. Pour un Qpérateur O, le noyau de Of est orthogonal à l'image de O, et
on a une relation analogue en échangeant les rôles de O et Ot. Donc en termes
de compléments orthogonaux on a la correspondance
Le membre de gauche est aussi le complément de kerP,, celui de droite de
kerPi. Pour préciser cette correspondance, soit {T,} une base orthonormale
des modes propres de valeur propre non nulle de -AL+), les valeurs propres
correspondantes étant notées A, (le produit scalaire est entendu au sens des
équations (165))
2PLPnT, = A,T,
A,
>O
(171)
Par conséquent 2PnPi(PnT,) = A,(PnT,) et PnTT est vecteur propre de
pour la même valeur propre A,. Ces modes propres sont orthogonaux.
Pour les normaliser nous remarquons que
en admettant les valeurs propres non dégénérées. De la sorte les quantités
{ ?,'
= f i n T T } forment une base orthonormale de [ker
(- AL-+\)]
I
,
justifiant l'équation (170).
Dans le cas particulier où n = 1, les modes nuls de Pl sont les vecteurs de
Killing conformes, tandis que les tenseurs harmoniques de trace nulle à deux
indices, modes nuls de P l , engendrent l'espace des variations de la métrique
qui ne peuvent être obtenus ni par changement d'échelle ni par changement
de coordonnées et sont donc associés à l'espace des modules, qui est à l'origine
d'une intégration sur cet espace de dimension finie dans les equations (159c)
et (161). En général les modes nuls sont des tenseurs harmoniques dans leurs
espaces respectifs. Nous passons maintenant au calcul des déterminants en
utilisant comme précédemment la méthode du noyau de la chaleur. Ainsi
XI.2.3
369
GEOMETRIE ALEATOIRE
In det‘ (-AL+))
=-
lrn
$
Tr’exp ta;+’
puisque
In X p , la somme portant sur
I1 s’agit donc d’une régularisation brutale de
les valeurs propres positives et E jouant le rôle de facteur de coupure ultraviolet,
le carré d’une longueur élémentaire. On doit se souvenir que pour n # O,
l’opérateur -AL+’ agit sur la somme directe de deux espaces. Comme dans la
section 2.2, la méthode pour extraire la partie singulière de (172) consiste à
étudier le comportement du noyau aux temps courts.
Le calcul est parallèle à celui que nous avons déjà effectué. Nous allons cependant le présenter en assez grand détail en ce qui concerne les laplaciens qui
interviennent ici, en utilisant une adaptation de la méthode de perturbations.
(+)
Soit a un point où nous voulons évaluer le noyau G(a, a ;t ) = (al etAn la).
I1 s’agit en fait d’une matrice 2 x 2 diagonale. Nous savons que G se comporte
comme t-’ lorsque t tend vers zéro et que les longueurs varient comme t1/2.
Considérons les termes jusqu’à l’ordre t o
où G-1, Go, matrices 2 x 2 diagonales, dépendent bien entendu du point a.
En reportant ce développement dans (173) nous obtenons
lndet’ (-AL+))
=
-:
/d2a&TrG-,i
In& [/d2a&TrGo
-dimKer
+termes finis (1746)
Le second terme en In& provient de la prescription consistant à sommer sur
les modes non nuls.
Envisageons maintenant une variation du facteur d’échelle i, dans la
relation g = e2$go. Supprimant tous les indices pour un mode non nul de Sn,
la relation
x ( T ,T ) = 2 ( P T IPT)
s’écrit explicitement
X/d2a&(gZt)”
tf = 2
J
d2z&(gZr)n+1 (gz2&) (gZrat)
370
GEOMETRIE ALEATOIRE
XI.2.3
Nous en concluons que la normalisation entraîne la relation
âX
+ X2(n + 1) (T,6$T) = 4n ( P T ,ô$PT)
Si nous nous souvenons que f i T = T est le mode normalisé correspondant
dans
l'équation ci-dessus peut encore s'écrire
- (n + 1) (T,6 @ T ) }
6X = 2X {n (Fila$?')
En conséquence
6lndet' (-Ai+))
=L
O D
dt
cf
&X,e-txr
r
Pour évaluer cette quantité, nous avons aussi besoin du développement anaEcrivant en une colonne les deux éléments de
logue à (174) pour
l'opérateur nous avons
AL2).
Pour obtenir une expression analogue à (130) nous allons employer ici une
méthode perturbative en posant gzz = +e2$ et en utilisant un système de
coordonnées tel qu'au point O: où nous voulons évaluer le noyau, pris comme
origine nous ayons $ ( O ) = O , û+(O) = a$(O) = O . Avec les notations usuelles
de la mécanique quantique nous écrivons P2 = -4@, c'est-à-dire (moins) le
laplacien plat. Alors
Comme IzI est d'ordre
sous la forme
e-P2t-tV
4,il nous suffit d'un développement au premier ordre
= e-P2t -
dtfe-P2(t-t')Ve-t'p2 + . , ,
Pour les composantes supérieure et inférieure nous avons respectivement
XI.2.3
371
GEOMETRIE ALEATOIRE
v+=vo-v,
v- = v, + VI + v2
I/,
=-
+ 2ZEaa@(0)+ 2a2@(0)]
[2202@(0)
V2
= 8n0a@(O)
(
I I
Nous cherchons à calculer Tr O etan( + ) O ) , où ia trace signifie la somme
sur les composantes supérieure et inférieure de sorte que au premier ordre
la contribution de VI disparaît. Celle de Vi a déjà été obtenue en (130). I1
est intéressant de la reproduire en utilisant la méthode présentée ici où elle
apparaît doublée en raison de la trace, comme l’est le terme d’ordre zéro. En
outre V2 = 2nA@(O)donne lieu dans la trace à un terme dont le coefficient est
En rassemblant ces résultats, on a
où nous avons distingué successivement les différentes contributions. Ainsi si f
est une fonction diagonale dans l’espace de configuration et en nous rappelant
que d’après l’équation (119), R = -A@,
(176a)
Un calcul analogue donne
Tr je‘*-+‘
(-’
=JdaJgj{
&
- W 67r R
} +O(&)
(176b)
Finalement lorsque n = O , si A désigne le laplacien scalaire, nous avions obtenu
ci-dessus
(176c)
Une conséquence immédiate et remarquable de ces calculs est l’observation
suivante qui conduit à un cas particulier du théorème de l’index dû à Atiyah
et Singer. L’index est l’entier
in = dim [kerP,] -dim [kerPi]
qui est la différence entre la dimension et la codimension de l’opérateur.
Comme - A n ) = 2PnPn et
= 2P,,Pi ont un spectre de valeurs
propres non nulles identiques, on a pour tout t,
(177)
372
XI.2.3
GEOMETRIE ALEATOIRE
Puisque cette quantité est indépendante de t on peut la calculer pour t -+ O
à l’aide des équations (176) en y faisant f E 1. Le terme singulier en t-l
se compense dans la différence et les termes finis donnent alors la relation
entre l’index et les propriétés topologiques, c’est-à-dire dans le cas présent la
caractéristique d’Euler
La différence entre les nombres de tenseurs harmoniques réels de rang n et
n 1 est donc un invariant topologique.
+
Lorsque n = 1, l’index est 3x . Les dimensions calculées en (177) et
(178) sont celles d’espaces vectoriels réels. Le nombre de champs de vecteurs
de Killing conformes linéairement indépendants (dim [KerPl]) est la dimension
(sur les réels) d u groupe des difféomorphismes analytiques ou groupe conforme
global tel qu’il était nommé au chapitre IX. Donc dim [KerPl] = 6 , 2 , O suivant
que x = 2 , 0 ou négatif correspondant au groupe SL(2,C) pour la sphère et
aux translations complexes pour le tore. Les surfaces de Riemann de genre
plus grand que un n’admettent au plus qu’un groupe fini d’automorphismes.
Donc dim [KerP!] = dim(KerP1) -3x est nul en genre nul, deux en genre un,
et 6(g - 1) en genre plus grand que un, toutes ces quantités étant calculées sur
les réels. Rappelons que c’est la dimension de l’espace des modules. Ce résultat
est bien connu pour g = O (pas de module) et g = 1 (un module complexe).
Nous avons maintenant tous les outils nécessaires pour extraire des
déterminants les termes divergents et finis dépendant du facteur conforme
$. D’après les équations (174) et (176a)
Indet‘(-Ak+))
= -&/d2afi+lni
[(n+;)x-dim[KerP,]]
+fini
Ceci est dimensionnellement correct puisque E a la dimension d’une longueur
au carré. Le coefficient de in E est bien entendu un nombre pur. Cette formule
est cependant insuffisante puisque nous cherchons à obtenir aussi la dépendance en $ de la partie finie qui contient l’anomalie. A part le terme logarithmique qui contient la dimension du noyau de Pn (et qui sera éliminé dans la
suite) les divergences résiduelles peuvent être absorbées par une renormalisation de A0 et de la “tension” nue p i dans l’équation (161).
La formule variationnelie (175) contient des traces tronquées. Si on utilise
à la place les traces complètes il faut soustraire la contribution des modes nuis.
une base du noyau de Pn. Considérons la matrice symétrique finie
(179)
XI.2.3
373
GEOMETRIE ALEATOIRE
Rappelons que t(O) est analytique en z et peut être choisi indépendamment de
$. On a donc
Le projecteur sur le noyau de Pn peut alors s'écrire, en termes d'une notation
évidente,
et
En ce qui concerne le projecteur
pn+l sur
?io)
le noyau de P i , les fonctions
sio)
:(O)
correspondantes
telles que (gzz)n+l
= t , sont analytiques en 2 .
Choisissons ces indépendants de $. Le même raisonnement appliqué à la
matrice
z
montre que
-2nTr6$Pn+1 = 6lndet H,
(183)
Combinons les équations (175) et (176ab) avec les résultats précédents. NOUS
trouvons que sous l'action d'une variation d'échelle, et en posant g = c'+go
avec R = e-'@ [Ro - Ao+o]
6 In det' (-Ai+))
=
$1
d2aJgo6+
e'@
-+
E
6n(n
+ 1) + 1 (Ro- Ao+)
3
I
$6 In det H, det fi,
(184)
Soit
In det' (-Ai+')
-
27rE
=
1
d2a&e2*
-
6n(n
+ 1) + 1 J d'ad% { s ~ " ~ a ~+l ~2RoSi)
la~l~
6.rr
+ In det Hn det fi,, + fn
(185)
374
XI.2.3
GEOMETRIE ALEATOIRE
Le terme fn est indépendant de $I mais contient encore des singularités. Nous
obtenons l’action de Liouville parmi les termes finis comme on s’y attend. On
observe en outre que les termes singuliers dépendant de 11, sont les mêmes que
ceux qui figuraient dans l’équation (179). En comparant ces deux expressions,
on en conclut que
+In (det Hn det fi.)
+ Fn
(186)
Cette fois-ci Fn est une quantité finie indépendante de 11, (et donc uniquement
fonction des modules, ou si l’on veut de la métrique de référence). En dernière
analyse c’est ie terme le plus difficile à obtenir, mais aussi le plus intéressant.
Au chapitre IX nous avons vu un exemple d’évaluation dans la discussion du
champ libre sur un tore. Nous avons besoin de l’expression (186) pour n = 1.
Le fait que -Ai+’ diffère de PJPl par un facteur 2 n’est bien entendu d’aucune
... peut être absorbé dans
conséquence, puisque tout facteur constant 2,
la définition de la mesure d’intégration. Nous laissons le soin au lecteur de
reprendre le même calcul dans le cas du laplacien scalaire, avec les conventions
de régularisation utilisées ci-dessus, en prenant garde au terme topologique.
Le résultat s’écrit
6,
‘s
lndet‘(-A) = --
47rE
d2û&e2*
+ [ax - 11
avec FOfini et ne dépendant que des modules. En ce qui concerne la dépendance
dans le facteur d’échelle cette expression est en accord avec (134) puisque
indet’(-A).
In 2 =
-+
Le dernier ingrédient nécessaire avant de mettre bout à bout les expressions précédentes est la mesure d’intégration. La mesure sur l’espace des
modules (de dimension finie) a été écrite ’ D h M . Nous pouvons utiliser un développement de h sur la base du noyau de in P i pour écrire
dh = x d T u r u
U
Donc
XI.2.3
375
GEOMETRIE ALEATOIRE
Ce terme est absent si g = O, c’est une intégrale double pour g = 1 et en
général l’indice u varie de 1 à 6(g - 1).
Rassemblant les résultats des équations (186) pour n = 1 et (187) où
nous soulignons que Fi et FO sont fonctions des r , les paramètres modulaires,
nous obtenons
Nous avons encore manqué un peu de soin en écrivant la mesure. En effet
(cf. l’équation (173) où intervient la combinaison sans dimension E X ) chaque
intégrale gaussienne initiale devait faire intervenir la mesure dzs-3. D’où
dC: -+ dC:aË*,
( n z L d T Y )+ ( n u d r u ) a - ’ d i m ( k e r p ~ ) . De plus S V u l
n’est pas le ‘‘volume” entier du groupe des différomorphismes lorsque g = O
ou 1 (où la dimension de kerP1 est non nulle). I1 manque le “volume” infini
du groupe conforme global. Donc on voudrait factoriser VuLx “volume”
du groupe global et diviser par un facteur normalisation (que nous prenons
égal à l’unité) multiplié par a-dim(kerP1)(où dim(kerP1) est bien entendu la
dimension de ce groupe). Le fait qu’un facteur
est absent de l’exposant
5
L
résulte de ce que les valeurs propres de ( P i P l ) * qui s’annulent auraient une
dimension 1 dans une régularisation. Toutes ces subtilités se réduisent à dire
que le facteur
(XOE$@-~))
E
-
+
~
~
doit
~ ~être
( remplacé
~ ~ ~ par
~ la
~ quantité
)
Nous pouvons alors définir les quantités renormalisées
=Xoe12(26-d)
P2 =p;
+
1 (1 - T1 d )
La mesure complète sur l’espace des modules s’écrit
dM, = n d r u d e t k i ( d e t H l ) +
U
376
GEOMETFUE ALEATOIRE
XI.2.3
A première vue il semble que les facteurs dans cette formule dépendent
de l’échelle
d’après les équations variationnelles (181) et (183) et toute
l’expression dépend bien entendu des modules (comme la métrique de référence
go en principe). Pour g > 1, det Hi = 1. Après compensation des facteurs E ,
la mesure s u r les modes nuls de translation peut s’écrire
$J
où les X : désignent les coordonnées du centre de masse puisque le développement de X p commençait par la contribution de ces modes C; x
(s
+
du&Ge2“)-’
. . .. Finalement nous factorisons le “volume” du groupe
des difféomorphismes et nous posons
S(T) =
f [dFO(T) - Fl(T)]
(194)
qui est la partie la plus significative de l’action.
Le produit final de l’analyse précédente est l’expression due à Polyakov
et Friedan
1 11 1
d
ZRen
X
=Ax
-011,
dMTexp -Stat
dX:
I1 est clair que dans la dérivation que nous avons reproduite, de nombreux
points méritent une clarification. I1 en est ainsi en particulier de trouver
le domaine précis d’intégration dans l’espace des modules, de préciser la
mesure d’intégration, de calculer la partie finie de l’action S ( T ) . Comme
on l’a souligné la manière de superposer les différents termes 2, correspondant à différentes topologies peut être mise en doute. Un point cependant
ne fait pas de doute. La théorie bosonique contiiiue des surfaces aléatoires
décrite ci-dessus perd tout sens en dimension plus grande que 26, car la contribution du terme “cinétique’’ en devient alors négative. En dimension
inférieure à 26, il apparaît un nouveau degré de liberté, le champ 11, précisément, associé à l’anomalie conforme. C’est ce qu’on appelle la théorie
de Liouville. La dimension 26 est marginale. Si l’on se place alors au point
p2 = O , la contribution de se factorise (au prix d’une définition peut-être
plus correcte de la mesure dM,) et peut être absorbée dans une renormalisation multiplicative supplémentaire de 2,. La théorie est alors invariante
d’échelle.
+
XI.2.3
GEOMETRIE ALEATOIRE
377
On peut envisager deux types d’observables pour étudier le comportement de ces surfaces aléatoires. Les observables non locales s’apparentent à
celles qu’on utilisait dans les théories de jauge et font intervenir des courbes
frontières. La dérivation précédente peut en fait être généralisée en présence
de frontières données en imposant soigneusement l’invariance de reparamétrisation de la frontière elle-même. Suivant le type de conditions imposées
au bord il apparaît différents termes supplémentaires, proportionnels à l’aire
enfermée par la courbe frontière aussi bien que son périmètre. Dans le contexte de la physique des particules ceci conduit au modèle dit de la corde
ouverte. D’autres observables sont locales en ce sens qu’on demande aux
surfaces de passer par un certain nombre de points fixes {x”} dans l’espace
cible. Ceci revient à introduire dans l’intégrale fonctionnelle des facteurs du
X = J ( d d p / ( 2 7 r ) d exp(-ip.
)
x)exp(ip. X), dont la dépentype c ~ ( ~ )-( x)
dance exponentielle en X est appelée opérateur de vertex. Ces quantités
permettent d’étudier des corrélations dans la surface.
Au terme de ce survol préliminaire, la théorie continue des surfaces
aléatoires apparaît comme un domaine relativement complexe, requérant
des méthodes mathématiques avancées pour en extraire des résultats intéressants. I1 existe aussi des versions discrètes permettant des études numériques que nous voulons brièvement décrire en conclusion.
2.4 Modèles discrets
I1 semble à première vue qu’un modèle discret évite la question de
l’invariance de reparamétrisation. Nous allons voir que cette idée est un peu
trop optimiste.
I1 est bon de remarquer qu’a priori une triangulation ne fournit pas
une approximation uniforme d’une surface régulière comme c’est le cas pour
une ligne brisée, rectiligne par morceaux, dans le cas d’une courbe. Un
exemple classique est celui de l’approximation d’un cylindre vertical de rayon
a par des triangles obtenus en joignant les sommets de polygones réguliers
horizontaux, à n côtés, inscrits dans le cylindre, centrés sur l’axe à des points
d’ordonnées k b ( k entier), chacun étant tourné d’un angle a / n par rapport
au précédent (figure 5). Considérons une couche de K familles de 2n tels
triangles. L’aire cylindrique est 2aabK. Par ailleurs chaque triangle a une
4a2 sin2(a/2n), de sorte que le rapport de l’aire
aire ;.2asin(n/n) x Jb2
triangulée à l’aire continue est
+
n sin
. r { i
a
n
;cl’
+ -sin2
. ;2
Faisons tendre n vers l’infini. Si le rapport a2/b2 est maintenu constant, ce
rapport tend vers 1. Si nous autorisons a2/b2 à dépendre de n, nous pouvons
obtenir toute valeur plus grande que 1 bien que l’aire de chaque triangle
élémentaire tende vers zéro.
378
GEOMETRIE ALEATOIRE
XI.2.4
Figure 5 : Approximation d’un cylindre par une triangulation régulière
Considérons le modèle le plus simple. Nous fixons le type topologique,
le cas du tore = O étant le plus simple à traiter, et appliquons les sommets
d’une triangulation régulière d’un tore plat dans l’espace Rd.Prenons le cas
le plus simple d’une action proportionnelle à l’aire induite, la contribution
de chaque triangle étant e i j k . Intégrons sur tous les points, sauf un pour
tenir compte de l’invariance par translation. On obtient
x
Nous avons ainsi un facteur de coupure à courte distance analogue à E+
dans la théorie continue, pris comme unité ou absorbé si l’on veut dans le
coefficient /3. Nous nous intéressons au cas où le pas de la triangulation
devient infinitésimal et où, comme on l’a dit ci-dessus, cette dernière est
un réseau triangulaire régulier sur un tore plat à N sites, 3N liens et
2 N triangles. Sur l’espace de base nous avons ainsi une invariance de
translation discrète. Si nous multiplions X par A, la fonction de partition 2
se transforme en
Par conséquent pour N tendant vers l’infini
P(4,d
=id
(197)
Ceci suggère d’employer la méthode du col en grande dimension d. On introduit des variables conjuguées pour chaque lien afin d’imposer la condition
XI.2.4
379
GEOMETRIE ALEATOIRE
(Xi - Xj)2 = e$. Rappelons que l’aire eiih est donnée en fonction des côtés
par la relation (99). La fonction de partition s’écrit
ei3
exp -
{
X j k [(Xj - Xk)2 - e j k ]
+ PS
(ik)
Supposant le champ moyen homogène
du lien) la méthode du col conduit à
2 -exp -Se,,(X1
se,,
=N
= Al
lj,
= I indépendamment
e)
(199)
[ i d ln A - 3xe2 + +Ape21
Les conditions de stationarité en
A=-
(Xjk
e et X s’écrivent
d
6e2
oAe2= d
en accord avec l’équation (197). I1 en découle que Serf = ;Ndln(/3/2&).
Pour ces valeurs de X et e, le modèle se réduit à un produit de d champs
gaussien sans masse découplés, quand on étudie la valeur moyenne d’une
observable dépendant des coordonnées X. Pour donner un exemple, puisque
((Xi - XJ) = 2 1 le rayon de giration défini comme
e
(201a)
prend la valeur
R2
-
N - 7 T
I&
---e2
4
1
In N = - (aire élémentaire} In N
(201b)
7T
avec un comportement logarithmique qui résulte de la singularité infrarouge
standard du propagateur de masse nulle bidimensionnel. Ce résultat est à
comparer avec le comportement proportionnel à N de la quantité analogue
pour une courbe brownienne. Dans l’équation (201b) le préfacteur (l/a)(aire
élémentaire) est spécifique de la triangulation et d’ordre d. I1 y a des corrections relatives en puissances de l / d quand on poursuit le développement
autour du col. Dans le cas présent la correction dominante (1 (2/d) . . .)
a pu être observée dans des simulations numériques.
En conclusion un modèle fondé sur une topologie déterminée et une
triangulation fixée, défini par un poids de Boltzmann en exp( -Aire), engendre un effondrement des surfaces (de dimension de Hausdorff infinie)
+
+
380
XI.2.4
GEOMETRIE ALEATOIRE
comme en témoigne l’équation (201) et il semble qu’aucune modification
simple comme celle qui reviendrait à inclure un terme de Liouville discret
ne permet d’éviter cette conclusion. Pour obtenir des résultats plus raisonnables et plus proches de l’image continue, il faut se poser la question de
trouver un analogue discret à la reparamétrisation. A genre fixé cet analogue
ne peut être que d’envisager toutes les triangulations inéquivalentes I plutôt que de se limiter à l’une d’entre elles, ce qui a conduit l’effondrement
catastrophique discuté ci-dessus. Afin de simplifier, et en analogie avec le
cas continu, on assigne une métrique de référence à chacune de ces triangulations en prenant chaque lien entre voisins de longueur égale. Les triangles
sont équilatéraux et on peut donc associer à chaque site un élément d’aire
cri = +ni dans des unités convenables (l’équivalent du facteur
de la
théorie continue) où ni est le nombre des voisins. L’aire intrinsèque totale
est alors égale au nombre N2 de triangles
Js)
A=
Cui= N~
i
La courbure en un site de l’espace est donnée par l’angle de défaut
et satisfait à la relation
Un terme impliquant le carré de la courbure s’écrirait sous la forme
Pour obtenir une action analogue à celle utilisée dans le continu, on
ajoute au terme proportionnel à l’aire (202) un terme quadratique dans les
coordonnées du plongement X i utilisant pour ce faire la métrique de base.
A caract,éristique x donnée on somme alors sur toutes les triangulations
inéquivalentes I comportant un nombre arbitraire de triangles. En outre
on intègre sur les Xi avec la mesure
[(2)
z>X =
2d
(+
ddXi] ( 2 r ) id Sd
.ixi)
?
qui revient à omettre l’intégrale sur la position du centre de
conséquence
XI.2.4
GEOMETRIE ALEATOIRE
381
La somme sur les triangulations remplace la somme sur les métriques, et
k ( 7 ) est un facteur combinatoire égal à l’ordre du groupe de symétrie d’une
triangulation. On pourrait se permettre d’ajouter des termes en puissances
plus élevées de la courbure du type (205) pour voir qu’ils n’affectent pas les
résultats dans la limite continue. Enfin le coefficient /3 est l’analogue de pg
dans la section précédente, c’est-à-dire encore une tension de corde nue.
L’opérateur discret qui définit la partie quadratique en X dans l’action
a des termes diagonaux égaux à ni = 3ai et des termes non diagonaux égaux
à zéro ou moins un s’ils correspondent à un lien. Ceci n’est pas exactement
le laplacien discret (au signe près) qui s’obtient en multipliant lignes et
1
colonnes par azr
En omettant l’intégrale sur le mode nul, on trouve par conséquent que
où chaque terme dépend de la triangulation 1.Le fait que det’(-A)
est divisé par l’aire A provient de l’omission du mode nul. On constate
que comme dans la théorie continue la dimension d joue le rôle d’un
paramètre. De manière analogue on pourrait considérer des fonctions de
Green correspondant à fixer les images {X,} d’un certain nombre de points
r
1
à une normalisation près, ceci supposant bien entendu que le réseau contient
plus de points que l’ensemble {X,} .
A genre fixé, la fonction de partition 2, admet un développement en
série de puissances de e-P puisque A est un entier. On s’attend à ce que
ce développement ait un rayon de convergence fini comme les exemples cidessous le suggèrent. Donc le modèle semble bien défini au moins pour
382
GEOMETRIE ALEATOIRE
XI.2.4
P > Pc. Au point critique Pc certaines singularités apparaîtront et on
étudiera le comportement critique comme à l’accoutumée.
La fonction à un point G1 est indépendante de X par invariance
par translation et elle est égale à -802,. L’analogie avec la mécanique
statistique suggère d’appeler susceptibilité (et non chaleur spécifique) la
seconde dérivée de 2, par rapport à P, proportionnelle à l’aire moyenne.
Au voisinage du point critique on définira l’exposant y par le comportement
- (P
d2
-2,
8P2
1
- Pc)’
Si y est positif, l’aire moyenne diverge tandis qu’elle reste bornée si y est
négatif.
Lorsque P tend vers ,Oc, on s’attend à ce que la fonction à deux points
se comporte à grande séparation comme
avec des exposants 7 et v. A triangulation fixée on peut encore définir un
rayon de giration
où les crochets signifient une moyenne par rapport à la partie de la mesure
dépendant de X. On peut alors écrire une fonction génératrice par rapport
à toutes les triangulations
Si on développe en puissance de
le rapport b,/a,
fixée
P
est un rayon de giration moyen à aire intrinsèque A = n
(x2)A
La limite à n --+
de ces surfaces.
00
bn/an
(215)
fournit un candidat pour la dimension de Hausdorff dh
XI.2.4
GEOMETRIE ALEATOIRE
(X2)A
-
A-C€
A2/dH
383
(216)
Montrer que si m (bc)s’annule, on s’attend aux relations d’échelle
Dans la suite nous supposerons pour plus de simplicité que la topologie
est plane (x= 2, le plan étant compactifié en une sphère par adjonction d’un
point à l’infini). David a observé que le modèle des surfaces triangulées cidessus est équivalent, à des termes inessentiels près, à une théorie q53 planaire
avec propagateur exponentiel, généralisant la discussion donnée au chapitre
X, section 4. Dans ce contexte q5 est une matrice hermitique N x N et N
tend vers l’infini. La théorie du champ q5 est fondée sur l’action suivante
dans l’espace euclidien cible
,S@=
I
9 Tr q53
d d X Tr q5 e A 4+ -
JN
(218)
action qui n’est évidemment pas bornée inférieurement, mais qui ne sert
qu’à engendrer la série perturbative. Dans la limite planaire ( N + 00) les
diagrammes sont duaux de triangulations I du plan (figure 6). I1 est possible
de modifier le lagrangien pour éliminer les diagrammes en “tadpoles’’, et
les insertions d’énergie propre, en ajoutant un polynôme du second degré
en q5. Les règles perturbatives engendrent le facteur combinatoire k (7)
apparaissant dans l’équatiron (207). La contribution restante résulte de
l’intégrale de Feynman avec un propagateur en exp - (XI - X2)2 dans
l’espace de configuration joignant deux sommets du diagramme planaire.
Figure 6 : Dualité entre diagrammes planaires (doubles lignes) et
triangulations (lignes interrompues).
384
XI.2.4
GEOMETRIE ALEATOIRE
On intègre alors sur tous les X sauf un. I1 faut prendre garde au fait que
ceci n’est pas directement l’intégrale sur X dans (207) puisque les X sont
indexés par les sommets du graphe planaire et non ceux de la triangulation
duale. A un facteur près l’intégrale de Feynman est ici (det’K)-td, où
det’K est un mineur quelconque de la matrice d’incidence K du graphe
planaire, Kab = -1 si a et b sont voisins, Ka, = nombre de voisins du
site a,les autres éléments de matrice étant nuls. D’après le théorème de
Kirchoff (chapitre VII), det’K est le nombre d’arbres tracés sur le graphe
planaire, contenant tous les sommets. Chacun d’eux est en dualité avec un
arbre analogue du graphe dual, c’est-à-dire de la triangulation 7. Cette
propriété est spécifique de la topologie planaire et il faudrait envisager des
modifications pour traiter le cas de surfaces de genre plus élevé. Sur la figure
7, nous montrons un exemple de cette dualité.
n
Figure 7: Exemple de dualité entre arbres d’un graphe planaire
(indiqués par des lignes grasses et des lignes interrompues).
En conséquence (det’K)-ld = (det’KT)-ld ne diffère du résultat
attendu [(det -A)/A]-td que par des facteurs provenant dans ce dernier
oz!d= exp
In oi. Comme
cas de la mesure d’intégration (206)’ soit
oz = +ni = 2 [i - ozRi/r],
ni
no)‘
= exp { 4dAln2 - (2 - ln2) ?jdx
i d ci
+ ...}
(219)
i
en utilisant les propriétés de triangulations planaires (2Ni = 3N2, No Ni + N2 x
& O-&). Les termes omis contiennent des puissances
plus élevées de la courbure et sont probablement inessentiels (ou pourraient
être absorbés par une modification de l’action nue). Le premier terme dans
(219) équivaut à une renormalisation additive de p et le second est le terme
topologique attendu.
ci
XI.2.4
GEOMETRIE ALEATOIRE
385
Du point de vue de la renormalisation, le modèle 453 planaire défini
par l’action (218) est donc équivalent à un modèle de Polyakov discret. I1
faut une renormalisation du propagateur pour éviter les insertions de masse
propre (correspondant aux triangulations où un sommet n’a que deux
voisins et qui peuvent être omis) et un terme supplémentaire. linéaire en
4’ pour éviter les tadpoles’ c’est-à-dire les triangulations avec certains
sommets identifiés.
Considérons la fonctionnelle du vide connexe de la version 453. La
série en e-fl est équivalente au développement perturbatif ordinaire en g
pour la théorie planaire. Nous avons quelque expérience en ce qui concerne
les propriétés de convergence et les singularités de ce dernier. L’équation
(209) fournit une extrapolation en d. En particulier pour d = O (sic!) nous
,pouvons utiliser les résultats du chapitre XI notamment l’équation (X.290)
qui montre un rayon de convergence fini en g 2 = e-2p correspondant au
développement
1 O3 (72e-2fl)
(zk)
d=O
=Z
(k 2)! r ( f r c + 1)
z~
+
Le terme général de la série se comporte en e-2(fl-flc)kk-%. Ceci
correspond à un comportement singulier de 2, au voisinage de pc en
n
(0 - pc)z et l’exposant y défini pour la seconde dérivée en /3 est négatif
y = -A
(221)
d=O
2
qui signifie que l’aire moyenne ne diverge pas au point critique. Ces conclusions ne sont pas affectées si on introduit dans le lagrangien les termes
nécessaires pour supprimer tadpoles et insertions d’énergie propre. Bien entendu il s’agit d’un cas hautement irréaliste.
I1 est possible de trouver aussi une solution explicite dans le cas d = -2
(Kazakov, Kostov, Migdal) où on trouve une somme ayant pour poids le
nombre d’arbres complets du diagramme, équivalente à une théorie fermionique complexe. La série correspondante a aussi un rayon de convergence fini
avec
d=-2
(222)
y=-1
Par ailleurs, Zamolodchikov a montré que la théorie perturbative appliquée à
une valeur, non physique, de d grand et négatif produit les valeurs
d+-m
y = ‘6( d - 7 ) ,
u=o
Dans les références citées dans les notes, les auteurs donnent bien plus
de résultats sur les cas solubles, d = O et d = -2 où la longueur de corrélation
(223)
386
XI.2.4
GEOMETRIE ALEATOIRE
diverge à la transition avec un exposant très petit, correspondant
à une dimension de Hausdorff très grande. Ce résultat semble valable en
WZ(@,)-~
dimension plus grande.
Sur un réseau régulier on peut aussi étudier une théorie de champ moyen
à d grand positif (chapitre VI). On se souvient que cette théorie correspond à
des polymères de cubes branchés avec
d-++cc
y = ’2
1
Y = - = ’
dH
Une extrapolation hardie de ces résultats partiels semble indiquer que -y croît
pour d -t 00 , tandis que la dimension de Hausdorff
avec d et tend vers
demeurerait très grande voire infinie.
On ne peut pas dire qu’on ait atteint un degré de compréhension très
satisfaisant dans la théorie des surfaces aléatoires, sujet très riche et complexe. Nous n’avons pas discuté la somme sur les diverses topologies et nous
n’avons pas non plus inclus d’informations sur les quantités géométriques
extrinsèques. Par exemple, dans certaines applications physiques on peut
avoir à considérer des cas où la tension est très faible ou nulle et ou la
courbure moyenne (la somme des inverses des rayons de courbure principaux) joue un rôle prépondérant. D’autres degrés de liberté de membranes
aléatoires peuvent aussi jouer un rôle important. I1 reste donc quantité de
problèmes ouverts et la géométrie aléatoire semble promise à un bel avenir.
Notes
La statistique géométrique est présentée dans l’ouvrage de L.A. Santal0
Integral Geometry and Geometrical Probability, Addison-Wesley, Reading
(1976). Certaines applications à la physique de la matière condensée sont
décrites par R. Collins dans Phase Stability of Metals and Alloys, P.S. Rudman, J. Stringer et R.I. Jaf€ee éditeurs, McGraw-Hill, New York (1967),
et R. Zallen dans Fluctuation Phenomena, E.W. Montroll et J.L. Lebowitz
éditeurs, North-Holland, Amsterdam (1979), et dans le livre de J.M. Ziman
Models of Disorder, Cambridge University Press (1979).
Les réseaux aléatoires poissonniens ont été étudiés par N.H. Christ,
R. Friedberg et T.D. Lee, Nucl. Phys. B202, 89 (1982) B210 (FS6) 310,
337 (1982). Le travail de J.L. Meijering a paru dans Philips Research Report
8 , 270 (1953). Voir aussi l’article de H.G. Hanson, J. Stat. Phys. 30,
591 (1983) pour des considérations voisines. La contribution des auteurs
en collaboration avec M. Bander est résumée dans New Perspectives in
Quantum Field Theories, J. Abad, M. Asorey et A. Cruz éditeurs, World
Scientific, Singapore (1986). Pour une étude des modèles statistiques sur des
XI.Notes
GEOMETRIE ALEATOIRE
387
réseaux aléatoires bidimensionnels voir D. Espriu, M. Gross, P.E.L. Rakow
et J.F. Wheater, Nucl.Phys. B265 [FS15], 92 (1986). Les fermions de
Dirac-Kahler sont discutés dans le travail de P. Becher et H. Joos, 2. Phys.
C15, 343 (1982).
C’est T. Regge qui a donné une formulation discrète de la gravitation
dans un important article, Nuovo Cimento 19,558 (1961). Les problèmes de
courbure d’une variété linéaire par morceaux et les questions de limite continue sont étudiés en profondeur par J . Cheeger, W. Müller et R. Schrader,
Comm. Math. Phys. 92, 405 (1984). G. Feinberg, R. Friedberg, T.D. Lee et
H.C. Ren, Nucl. Phys. B245, 343 (1984) abordent des questions analogues
dans le cadre de la gravitation.
Le modèle dual des interactions fortes en physique des particules a don,né naissance à une théorie des surfaces à la suite des travaux de Y. Nambu
publiés dans Symmetries and Quark Models, édité par R. Chaud, Gordon et
Breach, New York (1970), et T. Goto, Prog. Theor. Phys. 46, 1560 (1971)
ainsi que d’autres auteurs. L’étude des surfaces aléatoires en tant que généralisation du mouvement brownien a été reprise par A.M. Polyakov, Phys.
Lett. 103B, 207 (1981). Une revue incluant de nombreuses références, une
discussion générale et de nombreux résultats exacts est due à J . Frohlich
dans Applications of Field Theory to Statistical Mechanics, édité par L. Garrido, Lecture Notes in Physics 216, Springer, Berlin (1985). Notre présentation est fondée sur l’analyse de O. Alvarez, Nucl. Phys. B216, 125 (1983)
et les leçons de D. Friedan aux Houches publiées dans Recent Advances
in Field Theory and Statistical Physics, édité par J.-B. Zuber et R. Stora,
North-Holland, Amsterdam (1984). L’inclusion de termes de courbure extrinsèque dans l’action trouve son origine dans les travaux de W. Helfrich,
2. Naturforsch. C28, 693 (1973) et J. Physique 46, 1263 (1985). Voir aussi
A.M. Polyakov, NucZ. Phys. B268, 406 (1986).
K. Fujikawa, Phys. Rev. D21, 2848 (1980), D23, 2262 (1981) a i n t r e
duit des méthodes originales pour calculer les anomalies dans le cadre des
intégrales fonctionnelles, méthodes utilisées dans le texte.
La théorie des interfaces entre phases a une très longue histoire. Parmi
des travaux récents citons D.J. Wallace et R.K.P. Zia, Phys. Rev. Lett. 43,
808 (1979), M.J. Lowe et D.J. Wallace, Phys. Lett. 93B, 433 (1980), J.
Phys. A13, L 381 (1980), F . David, Phys. Lett. 102B, 193 (1981).
Les modèles de surfaces discrets ont été introduits dans le contexte
des théories de jauge par J.-M. Drouffe, G. Parisi et N. Sourlas dans un
travail cité au chapitre VI, par D. Weingarten, Phys. Lett. 90B, 285 (1980),
T. Eguchi et H. Kawai, Phys. Lett. llOB, 143 (1982), 114B, 247 (1982),
par B. Durhuus, J . Frohlich et T. Jonsson, Nucl. Phys. B225 [FS9], 185
(1983), Phys. Lett. 137B, 93 (1984). D.J. Gross, Phys. Lett. 138B, 185
(1984), A. Billoire, D.J. Gross et E. Marinari, Phys. Lett. 139B, 75 (1984)
et B. Duplantier, Phys. Lett. 141B, 239 (1984) ont considéré des modèles
impliquant une triangulation fixe. La version discrète du modèle de Polyakov
388
GEOMETRIE ALEATOIRE
XI.Notes
et sa relation avec la limite planaire sont dus à F. David, Nucl. Phys. B257
(FS14), 543 (1985), V.A. Kazakov, I.K. Kostov et A.A. Migdal, Phys. Lett.
157B, 295 (1985) et J. A m b j ~ r n ,B. Durhuus et J. Frohlich, Nucl. Phys.
B257 (FS14),433 (1985). Les calculs analogues dans la limite continue sont
dus à A.B. Zamolodchikov, Phys. Lett. 117B, 87 (1982) et J. Jurkiewicz
et A. Krzywicki, Phys. Lett. 148B, 148 (1984). Cette liste est loin d’être
exhaustive.
La littérature sur la théorie des cordes et des supercordes est devenue
énorme. De nombreux travaux originaux sont rassemblés dans les volumes
Dual Theory, édité par M. Jacob, North Holland, Amsterdam (1974 et 1984)
et Superstrings, édité par J.H. Schwarz, World Scientific, Singapore (1985).
M.B. Green, J.H. Schwarz et E. Witten ont donné une présentation très
complète dans Superstring Theory, Cambridge University Press (1987).
INDEX
Cet index concerne les deux volumes de l'ouvrage. Les nombres en
italique se réfèrent aux pages du volume 1, ceux en caractères romains à celles
du volume 2.
Abe 154
Action de Hilbert-Einstein 346
Action de Liouville 351, 357, 373
Action de Nambu-Goto 359
Action de Villain 200, 324
Aimantation spontanée 59, 69
Algèbre de Clifford 51, 62
Algèbre de Kac-Moody 112, 165,
201, 220
Algèbre de Lie 322, 164, 202
Algèbre de Lie simplement lacée
164
Algèbre de Virasoro 107
Algèbre enveloppante 167
Algèbre super-conforme 195
Algorithme de Metropolis 54
Algorithme du thermostat 53
Alvarez 358
Amplitude de Born 276
Amplitudes critiques 186
Amputation 234
Analyse dimensionnelle 232
Anderson 229
Andrews, B u t e r , Forrester 164,
171
Anomalie 263, 102
Anomalie conforme 351
Approximants de Padé 41
Approximation de Bethe 119
Approximation de champ moyen
106
Approximation de MigdalKadanoff 175
Approximation des ondes de spin
194
Approximation gelée 80
Approximation planaire 283
Arbres de Cayley 14
Avron, Seiler 308
Baker, Nickel, Green, Meiron 310
B u t e r 143
B u t e r , Andrews, Forrester 164
Becchi-Rouet-Stora (BRS) 230,
239, 297
Belavin, Polyakov, Zamolodchikov
89, 163
Bender, Wu 40
Berezin 47
Berezinskii 197
Berlin-Kac 137
Berna1 317
Birapport 104
Bosonisation 94, 301
Boucle de 't Hooft 342
Boucle de Polyakov 59
Boucle de Wilson 335, 343
Boules de glu 374
Brézin, Le Guillou, Zinn-Justin
304
Brisure spontanée de symétrie 110
Caianiello 92
Caractères de Virasoro 133
390
Caractères des groupes 324
Caractéristique d’Euler 319, 343,
372
Cardy 132, 183
Cartan-Killing 164, 202
Cauchy 82
Cercles de Fisher 136
Champ de Dirac 300
Champ de Killing 364
Champ de Majorana 90, 139, 300
Champ libre 21
Champ moyen 105, 342
Champ primaire 99
Champs de Higgs 341
Champs de jauge 321
Champs euclidiens 21
Charge centrale 101
Cheeger, Müller, Schrader 346
Cheng-Wu 86
Chevalley, Serre 205
Christ, Friedberg, Lee 317
Chromodynamique quantique 322,
79
Classement topologique 241
Classification A-D-E 163, 332
Coleman 194
Complexe dual 339
Complexe topologique 336
Comptage de puissance 256
Conditions aux limites de NeveuSchwarz et Ramond 161, 198
Conductivité de Hall 308
Confinement 336
Construction de Dirichlet-Voronoi
318
Construction de Wulff 88
Convergence superficielle 257
Coracines 206
Correction du premier ordre 152
Corrections aux lois d’échelle 295
Couplage minimum 322
Courant de Noether 95
Creutz 63
Critère de Harris 295
INDEX
Critère de Landau-Ginzburg 155,
163
Cumulants 75, 234, 7
David 383
Degré canonique 232
Di Francesco, Saleur, Zuber 162
Diagrammes 1
Diagrammes articulés 245
Diagrammes de Coxeter-Dynkin
205
Diagrammes de Feynman 151
Diagrammes en arbre 151, 242
Diagrammes primitivement divergents 257
Diagrammes vide-vide 239
Différentielle quadratique 104
Dimension anormale 172, 237, 268
Dimension canonique 23, 237
Dimension critique inférieure 140
Dimension critique supérieure 140
Dimension d’échelle 92
Dimension de Hausdorff 379, 386
Dimension dynamique 237
Dotsenko 145, 148
Dotsenko, Dotsenko 295, 299, 307
Dualité de Kramers et Wannier 59
Dualité 58, 336
Dyson 304, 229, 246, 269
Décimation 173
Dérivée schwarzienne 103, 136
Déterminant de Faddeev-Popov
363
Déterminant de Kac 113, 118
Déterminant de Slater 278
Déterminant de Toeplitz 72
Déterminant de Vandermonde 74
Développement de basse température 24
Développement de couplage fort
357
Développement de haute température 32, 16
Développement en E 231, 284, 304
Développement en caractères 361
Echantillonnage sélectif 51
INDEX
Effet Casimir 105, 149
Effet Hall quantique 256
Effets de taille finie 68
Eguchi, Ooguri 163
Energie d’interface 70
Ensemble de Julia 190
Equation d’Airy 236
Equation d’état 163
Equation de Beltrami 362
Equation de Callan-Symanzik
229, 267, 278, 303
Equation de diffusion 3
Equation de Dirac 91
Equation de Fokker-Planck 76,
232
Equation de Langevin 76
Equation de Ricatti 232
Equation hypergéométrique 145
Equations de Painlevé 96
Equations du mouvement 142
Espace de Fock-Bargmann 49
Espace de Teichmuller 364
Espacements des niveaux 277
Exposant de Lyapounov 248
Exposants critiques 6, 123, 274
Facteurs associés à un groupe
d’invariance 254
Fantômes de Faddeev-Popov 329,
30
Feigin-Fuchs 118
Ferdinand, Fisher 158
Fermions de Kogut-Susskind 383
Fermions de Wilson 380
Fisher 229, 231, 284, 70
Fisher-Gaunt 154
Fixation de jauge 29
Flot de renormalisation 209, 265
Fock-Bargmann 258
Fonction [ de Riemann 153
Fonction de Dedekind 113, 134,
193
Fonction de Green 7
Fonction de partition coulombienne 177
391
Fonction de partition frustrée 70,
83
Fonction de Weierstrass 195
Fonctions d’onde d’un oscillateur
278
Fonctions de corrélations connexes
234
Fonctions de Green 233
Fonctions de Green renormalisées
260
Fonctions de Green une particule
irréductibles 234
Fonctions de Schwinger 233
Fonctions de vertex 234
Fonctions elliptiques 192
Fonctions génératrices 232
Forme contragrédiente 113
Formule d’Euler 285
Formule de Baker-CampbellHausdorff 327
Formule de Freudenthal 208
Formule de Gauss-Bonnet 345
Formule de Gell-Mann-Low 107
Formule de Hardy-Ramanujan 133
Formule de Kronecker 152
Formule de Kubo 310
Formule de Poisson 201, 164
Friedan 358, 376
Friedan, Qiu, Shenker 129, 175,
200, 220
Frustration 342, 172
Fujikawa 354
Gaudin 279
Gaz de Coulomb 192, 200, 272
Générateur de nombres aléatoires
55
Genre 285
Géométrie aléatoire 317
Gepner, Qiu 166
Gepner, Witten 166
Goddard, Kent, Olive 218, 224
Gradation 110
Graphe 1
Graphe tadpole 238
Gross-Neveu 299
392
Groupe de lacets 209
Groupe de renormalisation 265
Groupe de renormalisation Monte
Carlo 49
Groupe de Weyl 204
Groupe dual 338
Groupe modulaire 152
Groupes d’homologie et de
cohomologie 34 0
Haffnien 92
Halperin 230
Hioe, Montroll 294
Hohenberg 194, 215
’t Hooft 283
Huse 171
Hypothèse d’hyper-homogénéité
162
Hypothèse d’échelle 162
Identité de Ward 142, 95, 99
Identité pentagonale d’Euler 134,
193
Identités de Ward-Slavnov 329
Intégrale de chemins il
Intégrales de Feynman 241
Intégrales de Grassmann 47
Intégrales gaussiennes 21
Invariance conforme 90
Invariance d’échelle 87, 171
Invariance de jauge 322
Invariance de Weyl 360
Invariance modulaire 148
Invariant de Casimir 167, 208, 217
Jauge axiale 325
Kac 222
Kadanoff 165
Kadanoff-Ceva 85
Kaufmann 158
Kazakov, Kostov, Migdal 385
Lagrangien 229
Laplacien discret 3
Laughlin 269, 308
Lemme de Szego 72
Liberté asymptotique 321, 31, 306
Limite planaire 383
Limite thermodynamique 22
INDEX
Lipatov 304, 40
Loi de l’aire 336
Loi de Poisson 247
Loi du demi-cercle 271, 287
Loi en périmètre 336
Lois d’échelle 159
Longueur de corrélation 38
Longueur de localisation 252
Marche au hasard 1
Marche avec retour exclu 30
Matrice de Cartan 205
Matrice de transfert 36, 60, 133
Matrices aléatoires 269
Matrices de Dirac 378
Ma 49
McBryan-Spencer 218
McCoy-WU 75
Meijering 322
Mermin-Wagner 215
Mesure de Haar 21
Méthode de renormalisation
Monte Carlo 71
Méthode des répliques 240
Méthode des variables de bloc 165
Modes de Goldstone 105, 115, 117
Modèle O(n) 116
Modèle X Y 190, 177
Modèle 2, 64
Modèle u 25, 105, 30, 347
Modèle d’Ashkin-Teller 139, 178
Modèle d’king 32, 57, 158, 188
Modèle d’Ising tricritique 201
Modèle de Gross-Neveu 79
Modèle de Heisenberg classique
25, 105
Modèle de Potts 173, 142, 178
Modèle de Wess-Zumino-Witten
209
Modèle des hexagones durs 143
Modèle gaussien 32, 135, 175
Modèle gaussien discret 202
Modèle hiérarchique 189
Modèle S.O.S. 80, 202, 372
Modèle sine-Gordon 203
Modèle sphérique 137
INDEX
Modèle vectoriel à n composantes
24, 254, 22, 30, 178
Modèle à six vertex 139
Modèles minimaux 130
Modules 364
Module de Verma 111
Monodromie 146
Mouvement brownien 232, 356,
379
Nickel 304
Niveau de Fermi 293
Niveaux de Landau 256
Nombre de boucles 242
Nombre de configurations 33
Nombre de Coxeter 167, 206, 208
Nombre de Coxeter dual 207
Noyau de Darboux-Christoffel 279
Noyau de la chaleur 324, 354, 368
Noyau reproducteur 266
Onsager 47, 57, 66, 73
Opérateur de Casimir 325
Opérateur de Laplace-Beltrami
324
Opérateur de vertex 139
Opérateurs de désordre 85
Opérateurs essentiels 171
Opérateurs inessentiels 171, 300
Opérateurs marginaux 171, 214,
300
Ordre de Wick 242, 122
Paramètre de saut 81
Paramètres nus 233
Parisi, Sourlas 267, 295
Parisi, Wu Yong Shi 76
Pasquier 164, 171, 178
Peierls 26
Pfaffien 55
Phase de Berry 312
Phénomène de Goldstone 125
Pippard-Ginsberg I62
Plaquette 58, 324
Poids 207
Poids conformes 97
Poids dominant 217
Point critique 39, 268
393
Point fixe infrarouge 168
Points multicritiques 311
Polyakov 317, 357, 376
Potentiel aléatoire 230, 260
Potentiel effectif 152, 235, 2-44
Probabilité de saut 337
Problème du doublement 378
Processus de Markov 5, 51
Produit quintuple de Watson 193
Propriétés d’intersection 16
Pseudo-fermions 83
Quantification radiale 107
Quantification stochastique 76
Queue de distribution de Lifshitz
236
Racines 203
Ralentissement critique 53, 62
Rapports d’amplitude 308
Rayon de giration 379, 382
Regge 346
Règle majoritaire 180
Règles de Feynman 238, 329
Régularisation C 153
Régularisation dimensionnelle 24 5
Relation d’Euler 4
Relation de Clausius-Mossotti 107
Renormalisation dans l’espace réel
159, 165
Renormalisation de fonction
d’onde 259
Renormalisation perturbative 259
Renormalisation phénoménologique 220
Représentation adjointe 207
Réseau aléatoire 246
Réseau aléatoire 317
Réseau de Bethe 14
Réseaux 42
Schéma de renormalisation de
Bogoliubov, Parasiuk, Hepp,
Zimmermann 259
Schéma de soustraction minimale
329
Shankar 300, 307
Simulations microcanoniques 57
394
Singularité de Lee-Yang 123, 127,
129, 132, 151, 171
Somme de Gauss 194
Somme sur les chemins 9, 26
Somme sur les surfaces 358
Sous-algèbre de Cartan 202
Spectre hadronique 84
Sugawara 216
Super-champ 264, 297
Super-dérivée schwarzienne 198
Super-renormalisabilité 257
Supersymétrique 263
Surfaces aléatoires 343
Swendsen 49, 72
Symbole de Riemann-Christoffel
362
Séries 8 192
Séries de couplage fort 32
Séries de Gauss 146
Table de Kac 130, 143, 172
Temps de thermalisation 53
Tenseur impulsion-énergie 94
Tension de corde 336, 370
Tension superficielle 83
Terme de Schwinger 214
Théorie de Kirkwood-Yvon 107
Théorie de Liouville 376
Théorie perturbative 237
Théorème d’Elitzur 333
Théorème de Goldstone 293, 29,
84
Théorème de Kirchoff 5, 383
Théorème de l’index de AtiyahSinger 371
Théorème de Mermin-Wagner
140, 192
Théorème de Nielsen-Ninomiya
380
Théorème de Noether 94
INDEX
Théorème de Peter-Weyl 21
Théorème de von NeumannWigner 312
Théorème de Weinberg 268
Théorème de Wick 23, 55, 92, 96,
238, 28
Théorème du viriel 245
Tourbillons 194, 197, 138
Transformation de dualité 177,
201
Transformation de Jordan-Wigner
61
Transformation de Legendre 152,
156, 234, 10
Transformation de Mobius 96
Transformation étoiletriangle 180
Transformée de Laplace 149
Transition de Curie 57
Transition de Kosterlitz-Thouless
192, 197
Transition déconfinante 344
Transition de phase du deuxième
ordre 68
Transition rugueuse 89, 202, 370
Transmutation dimensionnelle 295
Universalité 32
Variables anticommutantes 4 7
Variété triangulée 343
Vecteur de Killing 368, 372
Vecteur de plus haut poids 111
Wegner 260
Weyl 207
Wigner 229, 269
Wilson 49
Wilson 229, 231, 284, 304, 321, 72
Yang 73
Yang, Mills 321, 327
Zamolodchikov 30, 171, 385

Document 4625026

Transcript Document 4625026

Directory