Linguistique externe & linguistique interne - Lacito

Download Report

Transcript Linguistique externe & linguistique interne - Lacito

Linguistique externe
& linguistique interne
François Jacquesson
CNRS-Lacito
www.lacito.vjf.cnrs.fr
[email protected]
Conférence à la Maison de la Recherche de Paris-4, rue Serpente, 5 novembre 2009
La présentation powerpoint
préparée pour la conférence prononcée le 5 novembre 09
a été ici reprise pour des visiteurs qui n’y auraient pas assisté.
Les images ont donc été un peu commentées.
1. le code
Une première façon d’aborder la question
est de voir ce qu’on peut faire d’un texte auquel on ne comprend rien.
C’est une approche toute interne :
on ne sait pas de quel milieu il vient, ni ce qu’il dit ou veut dire.
On se trouve dans une position de décodeur.
Un exemple
Un tel texte
peut être translittéré
caractère par caractère.
Dans un premier temps,
on devra considérer que
les espaces séparent des mots.
Aristide, Apologie
rédigée vers 125 EC
version syriaque.
Ed. Pouderon et al. 2003, Cerf.
9.1.
nata mkil el tšeita dilhun dalhihun . aikna dnxua xtitait el klhin damirn mn lel . mn qdm kl mdm
melin iunia alha . lqrnus hu dmtpšq kun uplxuhi dhna . mdbxin lh bnihun . umnhun kd xiin
muqdin lhun eluhi hkil el hna . amrin dnsb lh bnša [208] raa . umnh auld bnia sgiaa . hi dmnh
auld ap ldius dmtqra zus . hna dlxrta šna . umn dxla dqcma datamr lh . šri hua lmakl knuhi .
hna datgnb mnh zus . ula argš . dlh lhna lxrta pkrh zus upsq gnbruth ušda bima . dmn tmn
aik dbmtla amrin datildt aprudiθa . dmtqria astra . ulh lqrnus kd pkir šduhi bxšuka . rba hkil
θeiuta ubzxa daelu iunia el riša dalhihun . bhi dklhin hlin amru eluhi . au mlka . la mškxa
dalha ntpkr au ntpsq uan dcla sgi dua .
9.2.
umin btr qrunus melin alha axrna zus . uamrin eluhi dhna . dhu qbl rišnuta uhua mlka dklhun
alha . uamrin eluhi . daštxlp lbeira ulmdm axrin . aikna dngir lnša miutta unqnm lh mnhin bnia
. kd bzbn amrin daštxlp lazbrka . mθl rxmth daurpa udpsipa . utub aštxlp ldmuta ddhba mθl
rxmth ddnaa . ulquqnus mθl rxmth dlada . ulgbra mθl rxmth danθiupa . ulbrqa mθl rxmth
dshra . aikna [210] dmn hlin auld bnia sgiaa . mn aiθiupa gir amrin dauld ztus uampiuna .
umn shra ldinusus . mn alqmia lhrqlus . umn lθu . laplun ularθmis . umn dnaa prsaa . umn lda
qsθur uplduqius . ualea upludus . umn pnmsus auld tše bnta . hlin dmuss šmh anin . umn
aurupa . minuaa uqrdmuna usrpuna . lxrta din aštxlp ldmuta dnšra . mθl rxmth dgnudmus
reia .
A partir du texte précédent :
Les mots qui ont plus de 10 occurrences dans un extrait translittéré de 1769 mots.
mn
49
umn
15
alha
31
hda
14
la
25
kd
14
lh
25
mθl
14
anša
20
aik
13
el
20
dla
13
hu
19
aituhi
12
din
18
hna
12
hlin
18
dalha
11
umnhun
18
hi
11
gir
17
lhun
11
hkil
16
ula
11
ap
15
442
On constate que,
vraisemblablement,
certains « mots »
(ici cadrés en blanc)
sont la base de
certains autres
(cadrés en couleur)
310 mots (17 %)
des mots de l’extrait
commencent par d-,
242 mots (14 %) par u-.
L’extrait analysé comporte 1769 mots, et au total 7899 caractères.
Soit 4,47 en moyenne.
Si l’on fait le même calcul pour les mots les plus fréquents,
(les 25 mots du tableau précédent),
on trouve 3,2 caractères par mot.
Cela confirme une idée apparemment simple :
les mots les plus fréquents sont plus petits.
Est-ce le résultat d’une « usure » plus grande ?
Si oui,
nous devrions trouver des formes « ancestrales » plus longues.
Ce n’est pas le cas.
2. l’histoire
Pour comprendre pourquoi certains mots sont « plus petits »,
et en particulier pourquoi ce sont souvent les plus fréquents,
il nous faut une enquête historique.
Il faut donc prendre des exemples que nous puissions suivre
dans la longue durée.
de, en, à, et
Quatre petits mots à travers l’histoire du français du nord
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Saint Alexis
Chanson de Roland
Chrestien Lancelot
Robert de Clari (prose)
Villehardouin
Joinville
Froissart
Commynes Mémoires
Rabelais Pantagruel
Montaigne déb. Essais
Urfé, Astrée 1
Mme de La Fayette, Zaide
Lettres persanes
Essai sur les mœurs
Eugénie Grandet
XIe siècle
fin XIe
XIIe
déb. XIIIe
déb. XIIIe
1309
1400
1490
1532
1588
1612
1668
1721
1764
1833
La fréquence de quatre mots :
« de, et, à, en »
9
88%
7
66%
5
44%
3
22%
1
0
0
2
4
6
Robert de Clari
Villehardouin (id. déb. XIIIe)
de
de
Rabelais 1532
Urfé, Astrée. 1612
8
et
et
10
à
à
en
12
14
16
en
XIIIe – XVe siècles.
La zone de turbulence.
Nous examinons l’évolution des fréquences de « de » et de « et ».
Au-delà de la période de turbulence,
- de continue de progresser
- et décroît à nouveau.
C’est la même chose en italien
Voici le nombre d’occurrences
de certains mots
dans les 10.000 premiers mots de
deux textes italiens célèbres.
Le Décaméron de Boccace (mi-XIVe)
I promessi sposi de Manzoni (1842)
On constate que di supplante che
et gagne la seconde place.
e
che
di
a
non
il
un
la
in
con
o
si
una
gli
da
Decameron
477
340
276
196
150
141
19
133
124
67
103
86
26
42
73
Promessi
348
257
288
215
176
158
150
137
154
98
37
83
66
53
48
De même en castillan : progression du « de ».
de, del
de
a
y
que
el
la
en
los
no
las
Cid
Lazarillo Quintana
v. 1540 v. 1830
398
356
295
276
239
233
213
188
176
113
107
472
406
221
463
395
252
288
208
70
157
53
659
580
300
492
450
200
285
239
247
98
128
700
600
500
de
et
à
en
400
300
200
100
0
0
1
2
3
4
A chaque fois, on a pris 10 000 mots dans une œuvre, et trouvé les %.
Pour Quintana, il s’agit de la Vida de Pizarro.
5
La prolifération des « et » au moment du développement
des œuvres en prose correspond à des motifs syntaxiques.
Einsi se departent li compaignon; si s'en revint Perceval a la recluse. Et Lancelot
chevaucha apres le chevalier tout le travers de la forest en tel maniere qu'il ne tient ne
voie ne sentier, ainz s'en vet come aventure le meine. Et ce li fet mout mal que il ne voit ne
loign ne pres ou il puisse prendre sa voie: car mout ert la nuiz oscure. Et neporec tant a
ale que il vint a une croiz de pierre qui ert au departement de deus voies en une gaste
lande. Et il regarde la croiz quant il fut pres et voit par dejoste un perron de marbre ou il
avoit letres escrites, ce li ert avis. Mes li tens ert si oscurs que il ne pooit conoistre que
eles voloient dire. Et il resgarde vers la croiz et voit une chapele mout anciene, et il s'i
adrece car il i cuide trover gent. Et quant il est auques pres, si descent et atache son
cheval a un chesne et oste son escu de son col et le pent a l'arbre.
Dans les langues d’Europe, et au-delà,
le même phénomène a eu lieu.
Il est partout suivi d’une retombée de fréquence du « et »,
une fois la prose mise en place.
Voir : Jacquesson 2007. "La coordination, instrument décisif de l'émergence de la prose.
Une description historique".
André Rousseau (ed.) La coordination, Presses du Septentrion, 371-404.
Au contraire, le « de » continue de progresser partout.
On pourrait songer à l’expliquer par la disparition du génitif latin,
puis son usage croissant comme joncteur des syntagmes nominaux
au cours du Moyen âge.
Rabelais 1532
Urfé, Astrée. 1612
9
8
7
6
5
4
3
2
1
0
la courbe est une moyenne mobile pour « de »
0
2
4
6
8
10
12
Le rôle et la fonction de « de » et « et » ont donc beaucoup changé
de
et
Moy. mobile sur 2 pér. (de)
au cours de l’histoire des langues romanes.
Mais ils n’ont pas rétréci : ce sont de « petits mots » depuis longtemps.
14
16
Ces petits mots dont nous venons de scruter le trajet,
de, à, en, et
n’étaient pas plus longs voici 2000 ans.
Et pour autant qu’on puisse le savoir, même avant.
La question est :
l’instrument est-il toujours le sous-produit de la substance ?
En termes plus nets : le nom est-il nécessairement la base
d’où dérivent les autres mots de la langue ?
C’est le problème de la « grammaticalisation » :
les morphèmes grammaticaux sont-ils toujours le résultat
d’une utilisation plus fonctionnelle des lexèmes ?
En latin il existait une déclinaison.
On pourrait s’attendre, au moment de la disparition des déclinaisons,
à une croissance des prépositions.
Il semble que c’est plutôt le contraire qui est vrai :
il y a eu montée en puissance des prépositions ou relateurs,
et c’est ce qui a rendu possible l’effacement des clises.
Une question intéressante :
la montée du « de » comme joncteur inter-nominal
s’est-elle faite au même rythme
que celle d’autres relateurs ?
Evidemment, on peut obtenir un éclairage intéressant en observant
ce qui s’est passé en latin.
Dans le tableau de la page suivante,
on a choisi une dizaine d’œuvres latines,
échelonnées entre 200 av. JC et 400 après JC.
On a calculé dans chacune la proportion des mots
de, et, ad, in
(qui sont les « ancêtres » des mots français étudiés auparavant)
à partir d’échantillons significatifs.
et on a rangé ces textes selon la proportion croissante de « et ».
Ce rangement s’avère très proche d’un rangement chronologique.
Cicéron (106-43) : à Atticus
Darès
Quinte-Curce (v. 40)
Exo Est Jud
800
proportion de x sur
600des mots
l’ensemble
de l’œuvre.
400
6%
4%
2%
200
0
Pla
Dic
Nep Tite QCu
Att
de
Plaute
(254-184)
de
et
et
Dar
ad
ad
Ter Apu
in
ExoVulgate
Est Jud
(v. 400)
Hermas (v. 150)
in
Apulée (v. 120 – 170)
Dictys
Tertullien (v. 150 – 230)
Nepos (v. 100-v. 30)
Tite-Live (59-17 EC)
Tertullien (v. 150 – 230)
Apulée (v. 120 – 170)
800
proportion de x sur
l’ensemble600
des mots
de l’œuvre.
6%
4%
400
2%
200
0
Pla
Dic
Nep Tite QCu
Att
de
de
et
et
Dar
ad
ad
Ter Apu
ExoVulgate
Est Jud
(v. 400)
in
in
Le fait que la croissance de « et »
est chronologique
permet d’utiliser la proportion de « et » dans une œuvre mal datée
pour obtenir une approximation de sa date.
Hermas
(v. 150)
Total des pourcentages des 4 petits mots
2,90
13,69
6,50
800
600
6%
Cicéron (106-43) : à Atticus
4%
400
2%
200
0
Plaute
(254-184)
Pla
Dic
Nep Tite QCu
Att
Dar
Ter Apu
Exo Est Jud
Exo Est Jud
Vulgate (v. 400)
de et ad in
de et ad in
En somme, l’emploi des « petits mots grammaticaux » devient
nettement plus fréquent au cours de l’histoire du latin – du moins du latin écrit.
Aulularia
Mercator
Menaechmi
Miles
1
ego 129
est 227
quid 137
est 281
2
me 113
quid 125
me 135
et 162
3
est 110
me 124
ego 130
me 162
4
quid 95
ut 104
mihi 116
5
ut 85
mihi 98
6
te 78
7
Ammien Marcellin
et
2340
nec
310
in
963
non
272
te 155
ut
839
ex
245
ut 115
ut 147
ad
785
qui
245
non 94
te 112
quid 145
cum
576
haec
218
et 69
ego 90
est 104
ego 133
8
si 69
si 85
non 94
si 122
per
454
sed
217
9
nunc 59
tu 68
tu 91
non 107
est
417
vel
192
1
0
in 57
iam 65
qui 85
tibi 102
quod
360
post
192
quae
322
quam
186
Parmi les indéclinables, les plus fréquents sont
ut 451, et 361, si 346, non 345, in 295.
Plaute
Naturellement,
le genre littéraire intervient.
Dans la théâtre de Plaute,
les pronoms personnels
(en jaune)
sont très fréquents.
Ils sont rares chez l’historien
Ammien Marcellin,
contemporain de l’empereur Julien.
Un phénomène général : de plusieurs mots de coordination, un seul l’emporte.
80
en grec ancien
60
40
20
0
Ili
Ody
Hdt
Xen
de
Pla
kai
Thc
Plu
Arr
Luc
te
proportions
relatives des
coordonnants
la sémantique et l’histoire…
100
50
0
Pla
Cés
Cic
ValMax
atque
et
Tac
Am m
en latin
de quand date le « choix » de la coordination qui allait dominer ?
3. la structure
« structure » est d’abord un terme d’architecture.
La beauté selon Alberti
« Dans un ouvrage plus tardif et plus complexe : De Re Aedificatoria, il donne deux
définitions de la beauté qui sont grosso modo celles de Vitruve. Dans un cas, il décrit la
beauté comme "une certaine harmonie régulière entre toutes les parties d'une chose,
harmonie d'une espèce telle que rien ne pourrait être ôté ou ajouté, ou changé en elle sans
qu'elle ait aussitôt moins de charme." [Aedif. lib. 6, cap. 2]
Dans la seconde définition il déclare : "la beauté est une espèce d'harmonie et
d'accord entre toutes les parties, qui forme un tout construit selon un nombre fixe, une
certaine relation, un certain ordre, tels que le principe de symétrie, qui est la loi la plus élevée
et la plus parfaite de la nature, l'exige." [Aedif. lib. 9, cap. 5] »
Anthony Blunt, La théorie des arts en Italie 1450-1600. page 32.
La structure historique et l’orientation
Polybe I, 3, 3-4.
"Jusqu'à cette date, l'histoire du monde était restée en quelque sorte compartimentée,
car entre toutes les actions humaines, il n'y avait pas plus d'nité de conception et
d'exécution que d'unité de lieu.
A partir de ce moment au contraire [220-216], l'histoire du monde s'est mise à former
comme un tout organique (sômato-eidê).
Les affaires d’Italie et d’Afrique se sont trouvées désormais liées aux affaires de Grèce
et d’Asie
et il y a eu convergence de toute chose vers un aboutissement unique (pros hen telos)."
l’idée d’une « structuration » semble liée à la… mondialisation !
ἐν μὲν οὖν τοῖς πρὸ τούτων χρόνοις ὡσανεὶ σποράδας εἶναι συνέβαινε τὰς τῆς οἰκουμένης
πράξεις (διὰ) τὸ καὶ (κατὰ) τὰς ἐπιβολάς, (ἔτι) δὲ (καὶ τὰς) συντελείας αὐτ(ῶν ὁμοίως δὲ)
καὶ κατὰ το(ὺς τόπους διαφέρ)ειν ἕκαστα (τῶν πεπραγμ)ένων. ἀπὸ δὲ τούτων τῶν καιρῶν
οἱονεὶ σωματοειδῆ συμβαίνει γίνεσθαι τὴν ἱστορίαν, συμπλέκεσθαί τε τὰς Ἰταλικὰς καὶ
Λιβυκὰς πράξεις ταῖς τε κατὰ τὴν Ἀσίαν καὶ ταῖς Ἑλληνικαῖς καὶ πρὸς ἓν γίνεσθαι τέλος τὴν
ἀναφορὰν ἁπάντων.
on voit aussi le lien entre cette cohérence et son but.
A tort ou à raison,
on fait souvent remonter
cet impérialisme synthétique
à l’entreprise d’Alexandre
Mosaïque de la Maison du Faune.
Actuellement au Musée National de Naples. L’ensemble fait 5,12 m sur 2,71 m.
La bataille d’Issos ou de Gaugameles (331). Peut-être d’après un tableau d’Apelle.
Le mot STRUCTURE dans les titres de livre
1629. le P. Philibert Monet Ligatures des langues françoise et latine : réciproquement
appariées & proprement randues les unes par les autres, ou Explication des menus mots
françois & latins qui sont la liaison de la structure au langage.
Le terme apparaît ensuite en anatomie comme chez Malpighi 1683 et 1686.
En botanique, à partir de Vaillant 1718, De structura florum.
En géologie : Bertrand 1760. Mémoire sur la structure intérieure de la terre.
Hauÿ. 1784. Essai d’une théorie sur la structure des crystaux.
1860. Abbé Torrecilla. Lexicologie espagnole : essai sur la formation, les racines, les
familles de mots et sur tout ce qui se rattache à la structure et à la dérivation des mots.
Août 1931. CIL 2. Troubetskoj « Les systèmes phonologiques envisagés en eux-mêmes et
dans leurs rapports avec les structures générales de la langue. »
Damourette & Pichon. 1933. Des mots à la pensée. Essai de grammaire de la langue
française III : Morphologie du verbe. Structure de la phrase verbale.
Walter von Wartburg. 1934. Evolution et structure de la langue française. Leipzig et Berlin.
Voyez : CNRS Labo Histoire des Théories linguistiques.
SLP 14 novembre (ENS Ulm) : Patrick Sériot
4. langues mixtes
P. Bakker : Michif, the Cree-French mixed language
N. Boretsky & B. Igla : Romani mixed dialects
C. van Bree : so-called Town Frisian
A.J. Drewes : Maltese
E. Golovko : an Aleut-Russian mixed language
A. Grant : Shelta, the secret language of Irish travellers
M. de Gruiter : Jawindo, a contact language in Semarang
B. Hoff : Island Carib
M. Kossmann : Amarna Akkadian as a mixed language
M. Mous : Ma’a or Mbugu
P. Muysken : Media Lengua ; Callahuaya
D. Nurse : Ilwana = Bantu + Cushitic
H. van Rheeden : Petjo : the Indos in Batavia
Th. Shadeberg : MiMwani, southern fringe of KiSwahili
1994
terrains de 1987-88 et 1990.
« Michif has been called the ‘nec plus ultra’ of mixed languages.
It is probably the most devastating counterexample
against any linguistic theorizing which claims that mixed languages do not exist.
Ar first sight,
the language combines Cree verbs with French noun phrases,
and in both components
virtually all the complexities of both source languages are preserved.
All speakers of Michif belong to the ethnic group Métis,
but not all Métis speak or spoke Michif.
The Métis are descendants of French speaking fur traders from Quebec and Acadia,
who travelled west in their quest for furs from the 17th century onwards,
and their Amerindian wives.
Many of these men stayed in the west, married Native women
and raised a family there. »
« Nouns are roughly 90% from French.
Verbs are almost all from Cree (…)
French copulas however are regularly used by all speakers,
as well as some forms of the verb avoir (…) »
Pieter Bakker
Voir : le site web du LACITO
septembre 2007
au Colloque « Migrations » à Porquerolles
Le site du LACITO : http://lacito.vjf.cnrs.fr
Les créoles ne sont spécifiques en rien.
« A language is more like a bacterial, Lamarkian species, than like an organism. »
5. le conférencier,
sa vie, son oeuvre
F. Jacquesson a choisi,
à travers l’exemple simplifié de son propre parcours,
de montrer comment peut se passer la carrière d’un linguiste.
Il a choisi de résumer cela à 3 étapes,
symbolisées ici par 3 de ses livres.
les Mishing de la vallée.
Le livre sur
Les Personnes
c’est-à-dire sur
l’usage que font les locuteurs
des marques de personnes
dans leurs langues
(pronoms ou noms
et divers affixes personnels)
marque un temps de synthèse
dans la diversité des langues.
Montaigne
Marco Polo
Herder et la requête d’identité
Pourquoi les langues changent
Saussure contre Pictet
Langues et peuples : les migrations
Islande
Malte
Sanscrit : les deux langues
Langues romanes, vitesse du changement
Egyptien
Le jeu des personnes
construire un mot : les parlers Tani
Histoire des langues : débat SOV
Indo-européen
Tsiganes
Créoles
Balkans
La réflexion sur les langues et le langage
Les langues et le repérage du temps
François Jacquesson
remercie
Olivier Soutet,
professeur à la Sorbonne,
directeur de collection aux Editions Champion
et organisateur de cette conférence,
ainsi que le public de collègues, d’étudiants, et de curieux
qui ont animé cette soirée à la
Maison de la Recherche de la rue Serpente.