Diapositive 1 - perso.univ

Download Report

Transcript Diapositive 1 - perso.univ

Les langues de spécialité


Les grands corpus de références comme
le TLF ou le BNC ont pour but principal de
représenter le plus fidèlement possible la
langue générale.
Mais la linguistique de corpus s’applique
toutefois également aux langues de
spécialité, parfois appelées langues
spécialisées ou sous-langages.
LERAT, P. (1995) : Les langues
spécialisées, Paris, P.U.F.


Il préfère le terme langue spécialisée, car
il conçoit la langue de spécialité non pas
comme une « sous-langue » mais comme
une forme d’usage particulière de la
langue.
L’anglais language for special purposes
(LSP) dit bien cette particularité […].
« langue spécialisée » renvoie au système
linguistique pour l’expression et aux
professions pour les savoirs.
Sublanguage (les sous-langages)


« Sublanguage », employé par Z.
Harris, sous-entend, au delà d’une
particularité du lexique, un
fonctionnement langagier spécifique
Le terme englobe non seulement les
langages des disciplines
scientifiques et techniques, mais
également les méta-langages
comme celui de la linguistique.


L’hypothèse de Harris veut que les
sous-langages aient un lexique
limité et un nombre fini de schémas
de phrases, qui seraient des
combinaisons de sous-classes de
mots propres à ces sous-langages.
Cette finitude rend l’utilisation des
corpus particulièrement propice à
l’étude des sous-langages.
McEnery & Wilson (1996)

One key feature that has been
hypothesised for a sublanguage is
that it will show a high degree of
closure at various levels of
description. […] In short, a corpus
should be an exceptionally good
tool for identifying and describing a
sublanguage, because they both
have an important feature in
common – a finite nature.
HABERT, B., NAZARENKO, A. &
SALEM A. (1997) : Les linguistiques de
corpus, Paris, Armand Colin / Masson.


Les sous-langages ne sont pas forcément
des sous-ensembles de la langue
générale. Certains traits de la langue
générale s’y retrouvent, d’autres leur sont
propres.
Inversement, les sous-langages peuvent
recourir à des patrons syntaxiques
particuliers qu’il serait difficile d’intégrer
tels quels à une grammaire « de
langue ». C’est le cas de certains motifs
dénominatifs qui forment de véritables
« grammaires locales ».



Exemple cité par Habert :
The system will be unable to vary
on the device.
Mais cette tournure est une simple
variation lexicale sur le verbe à
particule adverbiale to turn on, et
non pas un patron syntaxique
typique de la langue de spécialité.

Il y a dissociation partielle des
lexiques



de la langue générale et des langues de
spécialité
des langues de spécialité entre elles
Mais leur syntaxe est
fondamentalement identique.
Notion de langue commune
(CABRÉ, M. T. (1998). La TerminologieThéorie, méthode et applications.)

« La langue générale (…) peut être
considérée comme un ensemble
d’ensembles, imbriqués et reliés
entre eux selon de nombreux points
de vue. Le lien entre tous ces
ensembles est la langue commune.
Chacun de ces sous-ensembles peut
être une langue de spécialité. »
(1998 : 115)
Critères de dissociation des
lexiques

Anglais de spécialité : absence de
lexèmes



d’origine dialectale (bodacious)
appartenant au registre familier
(groovy)
exprimant un jugement selon des
critères affectifs (loathsome)

Inversement, les technolectes sont
absents des corpus de langue
générale :



cervicothoracic-lumbosacral orthosis
hypothalamic-pituitary-gonadal
Mais une partie du lexique de la
langue générale est investie d’un
sens spécifique en langue de
spécialité (cf. sensibilité)

Ces blocages contextuels ne
s’appliquent pas uniquement au
sens des mots polysémiques, mais
aussi à la catégorie grammaticale
de certains homographes (l’adjectif
novel en anglais scientifique)
Existe-t-il une spécificité syntaxique
des langues de spécialité ?


Cette spécificité est inhérente aux
hypothèses de Harris.
Selon N. Sager, elle est démontrée
par la démarche suivante :
SAGER N., FRIEDMAN C. (eds) (1987):
Medical Language Processing : Computer
Management of Narrative Data, AddisonWesley, Reading, p. 198

Si l’on applique à un corpus de textes d’un
secteur scientifique des méthodes de
linguistique descriptive similaires à celles
utilisées pour le développement d’une
grammaire d’une langue dans son ensemble,
on obtient :


des motifs précis de cooccurrences de mots à
partir desquels on peut définir des sous-classes de
mots
des séquences de ces sous-classes qui sont
caractéristiques (c’est-à-dire une grammaire).
Exemple de syntaxe d’une langue de
spécialité : l’anglais médical



The ability of [PET] to [detect
cancer] is based on [the altered
substrate requirements of malignant
cells], which result from [increased
nucleic acid and protein synthesis
and glycolysis].
DC
C  A peut B
Quelques patrons syntaxiques typiques
de l’anglais scientifique





674 000 pour "ability of * to
detect".
48 200pour "the ability * is
based on".
12 700 pour "altered * result
from".
27 600 pour "altered substrate".
493 000 pour "altered *
requirements".
La grammaire des langues de spécialité
diffère-t-elle fondamentalement de celle de
la langue générale ?


Sens premier : oui. (American
Heritage Dictionary : the study of
how words and their component
parts combine to form sentences)
Sens dérivé : ? (The system of rules
implicit in a language, viewed as a
mechanism for generating all
sentences possible in that
language).


Certaines structures syntaxiques de la
langue générale (les structures inversives
des subordonnées hypothétiques
notamment) sont absentes des textes de
certaines langues spécialisées.
En revanche, les schémas typiques des
langues spécialisées peuvent presque
toujours se réduire à des phénomènes de
variation lexicale (cf. vary on)

La présence fréquente de certains
vocables à l’intérieur de
constructions syntaxiques figées ne
signifie pas pour autant que l’on a
affaire à un patron syntaxique qui
se présente exclusivement en
langue de spécialité.
Exemple : « lost to follow-up » (G> 1M)





Treatment of subjects lost to follow-up in
the analysis of mortality studies.
La structure est susceptible de connaître
des variantes :
The trial lost 25% of subjects at follow-up
(during / from / because of poor)
In this group, 8 of the primary allografts
were lost to recurrent disease.
Some U.S. aircraft would be lost to Iraq’s
enormous ground-defense system.
Pas d’exclusivité de certains schémas
syntaxiques, mais des différences de
fréquence


Chris Gledhill confirme certaines des
assertions de Biber (1998) concernant le
rôle des diverses parties d’un article de
recherche scientifique (les structures
syntaxiques saillantes peuvent différer en
fonction des diverses subdivisions des
articles).
GLEDHILL, C., (2000) : "The Discourse
Function of Collocation in Research Article
Introductions". In English for Specific
Purposes. Volume 19/2:115-135.



les introductions contiennent un
plus grand nombre de formes
passives suivies d’une proposition
infinitive :
TNF alpha has been shown to
deliver the toxicity of ricin A
CsA therapy has been reported to
cause immunological changes in the
thymus)

haute fréquence de certains patrons
formalisables sous la forme X has
received Y attention / investigation,
dans lesquels


X symbolise une approche ou une
technique thérapeutique
Y symbolise un quantificateur tel que
much ou little.


Les régularités syntaxiques sont
démontrables dans le cadre d’une
approche purement lexicale qui se fonde
sur l’utilisation d’un concordancier.
formes passives : fréquence supérieure
des verbes à forte valeur assertive (show,
report, find, document, demonstrate,
recognize) par rapport aux verbes liés à la
supposition (estimate, hypothesize,
propose, argue, suggest).
Constitution d’un corpus en langue de
spécialité : l’exemple de la langue
médicale


Possibilité de constituer un corpus
représentant l’usage d’un sous-langage à
partir de ressources en ligne, grâce à
l’utilisation fine des moteurs de recherche
Un grand nombre de revues scientifiques,
proposent à leurs lecteurs un abonnement
sous forme de cédéroms, bases de
données dont la taille dépasse celle de la
première version du BNC.
Représentativité en termes de
présence des divers genres?

Les données représentant la langue orale
sont difficiles à rassembler :



temps nécessaire à la transcription et à la
vérification des données
problèmes de confidentialité.
Elles sont quasi-inexistantes sur la Toile,
où l’on trouve principalement :


articles de recherche médicale
textes de nature didactique (polycopiés des
Facultés de médecine).
Quel type de données inclure dans un
corpus de langue spécialisée ?



Articles de recherche (facilement
disponibles)
Textes de nature didactique ?
HABERT et al. (1997) « Le discours
didactique n’est pas forcément le meilleur
« observatoire » des régularités de ce
domaine : par souci de généralisation, il
utilise des hyperonymes qui ne se
rencontrent pas dans les comptes rendus
d’hospitalisation. On y trouve peut-être des
régularités propres à tout discours
didactique (pluriels génériques, présent de
vérité générale, etc.) qui « parasitent » la
perception du sous-langage proprement
dit. » (p. 151).
Une même publication peut renfermer
des genres d’articles très divers

Journal of the American Medical
Association :






Clinical Observation
Commentary
Consensus Conference
Correspondance and Brief
Communications
Original Article
Paper


La constitution du corpus est
tributaire du phénomène
linguistique à étudier.
On peut choisir de se restreindre à
un type d’article particulier ou de
viser une représentation aussi large
que possible en fonction du but
recherché.