Données linguistiques > Maurice Gross et le LADL                             Accueil               Home

Maurice Gross et le LADL

"I think Maurice was one of the most creative,
imaginative and talented linguists of our age."
Ray Dougherty

Au cours de ses deux séjours aux États-Unis, Maurice Gross, ingénieur de formation, s'était intéressé aux travaux de N. Chomsky et M.-P. Schützenberger, avait rencontré de nombreux linguistes et avait collaboré avec Z. Harris à l'Université de Pennsylvanie (1964). À son retour, il entre au Laboratoire de calcul Blaise-Pascal du CNRS, travaille avec M.-P. Schützenberger et publie, avec André Lentin, Notions sur les grammaires formelles (Gauthier-Villars, 1967).

Il crée le Laboratoire d'Automatique Documentaire et Linguistique (LADL, laboratoire du CNRS) et publie Syntaxe du verbe (Larousse, 1968), premier tome de sa série Grammaire transformationnelle du français (suivront plus tard: Syntaxe du nom (1977) et Syntaxe de l'adverbe (1986)). Sa thèse sur les constructions complétives (1969) marque une étape décisive. Publiée un peu plus tard sous le nom de Méthodes en syntaxe (Hermann, 1975), elle est l'ouvrage de référence pour comprendre ses positions théoriques. Il y jette les bases de ce qui deviendra le "Lexique-grammaire". Une nouvelle génération de linguistes est apparue en France à cette époque (à la suite des Américains). Elle se regroupera d'abord à un séminaire d'été à Nancy (1967). Après la "révolution" de 1968, l'Université "expérimentale" de Vincennes, qui ouvre ses portes en janvier 1969, sera son principal centre de ralliement.

M. Gross installe d'abord son laboratoire de recherche dans le 19e arrondissement de Paris, puis, en 1972, à l'Université de Paris 7 (Jussieu). Avec son équipe, il lance un vaste programme de description systématique des propriétés syntaxiques de tous les éléments du lexique français. Il s'appuie pour cela sur les théories distributionnelles et transformationnelles de Z. Harris, avec lequel il a toujours gardé une grande connivence intellectuelle et scientifique. N. Chomsky avait bien posé le problème des contraintes lexicales dans les opérations transformationnelles, en particulier dans Aspects of the Theory of Syntax (1965), mais il l'avait laissé de côté:

"Une grande partie de la structure lexicale n'est en fait qu'une classification entraînée par le système des règles phonologiques et syntaxiques. Postal a, de plus, suggéré qu'il devrait y avoir une analyse générale des éléments lexicaux du point de vue de chaque règle R, les divisant entre ceux qui doivent, ceux qui peuvent, et ceux qui ne peuvent pas être soumis à la règle R [...]. Je mentionne ces possibilités afin seulement d'indiquer qu'il reste plusieurs façons relativement inexplorées de traiter les problèmes qui se posent lorsque l'on considère avec sérieux la structure du lexique." [...]
"Pour le moment, on peut à peine dépasser le simple arrangement classificatoire des données. Quant à savoir si ces limitations sont intrinsèques ou si une analyse plus profonde peut parvenir à débrouiller certaines de ces difficultés, cela reste en suspens."
(Noam Chomsky, 1965, Aspects of the Theory of Syntax. Trad. J.-C. Milner, 1971.)

Ce problème en suspens, M. Gross décide de s'y attaquer, seul d'abord, puis avec son équipe du LADL (CNRS). Il écrit dans Méthodes en syntaxe :

"Les études transformationnelles ne portent que sur un petit nombre d'exemples. Elles ont dégagé un grand nombre de phénomènes nouveaux, mais elles ne permettent pas d'évaluer l'étendue de ces phénomènes pour une langue donnée." [...]
"Après une période où des succès ont pu laisser croire que l'emploi de transformations dans les descriptions allait régulariser considérablement ces dernières, il est devenu clair que les nouvelles règles continuaient à comporter des "exceptions" en nombre sensible. Il est donc devenu crucial de vérifier ces théories en entreprenant la description d'une langue au moins [...]."
(Maurice Gross, Méthodes en syntaxe, 1975.)

Ce travail aboutira, dans un premier temps, à la classification de tous les verbes simples du français (quelque 5 000 verbes divisés en 15 000 emplois et répartis en une soixantaine de tables qui répertorient leurs propriétés syntaxiques et distributionnelles). En même temps, M. Gross dirige des travaux similaires sur les noms et les adjectifs. Parallèlement, M. Gross établit une collaboration durable avec des équipes étrangères, au sein d'un réseau baptisé RELEX, et encourage des descriptions similaires (i.e. sur les mêmes bases théoriques) pour de nombreuses autres langues (italien, espagnol, portugais, allemand, coréen, malgache, grec, hongrois, chinois, etc.).

Au cours de ce travail, il est apparu que, dans de nombreux cas, la description d'un élément unique n'a pas de sens : l'unité de base à considérer est une séquence complexe. Par exemple :

  • dans donner une gifle, c'est le substantif qui constitue l'élément prédicatif principal et commande les restrictions de sélection. Le prédicat complexe est constitué d'un verbe support (donner) et de ce substantif prédicatif (Vsup Npréd).
  • perdre la tête, au sens de "devenir fou", doit être décrit comme une seule unité prédicative.
    Une description considérant perdre et tête comme des entrées lexicales distinctes ne rendrait évidemment pas compte du sens de la séquence, ni des contraintes distributionnelles et syntaxiques qui commandent son fonctionnement. On a recensé plusieurs milliers de ces deux types de séquences complexes.

    Z. Harris et N. Chomsky avaient bien vu le problème, mais aucune étude systématique n'avait été entreprise:

    "[...] en étendant la substitution des classes des morphèmes seuls aux séquences de morphèmes, nous aboutissons à des formules qui rendent égales diverses séquences substituables l'une à l'autre dans toutes ou certaines expressions de la langue en question."
    (Zellig S. Harris, 1946, From Morpheme to Utterance, reproduit dans Langages 9, M. Gross (ed.), 1968.)

    "Considérons par exemple des groupes tels que take for granted [prendre pour acquis], qui sont nombreux en anglais. D'un point de vue sémantique et distributionnel, ce groupe paraît être un élément lexical unique, et doit de ce fait être introduit comme tel dans le lexique, avec son ensemble de traits syntaxiques et sémantiques. D'un autre côté, son comportement du point de vue des transformations et des processus morphologiques manifeste à l'évidence qu'il s'agit d'un certain type de construction Verbe + Complément."[...]
    "Je ne vois pour le moment aucun moyen de présenter un traitement complètement satisfaisant de cette question générale."
    (Noam Chomsky, 1965, Aspects of the Theory of Syntax, trad. J.-C. Milner, 1971.)

    Là encore, M. Gross décide de répertorier l'ensemble des données, de façon aussi exhaustive que possible, et de les classer. Il constituera un lexique-grammaire de plus de 25 000 de ces expressions verbales complexes "figées" (auxquelles il ajoutera ensuite 20 000 expressions en être et avoir).

    En même temps, M. Gross lance la création de dictionnaires électroniques (baptisés DELA), qui répertorient systématiquement les différents traits de chaque élément (simple ou composé) du lexique (catégorie grammaticale, flexion, code de la table syntaxique où il est décrit, etc.). Le dictionnaire des mots simples (DELAS) compte aujourd'hui 90 000 entrées. Il est accompagné d'un dictionnaire de transcription phonétique (DELAP). À partir du DELAS, un système de flexion automatique permet de constituer le dictionnaire complet de toutes les formes fléchies (DELAF). On y a ajouté un lexique de 100 000 noms composés (DELAC) et divers autres lexiques plus spécialisés.

    Enfin, pour la description de micro-systèmes complexes, M. Gross préconise une représentation par automates finis qu'il appelle des "grammaires locales". Cette approche donne naissance à une vaste bibliothèque de graphes, dont chacun décrit un ensemble de combinaisons d'éléments plus ou moins figés couvrant un domaine syntaxique ou sémantique particulier (place des incises, compatibilité des clitiques, compte-rendu boursier, grammaire des dates, etc.). De plus, l'utilisation des automates finis permet d'unifier la formalisation de tout le système, grammaires et dictionnaires, et de donner une représentation claire des ambiguïtés.

    Ce vaste ensemble de données (lexique-grammaire, dictionnaires, bibliothèque de graphes) est formellement combinable au sein de programmes de traitement automatique du langage. Ceux-ci permettent une exploration très fructueuse de grands corpus, tant pour la recherche linguistique que pour l'extraction d'informations, et peut-être (enfin!), pour un début de traduction automatique. C'est à la constitution de ce puissant outil de traitement du langage, combinant toutes les données accumulées pendant plus de quarante ans, que M. Gross travaillait les derniers temps.

    Sur le plan scientifique, il a eu le mérite d'ouvrir constamment de nouvelles pistes de recherches et d'y intéresser tout un ensemble d'étudiants français et étrangers qui continuent son travail et ont conscience d'appartenir à une même communauté. Mais il a fait plus : il avait la qualité de créer une ambiance conviviale entre ses collaborateurs et a su faire de son laboratoire un centre d'accueil chaleureux pour les nombreux étudiants ou chercheurs étrangers de passage, qui, souvent, sont devenus ses amis. Sa rigueur scientifique n'a jamais empêché le côté cordial, attentionné, en même temps qu'empreint de fantaisie, qu'il donnait aux relations professionnelles.

    À partir de 1981, le LADL et les autres laboratoires du réseau RELEX organisent annuellement un Colloque international sur les lexiques et grammaires comparés : dates et les lieux des éditions du Colloque.

    Maurice Gross est mort le 8 décembre 2001, des suites d'un cancer.

    Les membres du LADL ont été intégrés à l'Institut Gaspard Monge (IGM) de l'Université de Marne-la-Vallée.


    Christian Leclère