Résumé : Selon la théorie du syntagme nominal développée par Wilmet (2003), la notion de caractérisant est une notion fonctionnelle qui désigne tous les « accompagnateurs » du nom (ou déterminants) qui modifient l’extension du nom. Cette notion est indépendante des catégories morpho-syntaxique puisqu’on trouve parmi les caractérisants des adjectifs, des syntagmes prépositionnels, des noms, des adverbes, des propositions relatives voire des phrases entières.

Les linguistes du français se sont surtout intéressés à la position absolue de l’adjectif (antéposition ou postposition au nom), mais peu à leur ordre relatif. Il était intéressant d’étendre le point de vue à tous les caractérisants parce que le mélange de caractérisants de différentes natures, en particulier la séquence relative de l’adjectif et du complément du nom, pose d’intéressantes questions linguistiques. La notion fonctionnelle montre également sa valeur dans un cadre comparatiste, car différentes langues ne rendent pas le même concept avec la même catégorie morpho-syntaxique.

Notre théorie est que la séquence des caractérisants, tant en antéposition qu’en postposition, est régie par une hiérarchie de critères morpho-syntaxiques et sémantiques, en particulier par leur valeur classificatrice, descriptive ou spécificatrice. On a souvent classé les adjectifs en fonction de leur appartenance à une classe sémantique ontologique (couleur, forme, matière…). En réalité, de très nombreux adjectifs et caractérisants n’entrent pas dans ces catégories et ce type de classification n’est pas le premier critère à l’œuvre dans l’ordre des mots.

Le syntagme nominal apparaît dès lors comme structuré en différentes couches concentriques autour du nom ; il est délimité en antéposition par les quantifiants et en postposition par les caractérisants spécificateurs qui lui font en quelque sorte pendant. On observera dès lors d’intéressants phénomènes de sens et d’acceptabilité grammaticale dans le jeu des quantifiants et des caractérisants. Inversement, la position relative d’un caractérisant influe sur sa valeur. On pourrait résumer ces effets de sens par la formule : on dit d’abord ce que c’est, ensuite comment c’est, et enfin lequel c’est. De manière très générale donc, on observe que l’orientation des déterminants se fait selon un axe intrinsèque-extrinsèque ou objectif-subjectif.

L’étude d’expressions dans d’autres langues et dans des domaines spécialisés (cuisine, appellations officielles incluant des adjectifs géographiques, localisation de logiciels et chimie organique) permet de valider cette hypothèse tout en montrant que l’ordre des mots est un phénomène de génération, propre à chaque langue car la traduction modifie la nature morpho-syntaxique et peut modifier la valeur des caractérisants.

La partie technique de la thèse a exploité des techniques de traduction assistée par ordinateur, de traduction automatique et de traitement du langage, elle a fait appel aux langages de balisage standards de la famille XML pour la représentation des corpus et des règles ainsi que pour la réalisation des procédures. Les corpus spécialisés ont été constitués par alignement de corpus monolingues ou par traduction. Ils ont tous été mis au format XML ; les règles de traduction ont été formalisées dans le même format et elles ont été implémentées en XSLT. La formalisation des corpus en assure la portabilité et facilite les recherches de structures grammaticales sur un corpus catégorisé. Les corpus parallèles sont en outre d’une grande aide pour les traducteurs. Enfin, l’automatisation permet de valider les règles linguistiques proposées.