Loading AI tools
dictionnaire numérisé de langue française De Wikipédia, l'encyclopédie libre
Le Trésor de la langue française informatisé, couramment abrégé sous le sigle TLFi, est la version informatisée du Trésor de la langue française (TLF), qui est un dictionnaire de la langue française des XIXe et XXe siècles, imprimé en seize volumes, paru entre 1971 et 1994, regroupant 100 000 mots avec leur usage, 270 000 définitions, 430 000 exemples. Il est disponible en accès gratuit depuis 2002 sur le web et fut publié en CD-ROM en 2004.
Titre original | |
---|---|
Format | |
Langue | |
Auteur | |
Dates de parution | |
Site web |
Bien avant la fin de sa publication papier, l'informatisation du TLF est envisagée [1]. Selon Sabine Albert, la relation entre le TLF et les technologies de l'information se développe sur deux plans : le développement de l'ouvrage et son informatisation sous la forme du Trésor de la Langue Française informatisé (TLFi). Le premier concerne l'effort qui a permis au TLF d'être pionnier dans l'utilisation des nouvelles technologies au service de la lexicographie. C'est ainsi qu'à l'aide d'un Bull Gamma 60, des cartes perforées et des logiciels de plus en plus performants, les lexicographes ont rassemblé et traité une énorme quantité de documents et des millions d'informations pour créer le dictionnaire le plus complet de la langue française [2]. Le TLF, dans sa version papier, comptait seize volumes[3],[4].
La seconde approche consiste à passer d'un dictionnaire élaboré à l'aide d'ordinateurs à un dictionnaire informatisé. Il fallait adapter le TLF à un nouveau modèle qui nécessitait d'autres formes de consultation. Pour ce faire, on s'est inspiré de l'Oxford English Dictionary (OED), informatisé en 1984[2].
Le projet a été confié à Jacques Dendien, Ingénieur de Recherche CNRS. Selon lui, « informatiser un dictionnaire ne consiste pas à écrire des logiciels plus ou moins géniaux, mais consiste beaucoup plus prosaïquement à le transformer en document structuré » [5],[6]:14-15. En d'autres termes, il fallait repenser complètement la forme du texte, sans en altérer le contenu. Le concept Standard Generalized Markup Language (SGML), un langage de balisage normalisé fut utilisé pour décrire la structure des articles. C'est la Bibliothèque nationale de France qui a financé la saisie des données ; en 1994, grâce au soutien du CNRS et à l'énorme travail effectué par le laboratoire dirigé par Dendien, « qui sut démontrer, à travers un prototype construit à partir du volume XIV, que la faisabilité de la rétro-conversion du TLF pouvait être réalisée au sein même du laboratoire »[1]. Lorsque l'édition du dernier volume a été achevée, l'informatisation réelle a pu commencer, aboutissant à « l'un des documents structurés les plus volumineux et les plus complexes produits à ce jour. »[6]:19. En même temps, il était nécessaire d'offrir à l'utilisateur des services supplémentaires pour rendre l'accès au TLF aussi complet et facile que possible. Alors que l'utilisation d'un dictionnaire papier se limite généralement aux entrées, un dictionnaire informatisé permet d'effectuer des recherches dans l'ensemble du texte. Pour ce faire, il a fallu mettre en place un moyen de communication entre le lecteur et le TLF : le logiciel STELLa (Système de Traitement et d'Exploitation en Ligne de la Langue) développé par le Département Développement Informatique de l'ATILF. Grâce à un langage spécialement conçu pour le TLF, STELLa permet de formuler des requêtes et d'extraire des résultats à partir du corps même de l'œuvre[2].
La première mise en ligne du Trésor de la langue française est réalisée au début des années 1990 à l'Institut national de la langue française (INaLF)[7], avec les participations d'Alain Rey[8] et de Bernard Cerquiglini[9]. Le dictionnaire est présenté directement en ligne, sans modification ni mise à jour. En 2001, le rapprochement de l'INaLF et de Landisco (Langue discours cognition, université Nancy 2) donne naissance au laboratoire Analyse et traitement informatique de la langue française (ATILF), une unité mixte de recherche associée au CNRS et à l’université de Lorraine[7].
Le , le TLFi devient disponible sur CD-ROM pour Windows et Mac OS X[10],[11]. Cette version a depuis disparu.
Le dictionnaire est issu de l’analyse sémantique du Trésor de la langue française et de sa décomposition en plusieurs domaines : définitions, exemples d’utilisation, indications sémantiques et lexicales[12].
Le TLFi contient les définitions, des extraits littéraires où apparaît le mot recherché, des indicateurs de domaine technique, des indicateurs sémantiques, étymologiques, historiques, grammaticaux et stylistiques, les usages et emplois, les synonymes et antonymes et analyse les relations hiérarchiques liant ces objets[13]. Il a été composé en objets élémentaires (définitions, exemples, indicateurs de domaine technique, etc.[14]) permettant une recherche complexe en trois niveaux :
Il est possible de trouver un mot sans en connaître l'orthographe exacte, grâce à une recherche phonétique.
Le contenu du TLFi correspond à celui du TLF dans sa première édition, achevée en 1994[7], et l'ATILF indique sur son site qu'« il n’a pas vocation à être mis à jour »[15]. Cependant, en plus des erreurs existantes dans la version imprimée d'origine, le contenu informatisé comporte des anomalies dues à des fautes de transcriptions[7].
Comme il est « évident que ce corpus de textes en français [est] une ressource importante pour les lexicographes, mais aussi pour les sciences sociales et les humanités », le projet initial s'est poursuivi avec le DVLF, à l'intérieur du projet ARTFL de l'Université de Chicago[16],[17]...
Des projets amateurs tels que Simple TLFi voient le jour afin de proposer une présentation différente du TLFi et améliorer ainsi l'expérience utilisateur (lisibilité, usage sur mobile) et l'accessibilité[18].
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.