Chargement...

Terminologie numérique : conception, représentation et gestion

de Federica Vezzani (Auteur)
©2022 Thèses 238 Pages
Open Access
Série: Linguistic Insights, Volume 290

Résumé

Cet ouvrage se consacre à la notion de terminologie
numérique considérée comme une
approche de la discipline impliquant la représentation
numérique d’informations conceptuelles
et linguistiques d’un domaine spécifique.
L’objectif est l’illustration des étapes de
conception et d’implémentation de base de
données terminologiques multilingues permettant
le respect des meilleures pratiques dans
la gestion des données terminologiques du
numérique. Pour ce faire, l’ouvrage met en
exergue les nouvelles compétences du terminologue
à l’ère numérique. Celles-ci trouvent leur
véritable essence dans l’esprit interdisciplinaire
et collaboratif de la recherche.

Table des matières

  • Couverture
  • Titre
  • Copyright
  • À propos de l’auteur
  • À propos du livre
  • Pour référencer cet eBook
  • Table des matières
  • Liste des figures
  • Liste des tableaux
  • Préface
  • Introduction
  • 1 Numérisation de la terminologie
  • 1.1 Pour une métaterminologie
  • 1.1.1 Terminologie, terminographie et terminotique
  • 1.1.2 Terminologie computationnelle
  • 1.1.3 Terminologie numérique
  • 1.2 Curation des données numériques
  • 1.2.1 Principes FAIR
  • 1.2.2 Principes des données liées
  • 1.2.3 Données linguistiques liées ouvertes
  • 1.3 Conclusion
  • 2 Fondements pour une terminologie numérique
  • 2.1 Théories et approches en terminologie
  • 2.2 Travail terminologique numérique
  • 2.2.1 Dimension conceptuelle
  • 2.2.2 Dimension linguistique
  • 2.3 Conclusion
  • 3 Conception d’une ressource terminologique
  • 3.1 Principes FAIR en terminologie
  • 3.1.1 Terminologie trouvable
  • 3.1.2 Terminologie accessible
  • 3.1.3 Terminologie interopérable
  • 3.1.4 Terminologie réutilisable
  • 3.2 Paradigme de la « terminologie FAIR »
  • 3.3 Modélisation conceptuelle de la ressource
  • 3.3.1 Schéma entité-association
  • 3.3.2 Métamodèle structurel Terminological Markup Framework
  • 3.3.3 Catégories de données
  • 3.4 Conclusion
  • 4 Vers l’implémentation d’une ressource terminologique
  • 4.1 Représentation des données terminologiques
  • 4.1.1 Format TermBase eXchange
  • 4.1.1.1 Dialectes TBX
  • 4.1.1.2 Conception d’un dialecte
  • 4.2 Actualisation des données terminologiques
  • 4.3 Publication des données terminologiques
  • 4.4 Conclusion
  • 5 Étude de cas : la ressource TriMED
  • 5.1 Langue médicale
  • 5.1.1 Perspective intra-linguistique
  • 5.1.2 Perspective inter-linguistique
  • 5.2 Analyse des exigences
  • 5.3 Modèle structurel de TriMED
  • 5.4 Fiche terminologique
  • 5.4.1 Catégories de type terminologique
  • 5.4.2 Catégories de type conceptuel
  • 5.4.3 Catégories de type administratif
  • 5.5 Répertoire des catégories de TriMED
  • 5.6 Mise en œuvre TBX
  • 5.6.1 Formulation du dialecte TBX-TriMED
  • 5.6.2 Position des catégories de données
  • 5.7 Application Web TriMED
  • 5.7.1 Utilisateurs
  • 5.7.1.1 Le patient
  • 5.7.1.2 Le traducteur
  • 5.7.1.3 Le médecin
  • 5.8 Application Web RCD
  • 5.9 Collection terminologique
  • 5.10 Conclusion
  • 6 Is it FAIR enough?
  • 6.1 Resource Description Framework – RDF
  • 6.2 De TBX à RDF
  • 6.3 Conclusion
  • Annexe A
  • Annexe B
  • Bibliographie
  • Index
  • Titres de la collection

←12 | 13→

Préface
Les normes au service de la terminologie numérique

Ce livre intitulé « Terminologie numérique : conception, représentation et gestion » est innovateur dans sa conception et dans son but. Cela le rend indispensable pour tout terminologue provenant des sciences sociales et humaines dont l’objectif est de s’aventurer dans l’une des facettes du travail terminologique consistant à créer, à gérer et à mettre à jour des ressources terminologiques. Ces dernières sont des conteneurs de données terminologiques collectées de façon systématique d’après des principes théoriques et méthodologiques de la science de la terminologie.

Le terminologue d’aujourd’hui opère nécessairement dans le numérique, d’où l’importance qu’assume son activité dès lors qu’il s’agit de partager les données sur lesquelles il travaille. Ces données doivent être interchangeables et interopérables pour correspondre aux politiques scientifiques qui visent à accélérer le développement vers la Science Ouverte. C’est dans cet esprit que Federica Vezzani se propose d’implémenter les principes FAIR (Faciles à trouver, Accessibles, Interopérables et Réutilisables) à la conception et la construction des ressources terminologiques selon trois normes élaborées au sein de l’ISO SC3, CT 37 :

i.ISO-16642 : 2017 – Applications informatiques en terminologie – Plate-forme pour le balisage de terminologies informatisées ;

ii.ISO-12620 : 2019 – Gestion des ressources terminologiques – Spécifications des catégories de données ;

iii.ISO-30042 : 2019 – Gestion des ressources terminologiques – TermBase eXchange (TBX).

Ces trois documents fournissent les lignes directrices et les exigences nécessaires pour structurer et représenter les données afin de permettre ←13 | 14→l’interchangeabilité et leur réutilisation. Le défi majeur du travail terminologique est bel et bien la possibilité de réutiliser les données qui se doivent accompagnées de descriptions standardisées.

À ce stade Federica Vezzani, rejoignant la tendance de la Science Ouverte, propose un nouveau paradigme qu’elle désigne de « terminologie FAIR », où elle dessine une méthodologie innovatrice qui associe les principes FAIR aux principes de gestion de la terminologie représentés dans les normes ISO supra mentionnées.

Finalement, l’auteure de l’ouvrage applique son paradigme à une ressource terminologique médicale polyvalente – TriMED – qui se dirige à des publics qui ont des besoins de communication spécifiques dans des contextes médicaux – patients, médecins, traducteurs. Du point de vue de sa structure, la fiche terminologique de TriMED correspond aux requis normalisateurs. Du point de vue du contenu, on peut y trouver une quantité diverse d’informations concernant le comportement linguistique des termes et du vocabulaire spécialisé. Enfin, une application Web est construite qui permet la consultation, mais aussi la réutilisation des données terminologiques multilingues.

La perspective théorique et l’approche méthodologique de l’auteure de l’ouvrage sont ancrées dans une terminologie à dimension conceptuelle et linguistique dont les principes se reflètent dans l’usage qu’elle fait des normes et dans le dessin de TriMED. L’approche de Federica Vezzani se veut multidisciplinaire et appelle au besoin de constituer des équipes mixtes pour mener à bon terme un travail terminologique qui actuellement est nécessairement numérique. Ce livre a le grand mérite d’assumer un point de vue qui l’accompagne l’auteure au fil des pages.

Dans le chapitre premier « Numérisation de la terminologie », l’auteure fait une approche historique au concept de « numérique » dans le contexte du travail terminologique, ce qui l’amène à reprendre des termes comme « terminographie », « terminotique » et « terminologie computationnelle » en faisant une incursion aux spécificités de chacune de ces approches. Elle passe ensuite aux questions actuelles concernant le numérique en s’attardant sur l’avènement du Web sémantique e du Linked Open Data (LOD).

Avec le deuxième chapitre intitulé « Fondements pour une terminologie numérique », Federica Vezzani fait le tour des théories, selon elle ←14 | 15→les plus proéminentes, ainsi que de diverses approches appliquées au travail terminologique où elle déclare sa préférence pour une approche à la terminologie qui est bidimensionnelle et qui prend tout sens, vue la place accordée aux normes ISO dans son étude.

Le troisième chapitre est consacré à la « Conception d’une ressource terminologique » où l’auteure élabore la proposition d’une « terminologie FAIR », ce qui l’induit à décrire deux des normes, à savoir, l’ISO-16642 : 2017 qui permet la modélisation et l’organisation des entités « concept », « terme » et « langue » (au sens que la norme leurs donne) et l’ISO-12620 : 2019 qui, à son tour, permet de représenter et d’harmoniser les propriétés (catégories de données) choisies pour chaque entité.

La troisième norme ISO évoquée supra est traitée dans le quatrième chapitre intitulé « Vers l’implémentation d’une ressource terminologique ». Ici, Federica Vezzani se concentre sur le format de représentation TermBase eXchange (TBX) (ISO-30042, 2019) qu’elle considère être le modèle à suivre pour l’adoption d’une approche FAIR à la terminologie. Elle termine ce chapitre, en proposant des pistes de réflexion sur la mise à jour et la publication des données terminologiques contenues dans une ressource FAIR.

L’« Étude de cas : la ressource TriMED » est décrite dans le cinquième chapitre et concerne la conception et la mise en œuvre de la base de données TriMED. C’est dans ce chapitre que l’auteure explique toutes les spécificités détaillées de la ressource TriMED dont le but est de démontrer que la méthodologie utilisée est réplicable à tout autre domaine. Le détail de spécificité du dessin de la ressource fait de ce chapitre un texte très didactique qui pourra très facilement se transformer en un guide pour tout novice de la terminologie numérique.

Le sixième chapitre dont le titre est « Is it FAIR enough? » nous renvoie à une sorte de palimpseste construit sur un jeu de mots provocateur. Ce chapitre est une réflexion critique aux aspects de la FAIRisation. L’auteur considère que la démarche dessinée est un bon point de départ pour aller plus loin, car la méthodologie proposée doit être mise à jour et constitue le levier pour d’autres envols tenant en compte d’autres normes tels que RDF ou Ontolex-Lemon (une norme de facto) – rien que pour en nommer quelques-unes – pour avancer vers ←15 | 16→l’interopérabilité entendue comme la capacité que les systèmes existants ou à créer ont à s’adapter et à interagir entre eux.

Rute Costa
Faculdade de Ciências Sociais e Humanas
Universidade NOVA de Lisboa
NOVA CLUNL, Lisbonne

←16 | 17→

Introduction

Cet ouvrage se consacre à la question de l’évolution de la discipline de la terminologie à l’ère numérique. La terminologie est la science qui traite de l’étude et de la représentation des connaissances spécialisées et, à ce titre, englobe une double dimension d’analyse, conceptuelle et linguistique, qui caractérise le spectre d’investigation du chercheur. La complémentarité des deux dimensions permet, en effet, d’examiner, d’une part, les conceptualisations d’un domaine de travail donné, d’autre part, les représentations linguistiques (termes) qui concrétisent verbalement les concepts spécialisés étudiés. Le travail du terminologue vise donc à maximiser et à mettre en corrélation les deux dimensions de la terminologie à la fois dans une perspective monolingue et multilingue.

La création de ressources terminologiques contenant la terminologie d’un secteur spécialisé est l’une des principales activités de cette discipline. Ces outils, s’ils sont partagés à grande échelle, constituent un patrimoine inestimable pour l’avancement de la recherche, non seulement dans le domaine strictement linguistique, mais aussi pour des secteurs plus ou moins voisins tels que l’informatique, le traitement automatique des langues, la recherche de l’information. Or, la mise à disposition d’une ressource terminologique numérique sur le Web est une activité qui nécessite une étude de conception préalable approfondie. Le processus de numérisation du matériel terminologique implique donc de repenser la structure des données, des métadonnées et des collections que l’on veut représenter afin qu’elles soient organisées et gérées de manière optimale sur le Web. Faire de la terminologie à l’ère du numérique signifie prendre en considération tous les aspects qui permettent au chercheur de conformer et de modéliser son produit par rapport aux exigences actuelles en termes de bonne gestion des données numériques.

Résumé des informations

Pages
238
Année
2022
ISBN (PDF)
9783034342643
ISBN (ePUB)
9783034344319
ISBN (MOBI)
9783034344852
ISBN (Relié)
9783034343947
DOI
10.3726/b19407
Open Access
CC-BY-NC-ND
Langue
Français
Date de parution
2022 (Mai)
Published
Bern, Berlin, Bruxelles, New York, Oxford, Warszawa, Wien, 2022. 238 p., 21 ill. n/b, 5 tabl.

Notes biographiques

Federica Vezzani (Auteur)

Federica Vezzani est chercheuse à l’Université de Padoue. Ses intérêts scientifiques concernent la terminographie et la mise en place des bases de données terminologiques multilingues conformément aux principes FAIR (Findability, Accessibility, Interoperability, Reusability) de la science ouverte.

Précédent

Titre: Terminologie numérique : conception, représentation et gestion