Top Qs
Chronologie
Chat
Contexte
Medical Subject Headings
De Wikipédia, l'encyclopédie libre
Remove ads
Le Medical Subject Headings ou MeSH est un vocabulaire contrôlé (ou un système de métadonnées) en langue anglaise très étendu utilisé pour l'indexation et le catalogage des publication scientifiques telles que les articles de journaux et les livres dans le domaine biomédical. Ce thesaurus a été lancé et est toujours maintenu par la Bibliothèque nationale de médecine des États-Unis d'Amérique ou NLM pour National Library of Medicine et constitue le vocabulaire contrôlé le plus important du domaine biomédical[1]. Il comporte près de 30 000 descripteurs et est mis à jour annuellement[2]. Il est notamment utilisé pour l'indexation des articles de la base de données MEDLINE et son moteur de recherche PubMed.
Bien qu'en langue anglaise, le MeSH est traduit dans plusieurs langues. La traduction française est entretenue par l'Inserm, qui en réalise la mise à jour annuelle depuis 1986[3]. Cette version bilingue de MeSH, elle-même utilisé comme outil de traduction, est souvent utilisée pour l’indexation et l’interrogation des bases de données en français.
Remove ads
Structure des MeSH
Résumé
Contexte
La structure de ce vocabulaire se recoupe en trois concepts principaux, soit les sujet/titres principaux, ou descripteurs, les sous-titres, ou qualificatifs et les termes d’entrée[4].
Les descripteurs permettent de décrire le sujet ou le contenu des citation et sont ordonnés hiérarchiquement du plus général au plus spécifique[1]. Au sommet de cette hiérarchie sont définis les seize catégories suivantes[3] :
- Anatomie [A]
- Organismes [B]
- Maladies [C]Produits chimiques et pharmaceutiques [D]
- Techniques et équipements analytiques, diagnostiques et thérapeutiques [E]
- Psychiatrie et psychologie [F]
- Phénomènes et processus [G]
- Disciplines et professions [H]
- Anthropologie, enseignement, sociologie et phénomènes sociaux [I]
- Technologie, industrie et agriculture [J]
- Sciences humaines [K]
- Sciences de l’information [L]
- Individus [M]
- Santé [N]
- Caractéristiques d’une publication [V]
- Lieux géographiques [Z]
- Historique
Les qualificatifs ont pour fonction de mieux définir les résultats de recherche en spécifiant un aspect particulier du descripteur auquel il est lié. Par exemple, le qualificatif diagnostic peut être utilisé conjointement avec le descripteur diabète afin de repêcher uniquement les citations sur le diabète et sous-catégorisée comme traitant de diagnostic du diabète[5].
Les termes d’entrée sont des synonymes ou des termes fortement liés qui renvoient aux descripteurs. Les termes d’entrées peuvent être employés de manière interchangeable avec leurs descripteurs associés dans le cadre d’une recherche sur PubMed, ainsi d’un point de vue pratique, il n’y a aucune différence entre les termes d’entrée et les descripteurs. La recherche de l’un comme de l’autre entraînera un résultat identique[4].
Remove ads
Historique
Résumé
Contexte
En 1960 la NLM publie le MeSH, un thesaurus remplaçant l’Index Medicus et l’Index-Catalogue, utilisés jusqu’alors depuis leur création en 1879 et en 1880 respectivement. Ce nouveau vocabulaire contrôlé de 4 300 descripteurs au départ avait pour objectif de fournir un indexage plus constant et cohérent facilitant la recherche d’information. Quarante ans plus tard, son usage soutenu a mené à une expansion significative de son contenu d’origine et avec une évolution remarquable de sa structure au début des années 2000, le MeSH est déjà l’un des thesauri les plus sophistiqués[1].
En 1996, la NLM met sur pied le projet Indexing Initiative dans le but d’explorer de nouvelles technologies d’indexage pouvant substituer partiellement ou complètement les méthodes d’alors et permettre des performances de rappel égales ou supérieures à celles des systèmes basés principalement sur le procédé manuel d’assignation de termes d’index[6],[7]. En effet, le recours à des indexeurs professionnel entraîne éventuellement des limitations importantes nécessitant le recours à une approche alternative. Le nombre de nouvelles publications ajoutées dans la base de données MEDLINE – et devant être indexées – chaque année augmente de manière exponentielle, passant de 151,635 en 1965 à 1.3 million en 2021[8]. Le vocabulaire MeSH quant à lui devient de plus en plus complexe comprenant jusqu’à 30,194 descripteurs en 2022, chacun avec leurs propres ensembles de règles encadrant leur usage.
Ces difficultés toujours plus importantes conjuguées à des budgets restreints ont progressivement entraîné une accumulation de 576,735 publications non indexées sur PubMed® en janvier 2021[8]. Au terme de l’Indexing Initiative, l’indexeur de texte médical ou Medical Text Indexer (MTI) voit le jour comme produit principal du projet et dès 2002 la NLM en fait l’usage comme outil semi-automatique pour assister ses indexeurs en leur suggérant des recommandations d’indexage[9]. Avec le perfectionnement progressif de cet outil, la NLM désigna un ensemble de journaux avec lesquels MTI performait suffisamment pour être désigné comme un indexeur de première ligne, rendant l’indexage des publications issues de ces journaux totalement automatisé. Toujours grâce à l’amélioration de la précision de l’outil, cette liste de journaux, libellée MTI first-line ou MTIFL, augmenta pour inclure 230 journaux en 2014[10]. La méthode d’indexage à l’aide des MITFL fut utilisée jusqu’en. 2020. En parallèle, un effort continu de perfectionnement de l’outil a mené au développement de différentes variantes de l’algorithmes, telles que MTI Comment On et MTI Review en 2017, puis MTI Automatic en 2019[8].
Aujourd’hui, l’indexage des articles est réalisé de manière complètement automatisée par l’algorithme Medical Text Indexer-NeXt Generation ou MTIX, un modèle d’apprentissage automatique basé sur les réseaux de neurone entraîné avec des millions de citations MEDLINE publiées entre 2007 et 2022. Un contrôle qualité est également réalisé par des indexeurs humains sur un ensemble de citations indexées automatiquement sélectionné de manière aléatoire, ou parmi des cas reconnus pour leur ambiguïté[11].
Remove ads
Références
Liens externes
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads
