Comme le précisent les organisateurs du Challenge Atelier TextMine de la conférence francophone sur l'Extraction et la Gestion des Connaissances (EGC) dans la présentation de leur évènement, « nous sommes entrés dans une ère ou la donnée textuelle sous toute ses formes submerge chacun de nous que ce soit dans son environnement personnel ou professionnel : l'augmentation croissante de documents nécessaires aux entreprises ou aux administrations, la profusion de données textuelles disponibles via Internet, le développement des données en libre accès (Open Data), les bibliothèques et archives en lignes, les media sociaux ne sont que quelques exemples illustrant l'évolution de la notion de texte, sa diversité et sa prolifération.
Le Challenge de cette année intitulé « Reconnaissance d'entités géographiques dans un corpus d'instructions nautiques », avait pour objectif la détection des mentions de lieux décrites dans les volumes de descriptions des littoraux constitués par l’Institut national de l'information géographique et forestière (IGN) et le Service hydrographique et océanographique de la Marine (Shom).
L’UMR TETIS, regroupant de nombreux chercheurs spécialisés dans le domaine de l'IA, a relevé le défi en réentraînant plusieurs modèles d'intelligence artificielle basés sur des réseaux de neurones avec des architectures appelées "transformers". Les travaux et résultats des chercheurs mobilisés ont été récompensés par la seconde place à l'EGC'24.