- Site officiel

CAFES MTD & CAFES DOCTORANTS

 

JEU 
06 
JUIN

De 11h00 à 12h00, en salle Saltus.

Martin Lentschat présentera sa thèse s'intitulant : 
"ARTEXT4LOD - n-ARy relaTions EXTraction for Linked Open Data" 

Résumé : 
L'objectif de la thèse ARTEXT4LOD est de concevoir une méthode générique d'extraction de données expérimentales depuis un corpus de documents en domaine de spécialité. Guidée grâce à l'usage d'une Ressource Termino-Ontologique, les informations extraites sont ensuite représentées sous forme de relation N-Aires.
L’un des principaux obstacles étant la dispersion des informations dans les documents, l’exposé se concentrera sur notre première étape : l’extraction d’instances partielles de relations N-Aire, et présentera nos premières contributions. Les articles scientifiques étant riches en informations il est en effet important de réussir à capter l'ensemble de ses variations tout en la caractérisant.
Pour cela nous avons mené un travail autour de l'enrichissement de notre Ontologie via la recherche de variations terminologiques et d'acronymes dans les documents. La prise en compte du contexte d'expression des informations est également possible en étudiant les spécificités propres aux différentes sections des articles scientifiques.