Jour 2 (9h30) - Ateliers > 09h30 | La lexicométrie NooJ d'analyse linguistique et sémantique

La lexicométrie NooJ : un outil linguistique au service des humanités numériques

Max Silberztein (contact)
Centre de Recherches Interdisciplinaires et Transculturelles (CRIT)
Université de Franche-Comté

Présentation

Aujourd'hui, les chercheurs en sciences humaines et sociales utilisent de plus en plus leur corpus pour leurs recherches. Pour cela, ils utilisent des logiciels d'analyse statistique. Mais la plupart de ces logiciels comportent peu de ressources linguistiques, au détriment de la fiabilité des résultats qu'ils produisent. Nous présenterons la plateforme NooJ d'analyse de corpus qui utilise des ressources linguistiques sous la forme de dictionnaires et de grammaires électroniques, et ainsi peut reconnaître et traiter des unités linguistiques (i.e. des unités de sens) plutôt que de simples formes graphiques.

Programme

L'objectif de l'atelier est de permettre aux participants de maîtriser les fonctionnalités de recherche d'information et d'annotation de textes du logiciel NooJ.

  • Manipuler et importer des textes et corpus
  • Appliquer des requêtes simples sous forme d'expressions régulières
  • Concordance et analyses statistiques
  • Appliquer des requêtes plus puissantes sous forme de grammaires
  • Annoter un texte automatiquement
  • Exporter un texte annoté au format XML
Personnes connectées : 2 Vie privée
Chargement...