|
|
Jour 2 (9h30) - Ateliers > 09h30 | L'analyse de corpus textuels TXMAnalyse textométrique avec TXM : analyse de données textuelles structurées et enrichies linguistiquement Serge Heiden (contact) Serge Heiden, ingénieur de recherche au laboratoire IHRIM, développe la méthode d’analyse de corpus textuels appelée « textométrie » à travers le développement et la diffusion de la plateforme TXM. Présentation La plateforme TXM combine à la fois des outils d’analyse qualitatifs pour assister l’extraction de listes de termes ou la lecture focalisée à l’aide de concordanciers et quantitatifs pour caractériser l’attirance statistique entre mots ou pour cartographier les différences d’usage de termes entre textes ou entre parties d’un corpus. Pour cela le logiciel s’appuie sur un niveau modulable de représentations textuelles du plus simple (texte brut) au plus riche (XML TEI) et sur une représentation augmentée d’annotations linguistiques automatiques (lemmes, catégories grammaticales, rôle syntaxique). Programme L’atelier introduira aux fondamentaux de l'analyse textométrique par la mise en pratique des outils de TXM pour poste sur un corpus exemple de vœux présidentiels :
|
Personnes connectées : 2 | Vie privée |