Jour 2 (9h30) - Ateliers > 09h30 | La plateforme RStudio pour suivre le profilage des contributeurs

Plateforme RStudio : profilage des contributeurs en réseaux sociaux, le cas du Wikipédia

Tania Jiménez (contact)
Ingénieure de recherche en informatique
Laboratoire d'informatique d'Avignon (LIA) - Avignon Université

Tania Jiménez est ingénieure de recherche dans le Laboratoire Informatique d'Avignon (LIA) depuis 2005. Ses sujets de recherche sont dans les domaines de la recherche opérationnelle sur les réseaux, la théorie des jeux et dernièrement sur l'analyse automatique des textes.

Éric Sanjuan (contact)
Maître de conférences HDR en informatique
Laboratoire d'informatique d'Avignon (LIA) - Avignon Université

Éric Sanjuan est maître de conférences en informatique, spécialisé dans le traitement automatique du langage naturel (TAL) et la recherche d'information (RI). Titulaire d'une HDR, il est affilié à l'IUT d'Avignon. Ses recherches portent principalement sur l'analyse des données textuelles et la contextualisation de requêtes et de microblogs, avec un intérêt particulier pour les pratiques culturelles. Il a développé plusieurs outils logiciels.

Jeanne Vermeirsche (contact)
ATER - Doctorante en science politique
Laboratoire •JPEG / FR Agor@ntic - Avignon Université

Jeanne Vermeirsche est doctorante en science politique à l'université d'Avignon, où elle exerce actuellement en tant qu'ATER. Ses recherches portent sur la circulation des discours politiques français, notamment d'extrême-droite, dans le Wikipédia francophone. Dans ce cadre, elle collabore depuis plusieurs années avec Éric Sanjuan (MCF HDR en informatique) et Tania Jiménez (ingénieure de recherche) du Laboratoire d'Informatique d'Avignon (LIA).

Présentation de l’atelier
L’atelier « Profilage des contributeurs en réseaux sociaux, le cas du Wikipédia » initie à l'étude des contributeurs sur Wikipédia à partir des pages de l'encyclopédie en ligne et aux pratiques de terrain en numérique. Les participants travailleront sur la plateforme RStudio à partir d’un fichier interactif RMarkdown.
Les participants seront encadrés par Tania Jiménez, Éric Sanjuan et Jeanne Vermeirsche, à la fois pour développer leurs compétences et leur maîtrise des outils mis à disposition mais également pour travailler à l’interprétation des résultats et à la formulation d’hypothèses pouvant être objectivées avec ces mêmes outils. Cet atelier se veut résolument ancré dans un dialogue interdisciplinaire.
La puissance de ces outils sera mise en valeur tout en apportant un regard critique et une méthodologie d’évaluation et d’identification de leurs limites.

Programme de l’atelier

  • Mise à disposition d’un serveur RStudio / PostGreSQL
  • Echantillonnage des pages et contributeurs de Wikipédia à partir du contenu de l'encyclopédie en ligne
  • Profilage des contributeurs (méthode probabiliste LDA)
  • Prise en main pour tous les participants de l’ensemble de ces outils à partir d’un document interactif
  • Création d'une cartographie sémantique, nuages de mots et séries temporelles
  • Analyse et imbrication des pratiques en ligne et des parcours hors-ligne (méthodologie de terrain qualitatif)
  • Application des participants à leurs propres objets d'étude

Vidéothèque

Interview Jeanne Vermeirsche et Éric Sanjuan - Profilage des contributeurs sur Wikipédia (4min30)

Personnes connectées : 2 Vie privée
Chargement...