Gérer des données catégorielles

Dans un monde idéal pour les machines, toutes les données récoltées lors d’une enquête le seraient sous forme numérique. Heureusement, le monde est idéal précisément parce qu’étant sans raison et sans but ; et comme il ne se fait pas leur complice, à notre volonté de les assister dans leur tâche. D’autant plus que, pour corser le tout, même une donnée numérique peut se révéler catégorielle : une échelle de satisfaction, codée de 0 à 5, laisse bien penser qu’il existe plusieurs catégories d’observations. Tout l’enjeu de la prise en charge des variables catégorielles, encore plus prégnant dans le domaine du TAL, réside dans les phases de pré-traitement, par des moyens d’encodage, en vue de les injecter dans les algorithmes d’apprentissage.

Intervenant·e : Alexandre Roulois (LLF)
Date : 20 mars 2023, 09:30
Salle : ODG 531
Domaine : Apprentissage automatique