Mis à jour le 08/02/2017
Publié le 13/02/2013

Les départements Sad et SAE2 de l'Inra et l'Ifris (Institut Francilien Recherche, Innovation, Société) ont développé une plateforme technologique d’analyse de données textuelles à destination plus particulière des recherches sociologiques : la plateforme CorTexT.


 

Contexte et enjeux

La mise à disposition, sur internet, d’un nombre toujours croissant de ressources constitue un terrain d’étude privilégié pour l’analyse de données textuelles. Le traçage des activités scientifiques et de l’innovation dans les bases de données scientifiques, les bases de brevet et les bases de projet, livre une information détaillée pour analyser la production scientifique.

Devant cette masse de données plus ou moins structurée, les travaux scientifiques en sciences humaines et sociales sur la recherche et l’innovation doivent désormais se confronter à l’analyse de grands corpus hétérogènes de données pour à la fois caractériser et prendre la mesure des phénomènes qu’ils étudient.

Réponses apportées par la plateforme CorTexT

Ces deux exigences nécessitent l’utilisation de recherches et outils développés dans différents domaines scientifiques et techniques pour comprendre les mécanismes impliqués : le traitement automatique de la langue, l’extraction d’information, l’ingénierie des connaissances, la sociologie des réseaux, la scientométrie, l’analyse de controverses et la sémiotique.

Pour appuyer le travail d’analyse et d’interprétation des problématiques rencontrées au sein de l’Institut francilien "Recherche, Innovation et Société" (Ifris), l’Ifris développe une plateforme digitale appelée CorTexT qui vise le traitement de grands corpus textuels à des fins de recherche, d’expertise et de formation. CorTexT est un projet soutenu par l’UMR Lisis (Inra, Ifris).

L’objectif est de mettre à disposition des équipes partenaires de l’Ifris des outils, des chaînes de traitement, des procédures et des méthodes pour aider les chercheurs à traiter, caractériser, analyser et quantifier des données textuelles organisées.
Projet phare de la plateforme, CorTexT Manager offre un ensemble d’outils d’analyse de corpus développés par CorText. Cette application permet de charger des jeux de données provenant de sources hétérogènes, et de lancer des traitements (scripts) à distance pour analyser/cartographier les données primaires. Un espace utilisateur privé permet aux utilisateurs de mener des expérimentations sur leur projets avant de les rendre éventuellement publiques.

 

Site web de CorTexT