explore-corpus / Niveau-2 / Polaris /
@camille camille authored on 21 Dec 2017
..
Extraction_metadata.pl 7 commit 8 years ago
Preparation_entree_Ira_polaris.pl 7 commit 8 years ago
README.md nouvelles màj 7 years ago
README.md

POLARIS

Ces deux scripts, écrits en perl, servent à préparer en deux étapes les données d'entrée du corpus Polaris pour l'outil IRaMuTeQ. Ils sont adaptés aux résultats de l'extraction par l'outil harvestCorpus

Extraction_metadata.pl :

Extrait certaines métadonnées choisies comme variables (DT>type de document, SO>source, LA>langue) depuis le fichier polarisRecent_modifié.txt issu de l'outil harvestCorpus.

Preparation_entree_Ira_polaris.pl :

Concatène les articles issus du corpus Polaris et les métadonnées extraites par le script précédent.