Newer
Older
explore-corpus / Niveau-2 / Polaris / README.md
@camille camille on 21 Dec 2017 621 bytes nouvelles màj

POLARIS

Ces deux scripts, écrits en perl, servent à préparer en deux étapes les données d'entrée du corpus Polaris pour l'outil IRaMuTeQ. Ils sont adaptés aux résultats de l'extraction par l'outil harvestCorpus

Extraction_metadata.pl :

Extrait certaines métadonnées choisies comme variables (DT>type de document, SO>source, LA>langue) depuis le fichier polarisRecent_modifié.txt issu de l'outil harvestCorpus.

Preparation_entree_Ira_polaris.pl :

Concatène les articles issus du corpus Polaris et les métadonnées extraites par le script précédent.