Newer
Older
explore-corpus / Niveau-2 / Polaris / README.md

POLARIS

Ces deux scripts, écrits en perl, servent à préparer en deux étapes les données d'entrée du corpus Polaris récent (v1 ou v2) pour l'outil IRaMuTeQ. Ils sont adaptés aux résultats de l'extraction par l'outil harvestCorpus

Extraction_metadata.pl :

Extrait certaines métadonnées choisies comme variables (DT>type de document, SO>source, LA>langue) depuis le fichier polarisRecent_modifié.txt issu de l'outil harvestCorpus.

Preparation_entree_Ira_polaris.pl :

Concatène les articles issus du corpus Polaris récent et les métadonnées extraites par le script précédent.