Newer
Older
explore-corpus / Niveau-2 / Polaris / README.md
@camille camille on 21 Dec 2017 621 bytes nouvelles màj
POLARIS
=======

Ces deux scripts, écrits en perl, servent à préparer en deux étapes les données d'entrée du corpus Polaris pour l'outil **[IRaMuTeQ](http://iramuteq.org/)**. Ils sont adaptés aux résultats de l'extraction par l'outil harvestCorpus

### **Extraction_metadata.pl** : 
Extrait certaines métadonnées choisies comme variables (DT>type de document, SO>source, LA>langue) depuis le fichier polarisRecent_modifié.txt issu de l'outil harvestCorpus.


### **Preparation_entree_Ira_polaris.pl** : 
Concatène les articles issus du corpus Polaris et les métadonnées extraites par le script précédent.