Ces deux scripts, écrits en perl, servent à préparer en deux étapes les données d'entrée du corpus Polaris pour l'outil IRaMuTeQ. Ils sont adaptés aux résultats de l'extraction par l'outil harvestCorpus
Extrait certaines métadonnées choisies comme variables (DT>type de document, SO>source, LA>langue) depuis le fichier polarisRecent_modifié.txt issu de l'outil harvestCorpus.
Concatène les articles issus du corpus Polaris et les métadonnées extraites par le script précédent.