Ces deux scripts, écrits en perl, servent à préparer en deux étapes les données d'entrée du corpus Polaris récent (v1 ou v2) pour l'outil IRaMuTeQ. Ils sont adaptés aux résultats de l'extraction par l'outil harvestCorpus
Extrait certaines métadonnées choisies comme variables (DT>type de document, SO>source, LA>langue) depuis le fichier polarisRecent_modifié.txt issu de l'outil harvestCorpus.
Concatène les articles issus du corpus Polaris récent et les métadonnées extraites par le script précédent.