diff --git "a/Niveau-2/Polaris/Polaris r\303\251cent/README.md" "b/Niveau-2/Polaris/Polaris r\303\251cent/README.md" index 47228bb..374d984 100644 --- "a/Niveau-2/Polaris/Polaris r\303\251cent/README.md" +++ "b/Niveau-2/Polaris/Polaris r\303\251cent/README.md" @@ -3,9 +3,11 @@ Le corpus ***Polaris récent*** contient des documents extraits de l'archive Istex, circonscrits à la zone polaire arctique et publiés entre 2000 et 2015. -L'exploration thématique de ce corpus a notamment utilisé l'outil **[IRaMuTeQ](http://iramuteq.org/)**. Celui-ci nécessite un prétraitement des données pour n'ingérer qu'un fichier unique, contenant à la fois les métadonnées et les textes : +L'exploration thématique de ce corpus a été réalisée au moyen de l'outil **[IRaMuTeQ](http://iramuteq.org/)**. -- Constitution du fichier de données en entrée = textes concaténés et précédés chacun des métadonnées que l’on souhaite explorer selon une syntaxe précise ; +Cet outil nécessite un prétraitement des données pour n'ingérer qu'un fichier unique, comportant à la fois les métadonnées et les textes correspondants. Ce prétraitement s'opère en deux étapes : + +- constitution du fichier de données en entrée = textes concaténés et précédés chacun des métadonnées que l’on souhaite explorer selon une syntaxe précise ; - Sélection des métadonnées suivantes : titre de revue, langue, type de document.