Préparation des données d'import dans TXM ========================================= **Programmes** * *Extraction\_Corps\_TEI.pl* : extrait l’élément <body> des fichiers .tei vers un fichier .txt. Utilise le module twig pour manipuler le format .tei. Syntaxe ``` Perl nom_du_script -i nom_du_fichier_WOS -o nom_du_fichier_sortie ``` * *Metadata1.pl* : constitue le fichier de métadonnées au format .csv pour le sous-corpus « Arthropode ». Ce fichier contient 4 variables : id, corpus, journal et année. Syntaxe ``` Perl nom_du_script -i nom_du_fichier_métadonnée -o nom_du_fichier_sortie ``` * *Metadata2.pl* : constitue le fichier de métadonnées au format .csv pour l’ensemble du corpus « Systématique animale » v1. Comme ce corpus est trop volumineux pour être utilisé tel quel dans TXM, ce programme ajoute une variable supplémentaire : sous-corpus.