explore-corpus / Niveau-1 / TXM /
@sabine sabine authored on 1 Dec 2017
..
Extraction_Corps_TEI.pl second commit 8 years ago
Extraction_Infos_Depuis_wos.pl 6commits 8 years ago
Metadata1.pl 6commits 8 years ago
Metadata2.pl 6commits 8 years ago
README.md Update README.md 8 years ago
README.md

Préparation des données d'import dans TXM

Programme

  • Extraction_Corps_TEI.pl : extrait l’élément des fichiers .tei vers un fichier .txt. Utilise le module twig pour manipuler le format .tei.

Syntaxe

Perl Extraction_Corps_TEI.pl -i input_WOS -o output
  • Metadata1.pl : constitue le fichier de métadonnées au format .csv pour le sous-corpus « Arthropode ». Ce fichier contient 4 variables : id, corpus, journal et année.

Syntaxe

Perl nom_du_script -i nom_du_fichier_métadonnée -o nom_du_fichier_sortie
  • Metadata2.pl : constitue le fichier de métadonnées au format .csv pour l’ensemble du corpus « Systématique animale » v1. Ce fichier contient 4 variables : id, corpus, journal et année.