diff --git a/Niveau-1/TXM/README.md b/Niveau-1/TXM/README.md index 0493fd3..64b4d70 100644 --- a/Niveau-1/TXM/README.md +++ b/Niveau-1/TXM/README.md @@ -7,7 +7,9 @@ ### **Extraction\_Corps\_TEI.pl** -Extrait l’élément `` des fichiers .tei pour ne cibler que le texte et le transposer dans un fichier .txt. Utilise le module twig pour manipuler le format .tei. +Ce programme extrait l’élément `` des fichiers .tei pour ne cibler que le texte et le transposer dans un fichier .txt. + +Il utilise le module twig pour manipuler le format .tei. #### Syntaxe : @@ -25,7 +27,7 @@ ### **Metadata1.pl** -Constitue le fichier de métadonnées au format .csv pour le sous-corpus « Arthropode » (volume : 171 documents). Ce fichier contient 4 variables : id, corpus, journal et année. +Ce programme constitue le fichier de métadonnées au format .csv pour le sous-corpus « Arthropode » (volume : 171 documents) en l'organisant autour de 4 variables : id, corpus, journal et année. #### Syntaxe @@ -35,9 +37,7 @@ #### Données d'entrée : -Fichier de métadonnées généré par le programme [istex2wos](https://git.istex.fr/scodex/istex2wos). - -Il se présente sous la forme suivante : +Fichier de métadonnées généré par le programme [istex2wos](https://git.istex.fr/scodex/istex2wos) se présentant sous la forme suivante : ``` 1/171 @@ -59,18 +59,26 @@ ``` #### Données de sortie : -Fichier au format .csv. +Fichier au format .csv se présentant sous la forme suivante : + +``` +"id","corpus","journal","annee" +"Arthropodes_0002","Degruyter-journals","Geologica Carpathica","2012" +"Arthropodes_0003","Degruyter-journals","Travaux du Muséum National d'Histoire Naturelle "Grigore Antipa"","2011" +"Arthropodes_0004","Degruyter-journals","mammalia","2012" +"Arthropodes_0005","Degruyter-journals","Biological Letters","2011" +``` ### **Metadata2.pl** : -Constitue le fichier de métadonnées au format .csv pour l’ensemble du corpus « Systématique animale » v1. +Ce programme constitue le fichier de métadonnées au format .csv pour l’ensemble du corpus « Systématique animale » v1. -Comme ce corpus est trop volumineux pour être utilisé tel quel dans TXM, ce programme ajoute une variable supplémentaire, sous-corpus, qui permettra de réaliser une partition pour chacun des sous-corpus. +Comme ce corpus est trop volumineux pour être utilisé tel quel dans TXM, il ajoute une variable supplémentaire, "sous-corpus", qui permettra de réaliser une partition pour chacun des sous-corpus. -#### Syntaxe (à corriger) +#### Syntaxe ``` -Perl nom_du_script -d nom_du_répertoire -o nom_du_fichier_sortie +Perl Metadata2.pl -d nom_du_répertoire -o nom_du_fichier_sortie ``` ### **Extraction_Infos_Depuis_wos.pl** :