diff --git a/Niveau-1/README.md b/Niveau-1/README.md index 47de9f5..358a7c2 100644 --- a/Niveau-1/README.md +++ b/Niveau-1/README.md @@ -24,3 +24,5 @@ La jonction entre les noms d'espèces présents dans le corpus et les fréquences d'occurrence des noms ressemblant à des noms d'espèces est réalisée grâce à des tableaux croisés dynamiques dans **[Calc](https://www.openoffice.org/product/calc.html)**. Les documents ayant un nombre de noms d'espèces égal à 0 sont considérés comme du bruit. + +Le logiciel d'analyse et de visualisation de données **[ezVIS](http://www.inist.fr/?ezVIS-un-outil-libre-pour-analyser)** est ensuite utilisé pour naviguer dans le contenu du corpus à travers des statistiques sur différentes informations bibliographiques (**[Exploration Niveau 0](https://git.istex.fr/scodex/explore-corpus/tree/master/Niveau-0)**). diff --git a/Niveau-1/TXM/Extraction_Infos_Depuis_wos.pl b/Niveau-1/TXM/Extraction_Infos_Depuis_wos.pl deleted file mode 100755 index c0faea3..0000000 --- a/Niveau-1/TXM/Extraction_Infos_Depuis_wos.pl +++ /dev/null @@ -1,116 +0,0 @@ -#!/usr/bin/perl -use strict; -use warnings; -use utf8; -use open qw/:std :utf8/; - -use Getopt::Long; - -my ($programme) = $0 =~ m|^(?:.*/)?(.+)|; - -my $input = ""; -my $output = "metadata.txt"; - -eval { - $SIG{__WARN__} = sub {usage(1);}; - GetOptions( - "input=s" => \$input, - "output=s" => \$output, - ); - }; -$SIG{__WARN__} = sub {warn $_[0];}; - -usage(2) if not $input; - -open(WOS, "<:utf8", $input) or die "Couldn't open file \"$input\", $!"; -open(META, ">:utf8", $output) or die "Couldn't open file \"$output\", $!"; - -print META "TI;SO;LA;DT;AB;PU;J9;PY;SC;UT\n"; - -my @valeurs = (); - -foreach my $ligne () -{ - chomp($ligne); - $ligne =~ s/\r//go; - if ($ligne =~ /^TI (.*)/o) - { - $valeurs[0] = "$1"; - # équivalent à - # $valeurs[0] = substr($ligne, 3); - } - elsif ($ligne =~ /^SO (.*)/o) - { - $valeurs[1] = "$1"; - } - elsif ($ligne =~ /^LA (.*)/o) - { - $valeurs[2] = "$1"; - } - elsif ($ligne =~ /^DT (.*)/o) - { - $valeurs[3] = "$1"; - } - elsif ($ligne =~ /^AB (.*)/o) - { - $valeurs[4] = "$1"; - } - elsif ($ligne =~ /^PU (.*)/o) - { - $valeurs[5] = "$1"; - } - elsif ($ligne =~ /^J9 (.*)/o) - { - $valeurs[6] = "$1"; - } - elsif ($ligne =~ /^PY (.*)/o) - { - $valeurs[7] = "$1"; - } - elsif ($ligne =~ /^SC (.*)/o) - { - $valeurs[8] = "$1"; - } - elsif ($ligne =~ /UT ISTEX:(.*)/o) - { - my $lien = $1; - $valeurs[9] = "".$lien.""; - } - elsif ($ligne =~ /^ER/o) - { - foreach my $valeur (@valeurs) - { - if ($valeur =~ /[,;"]/o)#pour proteger les valeurs au format CSV - { - $valeur =~ s/"/""/go; - $valeur = '"' . $valeur . '"'; - } - } - print META join(";", @valeurs), "\n"; - @valeurs = (); - } -} -close WOS; -close META; - - -exit 0; - -sub usage -{ -my $code = shift; - -print "Usage : $programme -i input [ -o output ]\n"; - -exit $code; -} - - - - - - - - - - diff --git a/Niveau-1/TXM/README.md b/Niveau-1/TXM/README.md index 64b4d70..2548f97 100644 --- a/Niveau-1/TXM/README.md +++ b/Niveau-1/TXM/README.md @@ -80,7 +80,3 @@ ``` Perl Metadata2.pl -d nom_du_répertoire -o nom_du_fichier_sortie ``` - -### **Extraction_Infos_Depuis_wos.pl** : - -Programme à décrire