diff --git a/outils/stats-corpus/README.md b/outils/stats-corpus/README.md index 8742c35..5bbe950 100644 --- a/outils/stats-corpus/README.md +++ b/outils/stats-corpus/README.md @@ -47,7 +47,7 @@ ### Données extraites -Pour l’instant, on a 17 champs : +Pour l’instant, on a 18 champs : * Identifiant ISTEX * Identifiant ARK @@ -65,5 +65,6 @@ * Type de document (par exemple “research-article”) * Catégories Web of Science * Catégories Science-Metrix + * Catégories Scopus * Catégories INIST diff --git a/outils/stats-corpus/statsCorpus.pl b/outils/stats-corpus/statsCorpus.pl index 77c3ece..45dc422 100755 --- a/outils/stats-corpus/statsCorpus.pl +++ b/outils/stats-corpus/statsCorpus.pl @@ -18,8 +18,8 @@ my ($programme) = $0 =~ m|^(?:.*/)?(.+)|; -my $version = "1.5.3"; -my $dateModif = "7 Mars 2018"; +my $version = "1.6.1"; +my $dateModif = "26 Mars 2018"; # Variables my $aide = 0; @@ -137,7 +137,8 @@ } print OUT "\x{FEFF}Identifiant ISTEX\tARK\tNom de fichier\tÉditeur\tScore qualité\tVersion PDF"; print OUT "\tXML structuré\tDate de publication\tTitre\tRevue\tISSN\te-ISSN\tType de publication"; -print OUT "\tType de document\tCatégories WoS\tCatégories Science-Metrix\tCatégories INIST\n"; +print OUT "\tType de document\tCatégories WoS\tCatégories Science-Metrix\tCatégories Scopus\t"; +print OUT "Catégories INIST\n"; if ( $logfile ) { open(INP, "<:raw", $logfile) or die "$!,"; @@ -257,6 +258,7 @@ } my $wos = ""; my $scienceMetrix = ""; +my $scopus = ""; my $inist = ""; if ( defined $hit{'categories'} ) { my %categories = %{$hit{'categories'}}; @@ -266,6 +268,9 @@ if ( defined $categories{'scienceMetrix'} ) { $scienceMetrix = join(" ; ", @{$categories{'scienceMetrix'}}); } + if ( defined $categories{'scopus'} ) { + $scopus = join(" ; ", @{$categories{'scopus'}}); + } if ( defined $categories{'inist'} ) { $inist = join(" ; ", @{$categories{'inist'}}); } @@ -355,68 +360,10 @@ elsif ( $corpusName eq 'wiley' ) { $structure = "Oui" if $texte =~ /\s*\s*\s*\s*/oi; -# } -# # Brill -# elsif ( $texte =~ m|http://dtd.nlm.nih.gov/publishing|o or -# $texte =~ m|Brill|o ) { -# $structure = "Oui" if $texte =~ /\s*<(sec|p)\b/o; -# } -# # OUP -# elsif ( $texte =~ m|Oxford University Press|o ) { -# $structure = "Oui" if $texte =~ /\s*Emerald Group Publishing Limited|o or -# $texte =~ m|MCB UP Ltd|o ) { -# $structure = "Oui" if $texte =~ /\s*\s*(BMJ|British Medical Journal) Publishing Group/o or -# $texte =~ m|//NLM//DTD Journal Archiving and Interchange DTD|o ) { -# $structure = "Oui" if $texte =~ /\s*<(sec|p)\b/o; -# } -# # Nature -# elsif ( $texte =~ m|"-//NPG//DTD XML Article//EN"|o ) { -# $structure = "Oui" if $texte =~ m|\s*

|o; -# } -# # RSC -# elsif ( $texte =~ m|http://www.rsc.org/|o ) { -# $structure = "Oui" if $texte =~ m|\s*

Sage Publications|o ) { -# $structure = "Oui" if $texte =~ /\s*<(sec|p)\b/; -# } -# # Degruyter ou -# # Cambridge University Publishing (CUP) -# elsif ( $texte =~ m|-//NLM//DTD JATS \(Z39.96\) Journal Publishing DTD|o or # Cambridge -# $texte =~ m|-//Atypon//DTD Atypon Systems .+ NLM DTD|o or # Degruyter -# $texte =~ m|-//NLM//DTD Journal Publishing DTD|o ) { # Degruyter ou Cambridge ou Sage -# $structure = "Oui" if $texte =~ /\s*<(sec|p)\b/; -# } -# # Springer -# elsif ( $texte =~ m|-//Springer-Verlag//DTD|o ) { -# $structure = "Non" if $texte =~ m|\s*