diff --git a/alignement/README.md b/alignement/README.md index b87ffe5..7861c0f 100644 --- a/alignement/README.md +++ b/alignement/README.md @@ -115,7 +115,7 @@ ``` -#### 2 - Fichier résultat +#### 2 - Sortie standard Pour chaque notice Inist traitée, et sauf pour 2 exceptions que l’on verra plus loin, on a une première ligne commençant par `URI` et indiquant la requête envoyée à l’API. La ligne suivante donne le nombre de réponses obtenues. @@ -128,7 +128,7 @@ => 68 ``` -On peut ensuite trouver d’autres requêtes commençant par `ALT`, `ETC` ou `RAC`. Ces requêtes complémentaires servent soit à tester une autre stratégie de recherche (`RAC`), soit à essayer différentes valeurs pour la pagination (`ETC`) ou soit à rechercher un groupe de documents indexé dans une seule notice Inist (`ALT`). Les requêtes de type `ETC` et `RAC` sont suivies d’une ligne indiquant le nombre de réponse renvoyées par l¹API. +On peut ensuite trouver d’autres requêtes commençant par `ALT`, `ETC` ou `RAC`. Ces requêtes complémentaires servent soit à tester une autre stratégie de recherche (`RAC`), soit à essayer différentes valeurs pour la pagination (`ETC`) ou soit à rechercher un groupe de documents indexés dans une seule notice Inist (`ALT`). Les requêtes de type `ETC` et `RAC` sont suivies d’une ligne indiquant le nombre de réponse renvoyées par l¹API. Dans le cas le plus général, on a ensuite le résultat sur une ligne avec 22 champs, pas toujjours remplis, séparés par des tabulations. On a respectivement : - une note exprimée à l’aide d’astérisques (1 étoile) et de signes plus (½ étoile), de `*****` à `0` @@ -162,7 +162,30 @@ ark:/67375/VQC-DZRDKVN2-2 10.1007/s11192-007-1696-x ! ! ``` -On considère que l'alignement est bon si le score est supérieur ou égal à `3.490`. Pour les scores inférieurs à cette valeur, on a parfois un point d’exclamation `!` qui indique que les données bibliographiques sur la revue, l’année de publication, la volumaison, la tomaison (si elle existe) et la pagination sont correctes, mais que le reste des données ne correspond pas. Cela peut être dû à des fautes de frappe ou d’OCR dans les noms d’auteur ou dans le titre ou cela peut être dû à une erreur de bulletinage : le document s'est vu attribuer par exemple la pagination d’un autre article du même fascicule. On trouve de tels décalages aussi bien dans les données Inist que dans celles des éditeurs. +On considère que l'alignement est bon si le score est supérieur ou égal à `3.490`. Pour les scores inférieurs à cette valeur, on a parfois un point d’exclamation `!` qui indique que les données bibliographiques sur la revue, l’année de publication, la volumaison, la tomaison (si elle existe) et la pagination sont correctes, mais que le reste des données ne correspond pas. Cela peut être dû à des fautes de frappe ou d’OCR dans les noms d’auteur ou dans le titre, ou cela peut être dû à une erreur de bulletinage : le document s'est vu attribuer par exemple la pagination d’un autre article du même fascicule. On trouve de tels décalages aussi bien dans les données Inist que dans celles des éditeurs. +Dans deux cas, on n’a pas de requête, mais seulement un résultat nul : pour les monographies et pour les articles dont la revue n’est pas dans la base Istex. Dans le premier cas, la note est un *underscore* `_`, le score est un tiret `-` et le niveau bibliographique est `M`. Dans le deuxième cas, on a le même résultat que lorsque l’API n’a trouvé aucun document, mais sans la requête. En fait, au premier article d’une revue, on teste la présence de cette revue dans la base. Si la réponse est nulle, tous les autres articles de la même revue ne font l’objet d’aucune recherche inutile. +#### 3 - Erreur standard + +En cas d’utilisation de l’option `-v`, le programme envoie par la sortie “erreur standard” des messages sur le travail en cours. On a : + - le nom du programme et sa version (sauf dans les anciennes versions du programme) + - en cas de reprise d’un travail interrompu, le n° de la dernière notice Inist + - le nom du fichier traité ou la mention `entrée standard` + - la date et l’heure de début du traitement + - la date et l’heure auxquelles on a terminé un lot de notices correspondant à la valeur de l’option `-v` + - la date te l’heure de fin de traitement avec rappel du nombre de notices traitées + +```txt +==> matchStan2Istex.pl, version 14.3.2 (24 Août 2020) +*** Notices traitées : 2008/Pascal.strd08.bib *** + -> Mardi 29 Septembre 2020 03:27:56 : début + -> Mardi 29 Septembre 2020 03:29:47 : 10000 notices + -> Mardi 29 Septembre 2020 03:31:13 : 20000 notices + -> Mardi 29 Septembre 2020 03:32:59 : 30000 notices + ... + -> Mardi 29 Septembre 2020 04:45:50 : 480000 notices + -> Mardi 29 Septembre 2020 04:47:26 : 490000 notices + -> Mardi 29 Septembre 2020 04:48:35 : fin = 497745 notices +```