Objectif du module :
Le module effectue les opérations suivantes :
docObject
, ainsi que d'une callback cb
.Commande d'Installation :
npm install
🚧 Note importante : la variable d'environnement $CORPUSES_ROOT
doit être définie. Elle correspond au chemin du répertoire dans lequel seront stockés les fichiers moissonnés.
Commande d'exécution des tests unitaires :
npm test
{ corpusName: "hal", cartoType: "conditor:pubmed", corpusResources: "/applis/corhal/loadistex/corpus-resources", corpusOutput: "/applis/corhal/corpusOutput" }
{ corpusName: "hal", cartoType: "conditor:pubmed", corpusResources: "/applis/corhal/loadistex/corpus-resources", corpusOutput: "/applis/corhal/corpusOutput", corpusRoot: "/data/hal-20211121-to-20211121" }
. ├── node_modules │ └── ... ├── config/ │ ├── config.js // Fichier de configuration, du proxy et url de l'api │ │ │ └── query.json // Les paramètres de recherche de query ├── lib/ │ └── utils.js // Des fonctions 'utils' utilisées dans index.js ├── test │ ├── dataset // Ensemble des docObjects utilisés pour les tests │ │ └── ... │ └── run.js // Ensemble des tests à effectuer ├── .eslintrc.json // Configuration pour eslint ├── .gitignore ├── README.md // Le fichier que vous lisez actuellement ├── index.js // Script principal contenant la méthode doTheJob └── package.json // Fichier contenant les dépendances NPM
Le fichier config/query.json contient l'ensemble des paramètres de recherche à utiliser pour l'interrogation de l'api HAL
{ "fq": [""], // Liste des filtres a utiliser pour limiter les résultats retournés. "fl": "", // La liste des champs a retourner dans la recherche, séparés par , "q": "", // La requête. "rows": "", // Le nombre de réponses à retourner. "sort": "", // Pour trier les résultats. "cursorMark": "*" // Curseur utilisé pour parcourir plusieurs milliers de résultats. }
Le fichier config/config.js de configuration
{ "halApi":"", // L'adresse url de l'api Hal "maxRetry":2 // Nombre des retries en cas d'échec lors de l'interrogation de l'api HAL }
Code | Signification | Note(s) |
---|---|---|
FolderExistError | Harvest folder already exist. | |
FetchError | API-HAL request error. | |
NoResultFound | No result found to harvest. | |
MissingEnvironmentVariable | A required environment variable must be set |