diff --git a/corhal-dumps-config.json b/corhal-dumps-config.json new file mode 100644 index 0000000..1e3814c --- /dev/null +++ b/corhal-dumps-config.json @@ -0,0 +1,70 @@ +{ + "environnement": { + "CRON_VERBOSE": true, + "EZS_VERBOSE": true, + "NODE_OPTIONS": "--max_old_space_size=1024", + "NODE_ENV": "production" + }, + "tasks": [ + { + "CronRule": "0 1 * * *", + "FileName": "corhal-candidats-hal-green-json", + "RunOnStartup": false + }, + { + "CronRule": "30 1 * * *", + "FileName": "corhal-candidats-hal-json", + "RunOnStartup": false + }, + { + "CronRule": "0 2 * * *", + "FileName": "corhal-candidats-nonhal-2014-json", + "RunOnStartup": false + }, + { + "CronRule": "30 2 * * *", + "FileName": "corhal-candidats-nonhal-2015-json", + "RunOnStartup": false + }, + { + "CronRule": "0 3 * * *", + "FileName": "corhal-candidats-nonhal-2016-json", + "RunOnStartup": false + }, + { + "CronRule": "30 3 * * *", + "FileName": "corhal-candidats-nonhal-2017-json", + "RunOnStartup": false + }, + { + "CronRule": "0 4 * * *", + "FileName": "corhal-candidats-nonhal-2018-json", + "RunOnStartup": false + }, + { + "CronRule": "30 4 * * *", + "FileName": "corhal-candidats-nonhal-2019-json", + "RunOnStartup": false + }, + { + "CronRule": "0 5 * * *", + "FileName": "corhal-candidats-nonhal-2020-json", + "RunOnStartup": false + }, + { + "CronRule": "30 5 * * *", + "FileName": "corhal-candidats-nonhal-2021-json", + "RunOnStartup": false + }, + { + "CronRule": "0 6 * * *", + "FileName": "corhal-candidats-nonhal-2022-json", + "RunOnStartup": true + }, + { + "CronRule": "0 7 * * *", + "FileName": "corhal-hal-green-json", + "RunOnStartup": true + } + ] +} diff --git a/corhal-dumps/corhal-candidats-hal-green-json.ini b/corhal-dumps/corhal-candidats-hal-green-json.ini new file mode 100644 index 0000000..541504f --- /dev/null +++ b/corhal-dumps/corhal-candidats-hal-green-json.ini @@ -0,0 +1,60 @@ +[use] +plugin = basics +plugin = conditor +plugin = lodex + +[env] +path = currentDate +value = thru(() => new Date()).thru(d => d.getDay()).thru(i => ['Dimanche', 'Lundi', 'Mardi', 'Mercredi', 'Jeudi', 'Vendredi', 'Samedi'][i]).thru(m => env('Startup') ? 'Startup' : m) + +; +; +; Notices de 2014-2022 (jusqu'à maintenant) : +; - **présentes** dans HAL +; - sans lien vers un document plein text +; - respectant les contraintes CCSD d'import (possédant un code RNSR et une catégorie scientifique) +; - identifié par Unpaywall comme étant en open access +; - identifié par Unpaywall comme étant en open access GREEN +; +; fichier généré au format json +; +; + +[replace] +path = q +value = fix('business.sourceUidChain:*hal* AND business.authorsRnsr:* AND classifications.enrichments.hal.code:* AND enrichments.openAccess.unpaywall.isOa:true AND -fulltextUrl:http* AND enrichments.openAccess.unpaywall.oaStatus:green') + + +[CORHALFetch] +url = https://corhal-api.inist.fr +retries = 3 +timeout = 60000 + + +[replace] +path = url +value = get('business.sourceUidChain').prepend('https://corhal-api.inist.fr/mergedDocuments/') + +[URLFetch] +url = get('url') +json = true +target = result +timeout = 60000 +noerror = true + +[exchange] +value = get('result') + +[dump] +indent = true + +[FILESave] +location = fix(`${env('PWD')}/public/${env('FileName')}`) +identifier = fix(`${env('FileName')}-${env('currentDate')}.json`) +compress = true + +[exchange] +value = get('filename').append(' generated.') + +[dump] +indent = true diff --git a/corhal-dumps/corhal-candidats-hal-json.ini b/corhal-dumps/corhal-candidats-hal-json.ini new file mode 100644 index 0000000..761ae58 --- /dev/null +++ b/corhal-dumps/corhal-candidats-hal-json.ini @@ -0,0 +1,57 @@ +[use] +plugin = basics +plugin = conditor +plugin = lodex + +[env] +path = currentDate +value = thru(() => new Date()).thru(d => d.getDay()).thru(i => ['Dimanche', 'Lundi', 'Mardi', 'Mercredi', 'Jeudi', 'Vendredi', 'Samedi'][i]).thru(m => env('Startup') ? 'Startup' : m) + + +; +; +; Notices de 2014-2022 (jusqu'à maintenant) : +; - **présentes** dans HAL +; - sans lien vers un document fulltext +; - respectant les contraintes CCSD d'import (possédant un code RNSR et une catégorie scientifique) +; - identifiées par Unpaywall comme étant en open access +; +; fichier généré au format json +; +; + +[replace] +path = q +value = fix('business.sourceUidChain:*hal* AND business.authorsRnsr:* AND classifications.enrichments.hal.code:* AND enrichments.openAccess.unpaywall.isOa:true AND -fulltextUrl:http*') + +[CORHALFetch] +url = https://corhal-api.inist.fr +retries = 3 +timeout = 60000 + +[replace] +path = url +value = get('business.sourceUidChain').prepend('https://corhal-api.inist.fr/mergedDocuments/') + +[URLFetch] +url = get('url') +json = true +target = result +timeout = 60000 + +[exchange] +value = get('result') + +[dump] +indent = true + +[FILESave] +location = fix(`${env('PWD')}/public/${env('FileName')}`) +identifier = fix(`${env('FileName')}-${env('currentDate')}.json`) +compress = true + +[exchange] +value = get('filename').append(' generated.') + +[dump] +indent = true diff --git a/corhal-dumps/corhal-candidats-nonhal-2014-json.ini b/corhal-dumps/corhal-candidats-nonhal-2014-json.ini new file mode 100644 index 0000000..b61908d --- /dev/null +++ b/corhal-dumps/corhal-candidats-nonhal-2014-json.ini @@ -0,0 +1,55 @@ +[use] +plugin = basics +plugin = conditor +plugin = lodex + +[env] +path = currentDate +value = thru(() => new Date()).thru(d => d.getDay()).thru(i => ['Dimanche', 'Lundi', 'Mardi', 'Mercredi', 'Jeudi', 'Vendredi', 'Samedi'][i]).thru(m => env('Startup') ? 'Startup' : m) + +; +; +; Notices de 2014 : +; - non présentes dans HAL (selon les critères paramétrés dans le module de dédoublonnage) +; - respectant les contraintes CCSD d'import (possédant un code RNSR et une catégorie scientifique) +; - identifiées par Unpaywall comme étant en open access +; +; fichier généré au format json +; +; + +[replace] +path = q +value = fix('(host.publicationDate.normalized:2014 OR host.electronicPublicationDate.normalized:2014) AND -business.sourceUidChain:*hal* AND business.authorsRnsr:* AND classifications.enrichments.hal.code:* AND enrichments.openAccess.unpaywall.isOa:true') + +[CORHALFetch] +url = https://corhal-api.inist.fr +retries = 3 +timeout = 60000 + +[replace] +path = url +value = get('business.sourceUidChain').prepend('https://corhal-api.inist.fr/mergedDocuments/') + +[URLFetch] +url = get('url') +json = true +target = result +timeout = 60000 + +[exchange] +value = get('result') + +[dump] +indent = true + +[FILESave] +location = fix(`${env('PWD')}/public/${env('FileName')}`) +identifier = fix(`${env('FileName')}-${env('currentDate')}.json`) +compress = true + +[exchange] +value = get('filename').append(' generated.') + +[dump] +indent = true diff --git a/corhal-dumps/corhal-candidats-nonhal-2015-json.ini b/corhal-dumps/corhal-candidats-nonhal-2015-json.ini new file mode 100644 index 0000000..00a61c9 --- /dev/null +++ b/corhal-dumps/corhal-candidats-nonhal-2015-json.ini @@ -0,0 +1,55 @@ +[use] +plugin = basics +plugin = conditor +plugin = lodex + +[env] +path = currentDate +value = thru(() => new Date()).thru(d => d.getDay()).thru(i => ['Dimanche', 'Lundi', 'Mardi', 'Mercredi', 'Jeudi', 'Vendredi', 'Samedi'][i]).thru(m => env('Startup') ? 'Startup' : m) + +; +; +; Notices de 2015 : +; - non présentes dans HAL (selon les critères paramétrés dans le module de dédoublonnage) +; - respectant les contraintes CCSD d'import (possédant un code RNSR et une catégorie scientifique) +; - identifiées par Unpaywall comme étant en open access +; +; fichier généré au format json +; +; + +[replace] +path = q +value = fix('(host.publicationDate.normalized:2015 OR host.electronicPublicationDate.normalized:2015) AND -business.sourceUidChain:*hal* AND business.authorsRnsr:* AND classifications.enrichments.hal.code:* AND enrichments.openAccess.unpaywall.isOa:true') + +[CORHALFetch] +url = https://corhal-api.inist.fr +retries = 3 +timeout = 60000 + +[replace] +path = url +value = get('business.sourceUidChain').prepend('https://corhal-api.inist.fr/mergedDocuments/') + +[URLFetch] +url = get('url') +json = true +target = result +timeout = 60000 + +[exchange] +value = get('result') + +[dump] +indent = true + +[FILESave] +location = fix(`${env('PWD')}/public/${env('FileName')}`) +identifier = fix(`${env('FileName')}-${env('currentDate')}.json`) +compress = true + +[exchange] +value = get('filename').append(' generated.') + +[dump] +indent = true diff --git a/corhal-dumps/corhal-candidats-nonhal-2016-json.ini b/corhal-dumps/corhal-candidats-nonhal-2016-json.ini new file mode 100644 index 0000000..eea841d --- /dev/null +++ b/corhal-dumps/corhal-candidats-nonhal-2016-json.ini @@ -0,0 +1,55 @@ +[use] +plugin = basics +plugin = conditor +plugin = lodex + +[env] +path = currentDate +value = thru(() => new Date()).thru(d => d.getDay()).thru(i => ['Dimanche', 'Lundi', 'Mardi', 'Mercredi', 'Jeudi', 'Vendredi', 'Samedi'][i]).thru(m => env('Startup') ? 'Startup' : m) + +; +; +; Notices de 2016 : +; - non présentes dans HAL (selon les critères paramétrés dans le module de dédoublonnage) +; - respectant les contraintes CCSD d'import (possédant un code RNSR et une catégorie scientifique) +; - identifiées par Unpaywall comme étant en open access +; +; fichier généré au format json +; +; + +[replace] +path = q +value = fix('(host.publicationDate.normalized:2016 OR host.electronicPublicationDate.normalized:2016) AND -business.sourceUidChain:*hal* AND business.authorsRnsr:* AND classifications.enrichments.hal.code:* AND enrichments.openAccess.unpaywall.isOa:true') + +[CORHALFetch] +url = https://corhal-api.inist.fr +retries = 3 +timeout = 60000 + +[replace] +path = url +value = get('business.sourceUidChain').prepend('https://corhal-api.inist.fr/mergedDocuments/') + +[URLFetch] +url = get('url') +json = true +target = result +timeout = 60000 + +[exchange] +value = get('result') + +[dump] +indent = true + +[FILESave] +location = fix(`${env('PWD')}/public/${env('FileName')}`) +identifier = fix(`${env('FileName')}-${env('currentDate')}.json`) +compress = true + +[exchange] +value = get('filename').append(' generated.') + +[dump] +indent = true diff --git a/corhal-dumps/corhal-candidats-nonhal-2017-json.ini b/corhal-dumps/corhal-candidats-nonhal-2017-json.ini new file mode 100644 index 0000000..16c06b9 --- /dev/null +++ b/corhal-dumps/corhal-candidats-nonhal-2017-json.ini @@ -0,0 +1,55 @@ +[use] +plugin = basics +plugin = conditor +plugin = lodex + +[env] +path = currentDate +value = thru(() => new Date()).thru(d => d.getDay()).thru(i => ['Dimanche', 'Lundi', 'Mardi', 'Mercredi', 'Jeudi', 'Vendredi', 'Samedi'][i]).thru(m => env('Startup') ? 'Startup' : m) + +; +; +; Notices de 2017 : +; - non présentes dans HAL (selon les critères paramétrés dans le module de dédoublonnage) +; - respectant les contraintes CCSD d'import (possédant un code RNSR et une catégorie scientifique) +; - identifiées par Unpaywall comme étant en open access +; +; fichier généré au format json +; +; + +[replace] +path = q +value = fix('(host.publicationDate.normalized:2017 OR host.electronicPublicationDate.normalized:2017) AND -business.sourceUidChain:*hal* AND business.authorsRnsr:* AND classifications.enrichments.hal.code:* AND enrichments.openAccess.unpaywall.isOa:true') + +[CORHALFetch] +url = https://corhal-api.inist.fr +retries = 3 +timeout = 60000 + +[replace] +path = url +value = get('business.sourceUidChain').prepend('https://corhal-api.inist.fr/mergedDocuments/') + +[URLFetch] +url = get('url') +json = true +target = result +timeout = 60000 + +[exchange] +value = get('result') + +[dump] +indent = true + +[FILESave] +location = fix(`${env('PWD')}/public/${env('FileName')}`) +identifier = fix(`${env('FileName')}-${env('currentDate')}.json`) +compress = true + +[exchange] +value = get('filename').append(' generated.') + +[dump] +indent = true diff --git a/corhal-dumps/corhal-candidats-nonhal-2018-json.ini b/corhal-dumps/corhal-candidats-nonhal-2018-json.ini new file mode 100644 index 0000000..681cfe3 --- /dev/null +++ b/corhal-dumps/corhal-candidats-nonhal-2018-json.ini @@ -0,0 +1,55 @@ +[use] +plugin = basics +plugin = conditor +plugin = lodex + +[env] +path = currentDate +value = thru(() => new Date()).thru(d => d.getDay()).thru(i => ['Dimanche', 'Lundi', 'Mardi', 'Mercredi', 'Jeudi', 'Vendredi', 'Samedi'][i]).thru(m => env('Startup') ? 'Startup' : m) + +; +; +; Notices de 2018 : +; - non présentes dans HAL (selon les critères paramétrés dans le module de dédoublonnage) +; - respectant les contraintes CCSD d'import (possédant un code RNSR et une catégorie scientifique) +; - identifiées par Unpaywall comme étant en open access +; +; fichier généré au format json +; +; + +[replace] +path = q +value = fix('(host.publicationDate.normalized:2018 OR host.electronicPublicationDate.normalized:2018) AND -business.sourceUidChain:*hal* AND business.authorsRnsr:* AND classifications.enrichments.hal.code:* AND enrichments.openAccess.unpaywall.isOa:true') + +[CORHALFetch] +url = https://corhal-api.inist.fr +retries = 3 +timeout = 60000 + +[replace] +path = url +value = get('business.sourceUidChain').prepend('https://corhal-api.inist.fr/mergedDocuments/') + +[URLFetch] +url = get('url') +json = true +target = result +timeout = 60000 + +[exchange] +value = get('result') + +[dump] +indent = true + +[FILESave] +location = fix(`${env('PWD')}/public/${env('FileName')}`) +identifier = fix(`${env('FileName')}-${env('currentDate')}.json`) +compress = true + +[exchange] +value = get('filename').append(' generated.') + +[dump] +indent = true diff --git a/corhal-dumps/corhal-candidats-nonhal-2019-json.ini b/corhal-dumps/corhal-candidats-nonhal-2019-json.ini new file mode 100644 index 0000000..29627d0 --- /dev/null +++ b/corhal-dumps/corhal-candidats-nonhal-2019-json.ini @@ -0,0 +1,55 @@ +[use] +plugin = basics +plugin = conditor +plugin = lodex + +[env] +path = currentDate +value = thru(() => new Date()).thru(d => d.getDay()).thru(i => ['Dimanche', 'Lundi', 'Mardi', 'Mercredi', 'Jeudi', 'Vendredi', 'Samedi'][i]).thru(m => env('Startup') ? 'Startup' : m) + +; +; +; Notices de 2019 : +; - non présentes dans HAL (selon les critères paramétrés dans le module de dédoublonnage) +; - respectant les contraintes CCSD d'import (possédant un code RNSR et une catégorie scientifique) +; - identifiées par Unpaywall comme étant en open access +; +; fichier généré au format json +; +; + +[replace] +path = q +value = fix('(host.publicationDate.normalized:2019 OR host.electronicPublicationDate.normalized:2019) AND -business.sourceUidChain:*hal* AND business.authorsRnsr:* AND classifications.enrichments.hal.code:* AND enrichments.openAccess.unpaywall.isOa:true') + +[CORHALFetch] +url = https://corhal-api.inist.fr +retries = 3 +timeout = 60000 + +[replace] +path = url +value = get('business.sourceUidChain').prepend('https://corhal-api.inist.fr/mergedDocuments/') + +[URLFetch] +url = get('url') +json = true +target = result +timeout = 60000 + +[exchange] +value = get('result') + +[dump] +indent = true + +[FILESave] +location = fix(`${env('PWD')}/public/${env('FileName')}`) +identifier = fix(`${env('FileName')}-${env('currentDate')}.json`) +compress = true + +[exchange] +value = get('filename').append(' generated.') + +[dump] +indent = true diff --git a/corhal-dumps/corhal-candidats-nonhal-2020-json.ini b/corhal-dumps/corhal-candidats-nonhal-2020-json.ini new file mode 100644 index 0000000..c4ef536 --- /dev/null +++ b/corhal-dumps/corhal-candidats-nonhal-2020-json.ini @@ -0,0 +1,55 @@ +[use] +plugin = basics +plugin = conditor +plugin = lodex + +[env] +path = currentDate +value = thru(() => new Date()).thru(d => d.getDay()).thru(i => ['Dimanche', 'Lundi', 'Mardi', 'Mercredi', 'Jeudi', 'Vendredi', 'Samedi'][i]).thru(m => env('Startup') ? 'Startup' : m) + +; +; +; Notices de 2020 : +; - non présentes dans HAL (selon les critères paramétrés dans le module de dédoublonnage) +; - respectant les contraintes CCSD d'import (possédant un code RNSR et une catégorie scientifique) +; - identifiées par Unpaywall comme étant en open access +; +; fichier généré au format json +; +; + +[replace] +path = q +value = fix('(host.publicationDate.normalized:2020 OR host.electronicPublicationDate.normalized:2020) AND -business.sourceUidChain:*hal* AND business.authorsRnsr:* AND classifications.enrichments.hal.code:* AND enrichments.openAccess.unpaywall.isOa:true') + +[CORHALFetch] +url = https://corhal-api.inist.fr +retries = 3 +timeout = 60000 + +[replace] +path = url +value = get('business.sourceUidChain').prepend('https://corhal-api.inist.fr/mergedDocuments/') + +[URLFetch] +url = get('url') +json = true +target = result +timeout = 60000 + +[exchange] +value = get('result') + +[dump] +indent = true + +[FILESave] +location = fix(`${env('PWD')}/public/${env('FileName')}`) +identifier = fix(`${env('FileName')}-${env('currentDate')}.json`) +compress = true + +[exchange] +value = get('filename').append(' generated.') + +[dump] +indent = true diff --git a/corhal-dumps/corhal-candidats-nonhal-2021-json.ini b/corhal-dumps/corhal-candidats-nonhal-2021-json.ini new file mode 100644 index 0000000..def398c --- /dev/null +++ b/corhal-dumps/corhal-candidats-nonhal-2021-json.ini @@ -0,0 +1,55 @@ +[use] +plugin = basics +plugin = conditor +plugin = lodex + +[env] +path = currentDate +value = thru(() => new Date()).thru(d => d.getDay()).thru(i => ['Dimanche', 'Lundi', 'Mardi', 'Mercredi', 'Jeudi', 'Vendredi', 'Samedi'][i]).thru(m => env('Startup') ? 'Startup' : m) + +; +; +; Notices de 2021 : +; - non présentes dans HAL (selon les critères paramétrés dans le module de dédoublonnage) +; - respectant les contraintes CCSD d'import (possédant un code RNSR et une catégorie scientifique) +; - identifiées par Unpaywall comme étant en open access +; +; fichier généré au format json +; +; +[replace] +path = q +value = fix('(host.publicationDate.normalized:2021 OR host.electronicPublicationDate.normalized:2021) AND -business.sourceUidChain:*hal* AND business.authorsRnsr:* AND classifications.enrichments.hal.code:* AND enrichments.openAccess.unpaywall.isOa:true') + +[CORHALFetch] +url = https://corhal-api.inist.fr +retries = 3 +timeout = 60000 + +[replace] +path = url +value = get('business.sourceUidChain').prepend('https://corhal-api.inist.fr/mergedDocuments/') + +[URLFetch] +url = get('url') +json = true +target = result +timeout = 60000 +noerror = true + +[exchange] +value = get('result') + +[dump] +indent = true + +[FILESave] +location = fix(`${env('PWD')}/public/${env('FileName')}`) +identifier = fix(`${env('FileName')}-${env('currentDate')}.json`) +compress = true + +[exchange] +value = get('filename').append(' generated.') + +[dump] +indent = true diff --git a/corhal-dumps/corhal-candidats-nonhal-2022-json.ini b/corhal-dumps/corhal-candidats-nonhal-2022-json.ini new file mode 100644 index 0000000..ee82126 --- /dev/null +++ b/corhal-dumps/corhal-candidats-nonhal-2022-json.ini @@ -0,0 +1,55 @@ +[use] +plugin = basics +plugin = conditor +plugin = lodex + +[env] +path = currentDate +value = thru(() => new Date()).thru(d => d.getDay()).thru(i => ['Dimanche', 'Lundi', 'Mardi', 'Mercredi', 'Jeudi', 'Vendredi', 'Samedi'][i]).thru(m => env('Startup') ? 'Startup' : m) +; +; +; Notices de 2022 : +; - non présentes dans HAL (selon les critères paramétrés dans le module de dédoublonnage) +; - respectant les contraintes CCSD d'import (possédant un code RNSR et une catégorie scientifique) +; - identifiées par Unpaywall comme étant en open access +; +; fichier généré au format json +; +; + +[replace] +path = q +value = fix('(host.publicationDate.normalized:2022 OR host.electronicPublicationDate.normalized:2022) AND -business.sourceUidChain:*hal* AND business.authorsRnsr:* AND classifications.enrichments.hal.code:* AND enrichments.openAccess.unpaywall.isOa:true') + +[CORHALFetch] +url = https://corhal-api.inist.fr +retries = 3 +timeout = 60000 + +[replace] +path = url +value = get('business.sourceUidChain').prepend('https://corhal-api.inist.fr/mergedDocuments/') + +[URLFetch] +url = get('url') +json = true +target = result +timeout = 60000 +noerror = true + +[exchange] +value = get('result') + +[dump] +indent = true + +[FILESave] +location = fix(`${env('PWD')}/public/${env('FileName')}`) +identifier = fix(`${env('FileName')}-${env('currentDate')}.json`) +compress = true + +[exchange] +value = get('filename').append(' generated.') + +[dump] +indent = true diff --git a/corhal-dumps/corhal-candidats-nonhal-green-json.ini b/corhal-dumps/corhal-candidats-nonhal-green-json.ini new file mode 100644 index 0000000..f41b021 --- /dev/null +++ b/corhal-dumps/corhal-candidats-nonhal-green-json.ini @@ -0,0 +1,56 @@ +[use] +plugin = basics +plugin = conditor +plugin = lodex + +[env] +path = currentDate +value = thru(() => new Date()).thru(d => d.getDay()).thru(i => ['Dimanche', 'Lundi', 'Mardi', 'Mercredi', 'Jeudi', 'Vendredi', 'Samedi'][i]).thru(m => env('Startup') ? 'Startup' : m) + +; +; +; Notices de 2014-2022 (jusqu'à maintenant) : +; - non présentes dans HAL (selon les critères paramétrés dans le module de dédoublonnage) +; - respectant les contraintes CCSD d'import (possédant un code RNSR et une catégorie scientifique) +; - identifiées par Unpaywall comme étant en open access +; - identifiées par Unpaywall comme étant en open access GREEN +; +; fichier généré au format json +; +; +[replace] +path = q +value = fix('-business.sourceUidChain:*hal* AND business.authorsRnsr:* AND classifications.enrichments.hal.code:* AND enrichments.openAccess.unpaywall.isOa:true AND enrichments.openAccess.unpaywall.oaStatus:green') + +[CORHALFetch] +url = https://corhal-api.inist.fr +retries = 3 +timeout = 60000 + +[replace] +path = url +value = get('business.sourceUidChain').prepend('https://corhal-api.inist.fr/mergedDocuments/') + +[URLFetch] +url = get('url') +json = true +target = result +timeout = 60000 +noerror = true + +[exchange] +value = get('result') + +[dump] +indent = true + +[FILESave] +location = fix(`${env('PWD')}/public/${env('FileName')}`) +identifier = fix(`${env('FileName')}-${env('currentDate')}.json`) +compress = true + +[exchange] +value = get('filename').append(' generated.') + +[dump] +indent = true diff --git a/corhal-dumps/corhal-hal-green-json.ini b/corhal-dumps/corhal-hal-green-json.ini new file mode 100644 index 0000000..7613453 --- /dev/null +++ b/corhal-dumps/corhal-hal-green-json.ini @@ -0,0 +1,56 @@ +[use] +plugin = basics +plugin = conditor +plugin = lodex + +[env] +path = currentDate +value = thru(() => new Date()).thru(d => d.getDay()).thru(i => ['Dimanche', 'Lundi', 'Mardi', 'Mercredi', 'Jeudi', 'Vendredi', 'Samedi'][i]).thru(m => env('Startup') ? 'Startup' : m) + +; +; +; Notices de 2014-2022 (jusqu'à maintenant) : +; - **présentes** dans HAL +; - sans lien vers un document plein text +; - identifié par Unpaywall comme étant en open access +; - identifié par Unpaywall comme étant en open access GREEN +; +; fichier généré au format json +; +; +[replace] +path = q +value = fix('business.sources:hal AND business.hasFulltext:false AND enrichments.openAccess.unpaywall.isOa:true AND enrichments.openAccess.unpaywall.oaStatus:green') + +[CORHALFetch] +url = https://corhal-api.inist.fr +retries = 3 +timeout = 60000 + +[replace] +path = url +value = get('business.sourceUidChain').prepend('https://corhal-api.inist.fr/mergedDocuments/') + +[URLFetch] +url = get('url') +json = true +target = result +timeout = 60000 +noerror = true + +[exchange] +value = get('result') + +[dump] +indent = true + +[FILESave] +location = fix(`${env('PWD')}/public/${env('FileName')}`) +identifier = fix(`${env('FileName')}-${env('currentDate')}.json`) +compress = true + +[exchange] +value = get('filename').append(' generated.') + +[dump] +indent = true diff --git a/corhal-dumps/corhal-nonhal-green-json.ini b/corhal-dumps/corhal-nonhal-green-json.ini new file mode 100644 index 0000000..af70e44 --- /dev/null +++ b/corhal-dumps/corhal-nonhal-green-json.ini @@ -0,0 +1,55 @@ +[use] +plugin = basics +plugin = conditor +plugin = lodex + +[env] +path = currentDate +value = thru(() => new Date()).thru(d => d.getDay()).thru(i => ['Dimanche', 'Lundi', 'Mardi', 'Mercredi', 'Jeudi', 'Vendredi', 'Samedi'][i]).thru(m => env('Startup') ? 'Startup' : m) + +; +; +; Notices de 2014-2022 (jusqu'à maintenant) : +; - non présentes dans HAL (selon les critères paramétrés dans le module de dédoublonnage) +; - identifiées par Unpaywall comme étant en open access +; - identifiées par Unpaywall comme étant en open access GREEN +; +; fichier généré au format json +; +; +[replace] +path = q +value = fix('-business.sourceUidChain:*hal* AND enrichments.openAccess.unpaywall.isOa:true AND enrichments.openAccess.unpaywall.oaStatus:green') + +[CORHALFetch] +url = https://corhal-api.inist.fr +retries = 3 +timeout = 60000 + +[replace] +path = url +value = get('business.sourceUidChain').prepend('https://corhal-api.inist.fr/mergedDocuments/') + +[URLFetch] +url = get('url') +json = true +target = result +timeout = 60000 +noerror = true + +[exchange] +value = get('result') + +[dump] +indent = true + +[FILESave] +location = fix(`${env('PWD')}/public/${env('FileName')}`) +identifier = fix(`${env('FileName')}-${env('currentDate')}.json`) +compress = true + +[exchange] +value = get('filename').append(' generated.') + +[dump] +indent = true