diff --git "a/corhal-dumps/01-query/corhal-candidats-hal \050readme\051.md" "b/corhal-dumps/01-query/corhal-candidats-hal \050readme\051.md" new file mode 100644 index 0000000..dd8b430 --- /dev/null +++ "b/corhal-dumps/01-query/corhal-candidats-hal \050readme\051.md" @@ -0,0 +1,12 @@ +; +; +; Notices de 2014-2022 (jusqu'à maintenant) : +; - **présentes** dans HAL +; - sans lien vers un document plein text +; - identifié par Unpaywall comme étant en open access +; - respectant les contraintes CCSD d'import (possédant un code RNSR et une catégorie scientifique) +; +; fichier généré au format json +; +; + diff --git "a/corhal-dumps/01-query/corhal-candidats-hal-json \050readme\051.md" "b/corhal-dumps/01-query/corhal-candidats-hal-json \050readme\051.md" deleted file mode 100644 index dd8b430..0000000 --- "a/corhal-dumps/01-query/corhal-candidats-hal-json \050readme\051.md" +++ /dev/null @@ -1,12 +0,0 @@ -; -; -; Notices de 2014-2022 (jusqu'à maintenant) : -; - **présentes** dans HAL -; - sans lien vers un document plein text -; - identifié par Unpaywall comme étant en open access -; - respectant les contraintes CCSD d'import (possédant un code RNSR et une catégorie scientifique) -; -; fichier généré au format json -; -; - diff --git a/corhal-dumps/01-query/corhal-candidats-hal-json.txt b/corhal-dumps/01-query/corhal-candidats-hal-json.txt deleted file mode 100644 index a705dd6..0000000 --- a/corhal-dumps/01-query/corhal-candidats-hal-json.txt +++ /dev/null @@ -1,4 +0,0 @@ -business.sources:hal AND business.hasFulltext:false -AND enrichments.openAccess.unpaywall.isOa:true -AND business.authorsRnsr:* -AND classifications.enrichments.hal.code:* diff --git a/corhal-dumps/01-query/corhal-candidats-hal.txt b/corhal-dumps/01-query/corhal-candidats-hal.txt new file mode 100644 index 0000000..a705dd6 --- /dev/null +++ b/corhal-dumps/01-query/corhal-candidats-hal.txt @@ -0,0 +1,4 @@ +business.sources:hal AND business.hasFulltext:false +AND enrichments.openAccess.unpaywall.isOa:true +AND business.authorsRnsr:* +AND classifications.enrichments.hal.code:* diff --git "a/corhal-dumps/01-query/corhal-candidats-nonhal \050readme\051.md" "b/corhal-dumps/01-query/corhal-candidats-nonhal \050readme\051.md" new file mode 100644 index 0000000..e7fa801 --- /dev/null +++ "b/corhal-dumps/01-query/corhal-candidats-nonhal \050readme\051.md" @@ -0,0 +1,11 @@ +; +; +; Notices de 2014-2022 (jusqu'à maintenant) : +; - non présentes dans HAL (selon les critères paramétrés dans le module de dédoublonnage) +; - identifiées par Unpaywall comme étant en open access (et dont le document n'est pas un lien vers HAL) +; - respectant les contraintes CCSD d'import (possédant un code RNSR et une catégorie scientifique) +; +; fichier généré au format json +; +; + diff --git "a/corhal-dumps/01-query/corhal-candidats-nonhal-json \050readme\051.md" "b/corhal-dumps/01-query/corhal-candidats-nonhal-json \050readme\051.md" deleted file mode 100644 index e7fa801..0000000 --- "a/corhal-dumps/01-query/corhal-candidats-nonhal-json \050readme\051.md" +++ /dev/null @@ -1,11 +0,0 @@ -; -; -; Notices de 2014-2022 (jusqu'à maintenant) : -; - non présentes dans HAL (selon les critères paramétrés dans le module de dédoublonnage) -; - identifiées par Unpaywall comme étant en open access (et dont le document n'est pas un lien vers HAL) -; - respectant les contraintes CCSD d'import (possédant un code RNSR et une catégorie scientifique) -; -; fichier généré au format json -; -; - diff --git a/corhal-dumps/01-query/corhal-candidats-nonhal-json.txt b/corhal-dumps/01-query/corhal-candidats-nonhal-json.txt deleted file mode 100644 index a20bdb0..0000000 --- a/corhal-dumps/01-query/corhal-candidats-nonhal-json.txt +++ /dev/null @@ -1 +0,0 @@ --business.sources:hal AND business.authorsRnsr:* AND classifications.enrichments.hal.code:* AND enrichments.openAccess.unpaywall.isOa:true AND -fulltextUrl:(*//hal.* OR *//www.hal.* *//hal-* OR *archives-ouvertes.fr*) diff --git a/corhal-dumps/01-query/corhal-candidats-nonhal.txt b/corhal-dumps/01-query/corhal-candidats-nonhal.txt new file mode 100644 index 0000000..a20bdb0 --- /dev/null +++ b/corhal-dumps/01-query/corhal-candidats-nonhal.txt @@ -0,0 +1 @@ +-business.sources:hal AND business.authorsRnsr:* AND classifications.enrichments.hal.code:* AND enrichments.openAccess.unpaywall.isOa:true AND -fulltextUrl:(*//hal.* OR *//www.hal.* *//hal-* OR *archives-ouvertes.fr*) diff --git "a/corhal-dumps/01-query/corhal-potentials-hal \050readme\051.md" "b/corhal-dumps/01-query/corhal-potentials-hal \050readme\051.md" new file mode 100644 index 0000000..06e3af5 --- /dev/null +++ "b/corhal-dumps/01-query/corhal-potentials-hal \050readme\051.md" @@ -0,0 +1,11 @@ +; +; +; Notices de 2014-2022 (jusqu'à maintenant) : +; - **présentes** dans HAL +; - sans lien vers un document plein text +; - identifié par Unpaywall comme étant en open access +; +; fichier généré au format json +; +; + diff --git "a/corhal-dumps/01-query/corhal-potentials-hal-json \050readme\051.md" "b/corhal-dumps/01-query/corhal-potentials-hal-json \050readme\051.md" deleted file mode 100644 index 06e3af5..0000000 --- "a/corhal-dumps/01-query/corhal-potentials-hal-json \050readme\051.md" +++ /dev/null @@ -1,11 +0,0 @@ -; -; -; Notices de 2014-2022 (jusqu'à maintenant) : -; - **présentes** dans HAL -; - sans lien vers un document plein text -; - identifié par Unpaywall comme étant en open access -; -; fichier généré au format json -; -; - diff --git a/corhal-dumps/01-query/corhal-potentials-hal-json.txt b/corhal-dumps/01-query/corhal-potentials-hal-json.txt deleted file mode 100644 index 1672ae0..0000000 --- a/corhal-dumps/01-query/corhal-potentials-hal-json.txt +++ /dev/null @@ -1 +0,0 @@ -business.sources:hal AND business.hasFulltext:false AND enrichments.openAccess.unpaywall.isOa:true diff --git a/corhal-dumps/01-query/corhal-potentials-hal.txt b/corhal-dumps/01-query/corhal-potentials-hal.txt new file mode 100644 index 0000000..1672ae0 --- /dev/null +++ b/corhal-dumps/01-query/corhal-potentials-hal.txt @@ -0,0 +1 @@ +business.sources:hal AND business.hasFulltext:false AND enrichments.openAccess.unpaywall.isOa:true diff --git "a/corhal-dumps/01-query/corhal-potentials-nonhal \050readme\051.md" "b/corhal-dumps/01-query/corhal-potentials-nonhal \050readme\051.md" new file mode 100644 index 0000000..3c72a6b --- /dev/null +++ "b/corhal-dumps/01-query/corhal-potentials-nonhal \050readme\051.md" @@ -0,0 +1,10 @@ +; +; +; Notices de 2014-2022 (jusqu'à maintenant) : +; - non présentes dans HAL (selon les critères paramétrés dans le module de dédoublonnage) +; - identifiées par Unpaywall comme étant en open access (et dont le document n'est pas un lien vers HAL) +; +; fichier généré au format json +; +; + diff --git "a/corhal-dumps/01-query/corhal-potentials-nonhal-json \050readme\051.md" "b/corhal-dumps/01-query/corhal-potentials-nonhal-json \050readme\051.md" deleted file mode 100644 index 3c72a6b..0000000 --- "a/corhal-dumps/01-query/corhal-potentials-nonhal-json \050readme\051.md" +++ /dev/null @@ -1,10 +0,0 @@ -; -; -; Notices de 2014-2022 (jusqu'à maintenant) : -; - non présentes dans HAL (selon les critères paramétrés dans le module de dédoublonnage) -; - identifiées par Unpaywall comme étant en open access (et dont le document n'est pas un lien vers HAL) -; -; fichier généré au format json -; -; - diff --git a/corhal-dumps/01-query/corhal-potentials-nonhal-json.txt b/corhal-dumps/01-query/corhal-potentials-nonhal-json.txt deleted file mode 100644 index 75e08b9..0000000 --- a/corhal-dumps/01-query/corhal-potentials-nonhal-json.txt +++ /dev/null @@ -1,2 +0,0 @@ --business.sources:hal AND enrichments.openAccess.unpaywall.isOa:true AND -fulltextUrl:(*//hal.* OR *//www.hal.* *//hal-* OR *archives-ouvertes.fr*) - diff --git a/corhal-dumps/01-query/corhal-potentials-nonhal.txt b/corhal-dumps/01-query/corhal-potentials-nonhal.txt new file mode 100644 index 0000000..75e08b9 --- /dev/null +++ b/corhal-dumps/01-query/corhal-potentials-nonhal.txt @@ -0,0 +1,2 @@ +-business.sources:hal AND enrichments.openAccess.unpaywall.isOa:true AND -fulltextUrl:(*//hal.* OR *//www.hal.* *//hal-* OR *archives-ouvertes.fr*) + diff --git a/corhal-dumps/Makefile b/corhal-dumps/Makefile index b348011..a472f05 100644 --- a/corhal-dumps/Makefile +++ b/corhal-dumps/Makefile @@ -1,5 +1,5 @@ # Aliases -corhal: corhal-candidats-hal-json corhal-candidats-nonhal-json corhal-potentials-hal-json corhal-potentials-nonhal-json +corhal: corhal-candidats-hal corhal-candidats-nonhal corhal-potentials-hal corhal-potentials-nonhal # To set specific directory for each version ifeq ($(strip $(Startup)),) @@ -58,7 +58,7 @@ mkdir -p $(@D) time ezs $(EZSFLAGS) 02-download.ini < $< > $@.crdownload mv $@.crdownload $@ - ls -lhag $@ |sed -re 's/^[^ ]* //' >> "$(subst json,log,$@)" + ls -lhag $@ |sed -re 's/^[^ ]* //' >> "$(subst .json,.log,$@)" 02-download/$(VERSION_DIR)/%.json.gz: 02-download/$(VERSION_DIR)/%.json gzip $<