diff --git a/Docker/Dockerfile b/Docker/Dockerfile index f5f3e9e..dd06ee3 100644 --- a/Docker/Dockerfile +++ b/Docker/Dockerfile @@ -18,7 +18,8 @@ COPY ../outils/ligature/ligature.pl /usr/bin/ligature COPY ../outils/stats-corpus/statsCorpus.pl /usr/bin/statsCorpus -RUN chmod 0755 /usr/bin/harvestCorpus /usr/bin/extraitXmlEditeur /usr/bin/ligature /usr/bin/statsCorpus +RUN chmod 0755 /usr/bin/default.sh /usr/bin/harvestCorpus /usr/bin/extraitXmlEditeur \ + /usr/bin/ligature /usr/bin/statsCorpus # Install necessary tools and clean up diff --git a/Docker/README.md b/Docker/README.md index e69de29..f9f0567 100644 --- a/Docker/README.md +++ b/Docker/README.md @@ -0,0 +1,26 @@ +Dockerfile +========== + +Fichier “Dockerfile” pour créer une image contenant `harvestCorpus` et les différents outils +développés pour traiter les corpus téléchargés depuis ISTEX. + +#### Créer une image Docker + +``` + docker build -t istex/corpus . +``` + +#### Utiliser l’image Docker + +Dans le cas de l’exemple d’utilisation d’un fichier `.corpus` avec le programme `harvestCorpus` +en supposant que : + + * l’utilisateur a l’identifiant (ou [UID](https://fr.wikipedia.org/wiki/User_identifier)) 1002 + * son fichier `.corpus` s’appelle “exemple.corpus” + * il veut télécharger les métadonnées en JSON et en Mods + * le répertoire devant recevoir les fichier s’appelle “Metadata” + +``` + docker run --rm -u 1002 -v `pwd`:/tmp istex/corpus harvestCorpus -c exemple.corpus -m json,mods -d Metadata +``` +