| |
---|
| | |
---|
| | |
---|
| | |
---|
| | |
---|
| | |
---|
| | DOC_IDX= |
---|
| | PAGE= |
---|
| | |
---|
| | |
---|
| | |
---|
| | |
---|
| | JQ= "jq -c -M -r" |
---|
| | |
---|
| | |
---|
| | for DOC_IDX in $(seq 1 $NB_HITS ) |
---|
| | do |
---|
| | echo "--> Téléchargement de la page $PAGE_N / $TOTAL_PAGE " |
---|
| | FROM=$(wcalc -q ) |
---|
| | URL=" $ISTEX_URI &from= $FROM &output=fulltext,metadata" |
---|
| | PAGE=$(curl -s $URL ) |
---|
| | NB_HITS=$( echo $PAGE | $JQ ".hits | length" ) |
---|
| | |
---|
| | DOC_IDX=$(wcalc -q ) |
---|
| | DOC=$( echo $PAGE | $JQ ) |
---|
| | DOC_ISTEXID=$( echo $DOC | $JQ ".id" ) |
---|
| | DOC_FULLTEXT=$( echo $DOC | $JQ ".fulltext" ) |
---|
| |
---|
| | FILENAME= |
---|
| | curl -s $URI > $FILENAME |
---|
| | echo "--> Plein texte téléchargé : $FILENAME " |
---|
| | done |
---|
| | done |
---|
| | |
---|
| | |