grobid-corpus
corpus istex pour Grobid.
modèle segmentation nommé model.wapiti_9_mai_2017 est fait en faisant l'entraînement sur tous les fichiers : total de 243 fichiers, 110 fichier ISTEX et 133 fichiers public
split 20% des fichiers pour l'évaluation 80% pour l'entraînement