Ce module importe les transformations Pub2TEI (du projet PEER) dans le dossier etc/ comme point de départ pour les conversions body dans certaines branches du projet Istex, et en branche principale dans la refbib-stack pour convertir les références bibliographiques natives en corpus gold ou en corpus d'entraînement.
Cette version est conforme au dépôt git Public de Laurent Romary et Patrice Lopez qui comporte des documents-exemples obfusqués pour respecter les droits d'auteurs. Une transformation pour les exemples IOP y a déjà été inclue par le projet ISTEX, d'autres branches de modifications (feuille Nature, bibliographies Elsevier) y seront re-mergées prochainement.
dépôt privé chez Patrice Lopez + merges des branches ISTEX ------------------------ \ dépôt public https://github.com/kermitt2/Pub2TEI (sans les exemples sous droits d'auteurs) ----------------------- \ dépôt istex-rd libconsulte (subtree dans le dossier ./etc/Pub2TEI) ----------------------- \ \ \ différents dépôts qui utilisent libconsulte
Pub2TEI est un ensemble de transformations XSLT v2.0 pour passer de formats XML spécifiques aux éditeurs (publishers) à un format TEI commun.
Il a été développé dans le cadre du projet PEER, notamment par L. Romary et P. Lopez.
La feuille principale est Publishers.xsl:
<TEI> <teiHeader> <fileDesc>...</fileDesc> <profileDesc>...<profileDesc> </teiHeader> <text> <front>...</front> <body>...</body> <back></back> </text> </TEI>
La logique est donc "input-guided" pour générer le squelette et "output-guided" pour remplir les sous-branches spécifiques.