diff --git a/README.md b/README.md index f44f70a..fee3bb4 100644 --- a/README.md +++ b/README.md @@ -10,7 +10,7 @@ - le dédoublonnage : non seulement les bases Pascal et Francis ont des notices en commun, mais il y a également des documents qui ont été indexés plusieurs fois. Après cette étape, seule une notice, avec le meilleur score, est retenue. - la génération des fichiers d’enrichissement au format TEI pour la base **Istex**. -Pour chacune de ces étapes, on a dans ce dépôt un répertoire et un programme, comme le montre le schéma ci-dessous : +Pour chacune de ces étapes, on a dans ce dépôt un répertoire et un programme (et les tables de correspondance), comme le montre le schéma ci-dessous : ```txt alignement-pascal-francis @@ -21,7 +21,15 @@ ├── 03-dedoublonnage │   └── weedTei.pl ├── 04-generation_tei - │   └── alignment2tei.pl + │   ├── alignment2tei.pl + │   └── CC + │      ├── equivCCFrancis.txt + │      ├── equivCCPascal.txt + │      ├── liensLodex.txt + │      ├── verbFrancisEn.txt + │      ├── verbFrancisFr.txt + │      ├── verbPascalEn.txt + │      └── verbPascalFr.txt └── divers └── IhfdCat ```