diff --git a/Niveau-3/README.md b/Niveau-3/README.md index 1b7aa07..3025c1b 100755 --- a/Niveau-3/README.md +++ b/Niveau-3/README.md @@ -19,9 +19,14 @@ ## Outils et procédure -La combinaison entre les logiciels **[TXM](http://textometrie.ens-lyon.fr/files/software/TXM/0.7.8/)** et **[IRaMuTeQ](http://iramuteq.org/)** telle qu'elle a été réalisée pour le **[Niveau 1](https://git.istex.fr/scodex/explore-corpus/tree/master/Niveau-3)** a été testée sur ce nouveau corpus mais n'a pas pu aboutir. En effet, le volume des sous-corpus représente une limite pour l'utilisation de ces outils (le plus volumineux étant Poissons avec 10 251 documents). -Les fichiers d'entrée ont été tout de même créés, à l'aide des scripts présentés dans les répertoires correspondants, mais ceux correspondant à TXM n'ont pas pu être chargés dans l'outil. +La combinaison entre les logiciels **[TXM](http://textometrie.ens-lyon.fr/files/software/TXM/0.7.8/)** et **[IRaMuTeQ](http://iramuteq.org/)** telle qu'elle a été réalisée pour le **[Niveau 1](https://git.istex.fr/scodex/explore-corpus/tree/master/Niveau-3)** a été testée sur ce nouveau corpus mais n'a pas pu aboutir. -Pour aller jusqu'au bout de ce protocole d'exploration nous avons finalement eu recours à l'outil d'extraction de formes figées **[IRC3](https://git.istex.fr/scodex/IRC3)**. +En effet, le volume des sous-corpus représente une limite forte pour l'utilisation de ces outils (le plus volumineux étant Poissons avec 10 251 documents). -La jonction entre les noms d'espèces détectés dans le corpus et la ressource de référence contenant les éléments de classification a été ensuite réalisée grâce à la fonction Shell Join. Les comptages et l'identification de classes et embranchements manquants sont ensuite réalisés par des tableaux croisés dynamiques dans **[Calc](https://www.openoffice.org/product/calc.html)**. +Les fichiers d'entrée ont été tout de même créés, à l'aide des scripts présentés dans les répertoires correspondants, mais ceux générés pour TXM n'ont pas pu être chargés dans l'outil. + +Pour aller jusqu'au bout de ce protocole d'exploration, nous avons finalement eu recours à l'outil d'extraction de formes figées **[IRC3](https://git.istex.fr/scodex/IRC3)**. + +La jonction entre les noms d'espèces détectés dans le corpus et la ressource de référence contenant les éléments de classification a été ensuite réalisée grâce à la fonction Shell Join. + +Les comptages et l'identification de classes et embranchements manquants sont ensuite réalisés par des tableaux croisés dynamiques dans **[Calc](https://www.openoffice.org/product/calc.html)**.