diff --git a/Niveau-3/README.md b/Niveau-3/README.md index 3245f25..20b8c7e 100755 --- a/Niveau-3/README.md +++ b/Niveau-3/README.md @@ -1,7 +1,7 @@ Niveau-3 ======== -L’exploration de corpus Niveau 3 est destinée à évaluer la qualité d'un corpus en identifiant le bruit et le silence dans un corpus de volume plus important, par rapport à une ressource de référence. Elle sert également à tester la performance d'outils de textométrie pour réaliser cette tâche. +L’exploration de corpus Niveau 3 est destinée à évaluer la qualité d'un corpus de volume plus important en identifiant le bruit et le silence, par rapport à une ressource de référence. Elle sert également à tester la performance d'outils de textométrie pour réaliser cette tâche. - Bruit : vérification de la présence d’au moins 1 nom d’espèce animale en latin dans chacun des documents. Seront donc considérés comme du bruit, les documents ne contenant aucun nom d'espèce, d'après la ressource servant de référence. - Silence : vérification de la représentation de tous les embranchements et de toutes les classes de la ressource chez les espèces trouvées dans le corpus. @@ -9,7 +9,7 @@ ## Corpus -**Systématique animale v2** : 36 778 documents de zoologie répartis en 11 sous-corpus (arthropodes, batraciens, échinodermes, épondes, insectes, mammifères, mollusques, oiseaux, poissons, reptiles, vers). +**Systématique animale v2** : 36 778 documents de zoologie répartis en 11 sous-corpus (arthropodes, batraciens, échinodermes, éponges, insectes, mammifères, mollusques, oiseaux, poissons, reptiles, vers). ## Ressource de référence @@ -26,4 +26,3 @@ Les documents ayant un nombre de noms d'espèces égal à 0 sont considérés comme du bruit. La jonction entre les noms d'espèces présents dans le corpus et la ressource de référence contenant les éléments de classification est réalisée grâce à la fonction Shell Join. Les comptages et l'identification de classes et embranchements manquants sont ensuite réalisés par des tableaux croisés dynamiques dans **[Calc](https://www.openoffice.org/product/calc.html)**. -