.. | |||
Construction_Dictionnaires_Nom_Espèce.pl | 5 years ago | ||
Préparation_Données_entrée_Iramuteq.pl | 5 years ago | ||
Préparation_Données_entrée_Iramuteq2.pl | 5 years ago | ||
README.md | 5 years ago |
Ensemble de scripts Perl développés par Panpan Hu pour générer les fichiers utilisables par le logiciel d’analyse statistique IRaMuTeQ.
Script Perl qui prend en entrée une liste de noms d'espèce animales et végétales, un nom par ligne suivi d’une tabulation et de la mention “animalia” ou “plantae”. Comme par exemple :
Abies bifida plantae Gadus morhua animalia
Le programme sélectionne les noms d'espèces d'un règne et génère un ou deux fichiers pour IRaMuTeQ. D’une part, il transforme les noms d'espèce en une expression formant un seul mot puisqu’IRaMuTeQ travaille mot à mot :
Abies bifida Abies_bifida Gadus morhua Gadus_morhua
D’autre part, il définit cette expression comme une entrée du lexique avec un lemme (l’expression elle-même) et le type grammatical “nom” :
Abies bifida Abies_bifida nom Gadus morhua Gadus_morhua nom
Construction_Dictionnaires_Nom_Espèce.pl -i input -o output -t ("animalia"|"plantae") [ -l lexique ]
Le fichier de sortie output est à ajouter dans le dictionnaire “expression_en.txt” d’IRaMuTeQ. Sous Unix/Linux, ce dictionnaire se trouve dans le répertoire “~/.iramuteq/dictionnaires”. Optionnellement, ce programme peut créer un fichier lexique à ajouter au dictionnaire “lexique_en.txt” dans le même répertoire.
Concatène les données du sous-corpus Arthropodes préparées pour TXM.
Concatène les données de l'ensemble du corpus systématique animale v1 préparées pour TXM. Etant donné que ce corpus comprend 11 sous-corpus, un critère de sous-corpus est nécessaire dans les données d’entrée.