diff --git a/data-computer/README.md b/data-computer/README.md index fb9051b..c90bb0e 100644 --- a/data-computer/README.md +++ b/data-computer/README.md @@ -157,18 +157,19 @@ ### v1/lda -Créer pour l'ensemble des documents un champ "lda" d'un ensemble de 5 topics. Chaque topic contient un champ "word", qui est composé une liste de 10 mots qui sont les plus caractéristiques du topic, ainsi que d'un champ "weight" qui donne la probabilité que le document soit classé dans le topic. +Créer à partir de l'ensemble des documents un champ "lda" constitué de 5 topics. Chaque topic contient un champ "word", qui est composé une liste de 10 mots qui sont les plus caractéristiques du topic, ainsi que d'un champ "weight" qui donne la probabilité que le document soit classé dans le topic. Le texte doit être en anglais ou en français. -Par exemple, pour un document pris dans un ensemble de document (l'id "35" est totalement arbitraire) +Par exemple, pour un document pris dans un ensemble de document (l'id "85" est totalement arbitraire) + ```json -{"id": 35, "value": "L'anglais est souvent enseign\u00e9 comme langue seconde dans de nombreux pays \u00e0 travers le monde."} +{"id": 85, "value": "L'anglais est souvent enseign\u00e9 comme langue seconde dans de nombreux pays \u00e0 travers le monde."} ``` On obtiendra : ```json { - "id": 35, + "id": 85, "value": "L'anglais est souvent enseign\u00e9 comme langue seconde dans de nombreux pays \u00e0 travers le monde.", "lda": { "topic_1": { @@ -251,7 +252,7 @@ ``` -NOTE : l'algorithme a besoin de beaucoup de documents pour fonctionner (> 100 idéalement), d'où la non exhaustivité de l'exemple. +NOTE : l'algorithme a besoin de beaucoup de documents pour fonctionner (plus d'une centaine), d'où la non exhaustivité de l'exemple. #### Paramètre(s) URL