diff --git a/terms-extraction/examples.http b/terms-extraction/examples.http index 0c59076..2f4daae 100644 --- a/terms-extraction/examples.http +++ b/terms-extraction/examples.http @@ -1,7 +1,9 @@ # These examples can be used directly in VSCode, using REST Client extension (humao.rest-client) +@baseUrl = http://localhost:31976 +#@baseUrl = https://terms-extraction.services.inist.fr # Extraction des termes de deux textes en français -POST https://terms-extraction.services.inist.fr/v1/teeft/fr?indent=true HTTP/1.1 +POST {{baseUrl}}/v1/teeft/fr?indent=true HTTP/1.1 Content-Type: application/json [ @@ -21,7 +23,7 @@ ### # Extraction des termes de deux textes en anglais -POST https://terms-extraction.services.inist.fr/v1/teeft/en?indent=true HTTP/1.1 +POST {{baseUrl}}/v1/teeft/en?indent=true HTTP/1.1 Content-Type: application/json [ @@ -37,17 +39,17 @@ ### # Normalisation des termes de deux textes -POST https://terms-extraction.services.inist.fr/v1/tools/normalize?indent=true HTTP/1.1 +POST {{baseUrl}}/v1/tools/keywords-clean?indent=true HTTP/1.1 Content-Type: application/json [ - { - "value": "Les dinosaures, de leur nom scientifique Dinosauria (du grec ancien deinόs « terrible » et saûros « lézard »), forment un super-ordre ainsi qu'un clade extrêmement diversifié de sauropsides de la sous-classe des diapsides et dont les uniques représentants actuels sont les oiseaux", - "id": "https://fr.wikipedia.org/wiki/Dinosauria" - }, - { - "value": "Café de Côte d'Ivoire", - "id": 1 - } + { "value": "languages" }, + { "value": "sociolinguistics" }, + { "value": "social psychology" }, + { "value": "SOCIETE EN GENERAL" }, + { "value": "FUSION " }, + { "value": ":Absorption:" }, + { "value": "Patrimoine" }, + { "value": "Transmissions active et passive "} ] ### diff --git a/terms-extraction/v1/tools/keywords-clean.ini b/terms-extraction/v1/tools/keywords-clean.ini new file mode 100644 index 0000000..e17b610 --- /dev/null +++ b/terms-extraction/v1/tools/keywords-clean.ini @@ -0,0 +1,40 @@ +# OpenAPI Documentation - JSON format (dot notation) +mimeType = application/json + +post.operationId = post-v1-tools-keywords-clean +post.requestBody.content.application/json.example.0.id = 1 +post.requestBody.content.application/json.example.0.value = sucres +post.requestBody.content.application/json.example.1.id = 2 +post.requestBody.content.application/json.example.1.value = arbres +post.requestBody.content.application/json.schema.$ref = #/components/schemas/JSONStream +post.requestBody.required = true +post.responses.default.content.application/json.example.0.id = 1 +post.responses.default.content.application/json.example.0.value = Sucre +post.responses.default.content.application/json.example.1.id = 2 +post.responses.default.content.application/json.example.1.value = Arbres +post.responses.default.content.application/json.schema.$ref = #/components/schemas/JSONStream +post.responses.default.description = Les mot-clés sont mis au singulier (empiriquement), sans caractères spéciaux et commencent par une majuscule +post.summary = Tente une homogénisation empirique de mot-clés +post.tags.0: terms-extraction +post.parameters.0.description = Indenter le JSON résultant +post.parameters.0.in = query +post.parameters.0.name = indent +post.parameters.0.schema.type = boolean + +[use] +plugin = @ezs/basics + +[JSONParse] +separator = * + +[assign] +path = value +value = get('value').replace(/[`~!@#$%^&*()_|+\-=?;:",.<>\{\}\[\]\\\/\s]+/g, ' ').trim() + +[TXTInflection] +path = value +transform = singularize +transform = humanize + +[dump] +indent = env('indent', false)