Newer
Older
web-services / terms-extraction / v1 / teeft / fr.ini
@François Parmentier François Parmentier on 16 Dec 1 KB feat(terms-extraction): Use @ezs/teeft
# OpenAPI Documentation - JSON format (dot notation)
mimeType = application/json

post.operationId = post-v1-teeft-fr
post.requestBody.content.application/json.example.0.id = 1
post.requestBody.content.application/json.example.0.value = Ceci est un texte en français dont les termes vont être extraits grâce à l'algorithme Teeft. L'algorithme Teeft calcule une spécificité pour chaque terme trouvé dans le texte, et ne garde que les termes les plus spécifiques.
post.requestBody.content.application/json.schema.$ref = #/components/schemas/JSONStream
post.requestBody.content.application/json.schema.$ref = #/components/schemas/JSONStream
post.requestBody.required = true
post.responses.default.content.application/json.example.0.id = 1
post.responses.default.content.application/json.example.0.value.0 = teeft
post.responses.default.content.application/json.example.0.value.0 = extraits grâce
post.responses.default.content.application/json.schema.$ref =  #/components/schemas/JSONStream
post.responses.default.description = Termes extraits du texte envoyé
post.summary = Extrait des termes du texte en français en utilisant Teeft
post.tags.0: terms-extraction
post.parameters.0.description = Indenter le JSON résultant
post.parameters.0.in = query
post.parameters.0.name = indent
post.parameters.0.schema.type = boolean

[use]
plugin = @ezs/basics
plugin = @ezs/teeft

[JSONParse]
separator = *

[replace]
path = content
value = get('value')

path = path
value = get('id', 'n/a')

[TeeftToLowerCase]
path = content

[TeeftSentenceTokenize]
[TeeftTokenize]

[TeeftNaturalTag]
lang = fr

[TeeftExtractTerms]
lang = fr

[TeeftFilterTags]
lang = fr

[TeeftRemoveNumbers]
[TeeftStopWords]
lang = fr

[TeeftSumUpFrequencies]
[TeeftSpecificity]
lang = fr
sort = true

[TeeftFilterMonoFreq]

[replace]
path = id
value = get('path')

path = value
value = get('terms').map('term').slice(0, 5)

[dump]
indent = env('indent', false)