Appearance
Распознавание речи
POST
/api/asr
Распознать речь из аудиофайла.
Отправьте аудиофайл в формате WAV, MP3, OGG, FLAC, AAC или другом поддерживаемом формате.
Запрос блокируется до завершения распознавания и возвращает результат в JSON.
Параметр word_timestamps позволяет получить список слов с временными метками.
Authorizations
HTTPBearer
Type
HTTP (bearer)
Request Body
multipart/form-data
file
string
Required
Аудиофайл для распознавания.
Format
"binary"model
const:GENVOICE_ASR
ASR-модель для распознавания.
Default
"GENVOICE_ASR"word_timestamps
boolean
Возвращать ли таймстемпы для каждого слова.
Default
falseResponses
Successful Response
application/json
{
"text": "string",
"duration_seconds": 0,
"words": [
{
"text": "string",
"start": 0,
"end": 0
}
]
}