Skip to content

Распознавание речи

POST
/api/asr

Распознать речь из аудиофайла.

Отправьте аудиофайл в формате WAV, MP3, OGG, FLAC, AAC или другом поддерживаемом формате.
Запрос блокируется до завершения распознавания и возвращает результат в JSON.

Параметр word_timestamps позволяет получить список слов с временными метками.

Authorizations

HTTPBearer
Type
HTTP (bearer)

Request Body

multipart/form-data
object

Аудиофайл для распознавания.

Format"binary"

ASR-модель для распознавания.

Default"GENVOICE_ASR"

Возвращать ли таймстемпы для каждого слова.

Defaultfalse

Responses

Successful Response

application/json
JSON
{
"text": "string",
"duration_seconds": 0,
"words": [
{
"text": "string",
"start": 0,
"end": 0
}
]
}

Playground

Authorization
Body

Samples