Распознавание речи

POST

/api/asr

Распознать речь из аудиофайла.

Отправьте аудиофайл в формате WAV, MP3, OGG, FLAC, AAC или другом поддерживаемом формате.
Запрос блокируется до завершения распознавания и возвращает результат в JSON.

Параметр word_timestamps позволяет получить список слов с временными метками.

Authorizations

HTTPBearer

Type

HTTP (bearer)

Request Body

multipart/form-data

object

Аудиофайл для распознавания.

Format"binary"

ASR-модель для распознавания.

Default"GENVOICE_ASR"

Возвращать ли таймстемпы для каждого слова.

Defaultfalse

Responses

Successful Response

Content-Type

application/json

JSON

{

"text": "string",

"duration_seconds": 0,

"words": [

{

"text": "string",

"start": 0,

"end": 0

}

]

}

POST

/api/asr

Playground

Authorization

HTTPBearer

Body

file*

model

word_timestamps

Распознавание речи​

Authorizations​

Request Body​

Responses​

Playground​

Samples​

Распознавание речи

Authorizations

Request Body

Responses

Playground

Samples