Распознавание речи, Speech To Text(STT), Automatic Speech Recognition(ASR) - это преобразование речевого сигнала в текстовое представление.
Поддерживаем одно- и двухканальные аудио.
Opus поддерживает только те Sample Rate, что указаны на официальном сайте Opus.
На данный момент мы не поддерживаем uniMRCP и используем собственный модуль для интеграции с Asterisk.
Для оценки точности распознавания используется метрика WER — Word Error Rate.
WER показывает, насколько распознанный текст отличается от оригинала.
При распознавании шумных GSM аудио
Наши модели обучались на русскоязычных телефонных разговорах в кол-центрах и умеют распознавать большую часть вокабуляра в этой предметной области.
С вашего разрешения мы можем осуществлять частичную разметку ваших данных с целью дообучения наших моделей по недостающим тематикам.
Разметка и сбор данных осуществляются на стороне нашего сервиса.
Оставить заявку
Мы свяжемся с вами в течение 2 рабочих дней, дадим доступ к API и отправим подробную инструкцию по работе с сервисом.