Подразделение искусственного интеллекта компании «Т-Технологии» опубликовало в свободный доступ потоковую систему распознавания речи T-one. Несмотря на компактные размеры, модель демонстрирует наилучшие показатели точности при работе с русской речью, особенно в условиях фоновых шумов и сжатых аудиозаписей из call-центров, заявили создатели.
Архитектура решения изначально разрабатывалась для обработки непрерывного аудиопотока с минимальной задержкой — это ключевое требование для голосовых помощников, автоматизированных служб поддержки и систем анализа телефонных разговоров, пояснили разработчики.
Технология потокового распознавания даёт возможность мгновенной обработки звонков, улучшения сервиса и сокращения операционных расходов за счёт уменьшения нагрузки на сотрудников, акцентировали в компании.
Модель T-one доступна под лицензией Apache 2.0, позволяющей бесплатно использовать и модифицировать решение в коммерческих целях. Исходный код, весовые коэффициенты модели и инструменты для интеграции в высоконагруженные системы размещены на специализированных ресурсах для IT-разработчиков.