Четверг, 04.09.2025
×
Мировой кризис и его малютки / Биржевая среда с Яном Артом

Переход на архитектуру Zipformer позволил в 3 раза ускорить распознавание устной речи

Аа +
+1 -0

Компания BSS значительно улучшила производительность своего модуля автоматического распознавания речи (ASR), используемого в диалоговой платформе Digital2Speech. Новая версия ASR работает более чем в три раза быстрее, сохраняя при этом высокое качество распознавания.

Благодаря недавнему обновлению скорость реакции голосового робота увеличилась более чем в три раза. Это означает, что голосовой ассистент теперь отвечает на запросы пользователей ощутимо быстрее, поэтому взаимодействие с ним стало более плавным и естественным. Несмотря на значительное увеличение скорости, качество распознавания речи не только не пострадало, но и улучшилось.

Основным фактором, позволившим реализовать эти улучшения и достичь результата, стал переход на новую архитектуру нейросети Zipformer. Эта архитектура существенно ускоряет процесс распознавания и увеличивает его точность за счет уменьшенного количества слоев нейросети, специальных методов сжатия данных и ряда других механик. Ранее компания использовала технологию Conformer.

Новая архитектура позволяет значимо снизить требования к аппаратному обеспечению и экономить на вычислительных мощностях благодаря увеличению эффективности. Оптимизированное решение адаптировано для использования в контуре заказчика. Поэтому обновленный ASR по-прежнему можно запускать как на GPU картах для обеспечения максимальной производительности, так и на более доступных x86 серверах.

«Скорость отклика голосового робота является одной из трех важнейших характеристик, по которым пользователи оценивают «человечность» и «приятность» голосового ассистента. И мы смогли, как минимум, в три раза ускорить распознавание вопроса абонента, сделав взаимодействие с нашим голосовым роботом еще более комфортным. Сегодня Zipformer это новейшая и самая эффективная архитектура для задач распознавания речи, которая появилась только год назад. Я рад, что мы одни из первых смогли представить ее своим клиентам и подготовить надежное решение Enterprise уровня», – прокомментировал директор департамента голосовых цифровых технологий компании BSS Александр Крушинский.

Заметили ошибку? Выделите её и нажмите CTRL+ENTER
все корпоративные новости »
+1 -0
85
ПОДПИСАТЬСЯ на канал Finversia YouTube Яндекс.Дзен Telegram

обсуждение

Ваш комментарий
Вы зашли как: Гость. Войти через
Осенний рублепад: ждут почти все Осенний рублепад: ждут почти все «Уж август кончился, а девальвации все нет». Примерно так можно охарактеризовать ситуацию с курсом рубля, которому, начиная с марта, многие прочат падение. OpenAI расширяет вторичное размещение акций до $10,3 млрд с оценкой в $500 млрд OpenAI расширяет вторичное размещение акций до $10,3 млрд с оценкой в $500 млрд Американский разработчик ИИ-технологий OpenAI увеличил объем предстоящей вторичной продажи акций более чем на $4 млрд, доведя его до примерно $10,3 млрд, пишет CNBC со ссылкой на информированный источник. Тимур Аитов: «Надо заставить бороться с хищениями и отвечать за них сами банки» Тимур Аитов: «Надо заставить бороться с хищениями и отвечать за них сами банки» В этом году в России обновляется законодательство, направленное на борьбу с финансовом мошенничеством. Три десятка новаций введены с 1 июня. Остановит ли это волну мошенничества? Комментирует председатель комиссии по безопасности финансовых рынков Торгово-промышленной палаты России Тимур Аитов.
Канал Finversia на YouTube

календарь эфиров Finversia-TV »