Вторник, 16.12.2025
×
Страхование в ваших финансах: как правильно использовать

Компания BSS в 10 раз сократила требования к объему аудиоматериалов для создания нового голоса бота

Аа +
- -

Компания BSS создала новый мужской голос для интеллектуального помощника, используя аудиоматериалы общей длительностью 2 часа. Ранее необходимое количество аудио составляло не менее 15–20 часов.

Голосовой робот BSS успешно консультирует клиентов максимально естественным голосом с человеческими интонациями. Новый мужской голос создан на основе голоса профессионального диктора, озвучившего необходимые для ведения диалогов с клиентами фразы. Озвучивание переменных данных (ФИО, улица, дата, номер и т.д.) производится на основе синтеза голоса этого диктора. Такой гибридный подход позволяет существенно сократить время на обучение модели, при этом обеспечить естественность, плавность и незаметность всех переходов и вставок.

В процессе создания нового голоса команда BSS отобрала целевую лексику, которую использует робот при общении с абонентами в реальных проектах. Это помогло отобрать необходимые фразы и, тем самым, сократить количество используемых для обучения модели аудиоматериалов. Более того, команда подобрала специальный фонетический корпус, в котором обеспечено максимальное разнообразие трезвучий (включая редкие), что обеспечивает естественное и приятное звучание голоса. Собранные фразы были озвучены диктором.

Для обучения модели, отвечающей за синтез голоса, понадобились 2 часа аудиозаписей вместо 15-20 часов, как было ранее. Синтезированный голос получился естественным, поскольку модель улавливала и учитывала интонации диктора. Такой способ обучения модели позволяет минимизировать разницу между ранее записанным голосом и синтезированным.

«Мы смогли сократить длительность требуемых материалов с 15-20 часов до 2 часов, что позволяет нам выполнять проекты в более короткие сроки. Модель синтеза речи реализовали на новой архитектуре Conformer — это более современная архитектура нейронной сети, которая лучше справляется с синтезом длинных фраз. Если раньше мы сталкивались с «зажевыванием» в конце предложений, то теперь эта проблема минимизирована и длинные фразы звучат корректно. Естественность и качество нового голоса, скорость его создания – важные преимущества для любого проекта по внедрению и развитию виртуального ассистента», — прокомментировал директор департамента голосовых цифровых технологий компании BSS Александр Крушинский.

Заметили ошибку? Выделите её и нажмите CTRL+ENTER
все корпоративные новости »
- -
98
ПОДПИСАТЬСЯ на канал Finversia YouTube Яндекс.Дзен Telegram

обсуждение

Ваш комментарий
Вы зашли как: Гость. Войти через
Будет ли новая пенсионная реформа? Будет ли новая пенсионная реформа? Что говорят о вероятности новой пенсионной реформы. Индексация пенсий и пенсионных коэффициентов в 2026 году. Обсуждение пенсионных проблем вызывает гнев «лучших людей города». Вранье о «13-й пенсии». Лучший способ получать достойную пенсию – не выходить на нее. Где и как хотят путешествовать пенсионеры. Кто «заплатил» за разговор о пенсиях. Сколько стоит терпение? Евгений Коган: Инвестиции в «миркоины» Евгений Коган: Инвестиции в «миркоины» Насколько способны вырасти «миркоины» в случае мирного соглашения? Кирилл Дианов: «Финансовый сектор стал драйвером импортозамещения» Кирилл Дианов: «Финансовый сектор стал драйвером импортозамещения» Российский финансовый сектор находится на этапе масштабной технологической перестройки ввиду регуляторных требований и ограничений на использование зарубежного программного обеспечения. Ужесточение стандартов ЦБ, в том числе приказ № 683-П, ставит перед банками и страховыми компаниями задачу не только обеспечить высокий уровень информационной безопасности, но и выстроить устойчивую ИТ-инфраструктуру на базе отечественных решений. Вместе с Кириллом Диановым, руководителем направления облачной интеграции «Онланты», обсудили тренд на импортозамещение в финсекторе и проанализировали ряд используемых решений.
Канал Finversia на YouTube

календарь эфиров Finversia-TV »

Новости »