Пятница, 07.11.2025
×
Золото, курс рубля, фондовый рынок: что будет до конца 2025 / Биржевая среда с Яном Артом

Компания BSS добилась наилучшего качества распознавания казахского языка

Аа +
+1 -0

Почти 80% качества автоматического распознавания казахского языка добилась компания BSS, всего за 3 месяца собрав собственную модель ASR (Automatic Speech Recognition).

Технология ASR необходима для распознавания устной речи клиентов, которые обращаются к виртуальному ассистенту с запросами. Чтобы оперативно обучить модель в условиях отсутствия исходных данных, разработчики использовали реальные диалоги на казахском языке, содержащие релевантную для заказчика лексику. Аналитики BSS тщательно транскрибировали 10 часов аудиоматериалов, перенеся корректно их в текстовый режим

Параллельно из открытых источников были собраны готовые речевые корпуса длительностью 1500 часов. На основе этих данных была обучена первая базовая версия модели, качество распознавания устной речи которой составило 70%. Затем базовая модель ASR была дообучена транскрибированными аналитиками 10-часовыми аудиоматериалами. После второй итерации модель показала качество в 80% на целевых запросах клиентов. Сейчас разработчики BSS запускают новый цикл обучения ASR, чтобы улучшить показатель распознавание устной речи.

«Наша команда показала выдающийся результат, разработав модель ASR за 3 месяца без исходных данных и сразу с уровнем качества в 80%. Мы собрали тестовый набор фраз клиентов заказчика и протестировали эти материалы на решениях других вендоров. Наша модель оказалась лучшей для заказчика, обогнав всех по качеству распознавания», — прокомментировал директор департамента голосовых цифровых технологий компании BSS Александр Крушинский.   

Он также отметил, что команда BSS осуществила переход модели ASR с архитектуры Conformer на ZIP-Former. «Это позволило ускорить ASR в 3 раза и повысить качество распознавания речи на 5%. Также благодаря переходу на более производительную архитектуру реакция бота сокращается на 200-500 мс, что повышает естественность диалога с клиентами», — добавил Александр Крушинский.

Заметили ошибку? Выделите её и нажмите CTRL+ENTER
все корпоративные новости »
+1 -0
102
ПОДПИСАТЬСЯ на канал Finversia YouTube Яндекс.Дзен Telegram

обсуждение

Ваш комментарий
Вы зашли как: Гость. Войти через
Этот «непослушный» рубль Этот «непослушный» рубль Курс рубля по-прежнему остается стабильным. Но его падения также по-прежнему ждут в прогнозах на ноябрь и до конца 2025 года. OpenAI нацелена на масштабные инвестиции и выручку $20 млрд к 2025 году OpenAI нацелена на масштабные инвестиции и выручку $20 млрд к 2025 году Разработчик ChatGPT — компания OpenAI — прогнозирует достижение годового уровня дохода свыше $20 млрд к концу 2025 года. Об этом сообщил глава компании Сэм Альтман, отметив, что в более долгосрочной перспективе, к 2030 году, OpenAI рассчитывает увеличить выручку до «сотен миллиардов» долларов ежегодно. Тимур Аитов: «Эпитет «цифровой» – порой просто дань моде» Тимур Аитов: «Эпитет «цифровой» – порой просто дань моде» Как идут процессы развития цифровой экономики в нашей стране, какие проблемы нас подстерегают на этом пути? Какие значимые проекты уже реализованы и как происходящее отразится и уже отражается на каждом из нас – об этом в беседе с председателем комиссии по безопасности финансового рынка совета Торгово-промышленной палаты России Тимуром Аитовым. Основные ракурсы сегодняшней беседы – проблематика цифрового рубля (ЦР), уязвимости и риски систем искусственного интеллекта (ИИ), будущее денежной системы (ДС) страны в целом.
Канал Finversia на YouTube

календарь эфиров Finversia-TV »

Новости »