При перепечатке материалов просим публиковать ссылку на портал Finversia.ru с указанием гиперссылки.

ИИ-поиск с RAG справляется успешно с 76% запросов, а вероятность некорректного ответа снизилась с 28% до 6% при работе с PDF-файлами. Также команда внедрила новую модель векторизации и оптимизировала работу с внешними нейросетями GPT. Нововведения направлены на повышение эффективности, быстроты и точности работы с Базой знаний.
В новой версии RAG внесены существенные доработки, направленные на повышение производительности и качества ИИ-поиска. Компания теперь использует другую модель векторизации, которая имеет больший размер контекстного окна, что позволяет собирать больше информации и увеличить точность поиска. Ранее компания BSS внедрила GPT-поиск с RAG в Базе знаний InKnowledge от компании L2U. Это позволяет строить ответы на основе документов, находящихся в доверенном хранилище Базы знаний. Также технология умеет различать права доступа каждого пользователя, что обеспечивает дополнительную информационную безопасность при работе с RAG.
Следующее важное изменение касается обработки PDF-документов. Теперь RAG-поиск умеет анализировать информацию из таблиц, размещенных в PDF-файлах, что ранее было недоступно. В предыдущей версии RAG на вопросы по таблице система находила релевантную информацию в других текстовых источниках.
Также новая версия адаптирована под особенности внешних нейросетей и LLM-моделей (например, Яндекс GPT). Теперь весь распознанный текст переводится в формат Markdown, который более точно распознается сторонними сервисами при работе с таблицами в PDF. Улучшено качество разбивки файлов на чанки (кусочки информации), на которые делится база знаний для дальнейшей передачи в промт. Это было достигнуто за счет более корректного распознавания структуры файлов и расстановки границ в нужных согласно контексту местах (стык параграфов, заголовки таблиц, подзаголовки разделов и т.д.) при дроблении текстовых материалов.
«При создании новой версии RAG мы сосредоточились на работе с PDF-файлами, поскольку это популярный формат документов, но вызывающий сложности при обработке материалов с помощью метода RAG. Мы научились корректно доставать информацию из таблиц в PDF-документах, а также передавать её внешним LLM-моделям за счет увеличения длины чанков. Качество поиска повысилось, а доля ошибочных ответов снизилась до 6% или более в 4 раза относительно значения показателя старой версии. Благодаря обновлению можно ещё быстрее получать содержательные ответы в Базе Знаний», — прокомментировал директор департамента голосовых цифровых технологий компании BSS Александр Крушинский.
Рынок прогнозов, экзотические ЦФА, акции– мемы и наследство бэби-бумеров
Грядущая смена поколений на фондовом рынке неизбежно приведёт к смене брокерских бизнес-моделей
Геополитика поддерживает цены на нефть: Венесуэла и Россия в центре внимания
Цены на нефть во второй день подряд демонстрируют рост, получая поддержку от геополитических рисков в Венесуэле и России, несмотря на давление со стороны избыточного предложения.
Кирилл Дианов: «Финансовый сектор стал драйвером импортозамещения»
Российский финансовый сектор находится на этапе масштабной технологической перестройки ввиду регуляторных требований и ограничений на использование зарубежного программного обеспечения. Ужесточение стандартов ЦБ, в том числе приказ № 683-П, ставит перед банками и страховыми компаниями задачу не только обеспечить высокий уровень информационной безопасности, но и выстроить устойчивую ИТ-инфраструктуру на базе отечественных решений. Вместе с Кириллом Диановым, руководителем направления облачной интеграции «Онланты», обсудили тренд на импортозамещение в финсекторе и проанализировали ряд используемых решений.
обсуждение