При перепечатке материалов просим публиковать ссылку на портал Finversia.ru с указанием гиперссылки.
По мере того, как искусственный интеллект переходит из исследовательских лабораторий в реальную жизнь, всё более внимания инвесторы начинают уделять не производителям чипов, но обработчикам и систематизаторам данных.
Обработка данных не менее важна, чем чипы
Согласно исследованию компании Sapien, которая предоставляет услуги по обработке данных, к 2032 году рынок обучающих данных для искусственного интеллекта (ИИ) в Китае, вырастет с $261 млн. в 2023 году до более чем $2,3 млрд. Таким образом, среднегодовой темп роста составит более 27%.
Таннер Браун, обозреватель Barron’s, издания которое выпускает с 1921 года компания Dow Jones & Company, заметил, что инвесторы чрезмерно сосредоточены на производителях чипов – таких, как Nvidia. А между тем, в цепочке создания стоимости есть компании, которые занимаются созданием и обработкой высококачественных обучающих данных. И в настоящее время данный рынок становится важнейшим сектором роста.
Как подчеркивает Браун, в основе бума ИИ лежит агрессивное стремление Китая стать мировым лидером в данной области. Эта цель подкреплена масштабным государственным финансированием, национальными планами развития и благоприятной нормативно-правовой базой.
– Но по мере того, как страна стремится реализовать свои амбиции в области ИИ, она сталкивается с растущим дефицитом: поиском достаточного количества соответствующих требованиям данных по конкретным областям для питания всё более сложных алгоритмов, – говорит Браун.
Так же считают и аналитики Sapien. Компании, которые будут специализироваться на предоставлении высококачественных наборах данных с подробными комментариями, адаптированными к конкретным потребностям, смогут стать бенефициарами внедрения ИИ в экономику.
Как отмечают в Barron’s, такие технологические гиганты, как Baidu, Alibaba Group и Tencent Holdings, уже используют свои обширные потребительские экосистемы для создания и обработки огромных объёмов обучающих данных.
– Однако реальная возможность может открыться перед нишевыми игроками, которые будут специализироваться на аннотировании данных, на их маркировке с соблюдением конфиденциальности и трансграничных решениях, – настаивает Таннер Браун.
И таких отраслей множество. Например, это автономные транспортные средства, образовательные технологии, автоматическое распознавание речи и обучение больших языковых моделей.
Конфиденциальность и соблюдение нормативных требований стали определяющими характеристиками рынка. Закон Китая о защите персональных данных и закон о кибербезопасности устанавливают строгие правила сбора, обработки и передачи персональных данных, особенно при их пересечении границ. Эти правила повышают затраты и усложняют работу, но они также создают конкурентные преимущества для компаний, которые могут предоставлять чистые, проверенные наборы данных.
– Вопросы суверенитета данных имеют решающее значение, в то время, как операционные стандарты растут. Компании, которые смогут предоставлять масштабируемые решения в рамках этих параметров, имеют все шансы на рост, – уверен Джеймс Ю, технический директор шанхайской исследовательской компании Xintai Analysis, которая занимается ИИ.
Возможности для инвесторов
В дорожной карте по внедрению ИИ, разработанной китайским правительством, приоритет отдаётся внедрению ИИ в конкретных отраслях. Внедрение ИИ в сфере финансов, образования, логистики и здравоохранения больше зависит от наборов данных, которые отражают сложность человеческой среды, а не от очищенных лабораторных данных. Это привело к росту спроса на поставщиков, которые могут получать, очищать и аннотировать беспорядочные, многоязычные и зачастую конфиденциальные потоки данных.
Например, в таких областях, как автоматическое распознавание речи, модели должны быть обучены на образцах голоса, записанных на разных диалектах, в разных условиях и с разными характеристиками говорящих, чтобы быть по-настоящему эффективными. А в финансовом секторе для разработки систем обнаружения мошенничества, управления рисками и робо-консультантов необходимы реальные записи транзакций – обезличенные, но с подробной информацией о поведении.
Для инвесторов это открывает несколько возможностей для действий. Во-первых, это расширение числа поставщиков данных, таких как Datatang и Data Magic, которые извлекают выгоду как из местного спроса, так и из партнёрских отношений с зарубежными разработчиками ИИ, которые стремятся обучить многоязычные модели. Во-вторых, венчурный капитал в последнее время стал всё больше обращать внимание на инфраструктурный уровень – программные платформы, которые упрощают маркировку данных и обеспечивают возможность аудита.
Наконец, существует нормативный арбитраж. Поскольку многие китайские компании испытывают трудности с соблюдением требований к конфиденциальности, особенно в таких чувствительных областях, как большие языковые модели, набирают популярность компании, предлагающие синтетические данные или анонимные глобальные наборы данных. Эти решения считаются менее рискованными альтернативами в условиях, когда вопросы суверенитета данных остаются актуальными, а несоблюдение требований может повлечь за собой серьёзные финансовые и репутационные издержки.
Тем не менее, проблемы сохраняются. Аналитики Sapien указали на опасения по поводу разнообразия, точности и предвзятости данных, а также на сохраняющуюся обеспокоенность по поводу безопасности данных и потенциального доступа к ним со стороны правительства. Недавние обвинения со стороны правительства Китая в отношении DeepSeek, только подчёркивают, насколько важными стали прозрачность и происхождение данных.
– Тем не менее, аналитики говорят, что эти проблемы являются частью более масштабного процесса становления отрасли. Ужесточение правил вынуждает отрасль становиться более профессиональной, отдавая предпочтение компаниям с эффективным управлением, специализированными знаниями и надёжными операционными моделями, – подчеркивает обозреватель Barron’s.
Китайские тигры ИИ
В Barron’s также отметили ещё одну набирающую популярность тенденцию – рост китайских «тигров» ИИ – стартапов, таких как Moonshot AI, Zhipu AI и MiniMax. Данные компании стремятся создать передовые большие языковые модели и мультимодальные системы. Эти компании являются ненасытными потребителями высококачественных обучающих данных и в ближайшие годы могут стать крупными покупателями или поглотителями компаний, ориентированных на данные.
Если Китай действительно является новым рубежом в развитии ИИ, то данные – это его золото. Но в отличие от предыдущих сырьевых бумов, этот связан не столько с добычей, сколько с переработкой – превращением необработанной информации в ценный, удобный и применимый на практике ввод для машин, которые всё чаще управляют всем – от логистики до языка, – приводит метафору Браун.
обсуждение