Вторник, 02.12.2025
×
Грядет год больших потрясений. Олег Вьюгин - Алексей Мамонтов

Павел Шпидель: Война на истощение

Аа +
- -

На кого поставить в битве ИИ?

Если среди американских производителей, я бы поставил на Google и объясню почему.

▪️ Ресурсы определяют долгосрочную устойчивость – Google имеет колоссальный операционный денежный поток в 150 млрд долларов в год, который может без потери стратегической устойчивости отгружать в «плантации ИИ фабрик», чего не может себе позволить OpenAI, Anthropic и xAI, сидящие на подсосе у венчурных инвесторов. 

▪️ Мощнейшая инженерная школа DeepMind (практически все ведущие ученые в LLM являются выходцами из DeepMind). Работают медленнее и менее рисково, чем стартапы, но зато системно и последовательно.

▪️ Общемировая корпоративная и потребительская клиентская база в несколько миллиардов уникальных пользователей, удерживая через развитую сеть цифровых сервисов Google на всех уровнях (от развлекательных, поисковых, навигационных до бизнес сервисов) и слоях, платформах (мобильные, web, PC, серверные и IDE среды).

▪️ Full-stack платформа: собственное железо, которое выкупает само у себя по себестоимости (Google производит TPU Trillium / v6e) + имеет развитые облачные технологии Google Cloud Platform (GCP)  + среда разработки Vertex AI и Google AI Studio с развитыми библиотеками и фреймфорками (Project IDX, Kotlin, Firebase Genkit и т.д.) + уникальный поисковый движок Google Search, платформу Youtube для сбора данных, дата-сетов и медиа трендов.

▪️ Индустриальный стандарт в WEB технологиях: архитектура Chromium, на котором базируются все современные веб браузеры и сам браузер Chrome с доминирующей рыночной долей, позволяющий отслеживать пользовательские предпочтения, вкусы, запросы и тренды во всех странах, всех возрастов и социальных групп (феноменальный дата сет).
 
▪️ Корпус данных и индексируемый набор данных последние 20 лет. Сейчас ни одна компания в мире не имеет настолько емкого и обширного доступа к текстовому и медиа контенту, как Google. Пока OpenAI третируют по судам из-за нелицензированного использованных данных многих веб-изданий, Google уже давно проиндексировали практически ВЕСЬ интернет и успешно кэшировали данные. 

Практически все, что когда-либо было передано или написано в публичном пространстве – уже знает Google и хранит на специальных серверах. Теперь задача правильно все эти данные извлечь и разместить. 

Эти уникальные характеристики и ресурсное обеспечение позволит Google доминировать (финансы, инженеры, платформа, датасеты, общемировая клиентская база и сквозная интеграция ИИ сервисов), здесь любой компании сложно перехватить лидерство.

Данные особо важны.

Gemini 3 обучалась, по моим оценкам (на основе данных обучения предыдущих моделей и аппроксимации с учетом расширенной мультимодальности), на 50-70 трлн токенов данных (большая часть видео-контент, где у Google абсолютное преимущество за счет Youtube) или почти 230 Терабайт чистого текста.

Какое количество качественных данных обучили в Gemini 3 – неизвестно, но сейчас вся мировая емкость интернета оценивается в следующей пропорции:

•  Научная, техническая и специализированная литература всех дисциплин  – 2 трлн токенов
•  Научные статьи всех специальностей – 0.7 трлн токенов
•  Мировая художественная литература всех жанров и времен – 3 трлн токенов
•  Образовательная литература, методички  – 1 трлн токенов
•  Прочая литература, в том числе развлекательных – 3.5 трлн токенов среди относительно качественных
•  Энциклопедии, справочники – 0.2 трлн токенов
•  Код (в основном GitHub, StackOverflow с учетом техдокументации) – 2 трлн токенов среди относительно качественного кода
•  Патенты, техническая документация, стандарты, законы – 2-2.5 трлн токенов.

Относительно качественный пласт данных оценивается около 15 трлн токенов за всю историю человечества, где качественных данных и источников не более 5-10%.

Цифровые новости, блоги и аналитические статьи около 40-45 трлн токенов, плюс еще 200-220 трлн емкость мировых соцсетей в публичной части, большая часть (свыше 99.8%) из которых скам, срач, копипасты, репосты, SEO-мусор.

Все это без медиа контента (графика, аудио, видео), только текст.

Не является индивидуальной инвестиционной рекомендацией

Telegram канал автора: https://t.me/s/spydell_finance/

В разделе «Обзор блогов» редакция представляет републикации наиболее интересных постов известных российских экономистов, публицистов, финансистов и экспертов, опубликованных на личных каналах и онлайн-ресурсах авторов. Ссылки на эти ресурсы указаны под обзором. Данные републикации не являются подготовленными специально для Finversia.

Ответственность за информацию, высказанные профессиональные и этические оценки, версии и прогнозы остается на авторах блогов.

Орфография и пунктуация авторов блогов сохранена. Перевод иноязычных блогов – авторы блога.

Заметили ошибку? Выделите её и нажмите CTRL+ENTER
все обзоры блогов »
- -
9
ПОДПИСАТЬСЯ на канал Finversia YouTube Яндекс.Дзен Telegram

обсуждение

Ваш комментарий
Вы зашли как: Гость. Войти через

Цифровое поветрие Цифровое поветрие В средние века Европу опустошали эпидемии чумы и прочей заразы, в новом времени по миру прошлась сперва «испанка», а совсем недавно – коронавирус, он же ковид. Два года жили как на вулкане, потом ничего, рассосалось… А вот эпидемии всяких экономических и тем более финансовых инфекций сами собой не проходят. Хуже того – усугубляются и плодят себе подобных. Нефть снижается: рынок взвешивает геополитические риски и угрозу перепроизводства Нефть снижается: рынок взвешивает геополитические риски и угрозу перепроизводства Цены на нефть во вторник немного снизились, поскольку трейдеры оценивали риски, связанные с напряжённостью между Россией и Украиной, а также опасения перепроизводства. Кирилл Дианов: «Финансовый сектор стал драйвером импортозамещения» Кирилл Дианов: «Финансовый сектор стал драйвером импортозамещения» Российский финансовый сектор находится на этапе масштабной технологической перестройки ввиду регуляторных требований и ограничений на использование зарубежного программного обеспечения. Ужесточение стандартов ЦБ, в том числе приказ № 683-П, ставит перед банками и страховыми компаниями задачу не только обеспечить высокий уровень информационной безопасности, но и выстроить устойчивую ИТ-инфраструктуру на базе отечественных решений. Вместе с Кириллом Диановым, руководителем направления облачной интеграции «Онланты», обсудили тренд на импортозамещение в финсекторе и проанализировали ряд используемых решений.

Канал Finversia на YouTube

календарь эфиров Finversia-TV »

 

Новости »

Корпоративные новости »

Blocks_DefaultController:render(13)