За пределами человеческих данных: ставка Дэвида Сильвера в $1,1 млрд на обучение с подкреплением

15

В гонку за превосходство в области искусственного интеллекта вступил новый игрок. Британский ИИ-стартап Ineffable Intelligence, основанный бывшим тяжеловесом DeepMind Дэвидом Сильвером, привлек $1,1 миллиарда финансирования при оценке компании в $5,1 миллиарда.

Этот проект — не просто очередной участник рынка больших языковых моделей (LLM); компания пытается фундаментально изменить сам принцип того, как машины обретают интеллект.

Цель: создание «суперобучаемого» ИИ

В то время как современные модели ИИ, такие как ChatGPT, в значительной степени полагаются на огромные массивы данных, созданных человеком, Ineffable Intelligence стремится преодолеть эту зависимость. Их цель — разработать «суперобучаемого агента» (superlearner) — ИИ, способного самостоятельно открывать новые знания и осваивать сложные навыки с помощью обучения с подкреплением (reinforcement learning).

В отличие от традиционного обучения с учителем, где ИИ изучает готовые примеры, созданные людьми, обучение с подкреплением позволяет системе учиться методом проб и ошибок. Такой подход дает возможность ИИ сталкиваться с задачами и решать их, даже если у людей нет данных, чтобы их описать.

«В случае успеха это станет научным прорывом, сопоставимым по масштабу с открытиями Дарвина: если его закон объяснил всё многообразие Жизни, наш закон объяснит и позволит создавать любой Интеллект». — Ineffable Intelligence

Репутация Дэвида Сильвера

Столь высокая оценка компании во многом обусловлена опытом её основателя. Дэвид Сильвер, профессор Университетского колледжа Лондона, более десяти лет возглавлял команду по обучению с подкреплением в Google DeepMind.

В его послужном списке значатся одни из самых значимых вех в истории ИИ:
AlphaZero: программа, которая освоила шахматы и игру Го исключительно путем игры против самой себя.
Автономное открытие: в отличие от предыдущих движков, опиравшихся на записи человеческих партий, системы Сильвера учились в процессе самообучения, в конечном итоге превзойдя лучших игроков мира — как людей, так и компьютеры.

Сильвер считает Ineffable Intelligence «делом всей своей жизни», отмечая при этом, что любая личная прибыль от проекта будет направлена в благотворительные фонды с высоким социальным эффектом.

Новая эра «кокосовых раундов»

Масштаб этого раунда финансирования подчеркивает растущий тренд в мире венчурного капитала. Ineffable Intelligence получила статус «пентакорна» (оценка свыше $5 млрд) практически сразу после своего основания.

Это следует моделям, характерным для стартапов, созданных «звездными исследователями». Такие раунды часто называют «кокосовыми» (coconut rounds) — это своего рода гипертрофированный «посевной раунд», когда колоссальный капитал выделяется на раннем этапе, опираясь исключительно на репутацию основателей. Недавние примеры включают:
AMI Labs: сооснованная лауреатом премии Тьюринга Янном Лекуном; недавно привлекла $1,03 млрд.
Recursive Superintelligence: сооснованная бывшим ученым DeepMind Тимом Роктшелем; по сообщениям, компания ищет до $1 млрд.

Лондон: новый глобальный центр ИИ

Успех Ineffable Intelligence подтверждает растущую роль Лондона как ключевого узла в глобальной экосистеме ИИ. Этому способствуют:
— Долгосрочное наследие DeepMind в Великобритании.
— Мощная сеть выпускников DeepMind, занимающих руководящие посты в новых стартапах.
— Стратегические инвестиции со стороны таких структур, как British Business Bank и британского фонда Sovereign AI.

Приток капитала от таких гигантов, как Sequoia Capital, Lightspeed Venture Partners, Nvidia и Google, говорит о том, что индустрия делает ставку на переход от моделей, которые имитируют человека, к моделям, которые превосходят его за счет независимого мышления.


Заключение
Отказываясь от зависимости от человеческих данных в пользу автономного обучения с подкреплением, Ineffable Intelligence пытается устранить одно из главных «узких мест» в развитии ИИ. Если Сильвер сможет масштабировать свой успех с AlphaZero на гораздо более высокий уровень, это может ознаменовать переход от генеративного ИИ к по-настоящему автономному интеллекту.