Anthropic опубликовала результаты внутреннего тестирования своей новой модели Claude Fable 5, в ходе которого ИИ-агент смог полностью пройти игру Pokémon FireRed, опираясь исключительно на картинку с экрана. Разработчики подчеркнули, что модель не получала карту, доступ к внутреннему состоянию игры и подсказки о том, куда двигаться дальше. Весь визуальный поток (локации, меню, диалоги, сражения) транслировался напрямую, как если бы перед монитором сидел человек.
Игра Pokémon FireRed Version Ролевая игра, Стратегия, Файтинг, В реальном времени, Вид сверху, Головоломка, Аниме / манга 28 января 2004 Game Boy Advance Игроки 9.3/10
В опубликованном видеоролике видно, как Claude Fable 5 запускает Pokémon FireRed, методично прокачивает покемона и проходит сюжетную линию. Некоторые действия выглядели неочевидно: например, ИИ время от времени возрождал слабых покемонов, чтобы те были моментально уничтожены. Остаётся неясным, нашла ли модель такую тактику самостоятельно или дополнила увиденное информацией из обучающих данных. Тем не менее факт остаётся фактом — игра была пройдена, причём без сложных вспомогательных модулей, которые требовались в более ранних экспериментах.


Параллельно Anthropic протестировала Fable 5 в других проектах. В карточном рогалике Slay the Spire результат оказался заметно скромнее: ИИ застрял на третьем уровне, который сами разработчики в блоге иронично охарактеризовали как «уровень новичка». Зато в Factorio модель сумела выстроить автоматизированную фабрику — задачу, где необходимо долгосрочное планирование, распределение ресурсов и удержание цели на десятках последовательных шагов.
Самый заметный нюанс, который не позволяет воспринимать эксперимент как прелюдию к замене геймеров или стримеров, — колоссальный расход токенов. По оценкам Anthropic, на полноценное прохождение Pokémon уходят вычислительные ресурсы, сопоставимые с промышленными объёмами. Пользователи сети отреагировали на демонстрацию с изрядной долей скепсиса. Комментарий @nopenope-j5s быстро разлетелся по соцсетям.
Я очень рад, что ИИ проходит игры за меня, так что у меня больше времени на мытьё посуды и работу в литиевых шахтах.
— @nopenope-j5s
![]()
Посягают на святое?
В Anthropic, впрочем, и не скрывают, что реальная цель — не прохождение Pokémon или строительство заводов в Factorio. Игры в данном случае служат удобным бенчмарком для оценки того, насколько модель способна обрабатывать визуальную информацию, удерживать контекст и адаптировать стратегию в динамической среде без участия человека. Навыки, отработанные в таких симуляциях, в перспективе могут пригодиться для автоматизации интерфейсов, тестирования сложного ПО или управления многошаговыми бизнес-процессами, где требуется сквозная визуальная ориентация. Ранее новую модель Anthropic попробовали и в создании игр, где она успешно создала клон Minecraft.
Как думаете, дойдут ли подобные игровые эксперименты до реального применения или останутся лишь эффектными демонстрациями возможностей больших моделей? Делитесь мнением в комментариях.
НовостиЖелезо и технологииискусственный интеллект
Источник: vgtimes.ru