
Группа исследователей из Китайского университета Гонконга представила фреймворк, который закрывает один из главных пробелов в ИИ-разработке: до сих пор языковые модели неплохо справлялись с изолированными задачами, например, написать функцию, починить баг, предложить архитектуру. Но стоило попросить собрать из этих кусочков рабочую игру, система рассыпалась. Файлы переставали согласовываться друг с другом, сцены ломались, логика конфликтовала.
OpenGame решает именно эту проблему, в основе системы — два механизма, которые авторы назвали Game Skill. Template Skill отвечает за выбор архитектуры: перед тем как писать код, агент смотрит в собственную библиотеку шаблонов и выбирает подходящий «скелет» проекта — на Phaser, canvas или three.js. Это не простой набор заготовок: библиотека пополняется с каждым успешным запуском, то есть система буквально учится на своем опыте.
Механизм Debug Skill работает как опытный QA-инженер внутри агента. После генерации кода фреймворк запускает игру в безголовом браузере — без интерфейса, в фоновом режиме — и ищет ошибки: зависшие сцены, сломанные переходы, нерабочие элементы управления. Найденные баги фиксируются в живой базе знаний, и при следующем похожем проекте агент уже знает, как их обойти. Это принципиально отличает OpenGame от обычных ИИ-кодеров, которые каждый раз наступают на одни и те же грабли.
Языковая основа системы — GameCoder-27B, модель на 27 миллиардов параметров, обученная специально под нужды геймдева. Ее тренировали в три этапа: сначала на большом массиве кода с акцентом на игровые движки, затем на конкретных примерах разработки с правильными траекториями решений, и через reinforcement learning, где вознаграждение модель получала только за реально играбельный результат. Не за «красивый» код, а за то, что игру можно открыть и пройти.
Чтобы оценивать результаты не на глаз, команда разработала собственный бенчмарк — OpenGame-Bench. Он проверяет сразу несколько пунктов: технически ли собирается проект, можно ли в него нормально играть визуально, и насколько итог соответствует исходному запросу. Оценку ставит не человек, а мультимодальная модель, которая буквально смотрит на скриншоты и видео с запуском игры.
На 150 разных промптах OpenGame показал результаты выше всех существующих решений. Среди тестовых заданий были полноценный файтинг в стиле King of Fighters, «защита башня» с кошками-мемами и ритм-игра по мотивам «Игры в кальмара». Фреймворк открыт: код доступен на GitHub, запустить его можно локально с любым OpenAI-совместимым API.
Также недавно стало известно, что по культовой игре Elden Ring выйдет фильм. Подробности в статье.
Источник: hi-tech.mail.ru