Microsoft представила ИИ-модель для создания игровых миров. Она не заменит разработчиков — лишь сможет им помочь (но и это не точно) Представители индустрии назвали систему бесполезной
Microsoft в середине февраля представила свою первую модель искусственного интеллекта, способную генерировать игровой процесс на основе визуального ряда. Исследователи сразу подчеркнули, что это не самостоятельный ИИ, который полностью заменит разработчиков, — скорее Muse станет помощником, ускоряющим процесс создания новых проектов. Система поможет в прототипировании геймплейных механик, тестировании идей, а в перспективе — и в сохранении старых игр. «Медуза» рассказывает, как новая модель может помочь разработчикам и есть ли у нее конкуренты.
Новая генеративная модель получила название Muse. Разработчики придумали для нее специальное определение — World and Human Action Model (WHAM). Они утверждают, что эта система способна «понимать», как устроены трехмерные миры, в том числе — как они реагируют на действия игрока и как в них устроена физика. Благодаря этому Muse может генерировать и визуализировать разнообразный геймплей, моделируя различные игровые ситуации.
Исследовательское подразделение Microsoft Research работало над Muse совместно со студией Ninja Theory. Для обучения модели использовали многопользовательскую игру Bleeding Edge, вышедшую в 2020 году. Это не самый удачный проект британских разработчиков, но он позволил исследователям получить доступ к записям геймплея обычных людей. Благодаря этому система обучалась на реальных действиях игроков в тех или иных ситуациях и на том, как они взаимодействовали с виртуальным миром.
В статье, опубликованной в журнале Nature, создатели Muse рассказали, что в их распоряжении были записи примерно 500 тысяч игровых сессий — это соответствует примерно семи годам непрерывного геймплея. Самая большая версия модели имеет 1,6 миллиарда параметров и способна генерировать изображение в разрешении 300 на 180 пикселей с частотой около 10 кадров в секунду. Примеры можно найти в блоге Microsoft Research.
Новая ИИ-модель не предназначена для полноценного создания игр и не способна полностью заменить людей ни на одном из этапов разработки. Фактически сейчас система лишь визуализирует возможный геймплей на основе заданных параметров. Но, по словам исследователей, она может упростить или ускорить определенные процессы. Например, с помощью Muse можно проверять работоспособность идей и прототипировать новые игровые механики.
Сейчас, если гейм-дизайнер хочет протестировать нового персонажа для игры, ему нужно привлекать команду программистов и художников, чтобы написать код и создать необходимые визуальные материалы, объясняет Engadget. Но в конечном итоге идею могут признать неудачной, отказаться от всех готовых наработок и начать весь процесс заново. Это очень трудоемкая и дорогая часть разработки видеоигр, отмечает издание. С помощью Muse студии смогут проверять жизнеспособность прототипов, не привлекая дополнительные ресурсы.
Исследователи определили для себя три ключевых требования, которым должна соответствовать система WHAM: стабильность, разнообразие и устойчивость. Первый параметр подразумевает, что модель генерирует игровые последовательности, учитывающие динамику происходящего. То есть персонаж должен выполнять команды с контроллера, не проходить сквозь стены и в целом соблюдать физические требования мира.
Разнообразие означает способность модели генерировать различные варианты игрового процесса на основе одного промпта. Показатель устойчивости — это способность системы корректно реагировать на пользовательские модификации. Например, если в уже сгенерированную игровую последовательность добавляют новый объект или персонажа, модель должна сохранить его и учитывать при дальнейшей генерации геймплея.
В статье Nature говорится, что в ходе тестов показатели устойчивости Muse варьировались в зависимости от условий и конкретных элементов, добавленных в последовательность. Но в целом он может достигать 85%, что можно считать довольно высоким показателем. На практике это означает, что разработчики смогут быстро получать относительно точную информацию о том, как новый контент повлияет на геймплей уже существующей игры.
Microsoft не первопроходцы: похожие разработки есть и у других компаний. А ИИ-модель Nvidia сгенерировала игру еще пять лет назад
В Microsoft утверждают, что Muse — «первая в своем роде» ИИ-модель, хотя это далеко не так. Например, в октябре 2024 года израильский стартап Decart представил свою разработку под названием Oasis. Эта модель способна генерировать интерактивные игровые миры в реальном времени. Причем Oasis воспринимает команды с клавиатуры и мыши, а также симулирует физику и общие правила игровой вселенной.
Модель обучали на видеозаписях геймплея Minecraft, поэтому миры, которые она генерирует, визуально похожи на эту игру. Учитывая это, Muse даже нельзя назвать первой ИИ-системой, в обучении которой использовались проекты Microsoft, отмечает Engadget.
Пока разработка Decart далека от идеала: Oasis генерирует картинку в низком разрешении, система часто выдает ошибки, а функция создания мира по скриншоту из другой игры работает плохо. Но главное — у модели нет «памяти». Если стоять на месте и просто поворачивать камеру, окружающий ландшафт будет постоянно меняться. Тем не менее уже на раннем этапе Oasis представляет собой рабочую модель, способную генерировать игровой процесс с приемлемой частотой кадров.
В декабре 2024-го подразделение Google DeepMind рассказало о схожей разработке — Genie 2. Эта модель может генерировать виртуальные миры на основе одного текстового промпта или изображения. Она учитывает различные сценарии поведения игрока, может симулировать физику объектов, освещение и различные эффекты — например, отражения или дым. Также с помощью Genie 2 можно создавать разную анимацию для виртуальных героев.
Модель может добавлять в мир неигровых персонажей и прописывать сложные сценарии взаимодействия с ними. Кроме того, во время генерации Genie 2 учитывает положение камеры (вид от первого или третьего лица, изометрия) и способна запоминать те части мира, которые пропадают из поля зрения пользователя (и восстанавливать их при необходимости).
Компания Nvidia тоже развивает это направление. Ее модель GameGAN смогла сгенерировать полностью рабочую версию игры Pac-Man еще в 2020 году — без базового игрового движка и доступа к исходному коду. Как уточняет TechCrunch, технически для создания виртуальных миров можно использовать и другие разработки. Например, ИИ-модель Sora от OpenAI, предназначенную для генерации видео.
В Microsoft надеются, что Muse поможет с сохранением старых игр. Другие разработчики считают, что компания просто заигрывает с акционерами
В исследовании Microsoft Research упоминается еще одна область, в которой Muse может быть полезна. Создатели модели считают, что она способна помочь в сохранении и восстановлении старых игр. Это действительно серьезная проблема, которую часто обсуждают в индустрии в последнее время.
По данным исследования Video Game History Foundation, опубликованного в 2023 году, под угрозой исчезновения находятся 87% классических видеоигр, выпущенных в США. Это означает, что они не доступны в современных цифровых магазинах и единственный способ запустить их — найти оригинальный носитель (например, диск или картридж) и соответствующее оборудование. Часть этих игр доступна на пиратских ресурсах, но это нельзя считать полноценным и надежным способом сохранения.
Некоторые компании запускают собственные программы по сохранению старых игр. Например, такой проект есть у цифрового магазина GOG. Сейчас в его каталоге более сотни классических игр, и в будущем он будет пополняться. Например, скоро в него добавят шутер F.E.A.R. от студии Monolith Productions, которую закрыли в феврале 2025 года. При этом GOG не просто продает старые игры, но и гарантирует, что они будут запускаться на современных компьютерах. В будущем цифровой магазин также планирует адаптировать все проекты из каталога под требования нового железа.
Сохранению видеоигр мешают законы об авторских правах. В случае некоторых проектов неизвестно, кто выступает правообладателем. Либо права на них стали предметом судебных (и не всегда завершенных) разбирательств. Все это становится серьезным препятствием для сохранения. Кроме того, часть старых игр просто невозможно добавить в каталог: исходный код утерян, и даже компании, которые их разрабатывали, не могут восстановить их в оригинальном виде.
Часть этих задач может решить Muse. Исследователи считают, что ИИ-модель может упростить и ускорить оптимизацию старых игр под возможности современных игровых систем. Пока Microsoft только изучает возможности Muse в этой области и не делится подробностями. Авторы исследования лишь уточняют, что хотят опробовать систему на старых играх из каталога компаний-разработчиков, входящих в игровое подразделение Xbox Game Studios.
Эти утверждения вызвали критику среди представителей игровой индустрии. Майкл Кук, старший преподаватель факультета информатики в Королевском колледже Лондона, считает, что до сих пор нет метода определить, что именно фиксирует ИИ-модель в ходе обучения. А значит, искусственный интеллект не способен воспроизвести игру в ее оригинальном виде, вне зависимости от количества обучающих материалов.
Кук в целом сомневается, что проект Muse может вырасти во что-то серьезное. По его мнению, это слишком дорогой и непрактичный инструмент, которому потребуется огромное количество обучающих данных. Иными словами, чтобы заниматься прототипированием для какой-то конкретной игры, она должна уже существовать на рынке какое-то время и быть относительно популярной.
Авторы исследования отмечают, что они опросили 27 разработчиков из восьми студий, чтобы лучше понять их потребности. Однако журналисты Wired обсудили анонс Muse с несколькими представителями игровой индустрии, и все они раскритиковали новую разработку Microsoft.
«Это классическая проблема Xbox — они теряют талантливых разработчиков, но при этом так сильно вкладываются в генеративный ИИ, что не видят за деревьями леса», — прокомментировал один из разработчиков ААА-игр на условиях анонимности. По его словам, ему не разрешено публично говорить о Muse.
«Они не понимают, что это никому не нужно. Им все равно, что это никому не нужно… Внутренние обсуждения таких вещей затихают, потому что все боятся выступить против и потерять работу в это нестабильное для игровой индустрии время», — добавил собеседник издания.
«Мне кажется, что настоящая целевая аудитория этой модели — не разработчики игр, а акционеры, которым Microsoft хочет показать, что полностью посвятила себя ИИ. Хотя компания еще не создала ни одного продукта, действительно востребованного кем-либо», — сказал другой разработчик. Он также попросил не раскрывать его имя, так как сейчас обсуждает сделку по включению своей игры в подписочный сервис Game Pass, принадлежащий Microsoft.
Марк Берредж, директор по разработке в британской студии Creative Assembly, утверждает, что компьютеры не могут извлекать из процесса обучения те же знания, что и люди. «Прототипирование — это не только результат, но и сам путь, и нужно пройти его, чтобы усвоить все необходимые знания, — сказал разработчик. — Быстрое прототипирование — важнейший навык, который нельзя просто отбросить и надеяться, что это никак не отразится на уровне твоей подготовки».
Михаил Герасимов