Интернет-магазин MagazinWeb

Google DeepMind представляет модель искусственного интеллекта Genie 2, способную генерировать игровые 3D-миры для обучения агентов искусственного интеллекта

Google заявила, что эти управляемые действиями игровые 3D-среды могут использоваться людьми или агентами ИИ.

Google DeepMind Unveils Genie 2 AI Model, Can Generate Playable 3D Worlds to Train AI Agents

Google заявляет, что Genie 2 может создавать согласованные миры для минутаРеклама <стр>В среду Google DeepMind представила преемника модели искусственного интеллекта (ИИ) Genie, которая может генерировать бесконечные игровые миры 2D. Новая модель ИИ, получившая название Genie 2, способна генерировать уникальные управляемые действиями игровые 3D-среды на основе единственного изображения-подсказки. Назвав Genie 2 «моделью мира» ИИ, компания заявила, что она может генерировать среды длительностью до минуты с постоянными объектами. Компания заявила, что эти сгенерированные миры могут быть использованы людьми или могут использоваться для обучения агентов ИИ.

Google DeepMind представляет модель искусственного интеллекта Genie 2

В сообщении в блоге компания подробно описала новую модель искусственного интеллекта и ее возможности. В то время как ее предшественник мог генерировать только игровые миры для 2D-платформенных игр, модель искусственного интеллекта Genie 2 может генерировать 3D-миры с согласованными моделями, с которыми можно взаимодействовать. Это означает, что люди или агенты искусственного интеллекта могут ходить, бегать, плавать, лазать и выполнять больше действий в этих средах.

Генеративные возможности Genie 2 позволяют ему генерировать маршруты, здания и объекты, которые не видны на входном изображении. Эти элементы разрабатываются и визуализируются моделью с нуля. Кроме того, базовая модель также способна поддерживать согласованность в этих средах. Это означает, что даже когда игрок уходит из одной области и возвращается обратно, среда остается прежней.

Помимо этого, Genie 2 способен генерировать различные перспективы, такие как виды от первого лица, изометрические виды или виды от третьего лица. Кроме того, пользователи также могут взаимодействовать с объектами в сгенерированных мирах и могут выполнять такие действия, как открытие двери, лопание воздушного шара или подъем по лестнице. Модель также может быть предложена для генерации эффектов, связанных с физикой, таких как водная рябь, дым, гравитация, направленное освещение, отражения и многое другое.

Переходя к техническим деталям, DeepMind объяснил, что Genie 2 является авторегрессионной моделью скрытой диффузии и была обучена на большом наборе видеоданных. Архитектура трансформатора также включает в себя автоэнкодер, который позволяет покадрово генерировать эти миры.

Примечательно, что DeepMind также выпустил модель ИИ, названную Scalable Instructable Multiworld Agent или SIMA ранее в этом году, которая по сути способна выполнять агентские функции ИИ в трехмерных мирах. Компания заявляет, что Genie 2 способен предоставлять уникальные среды для похожих агентов ИИ и обучать их различным реальным сценариям.

  • Вот как ИИ помог Google совершить выдающиеся научные открытия в 2024 году
  • Google Photos упрощает удаление медиафайлов из резервных копий на iPhone

Поскольку модель мира может генерировать уникальные среды, Google заявляет, что это исключит риск заражения данных и позволит разработчикам правильно оценивать возможности агента ИИ.