Google заявила, что эти управляемые действиями игровые 3D-среды могут использоваться людьми или агентами ИИ.
Google DeepMind представляет модель искусственного интеллекта Genie 2
В сообщении в блоге компания подробно описала новую модель искусственного интеллекта и ее возможности. В то время как ее предшественник мог генерировать только игровые миры для 2D-платформенных игр, модель искусственного интеллекта Genie 2 может генерировать 3D-миры с согласованными моделями, с которыми можно взаимодействовать. Это означает, что люди или агенты искусственного интеллекта могут ходить, бегать, плавать, лазать и выполнять больше действий в этих средах.
Генеративные возможности Genie 2 позволяют ему генерировать маршруты, здания и объекты, которые не видны на входном изображении. Эти элементы разрабатываются и визуализируются моделью с нуля. Кроме того, базовая модель также способна поддерживать согласованность в этих средах. Это означает, что даже когда игрок уходит из одной области и возвращается обратно, среда остается прежней.
Помимо этого, Genie 2 способен генерировать различные перспективы, такие как виды от первого лица, изометрические виды или виды от третьего лица. Кроме того, пользователи также могут взаимодействовать с объектами в сгенерированных мирах и могут выполнять такие действия, как открытие двери, лопание воздушного шара или подъем по лестнице. Модель также может быть предложена для генерации эффектов, связанных с физикой, таких как водная рябь, дым, гравитация, направленное освещение, отражения и многое другое.
Переходя к техническим деталям, DeepMind объяснил, что Genie 2 является авторегрессионной моделью скрытой диффузии и была обучена на большом наборе видеоданных. Архитектура трансформатора также включает в себя автоэнкодер, который позволяет покадрово генерировать эти миры.
Примечательно, что DeepMind также выпустил модель ИИ, названную Scalable Instructable Multiworld Agent или SIMA ранее в этом году, которая по сути способна выполнять агентские функции ИИ в трехмерных мирах. Компания заявляет, что Genie 2 способен предоставлять уникальные среды для похожих агентов ИИ и обучать их различным реальным сценариям.
- Вот как ИИ помог Google совершить выдающиеся научные открытия в 2024 году
- Google Photos упрощает удаление медиафайлов из резервных копий на iPhone
Поскольку модель мира может генерировать уникальные среды, Google заявляет, что это исключит риск заражения данных и позволит разработчикам правильно оценивать возможности агента ИИ.