Компания DeepMind, которая является дочерней структурой Google, выпустила новую модель искусственного интеллекта Genie 3 для генерации интерактивных трехмерных сред. Третья версия Genie демонстрирует значительно возросшее качество генерации и способность запоминать действия в созданном мире. Благодаря этому ИИ впервые создает взаимосвязанный мир, который не меняется при смещении камеры.

Genie 3 генерирует мир по простым текстовым подсказкам и позволяет быстро менять его содержимое. Изображение он выдает в формате 720p при 24 кадрах. Поддерживается навигация по миру в реальном времени и возможность генерации каких-то событий в нем. С учетом связности и сохранения структуры мира, это впервые напоминает полноценное трехмерное моделирование мира. Например, вы создаете квартиру, используете виртуальный валик для покраски – и все полосы остаются на том же месте после движений по комнате. Ранее подобные модели не умели поддерживать такую согласованность.

Genie 3 можно использовать для моделирования физических процессов в реальном мире и сцен из реального мира, и это теперь выглядят вполне правдоподобно. С помощью такого ИИ можно изучать исторические места и временные эпохи. Его можно использовать для обучения действиям в чрезвычайных ситуациях и для создания других учебных пособий. Также это мощный инструмент для создания анимации и игровых миров.

Что касается времени, то ИИ способен создавать уже несколько минут взаимосвязанного мира. Предыдущая версия выдавала рабочую среду на 10–20 секунд. И это тоже значительный прогресс.