Компанія DeepMind, яка є дочірньою структурою Google, випустила нову модель штучного інтелекту Genie 3 для генерації інтерактивних тривимірних середовищ. Третя версія Genie демонструє значно вищу якість генерації та здатність запам’ятовувати дії у створеному світі. Завдяки цьому ШІ вперше створює взаємопов’язаний світ, який не змінюється при зміщенні камери.
Genie 3 генерує світ за простими текстовими підказками та дає змогу швидко змінювати його вміст. Зображення він видає у форматі 720p при 24 кадрах на секунду. Підтримується навігація світом у реальному часі та можливість генерації якихось подій у ньому. З урахуванням зв’язності та збереження структури світу, це вперше нагадує повноцінне тривимірне моделювання світу. Наприклад, ви створюєте квартиру, використовуєте віртуальний валик для фарбування — і всі смуги залишаються на тому ж місці після рухів кімнатою. Раніше подібні моделі не вміли підтримувати таку узгодженість.
Genie 3 можна використовувати для моделювання фізичних процесів у реальному світі та сцен із реального світу, і це тепер має цілком правдоподібний вигляд. За допомогою такого ШІ можна вивчати історичні місця та часові епохи. Його можна використовувати для навчання дій у надзвичайних ситуаціях і для створення інших навчальних посібників. Також це потужний інструмент для створення анімації та ігрових світів.
Що стосується часу, то ШІ здатен створювати вже кілька хвилин взаємопов’язаного світу. Попередня версія видавала робоче середовище на 10–20 секунд. І це теж значний прогрес.
