Компания запускает новое приложение для создания видео с помощью генеративного искусственного интеллекта. Flow использует новую модель ИИ Veo 3, которая впервые сможет создавать видео со звуком, что является новым этапом развития подобных генеративных ИИ. Veo 3 понимает контекст и способна добавлять соответствующее звуковое сопровождение, включая разные эффекты, шумы и даже диалоги. Пользователи смогут создавать диалоги, указывая в описании персонажей и их реплики.
Генерация звуков и музыки не является чем-то необычным для ИИ. Но Google первой представила инструмент, который согласует генерацию видео со звуковой генерацией. Это позволяет создавать небольшие согласованные клипы длительностью до 8 секунд. Приложение Flow напоминает простой видеоредактор и в нем потом можно сшивать эти короткие ролики. Также Flow использует инструменты на основе ИИ Gemini и Imagen.
Google рассматривает Veo 3 в качестве мощного инструмента для творчества, чтобы создатели контента и режиссеры могли быстро посмотреть, как будет выглядеть их идеи до полноценной большой реализации. Google DeepMind не раскрывает, откуда брались данные для обучения. Но скорее всего, для этого использовался контент с платформы YouTube. Для снижения риска дипфейков в созданных видео компания запускает собственную технологию водяных знаков SynthID, позволяющую встраивать невидимые маркеры в кадры, которые генерирует Veo 3.
Также Google обновила предыдущую модель Veo 2 и модель генерации изображений Imagen 4.