OpenAI ещё не сделала свою ИИ-модель Sora, специализирующуюся на генерировании видео по текстовым подсказкам, доступной для широкой публики. Однако её способность создания реалистичных видеороликов в высоком разрешении уже нашла применение в профессиональной сфере. В частности, сценарист и режиссёр Пол Трилло впервые использовал данную технологию для генерирования полноценного музыкального клипа для музыканта Эрнеста Грина, известного под псевдонимом Washed Out.
Paul Trillo
Создание видеороликов с иллюзией непрерывного зума- сложный и многогранный процесс. До сих пор, помимо тщательной подготовки съёмочной площадки, для съёмки подобных кинематографических шедевров было необходимо профессиональное оборудование с качественной стабилизацией, опытный оператор и пост-продакш специалист. Однако, возможно, эту задачу несколько облегчит появлений генеративных ИИ технологий вроде модели Sora, представленной OpenAI в феврале 2024 года. В последующие месяцы в сети стали появляться не только официальные ролики от разработчиков, но также экспериментальные короткометражные работы представителей сферы киноиндустрии. К примеру, компания shy kids из Торонто выпустила видеоролик Air Head. Его основу составили сгенерированные ИИ кадры, которые, по словам представителей shy kids, требовали немало пост-продакшн обработки.
В апреле электронный музыкант Август Кэмп также применил наработки OpenAI в отрасли генеративного ИИ, чтобы создать анимационный клип под своё произведение Worldweight. Теперь же режиссёр Пол Трилло использовал Sora, чтобы впервые произвести реалистичный музыкальный видеоклип. Его идея формировалась в воображении режиссёра на протяжении последних десяти лет. Она отчасти напоминает улучшенную версию клипа к композиции «The Great Divide» The Shins, однако, по задумке Трилло, камера должна была двигаться вперёд, а в кадре появляются реалистичные персонажи, взаимодействующие между собой. С помощью Sora Пол сгенерировал стремительное развитие событий, отображающих содержание сингла «The Hardest Part» инди-чиллвейв музыканта Washed Out.
Четырёхминутный ролик состоит из 55 клипов, сгенерированных ИИ по чётким текстовым описаниям режиссёра. В частности, Трилло задал модели создать более 700 отрывков, шаг за шагом описывая не только содержание кадра и развитие событий, но также ракурсы, освещение и т. п. К примеру, текстовая подсказка для одного из кадров выглядит следующим образом: «Девушка надувает розовый пузырь из жвачки. Мы пролетаем сквозь него, лопая его, и оказываемся на открытом футбольном поле». Создатель ролика подчеркнул, что он не использовал методику «оживления» готовых статичных кадров, сгенерированных другими ИИ, но генерировал кадры напрямую посредством Sora. К тому же Пол подчеркнул, что при тщательном отборе роликов и их объединении при помощи Adobe After Effects контент ИИ требовал минимальной постобработки. Результат трудно назвать безупречным: в кадре хватает странных дефектов, искажения форм людей, их движений и т. п. Тем не менее это определённо любопытный эксперимент, который отражает неплохие перспективы применения ИИ-технологий в различных проявлениях киноискусства.