YouTube продемонстрировала технологию ИИ-дубляжа видео

YouTube планирует упростить процесс дублирования видео пользователей на других языках, предоставив им помощь ИИ-алгоритма. Об этом представители компании сообщили в рамках конференции VidCon.

По словам представителей компании, ИИ-дубляж – это технология, разрабатываемая командой сервиса Aloud, зародившегося в «инкубаторе идей» Google Area 120. На официальном сайте проекта Aloud описан следующий алгоритм работы технологии. Сперва инструмент создаёт транскрипт видео, предоставляя его автору контента для проверки и редакции. Затем система переводит транскрипт и автоматически переозвучивает его на новом языке. По словам вице-президента по управлению продуктами бренда Амджада Ханифа, в настоящий момент YouTube уже тестирует технологию с «сотнями» ютуберов. Пока речь идёт о поддержке ограниченного числа языков, включая английский, испанский и португальский, однако в перспективе в Aloud планируют постепенно расширять поддержку новых языков.

В YouTube считают, что даже с ограниченным числом языков пользователи смогут по достоинству оценить функционал ИИ-дубляжа, поскольку огромное количество людей на платформе заинтересованы в подаче своего контента для широкой аудитории, и его дублирование на разных языках – эффективный способ нарастить разношерстную аудиторию. К тому же такой ход позволит сделать видео более доступным для людей из разных уголков планеты, что особенно актуально, если речь идёт об образовательно-просветительском контенте. К слову, услышать пример переозвучки в исполнении алгоритма Aloud вы можете на примере одного из видео канала Amoeba Sisters, который публикует доступный образовательный контент – обычно на английском языке. При нажатии на «шестерёнку» настроек нужно открыть опцию «звуковых дорожек» и выбрать дорожку дубляжа.

Стоит отметить, что пока ИИ-дубляж звучит несколько искусственно. Однако эксперты Aloud уже работают над технологией, которая позволит ИИ генерировать звуковые дорожки с голосом, максимально близким к голосу оригинальной озвучки видео. Кроме того, разработчики рассчитывают добавить в голос дубляжа больше эмоций и экспрессии, чтобы дубляж подкреплял посыл оригинального контента, а не существовал параллельно нему. И наконец, создатели алгоритма хотели бы, чтобы озвучка синхронизировалась с движениями губ людей в кадре, насколько это возможно. По словам пресс-секретаря платформы YouTube Джессики Гибби, запуск дополнительных функций сервиса запланирован на 2024 год.

Поделиться в соцсетях