Американские специалисты из Стэнфордского и Принстонского университетов разработали уникальный компьютерный алгоритм, который позволяет изменять речь людей на видео. Как выяснили журналисты «Фразы», «для пущей» убедительности программа способна не только фальсифицировать голос, но и изменять мимику, а также длину ролика.
Как передает «Нож» со ссылкой на ohadf.com, принцип работы программы заключается в следующем: сначала она выделяет аудиодорожку из ролика, разделяя речь человека на т. н. «фонемы» (минимальные смыслоразличительные единицы языка). Затем «прога» создает трехмерную модель лица человека, сканируя, как он двигает губами и произносит слова, поле чего находит висемы ‒ звуки, которые выглядят одинаково при движении губ ‒ и использует их для создания мимики под новые фразы.
В итоге из двух произнесенных слов алгоритм создает третье.
Чтобы отредактированный голос больше походил на речь оригинала, исследователи пользуются специальной программой VoCo, которую создали еще в 2016 году. Проанализировав небольшой монолог человека, программа способна «спародировать» его голос.
Как писала «Фраза», ученые рассказали, в какое время полезнее всего пить кофе.
Ранее ученые установили, где зародилась человеческая цивилизация.