В Университете Вашингтона разработали алгоритм, позволяющий создавать на основе аудио реалистичные видео. Алгоритм, обученный на 17 часах видеообращений Барака Обамы, получает на вход запись его речи, а выдаёт качественное видео c липсинком. Работает эта штука только с голосом, на котором её обучали, так что делать совсем грязные фейки не получится - можно сгенерить только видео со словами, которые человек действительно говорил, пусть даже 30 лет назад (пример на видео). Где это может пригодиться? К примеру, во время видеозвонка при плохой связи можно передавать только аудиоканал и все равно показывать качественное видео.
https://youtu.be/MVBe6_o4cMI
https://www.washington.edu/news/2017/07/11/lip-syncing-obama-new-tools-turn-audio-clips-into-realistic-video/
Ещё более впечатляющий алгоритм, который позволяет на лету заменять мимику другого человека на видео своей: https://t.me/brodetsky/232
https://youtu.be/MVBe6_o4cMI
https://www.washington.edu/news/2017/07/11/lip-syncing-obama-new-tools-turn-audio-clips-into-realistic-video/
Ещё более впечатляющий алгоритм, который позволяет на лету заменять мимику другого человека на видео своей: https://t.me/brodetsky/232