Репост из: Brodetskyi. Tech, VC, startups
Видео недоступно для предпросмотра
Смотреть в Telegram
Интересная штука: нейросеть получает на вход аудио речи и подбирает к ней жестикуляцию. Полноценные дипфейки всё ближе.
Обучали на видео с ведущими, лекторами и другими публичными спикерами, датасет можно скачать (144 часа видео с размеченной жестикуляцией).
Обучали на видео с ведущими, лекторами и другими публичными спикерами, датасет можно скачать (144 часа видео с размеченной жестикуляцией).