Компания OpenAI, известная своим чат-ботом ChatGPT, представила генеративную модель искусственного интеллекта под названием Sora. Она позволяет генерировать видео по текстовому описанию.
Sora — это диффузионная модель, которая способна «создавать сложные сцены с несколькими персонажами, определенными типами движения и точными деталями объекта и фона». На сайте проекта сказано, что модель умеет понимать подсказки и знает, как ведут себя различные объекты в физическом мире.
Что важно, так это тот факт, что Sora генерирует целое видео сразу, а не покадрово. Это помогает избежать того, что было проблемой при использовании других подходов — изменения объекта при движении или перемещении камеры.
Модель в том числе способна генерировать видео на основе статичных изображений, а также заполнять недостающие кадры в существующих роликах или расширять их.
Пока нейросеть недоступна для общего использования. Её предоставили только некоторым художникам, дизайнерам и режиссёрам, которые смогут поделиться своими отзывами с разработчиками. Даты появления общедоступной версии пока нет.
https://m.youtube.com/watch?time_continue=34&v=IW-NLYd8z80&embeds_referring_euri=https%3A%2F%2Fkod.ru%2F&source_ve_path=Mjg2NjY&feature=emb_logo