Sora — это новый генератор текста в видео от OpenAI, создателя ChatGPT. Вот что мы знаем о новом инструменте, вызывающем в равной степени беспокойство и волнение.
Создатель ChatGPT теперь погружается в мир видео, созданного искусственным интеллектом (ИИ).
Встречайте Sora — новый генератор текста в видео от OpenAI. Инструмент, который компания из Сан-Франциско представила в четверг, использует генеративный искусственный интеллект для мгновенного создания коротких видеороликов на основе письменных команд.
Сора не первый, кто демонстрирует подобную технологию. Но отраслевые аналитики отмечают высокое качество видео, показываемых этим инструментом, и отмечают, что его внедрение знаменует собой значительный скачок как для OpenAI, так и для будущего преобразования текста в видео в целом.
Тем не менее, как и все, что сегодня происходит в быстро растущем пространстве искусственного интеллекта, такая технология также вызывает опасения по поводу потенциальных этических и социальных последствий. Вот что вам нужно знать.
Что может Сора и могу ли я ее использовать?
Sora — это генератор текста в видео, позволяющий создавать видеоролики продолжительностью до 60 секунд на основе письменных подсказок с использованием генеративного искусственного интеллекта. Модель также может генерировать видео из существующего неподвижного изображения.
Генеративный ИИ — это отрасль ИИ, которая может создавать что-то новое. Примеры включают чат-боты, такие как ChatGPT от OpenAI, и генераторы изображений, такие как DALL-E и Midjourney.
Заставить систему искусственного интеллекта генерировать видео — более новая и сложная задача, но она опирается на некоторые из тех же технологий.
Sora пока недоступна для публичного использования (OpenAI заявляет, что сотрудничает с политиками и художниками перед официальным выпуском инструмента), и мы еще многого не знаем. Но после объявления в четверг компания поделилась несколькими примерами видеороликов, созданных Sora, чтобы продемонстрировать, на что она способна.
Генеральный директор OpenAI Сэм Альтман также обратился к X, платформе, ранее известной как Twitter, чтобы попросить пользователей социальных сетей присылать быстрые идеи.
Позже он поделился реалистично подробными видеороликами, которые отвечали на такие подсказки, как «два золотистых ретривера ведут подкастинг на вершине горы» и «велогонка по океану с участием разных животных в роли спортсменов, едущих на велосипедах, под видом камеры дрона».
Хотя видеоролики, созданные с помощью Sora, могут отображать сложные, невероятно подробные сцены, OpenAI отмечает, что у них все же есть некоторые недостатки, в том числе некоторые пространственные и причинно-следственные элементы.
Например, OpenAI добавляет на своем веб-сайте: «Человек может откусить кусочек файла cookie, но после этого на файле cookie может не остаться следа откусывания».
Какие еще существуют видеоинструменты, созданные искусственным интеллектом?
Sora от OpenAI — не первый в своем роде. Google, Meta и стартап Runway ML входят в число компаний, продемонстрировавших подобную технологию.
Тем не менее, отраслевые аналитики подчеркивают очевидное качество и впечатляющую длину видеороликов Sora, опубликованных до сих пор.
Фред Хавмейер, руководитель отдела исследований искусственного интеллекта и программного обеспечения в США в Macquarie, сказал, что запуск Sora знаменует собой большой шаг вперед для отрасли.
«Вы не только можете создавать более длинные видеоролики (я понимаю, до 60 секунд), но и создаваемые видеоролики выглядят более нормально и, кажется, на самом деле больше уважают физику и реальный мир», — сказал Хавемейер.
«В видеопотоках не так много видеороликов или фрагментов «зловещей долины», которые выглядят… неестественными».