Компания по разработке искусственного интеллекта OpenAI 15 февраля анонсировала Sora, новую модель, генерирующую видео высокой четкости продолжительностью до одной минуты из текстовых подсказок.
Sora, что в переводе с японского означает "небо", в ближайшее время не станет доступной для широкой публики. OpenAI делает ее доступной для небольшой группы ученых и исследователей, которые оценят вред и потенциал его неправильного использования.
"Sora способна генерировать сложные сцены с несколькими персонажами, определенными типами движения и точными деталями объекта и фона, – сообщает компания на своем сайте. – Модель понимает не только то, что спросил пользователь, но и то, как эти вещи существуют в физическом. мире".
Подписывайтесь на LIGA.Tech в Telegram: главные новости мира технологий
На одном из видео, сгенерированных Sora, опубликованном OpenAI, изображена пара, которая гуляет по заснеженному городу Токио, а лепестки вишневого цвета и снежинки развеваются вокруг них. Другой показывает реалистичных шерстистых мамонтов, гуляющих по лужайке на фоне заснеженных горных хребтов.
OpenAI говорит, что модель работает на основе глубокого понимания языка, что позволяет точно интерпретировать текстовые запросы. Однако, как и все генераторы изображений и видео искусственного интеллекта, Sora не идеальна и имеет артефакты. OpenAI также предупреждает, что модели может быть трудно понять причинно-следственные связи – например, она может создать видео человека, который ест печенье, но на печени может не быть следов укусов.
Читайте такжеПредставлен конкурент Apple Vision Pro. Это круглые очки с искусственным интеллектом.