Midjourney запускает первую видеомодель для преобразования изображений в короткие видео.

После многочисленных слухов компания Midjourney представила свою первую видеомодель. Этот шаг они считают важной вехой на пути к разработке искусственного интеллекта, способного в реальном времени моделировать целые 3D-миры.


Новая функция «Изображение в видео» дает возможность пользователям преобразовывать любое изображение от Midjourney в короткий анимированный клип. Процесс анимации осуществляется через новую кнопку «Анимировать» в веб-интерфейсе Midjourney. Пользователи могут выбирать между автоматическим режимом, когда система определяет движение, и ручным режимом, где они могут сами задавать, как должна развиваться анимация.

Существует два основных режима: «Низкое движение», который идеально подходит для сцен с неподвижной камерой и плавным движением, и «Высокое движение», который более активно анимирует как камеру, так и объекты съемки, хотя это иногда может привести к менее точным результатам, как утверждает Midjourney.

Каждое видео можно продлить до примерно четырех секунд, с возможностью увеличения повторно до четырех раз. Пользователи также могут менять исходное изображение при каждом увеличении.

Кроме того, пользователи могут анимировать изображения, созданные вне Midjourney, просто перетащив их в панель подсказок и выбрав в качестве «начального кадра». После этого нужно описать желаемое движение в текстовой подсказке.

Midjourney не предоставляет официальные спецификации по разрешению, частоте кадров или битрейту, и в данный момент не предусмотрено встроенное масштабирование. Однако загруженные видео выходят в формате MP4 с разрешением 480p и частотой 24 кадра в секунду.

Создание видео обойдется примерно в восемь раз дороже, чем создание изображения

В настоящее время возможность создания видео доступна только через веб-интерфейс. Каждое видео стоит примерно в восемь раз дороже, чем изображение, и генерирует четыре пятисекундных клипа. Практически это можно считать одним изображением на каждую секунду видео. Midjourney утверждает, что это примерно в 25 раз дешевле, чем у конкурентов.

Для подписчиков уровня «Pro» и выше Midjourney также тестирует «Режим расслабленного видео», который позволяет пользователям создавать видео без использования минут быстрого обработки, что потенциально снижает стоимость одного проекта. Компания отметила, что цены будут скорректированы в ближайшие недели в зависимости от спроса и нагрузки на сервер.

Midjourney считает эту видеомодель необходимым этапом. В конечном итоге планируется интеграция видеомоделей, 3D-элементов и обработки в реальном времени в единую платформу. Основатель Дэвид Хольц давно стремится создать систему, способную моделировать мир в реальном времени. Опыты, полученные в процессе разработки видеомодели, также используются в существующих инструментах Midjourney для работы с изображениями.

Конкуренция и правовое давление

В области видео с использованием ИИ новая модель Google Veo 3 признана лидером. Veo 3 может генерировать видео по текстовым подсказкам без необходимости исходного изображения, а также добавлять голоса и звуковые эффекты, что делает её уникальной на современном рынке.

Тем временем Disney и Universal подали совместный иск против Midjourney, утверждая, что генератор изображений на основе ИИ создает несанкционированные изображения защищенных товарными знаками персонажей, таких как Дарт Вейдер и Миньоны. В иске, поданном в окружной суд США в Калифорнии, Midjourney обвиняется в неоднократном копировании материалов, защищённых авторским правом, несмотря на предостережения.

Объекты иска требуют возмещения ущерба, судебного разбирательства с присяжными и запрета на дальнейшее использование защищенных персонажей. Подобные споры об авторских правах с участием Midjourney начали возникать в 2023 году. До сих пор Midjourney не делала публичных комментариев, и неясно, какие видеоданные использовались для обучения новой модели.


Хотите быть в курсе важных новостей из мира ИИ? Подписывайтесь на наш Telegram‑канал BotHub AI News.

Источник

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

Основатель более 10 стартапов в области ИТ и ИИ. Серийный предприниматель. Профессиональный управленец.