Исследователи OpenAI разрабатывают новую модель, которая ускоряет создание медиа в 50 раз

Подписка на новости

Подпишитесь на наши ежедневные и еженедельные информационные бюллетени, чтобы получать последние обновления и эксклюзивный контент о ведущих в отрасли технологиях искусственного интеллекта.

Новая модель согласованности от OpenAI

Исследователи из OpenAI представили новую модель согласованности в непрерывном времени (sCM), которая улучшает скорость генерации мультимедиа (изображений, видео и аудио) на 50 раз по сравнению с традиционными диффузионными моделями. Теперь изображения генерируются за 0,1 секунды вместо более чем 5 секунд.

В статье, опубликованной на arXiv.org, авторы Ченг Лу и Ян Сун описывают, как модель sCM позволяет достичь высокого качества выборки всего за два этапа отбора проб, что значительно быстрее по сравнению с предыдущими моделями, требующими сотни шагов.

Возможности новой технологии

Сравнение с диффузионными моделями:
Диффузионные модели требуют большое количество шагов, что замедляет процесс.
sCM обрабатывает шум непосредственно за один или два шага, снижая вычислительные затраты.

Самая большая модель sCM от OpenAI, содержащая 1,5 миллиарда параметров, может создать образец всего за 0,11 секунды на графическом процессоре A100, обеспечивая 50-кратное ускорение по сравнению с традиционными методами.

Качество выборки модели

Модель sCM была обучена на ImageNet 512×512 и сохраняет качество выборки, которое сопоставимо с лучшими диффузионными моделями, с оценкой по Фреше (FID) 1,88. Качество выборки в sCM находится в пределах 10% от моделей, требующих значительно больше вычислительных ресурсов.

Результаты тестирования

Новая модель прошла обширное тестирование и обеспечила высокие результаты как по качеству выборки, так и по вычислительным затратам. Модель sCM успешнее предыдущих методов, предлагая как скорость, так и высокую точность.

Будущее и приложения

Новые возможности на основе sCM открывают перспективы для генеративного ИИ в реальном времени в различных областях, включая:

Генерацию изображений
Синтез аудио
Создание видео

Исследования также предполагают дальнейшую оптимизацию модели, что может улучшить производительность и адаптировать решения для конкретных отраслей.

Подписка на обновления

Будьте в курсе всех новостей в области AI! Подпишитесь на наш информационный бюллетень, чтобы получать свежие новости на вашу почту.

16 КОММЕНТАРИИ

Котик123 25 октября, 2024 в 2:40 дп

Модель sCM реально крут, но как она работает, непонято. Зачем так много параметров?
ТворожноеУхо 25 октября, 2024 в 7:38 пп

Скорость генерации изображений по сравнению с традиционными моделями просто поражает. Надеюсь, это поможет улучшить искусственный интеллект в будущем!
!Супер_Интеллект! 26 октября, 2024 в 4:22 дп

‘Качество выборки’ звучит заманчиво, но что это дает на практике? Много вопросов.
- @Мозг_в_деле 27 октября, 2024 в 9:08 дп
  
  ‘FID’ — это вообще что такое? Я не знал о таком показателе ранее.
- #Фантастика 29 октября, 2024 в 3:49 дп
  
  ‘Генерация изображений’ интересно! Надеюсь, будут креативные результаты!
Gamer_007 26 октября, 2024 в 4:35 дп

50 раз быстрее? Это ж капец как круто! Надо смотреть, когда это внедрят в приложения!
ПростоЧеловек 26 октября, 2024 в 5:32 дп

По мне так качество выборки не может быть высоким если всего два шага. Как вообще это возможно? Может что-то не так? Не понимаю.
@AI_fan 26 октября, 2024 в 6:11 дп

Не понимаю, как можно создать образцы за такие короткие сроки. Это же магия какая-то!
Дядя Вася 26 октября, 2024 в 11:08 пп

Я не очень разбираюсь в ИИ, но скорость генерации впечатляет. Может это повлияет на игры?
Петя_папа 27 октября, 2024 в 4:38 дп

Сравнение с диффузионными моделями неплохое. Но нужны примеры использования, чтобы понять лучше.
ИванГрозный69 27 октября, 2024 в 7:57 пп

Новая модель sCM от OpenAI интересна но я не доверяю технологиям. Важно понимать их возможности и ограничения! Надо быть осторожным.
КотЛомка 28 октября, 2024 в 9:21 пп

Сравнение с диффузионными моделями показало, что новая модель может обрабатывать шум быстрее. Это хорошо для тех, кто работает с медиа.
#ТехноГик 29 октября, 2024 в 9:43 пп

‘Подобные модели должны быть оптимизированы для разных задач.’ Это правильно, но как их адаптировать?
СуперКот123 30 октября, 2024 в 6:06 дп

Модель sCM очень интересно, но незнаю как она работает. Параметры 1,5 миллиарда это много! Зачем так много?
__LunaStar__ 30 октября, 2024 в 9:53 дп

‘Генерация изображений и синтез аудио’ звучит классно! Я надеюсь увидеть больше примеров применения этой технологии в реальной жизни.
_JustAlex_ 30 октября, 2024 в 1:30 пп

‘Скорость и качество’ — это главное в любой технологии! Надеюсь, что такие модели станут доступны для всех разработчиков в скором времени.

комментарии закрыты.

Исследователи OpenAI разрабатывают новую модель, которая ускоряет создание медиа в 50 раз

Подписка на новости

Новая модель согласованности от OpenAI

Возможности новой технологии

Качество выборки модели

Результаты тестирования

Будущее и приложения

Подписка на обновления

16 КОММЕНТАРИИ

Цифровая инфраструктура и энергетика в эпоху искусственного интеллекта.

Изменения в правилах защиты дипломных работ на фоне развития ИИ

Исследование обнаружило религиозную предвзятость у моделей Grok, Claude и Llama

Ким Чен Ын возглавляет...

Портрет студентов медицинских специальностей...

Тестирование ИИ-роботов-администраторов для выполнения...

Ии который генерирует картинки по тексту?

Что представляет собой восходящая парадигма ии?

Ия остергрен сколько лет?

AI в спортивной аналитике: кейсы использования для повышения эффективности команд

Как компании используют AI для улучшения кибербезопасности

AI в образовании: примеры автоматизации учебного процесса

Исследователи OpenAI разрабатывают новую модель, которая ускоряет создание медиа в 50 раз

Подписка на новости

Новая модель согласованности от OpenAI

Возможности новой технологии

Качество выборки модели

Результаты тестирования

Будущее и приложения

Подписка на обновления

16 КОММЕНТАРИИ

ПОХОЖИЕ МАТЕРИАЛЫ