Alibaba представила новое поколение ИИ, способствующее упрощению процесса создания и редактирования изображений на основе текстов и визуальных материалов. Модель, названная Qwen VLo, станет частью серии ИИ-сервисов под брендом Qwen и позволит не только генерировать изображения по текстовым запросам, но и модифицировать уже существующие.
Источник изображения: Copilot
По данным Bloomberg, новая модель не только анализирует данные, но и может генерировать высококачественные изображения на их основе. Например, пользователь может ввести текстовый запрос и затем попросить добавить детали, такие как шляпа для кота. Также имеется возможность загрузить готовое изображение и «дорисовать» его.
Одной из ключевых особенностей Qwen VLo является технология прогрессивной генерации, позволяющая пользователю наблюдать процесс создания изображения шаг за шагом. Например, можно подать запрос «Создай картинку милого кота», и система начнёт формировать это изображение на глазах пользователя.
В своём блоге компания отметила, что новая версия модели не просто «воспринимает окружающий мир, но и способна создавать высококачественные реконструкции на основе этого восприятия». Это соответствует ранее озвученным целям генерального директора Эдди Ву, который говорил о разработке сильного искусственного интеллекта (AGI) с уровнем развития, сравнимым с человеческим.
Qwen VLo позиционируется как конкурентное решение на рынке, включая продукты OpenAI. Тем не менее, Alibaba сталкивается с активной конкуренцией внутри Китая, например, со стороны DeepSeek, которая произвела фурор, заявив о создании мощной модели всего за несколько миллионов долларов. В ответ компания Alibaba продолжает активно добавлять новые функции для обработки текстов, изображений, аудио и видео, оптимизируя модель и для работы на смартфонах.
Если вы заметили ошибку — выделите её мышью и нажмите CTRL+ENTER.