Black Forest Labs, стартап, поддерживаемый Andreessen Horowitz и занимающийся созданием изображений для ассистента Grok от xAI, запустил бета-версию API и выпустил новую модель.
Новый API предоставляет семейство моделей генерации изображений Black Forest Labs, Flux, в управляемом пакете. Используя его, разработчики могут выбрать, какую модель Flux встроить в свое приложение или сервис. Среди дополнительных возможностей — уровень модерации контента и ограничения на разрешение изображений.
Black Forest Labs также представила сегодня свою новейшую модель генерации изображений, Flux1.1 Pro, которая, по ее утверждению, обеспечивает в шесть раз более быструю генерацию, чем ее предшественница Flux.1 Pro. Модель может масштабировать изображения до 2k (2048 × 1080) — эта функция скоро появится в API — «при этом улучшается качество изображения, оперативность и разнообразие», — говорится в сообщении Black Forest Labs в блоге.
Помимо собственной платформы Black Forest Labs, Flux1.1 Pro доступен через партнеров стартапа, включая Together AI, Replicate, Fal.AI и Freepik.
Цены начинаются от 2,5 кредитов за изображение; 100 кредитов стоят 1 доллар. Flux1.1 Pro стоит 4 кредита за изображение.

Компания Black Forest Labs, базирующаяся в Германии и недавно вышедшая из невидимости, получив финансирование в размере 31 миллиона долларов, была основана инженерами, создавшими технологию Stability AI, включая Андреаса Блаттманна, Патрика Эссера, Доминика Лоренца и генерального директора Робина Ромбаха.
Стартап стал предметом споров после того, как заключил сделку с xAI, чтобы встроить Flux в Grok без защитных ограждений, что привело к потоку возмутительных — и зверских — изображений. Black Forest Labs не раскрывает, какие данные использовались для обучения Flux, но изображения на xAI предполагают, что в обучающий набор попали произведения, защищенные авторским правом, что может — если правообладатели решат подать в суд — стать причиной ответственности.
Компания Black Forest Labs, среди других спонсоров которой генеральный директор Y Combinator Гэрри Тан и бывший генеральный директор Oculus Брендан Айриб, разрабатывает модели, генерирующие видео, и, как говорят, собирает 100 миллионов долларов при оценке в 1 миллиард долларов. Это значительный скачок по сравнению с предыдущей оценкой в 150 миллионов долларов.
API, несомненно, является ключевой частью этого процесса. Обучение и запуск моделей стоят дорого, а инвесторы, как правило, хотят видеть отдачу — или, по крайней мере, дорожную карту для получения прибыли.
API или нет, но Black Forest Labs предстоит нелегкое восхождение к доминированию в медиагенерации — если это действительно цель — учитывая грозную и растущую конкуренцию. Ideogram, Pika, Luma, Runway, Stability и Midjourney — вот лишь некоторые из игроков в этой области, не говоря уже о таких лидерах, как OpenAI и Google.