Творческое руководство PicsArt по искусственному интеллекту: видение контекстного интеллекта и агентов искусственного интеллекта

Подпишитесь на наши ежедневные и еженедельные информационные бюллетени, чтобы получать последние обновления и эксклюзивный контент о ведущих в отрасли технологиях искусственного интеллекта. Узнать больше


Независимо от того, являетесь ли вы пользователем Android или iOS, большинство людей слышали о PicsArt. Платформа была запущена более десяти лет назад и стала одним из популярных сервисов для редактирования изображений и видео с более чем 150 миллионами активных пользователей в месяц.

Однако для компании этот путь был нелегким. Несмотря на то, что компания является пионером в сфере редактирования с помощью смартфонов, она столкнулась с серьезной конкуренцией со стороны таких игроков, как Canva и Adobe, которые уже довольно давно играют в кошки-мышки, создавая свои собственные аналогичные продукты. Когда я разговаривал с Артаваздом Меграбяном, техническим директором компании, на недавней конференции WCIT в Армении, он довольно открыто говорил о проблемах, говоря, что на этом рынке трудно быть другим или, по крайней мере, долго оставаться другим.

«Многие вещи, которые были у PicsArt раньше, были скопированы у конкурентов. PicsArt был первым универсальным сервисом редактирования на мобильных устройствах. До 2011 года другого игрока не было. Мы начали с этого подхода, и его, среди прочего, скопировали», — сказал Меграбян. Он отметил, что то же самое происходит и с ИИ, где конкуренты, в том числе основные фотосервисы, предлагают очень похожие возможности.

Например, PicsArt предлагает генерацию объектов, позволяя пользователям использовать продвинутый искусственный интеллект для создания необходимых элементов фотографий. Та же возможность была включена и в другие продукты этой категории, создавая своего рода дублирование.

Picsrt AI GIF-генератор
Генератор GIF-изображений PicsArt AI

Однако вместо того, чтобы стремиться выделиться, добавляя больше инструментов к существующей партии из более чем двух десятков возможностей искусственного интеллекта, компания стремится произвести впечатление на пользователей, улучшая качество того, что она предлагает. В частности, по словам Меграбяна, основное внимание уделяется тому, как они создают и адаптируют функции, чтобы помочь клиентам достичь своей цели – хотят ли они удалить конкретный объект из изображения отпуска или создать визуально привлекательную рекламу, дополненную изображениями и текстом.

Обучение качественному творческому ИИ

На раннем этапе, когда ИИ еще не существовал, Меграбян сказал, что большая часть технологических исследований и усилий PicsArt была направлена ​​на обеспечение беспрепятственного редактирования с помощью мобильных устройств.

«Было очень сложно заставить все эти функции редактирования работать на устройстве в автономном режиме. Затем следующей задачей стало масштабирование нашей экосистемы и инфраструктуры для поддержки растущей базы пользователей. Это привело нас к гибридной инфраструктуре. Мы начали с мультиоблака и центра обработки данных, который до сих пор остается лучшим решением, поскольку он более экономичный, высокопроизводительный и очень гибкий», — пояснил Меграбян.

Имея этот технологический стек, компания запустила свою первую функцию искусственного интеллекта в 2016 году, запустив несколько небольших моделей в автономном режиме на пользовательских устройствах. Постепенно это переросло в крупномасштабные усилия в области искусственного интеллекта: компания превратилась в организацию, ориентированную на искусственный интеллект, и начала использовать свои инфраструктурные и серверные службы для обслуживания более крупных моделей и API для более расширенных возможностей, таких как удаление/замена фона. Совсем недавно, когда волна генеративного искусственного интеллекта начала формироваться, PicsArt начала с нуля обучать свои собственные творческие модели искусственного интеллекта.

В творческой сфере очень легко потерять пользователя. Небольшая ошибка здесь или там (приводящая к некачественным результатам), и велика вероятность, что человек больше не вернется. Чтобы предотвратить это, PicsArt уделяет особое внимание данным. Он выборочно использует данные из своей собственной сети, помеченные пользователями как общедоступные и доступные для редактирования, для обучения моделей ИИ.

«У нас есть специальная лицензия на бесплатное редактирование. Если вы публикуете публично и помечаете свое изображение — от стандартной фотографии в любой категории до стикера или фона — как свободное для редактирования, это позволяет другому пользователю службы повторно использовать его или работать поверх него. Таким образом, по сути, пользователь предоставляет это изображение сообществу и самому PicsArt», — сказал Меграбян.

Лицензия действовала с первых дней существования сервиса и дала PicsArt огромный запас пользовательского контента для обучения ИИ. Однако, как отметил технический директор, не все это качественно и готово к использованию сразу. Данные должны пройти несколько уровней очистки и обработки, начиная вручную и с помощью искусственного интеллекта, чтобы превратиться в безопасный набор данных, готовый к обучению.

«В конце концов, у нас есть довольно большой набор данных, принадлежащий PicsArt. Нам не нужны дополнительные данные», — сказал он.

Однако иметь под рукой большой объем высококачественных данных было лишь частью головоломки.

Настоящей задачей для PicsArt, как описал Меграбян, было создание «маховика данных». Самоусиливающийся цикл, охватывающий не только доступность данных, но и такие аспекты, как аннотирование данных, их использование и, в конечном итоге, как использовать их в рамках непрерывного процесса обучения для улучшения с течением времени.

По его словам, создание системы обратной связи для достижения этой цели было долгим и сложным процессом.

«Мы создали собственную технологию аннотаций. Мы собственными силами разработали все сопутствующие инфраструктурные и экосистемные технологии, в том числе для идентификации и классификации изображений, их маркировки и добавления к ним различных типов меток», — сказал Меграбян. «Затем мы создали команду, которая поможет усовершенствовать конвейер и со временем давать обратную связь. В основном это было очень автоматическим, управляемым искусственным интеллектом с промежуточной обратной связью от человека, чтобы мы могли постоянно совершенствоваться».

Петля обратной связи ведет к контекстуальному интеллекту

Хотя цикл обратной связи, управляемый человеком, сыграл решающую роль в совершенствовании продуктов PicsArt (повышая качество генерируемых ими результатов), он также подводит компанию к тому, что Меграбян называет «контекстным интеллектом» или способностью платформы понимать потребности пользователей. и доставить именно то, что они хотят.

Эта функция особенно важна для растущей базы бизнес-пользователей платформы, которые хотят выполнять работу прямо на своих смартфонах. Будь то создание графики или полноценная реклама для кампании в социальных сетях. Платформу по-прежнему в основном используют люди, желающие редактировать личный контент, но компания заявляет, что ее исследования показывают, что многие хотят использовать ее в работе, особенно в маркетинговых целях.

«Контекстный интеллект не только отслеживает вашу историю или то, что вы делали, чтобы помочь вам быть более продуктивным в вашем путешествии, но также предсказывает ваше следующее намерение. Это одновременно реактивное и проактивное действие», — пояснил он.

Таким образом, каждый раз, когда человек использует платформу для создания чего-то для своей работы, ему не придется определять язык и тональность бренда. У продукта уже будет контекст, и он будет использовать его для создания необходимого контента. Меграбян сказал, что компания также планирует выпустить бренд-кит, который позволит пользователям настраивать этот контекст в соответствии со своими потребностями и дополнительно улучшать качество поколений.

Креативные агенты искусственного интеллекта уже в пути

В конечном итоге, говорит Меграбян, контекстный интеллект приведет PicsArt к экосистеме, основанной на агентах. Здесь у пользователей будет своего рода второй пилот – со всеми соответствующими знаниями об их работе и предпочтениях в дизайне – который поможет им в выполнении задач.

«Этот второй пилот поймет ваши намерения и исторический контекст, чтобы обеспечить интерактивную поддержку и помочь вам стать еще более продуктивными. Мы рассматриваем этот вариант использования как интегрированный во всю экосистему PicsArt с точки зрения пользователя», — сказал он.

Помимо этого, он также ожидает, что агенты ИИ помогут пользователям PicsArt выполнять некоторые задачи в массовом порядке. Например, если пользователю необходимо применить один и тот же дизайн или логику дизайна к нескольким ресурсам, он может использовать агент для автоматизации рабочего процесса от его имени.

Таким образом, компания надеется стать ключевым фактором в творческой индустрии, опережая своих конкурентов и позволяя пользователям без особых усилий развивать свой творческий потенциал и, в конечном итоге, бизнес.

Меграбян отметил, что ИИ приведет к серьезным изменениям, но пользователи – от бизнесменов до дизайнеров и маркетологов – должны попытаться понять, как он на них влияет, и воспользоваться изменениями, чтобы сделать больше, чем возможно в настоящее время.

«С нынешней точки зрения, это повлияет негативно. Но если вы посмотрите на это с другой стороны, например, из будущего, вы увидите, что эти люди будут использовать ИИ, чтобы узнать гораздо больше. Они перестанут быть узкими специалистами. С помощью ИИ они будут охватывать более широкие области глубже и быстрее», — отметил он.

По данным Future Markets Insights, мировой рынок редакторов изображений с использованием искусственного интеллекта, по прогнозам, вырастет с $80,3 млн в 2024 году до $217,9 млн к 2034 году, при среднегодовом темпе роста 10,5%. Между тем, генерация на основе искусственного интеллекта, которая стала основной частью большинства инструментов/сервисов для редактирования изображений, включая PicsArt, по оценкам, вырастет на 38% с 8,7 миллиардов долларов в 2024 году до 60,8 миллиардов долларов в 2030 году.

Основатель более 10 стартапов в области ИТ и ИИ. Серийный предприниматель. Профессиональный управленец.