Google Lens теперь может отвечать на вопросы о видео

Google обновляет свое приложение визуального поиска Lens, добавив в него возможность отвечать на вопросы об окружающей обстановке в режиме реального времени.

Англоязычные пользователи Android и iOS с установленным приложением Google теперь могут начать съемку видео через Lens и задавать вопросы об объектах, интересующих их на видео.

Лу Ванг, директор по управлению продуктами Lens, сообщил, что функция использует «настроенную» модель Gemini для осмысления видео и соответствующих вопросов. Gemini — это семейство моделей искусственного интеллекта Google, которые используются в ряде продуктов, входящих в портфолио компании.

«Допустим, вы хотите узнать больше об интересной рыбе», — сказал Ванг на пресс-брифинге. «[Lens will] предлагает обзор, объясняющий, почему они плавают по кругу, а также дополнительные ресурсы и полезную информацию».

Чтобы получить доступ к новой функции анализа видео в Lens, необходимо зарегистрироваться в программе Google Search Labs, а также подключиться к экспериментальным функциям «ИИ-обзоры и многое другое» в Labs. В приложении Google удерживание кнопки спуска затвора смартфона активирует режим видеосъемки Lens.

Задайте вопрос во время записи видео, и Lens выдаст ссылку на ответ, предоставленный AI Overviews — функцией Google Search, которая использует искусственный интеллект для обобщения информации из Интернета.

Видео Google Lens
Кредиты на изображения:Google

По словам Ванга, Lens использует искусственный интеллект для определения того, какие кадры в видео наиболее «интересны» и заметны — а главное, имеют отношение к заданному вопросу — и использует их для «обоснования» ответа из обзоров ИИ.

«Все это основано на наблюдении за тем, как люди пытаются использовать такие вещи, как Lens, прямо сейчас», — говорит Ванг. «Если снизить барьер для задавания таких вопросов и помочь людям удовлетворить их любопытство, люди будут воспринимать это довольно естественно».

Запуск видео для Lens последовал за аналогичной функцией, которую Meta представила в прошлом месяце для своих AR-очков Ray-Ban Meta. Meta планирует привнести в очки видео-возможности искусственного интеллекта в реальном времени, позволяющие пользователям задавать вопросы о том, что их окружает (например, «Что это за цветок?»).

OpenAI также анонсировала функцию, которая позволит ее инструменту Advanced Voice Mode понимать видео. В конечном итоге Advanced Voice Mode — премиум-функция ChatGPT — сможет анализировать видео в реальном времени и учитывать контекст при ответе.

Похоже, Google опередила обе компании — за вычетом того, что Lens асинхронна (с ней нельзя общаться в режиме реального времени), и при условии, что функция видео работает так, как заявлено. На пресс-брифинге нам не показали живую демонстрацию, а у Google есть опыт завышенных обещаний, когда речь заходит о возможностях ее ИИ.

Помимо анализа видео, Lens теперь может осуществлять поиск по изображениям и тексту в один прием. Англоязычные пользователи, в том числе и те, кто не участвует в программе Labs, могут запустить приложение Google и, удерживая кнопку спуска затвора, сделать фотографию, а затем задать вопрос, произнеся его вслух.

Наконец, Lens получает новую функциональность, ориентированную на электронную коммерцию.

Начиная с сегодняшнего дня, когда Lens на Android или iOS распознает товар, он будет отображать информацию о нем, включая цену и предложения, бренд, отзывы и акции. Функция Product ID работает с загруженными и только что снятыми фотографиями (но не с видео), и пока она ограничена некоторыми странами и определенными категориями покупок, включая электронику, игрушки и красоту.

Покупки в Google Lens
Кредиты на изображения:Google

«Допустим, вы увидели рюкзак, и он вам понравился», — говорит Ванг. «Вы можете использовать Lens, чтобы идентифицировать этот продукт, и вы сможете мгновенно увидеть детали, которые могут вас заинтересовать».

В этом есть и рекламный компонент. По словам Google, на странице результатов для товаров, идентифицированных объективом, будут также отображаться «релевантные» объявления о покупках с указанием вариантов и цен.

Зачем вставлять рекламу в Lens? По данным Google, около 4 миллиардов поисковых запросов в Lens ежемесячно связаны с покупками. Для технологического гиганта, чьей жизненной силой является реклама, это просто слишком выгодная возможность, чтобы упустить ее.

Основатель более 10 стартапов в области ИТ и ИИ. Серийный предприниматель. Профессиональный управленец.