Гемини 2.5 Flash от Google вводит «думательные бюджеты», которые сокращают затраты на ИИ на 600% при снижении мощности.

Обновления от Google: Gemini 2.5 Flash

Google запустил Gemini 2.5 Flash, значительное обновление своего AI-портфолио, предоставляя бизнесу и разработчикам непревзойденный контроль над вычислительной мощностью своих моделей. Этот новый модель показывает стремление Google улучшить умственные способности AI при конкурентоспособных ценах.

Что нового в Gemini 2.5 Flash?

Новая модель вводит концепцию «бюджета мышления», позволяя разработчикам определять, сколько вычислительных ресурсов выделить для решения сложных задач. Это решает серьезную проблему на рынке AI: более сложные решения часто приводят к задержкам и повышенным затратам.

  • Разработчики могут адаптировать объем обработки в зависимости от своих потребностей.
  • Предоставляется гибкость нагрузки для различных сценариев использования.
  • Запуск в preview-режиме через Google AI Studio и Vertex AI.

Ценовая структура Gemini 2.5 Flash

Новая ценовая модель акцентирует внимание на стоимости интеллектуального анализа в AI. При использовании Gemini 2.5 Flash разработчики платят:

Тип Стоимость (за миллион токенов)
Ввод $0.15
Вывод (мыслительная способность выключена) $0.60
Вывод (мыслительная способность включена) $3.50

Разница в цене показывает вычислительную интенсивность процесса «мыслительной работы», когда модель рассматривает множество возможных решений, прежде чем дать ответ.

Сравнение с конкурентами

Gemini 2.5 Flash демонстрирует конкурентоспособную производительность на ключевых тестах:

  • Humanity’s Last Exam: 12.1%
  • GPQA diamond: 78.3%
  • AIME: 78.0% на 2025 тестах и 88.0% на 2024 тестах

Эти показатели указывают на то, что Google сокращает разрыв в производительности с конкурентами, удерживая ценовое преимущество.

Сглаживание ума и скорости

Представление регулируемого интеллектуального анализа — это значительная эволюция в бизнес-применении AI. Google позволяет разработчикам адаптировать модель для разных сценариев, включая:

  • Отключение «мышления» для простых запросов, таких как перевод языка.
  • Включение «мышления» для сложных задач, например, математических уравнений.

Модель автоматически определяет, сколько анализа требуется для каждого запроса, учитывая уровень сложности.

Новая эра AI от Google

Запуск Gemini 2.5 Flash происходит в рамках активных инициатив Google в AI-сфере, включая:

  • Разработка Veo 2 для генерации видео по текстовым подсказкам.
  • Бесплатный доступ к Gemini Advanced для студентов колледжей до весны 2026 года.

Эти шаги направлены на привлечение новых пользователей и конкурентоспособность с такими гигантами, как OpenAI с их ChatGPT.

Ожидание от Gemini 2.5 Flash

Хотя модель доступна для разработчиков, Google не указал сроков общей доступности. Ожидается, что будут проводить доработки в ответ на отзывы разработчиков в процессе тестирования.

Для бизнеса это открывает новые возможности в развертывании AI, позволяя эффективно управлять ресурсами для различных задач.

Заключение

С подходом Google к настраиваемому интеллектуальному анализу можно ожидать, что компании смогут оптимизировать свои AI-решения в зависимости от потребностей и бюджетов. Это подчеркивает новую стадию в коммерциализации технологий генеративного AI.

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

Основатель более 10 стартапов в области ИТ и ИИ. Серийный предприниматель. Профессиональный управленец.