Мифос Anthropic развивается быстрее, чем ожидалось, сообщает агентство по безопасности ИИ.

Краткий обзор Claude Mythos

Недавняя версия Claude Mythos сделала значительные шаги вперед в развитии возможностей ИИ.

Основные выводы

  • Claude Mythos показывает улучшенные результаты в тестировании.
  • Специалисты отметили, что способности ИИ развиваются быстрее, чем ожидалось.
  • Модель обходит OpenAI’s GPT-5.5 в первоначальных тестах.

Тестирование и достижения

Согласно блогу UK AI Security Institute (AISI), новая версия Mythos получила положительные оценки. В частности, она:

  • Успешно завершила тестовые задания «The Last Ones» в 6 из 10 случаев.
  • Справилась с «Cooling Tower» в 3 из 10 раз.

Это первое завершение обоих заданий для модели.

Киберугрозы

Модели ИИ, такие как Mythos, демонстрируют резкий рост в выявлении программных уязвимостей:

  • С 2024 года киберзадачи, которые могут выполнять ИИ, удваиваются каждые 4.7 месяцев.
  • AISI обнаружил, что Mythos и GPT-5.5 существенно превышают эти тенденции.

Ограничения и неопределенности

AISI подчеркивает несколько неясностей в тестировании:

  • Задачи ограничены 2.5 миллионами токенов, что не отражает полного потенциала модели.
  • Уровень успешных результатов на тестах выше без ограничения токенов.
  • Модели, имеющие доступ к большему числу токенов, могут показывать ещё более высокие результаты.

Будущее ИИ технологий

Существуют опасения об ускоренной эволюции ИИ в контексте киберугроз. Прорывы, сделанные моделями, как Mythos, поднимают вопросы о будущем безопасности:

  • Увеличение качества и скорости выполнения киберзадач.
  • Новые риски, связанные с ИИ-системами.

Подводя итоги

Claude Mythos демонстрирует свои возможности в области кибербезопасности, и хотя природа успехов может вызывать вопросы, тем не менее, важно отслеживать развитие технологий и их влияние на общество.

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

Основатель более 10 стартапов в области ИТ и ИИ. Серийный предприниматель. Профессиональный управленец.