Краткий обзор Claude Mythos
Недавняя версия Claude Mythos сделала значительные шаги вперед в развитии возможностей ИИ.
Основные выводы
- Claude Mythos показывает улучшенные результаты в тестировании.
- Специалисты отметили, что способности ИИ развиваются быстрее, чем ожидалось.
- Модель обходит OpenAI’s GPT-5.5 в первоначальных тестах.
Тестирование и достижения
Согласно блогу UK AI Security Institute (AISI), новая версия Mythos получила положительные оценки. В частности, она:
- Успешно завершила тестовые задания «The Last Ones» в 6 из 10 случаев.
- Справилась с «Cooling Tower» в 3 из 10 раз.
Это первое завершение обоих заданий для модели.
Киберугрозы
Модели ИИ, такие как Mythos, демонстрируют резкий рост в выявлении программных уязвимостей:
- С 2024 года киберзадачи, которые могут выполнять ИИ, удваиваются каждые 4.7 месяцев.
- AISI обнаружил, что Mythos и GPT-5.5 существенно превышают эти тенденции.
Ограничения и неопределенности
AISI подчеркивает несколько неясностей в тестировании:
- Задачи ограничены 2.5 миллионами токенов, что не отражает полного потенциала модели.
- Уровень успешных результатов на тестах выше без ограничения токенов.
- Модели, имеющие доступ к большему числу токенов, могут показывать ещё более высокие результаты.
Будущее ИИ технологий
Существуют опасения об ускоренной эволюции ИИ в контексте киберугроз. Прорывы, сделанные моделями, как Mythos, поднимают вопросы о будущем безопасности:
- Увеличение качества и скорости выполнения киберзадач.
- Новые риски, связанные с ИИ-системами.
Подводя итоги
Claude Mythos демонстрирует свои возможности в области кибербезопасности, и хотя природа успехов может вызывать вопросы, тем не менее, важно отслеживать развитие технологий и их влияние на общество.