Основные выводы
- Обсуждение Fable 5 касается прозрачности, а не чистой мощности ИИ.
- Скрытые меры безопасности вызвали вопросы у исследователей о том, что они тестируют.
- Эксперты по кибербезопасности предупреждают, что защитные меры могут мешать защитникам.
Что такое Mythos?
Mythos был представлен в апреле в рамках проекта Glasswing, сотрудничества ведущих технологических компаний и Anthropic, нацеленного на выявление и исправление уязвимостей в интернет-инфраструктуре. Инструмент был доступен только определенным организациям из-за его потенциального использования как для защиты, так и для атаки.
Выпуск Fable
На этой неделе Anthropic представила Fable, технически обозначенный как «Fable 5», — это ограниченная версия Mythos. Anthropic заявила, что Fable не будет поддерживать некоторые рискованные направления в кибербезопасности, биологии и химии.
Ограничения Fable
- Пока пользователи работали над суперсовершенными чипами или крупными языковыми моделями, Fable молчала.
- При работе над определенными проектами пользователи не были уведомлены о понижении уровня модели с Fable до Opus.
Обратная реакция и проблемы
Скрытые ограничения в Fable вызвали негативную реакцию. Согласно Fortune, это поведение назвали «секретным саботажем». Wired добавила, что такой подход может саботировать исследования в области ИИ.
Мнение экспертов
Мнения экспертов расходятся:
- Некоторые уверены, что ограничения Fable мешают созданию новых технологий защиты.
- Другие считают, что мотивированные злоумышленники найдут другие подходы к атаке.
Ответ Anthropic
Anthropic отреагировала на критику, заверив, что изменения будут более заметными.
- Запросы с пометкой теперь будут возвращаться к Opus 4.8, с указанием причины отказа.
- Компанию похвалили за то, что она удерживала Mythos достаточно долго, чтобы создания безопасных защит.
Проблемы с защитой данных
Существуют и другие вопросы, связанные с политикой сохранения данных Anthropic для моделей Mythos, которое может вызвать беспокойство у компаний в регулируемых отраслях.
Выводы
Споры о Fable касаются не столько его мощности, сколько ограничений:
- Одни считают ограничения слишком строгими.
- Другие уверены, что адекватно защищает от злоумышленников.
Это поднимает вопрос о том, смогла ли Anthropic сохранить уравновешенность между безопасностью и функциональностью.
Заключение
Как вы относитесь к изменениям в политике Anthropic? Считаете ли вы, что они сделали правильный выбор, сделав скрытые меры безопасности видимыми?