Клод Фабль 5 тайно ограничил исследователей ИИ, и интернет взорвался от эмоций

Основные выводы

  • Обсуждение Fable 5 касается прозрачности, а не чистой мощности ИИ.
  • Скрытые меры безопасности вызвали вопросы у исследователей о том, что они тестируют.
  • Эксперты по кибербезопасности предупреждают, что защитные меры могут мешать защитникам.

Что такое Mythos?

Mythos был представлен в апреле в рамках проекта Glasswing, сотрудничества ведущих технологических компаний и Anthropic, нацеленного на выявление и исправление уязвимостей в интернет-инфраструктуре. Инструмент был доступен только определенным организациям из-за его потенциального использования как для защиты, так и для атаки.

Выпуск Fable

На этой неделе Anthropic представила Fable, технически обозначенный как «Fable 5», — это ограниченная версия Mythos. Anthropic заявила, что Fable не будет поддерживать некоторые рискованные направления в кибербезопасности, биологии и химии.

Ограничения Fable

  • Пока пользователи работали над суперсовершенными чипами или крупными языковыми моделями, Fable молчала.
  • При работе над определенными проектами пользователи не были уведомлены о понижении уровня модели с Fable до Opus.

Обратная реакция и проблемы

Скрытые ограничения в Fable вызвали негативную реакцию. Согласно Fortune, это поведение назвали «секретным саботажем». Wired добавила, что такой подход может саботировать исследования в области ИИ.

Мнение экспертов

Мнения экспертов расходятся:

  • Некоторые уверены, что ограничения Fable мешают созданию новых технологий защиты.
  • Другие считают, что мотивированные злоумышленники найдут другие подходы к атаке.

Ответ Anthropic

Anthropic отреагировала на критику, заверив, что изменения будут более заметными.

  • Запросы с пометкой теперь будут возвращаться к Opus 4.8, с указанием причины отказа.
  • Компанию похвалили за то, что она удерживала Mythos достаточно долго, чтобы создания безопасных защит.

Проблемы с защитой данных

Существуют и другие вопросы, связанные с политикой сохранения данных Anthropic для моделей Mythos, которое может вызвать беспокойство у компаний в регулируемых отраслях.

Выводы

Споры о Fable касаются не столько его мощности, сколько ограничений:

  • Одни считают ограничения слишком строгими.
  • Другие уверены, что адекватно защищает от злоумышленников.

Это поднимает вопрос о том, смогла ли Anthropic сохранить уравновешенность между безопасностью и функциональностью.

Заключение

Как вы относитесь к изменениям в политике Anthropic? Считаете ли вы, что они сделали правильный выбор, сделав скрытые меры безопасности видимыми?

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

Основатель более 10 стартапов в области ИТ и ИИ. Серийный предприниматель. Профессиональный управленец.