Anthropic только что усложнил ИИ возможность выйти из-под контроля благодаря своей обновленной политике безопасности.

Подпишитесь на наши ежедневные и еженедельные информационные бюллетени, чтобы получать последние обновления и эксклюзивный контент о ведущих в отрасли технологиях искусственного интеллекта. Узнать больше


Anthropic, компания по искусственному интеллекту, стоящая за популярным чат-ботом Claude, сегодня объявила о масштабном обновлении своей Политики ответственного масштабирования (RSP), направленной на снижение рисков, связанных с высокопроизводительными системами искусственного интеллекта.

Эта политика, первоначально представленная в 2023 году, была дополнена новыми протоколами, обеспечивающими безопасную разработку и развертывание моделей ИИ по мере их роста.

Эта пересмотренная политика устанавливает конкретные пороговые значения возможностей — контрольные показатели, которые указывают, когда возможности модели ИИ достигли точки, когда необходимы дополнительные меры безопасности.

Пороговые значения охватывают области высокого риска, такие как создание биологического оружия и автономные исследования искусственного интеллекта, что отражает стремление Anthropic предотвратить неправильное использование своих технологий. Обновление также вводит более подробные обязанности ответственного за масштабирование — роль, которую Anthropic сохранит для контроля за соблюдением требований и обеспечения наличия соответствующих мер безопасности.

Проактивный подход Anthropic свидетельствует о растущем осознании в отрасли искусственного интеллекта необходимости сочетать быстрые инновации с надежными стандартами безопасности. С развитием возможностей искусственного интеллекта ставки как никогда высоки.

Почему политика ответственного масштабирования Anthropic важна для управления рисками ИИ

Обновленная Политика ответственного масштабирования Anthropic достигла критического момента для индустрии искусственного интеллекта, когда грань между полезными и вредными приложениями искусственного интеллекта становится все более тонкой.

Решение компании формализовать пороговые значения возможностей с соответствующими необходимыми мерами безопасности демонстрирует явное намерение предотвратить причинение крупномасштабного вреда моделями ИИ, будь то путем злонамеренного использования или непредвиденных последствий.

Акцент политики на химическом, биологическом, радиологическом и ядерном (ХБРЯ) оружии и автономных исследованиях и разработках искусственного интеллекта (НИОКР) подчеркивает области, в которых передовые модели искусственного интеллекта могут быть использованы злоумышленниками или непреднамеренно ускорить опасные достижения.

Эти пороговые значения действуют как системы раннего предупреждения, гарантируя, что, как только модель ИИ продемонстрирует рискованные возможности, она вызовет более высокий уровень проверки и принятия мер безопасности перед развертыванием.

Этот подход устанавливает новый стандарт в управлении ИИ, создавая структуру, которая не только устраняет сегодняшние риски, но и предвидит будущие угрозы, поскольку системы ИИ продолжают развиваться как по мощности, так и по сложности.

Как антропный сПороги возможностей могут повлиять на стандарты безопасности ИИ во всей отрасли

Политика Anthropic — это больше, чем просто внутренняя система управления: она призвана стать образцом для более широкой индустрии искусственного интеллекта. Компания надеется, что ее политика будет «экспортируемой», а это означает, что она может вдохновить других разработчиков ИИ принять аналогичные системы безопасности. Вводя уровни безопасности ИИ (ASL), созданные по образцу стандартов биобезопасности правительства США, Anthropic создает прецедент того, как компании, занимающиеся ИИ, могут систематически управлять рисками.

Многоуровневая система ASL, которая варьируется от ASL-2 (текущие стандарты безопасности) до ASL-3 (более строгая защита для более рискованных моделей), создает структурированный подход к масштабированию разработки ИИ. Например, если модель демонстрирует признаки опасных автономных возможностей, она автоматически перейдет на ASL-3, что потребует более строгого «красного взаимодействия» (имитация состязательного тестирования) и стороннего аудита, прежде чем ее можно будет развернуть.

Если эта система будет принята во всей отрасли, она может создать то, что Anthropic назвала «гонкой к вершине» в области безопасности ИИ, где компании конкурируют не только по производительности своих моделей, но и по силе своих мер безопасности. Это может изменить ситуацию в отрасли, которая до сих пор не желала саморегулироваться на таком уровне детализации.

Роль ответственного специалиста по масштабированию в управлении рисками ИИ

Ключевой особенностью обновленной политики Anthropic является расширение обязанностей ответственного за масштабирование (RSO) — роль, которую Anthropic продолжит сохранять по сравнению с исходной версией политики. В обновленной политике теперь подробно описаны обязанности RSO, которые включают в себя надзор за протоколами безопасности ИИ компании, оценку того, когда модели ИИ пересекают пороговые значения возможностей, и рассмотрение решений по развертыванию моделей.

Этот механизм внутреннего управления добавляет еще один уровень подотчетности к деятельности Anthropic, гарантируя, что обязательства компании по обеспечению безопасности не просто теоретические, но и активно соблюдаются. RSO имеет право приостановить обучение или развертывание ИИ, если меры безопасности, требуемые на уровне ASL-3 или выше, не предусмотрены.

В отрасли, развивающейся с головокружительной скоростью, такой уровень надзора может стать моделью для других компаний, занимающихся искусственным интеллектом, особенно тех, которые работают над передовыми системами искусственного интеллекта, которые могут нанести значительный вред в случае неправильного использования.

Почему обновление политики Anthropic является своевременным ответом на растущее регулирование ИИ

Обновленная политика Anthropic появилась в то время, когда индустрия искусственного интеллекта находится под растущим давлением со стороны регулирующих органов и политиков. Правительства США и Европы обсуждают, как регулировать мощные системы искусственного интеллекта, а за такими компаниями, как Anthropic, внимательно следят за их ролью в формировании будущего управления искусственным интеллектом.

Пороги возможностей, представленные в этой политике, могут послужить прототипом для будущих правительственных постановлений, предлагая четкую основу для того, когда модели ИИ должны подвергаться более строгому контролю. Обязуясь публично раскрывать отчеты о возможностях и оценках мер безопасности, Anthropic позиционирует себя как лидер в области прозрачности ИИ — проблемы, которую многие критики отрасли отмечают как недостаточную.

Эта готовность поделиться внутренними практиками безопасности может помочь преодолеть разрыв между разработчиками ИИ и регулирующими органами, предоставив дорожную карту того, как ответственное управление ИИ может выглядеть в масштабе.

Заглядывая в будущее: что означает политика ответственного масштабирования Anthropic для будущего развития ИИ

По мере того, как модели ИИ становятся более мощными, риски, которые они представляют, неизбежно будут расти. Обновленная Политика ответственного масштабирования Anthropic представляет собой дальновидный ответ на эти риски, создавая динамичную структуру, которая может развиваться вместе с технологией искусственного интеллекта. Сосредоточение компании на итеративных мерах безопасности (с регулярным обновлением пороговых значений возможностей и мер безопасности) гарантирует, что она сможет адаптироваться к новым задачам по мере их возникновения.

Хотя в настоящее время эта политика специфична для Anthropic, ее более широкие последствия для индустрии искусственного интеллекта очевидны. По мере того, как все больше компаний последуют этому примеру, мы можем стать свидетелями появления нового стандарта безопасности ИИ, который сочетает инновации с необходимостью строгого управления рисками.

В конце концов, политика ответственного масштабирования Anthropic направлена ​​не только на предотвращение катастроф, но и на обеспечение того, чтобы ИИ мог выполнить свои обещания по преобразованию отраслей и улучшению жизни, не оставляя после себя разрушений.

Основатель более 10 стартапов в области ИТ и ИИ. Серийный предприниматель. Профессиональный управленец.