ИИ распространяет старые стереотипы на новые языки и культуры

Маргарет Митчелл и её работа с искусственным интеллектом

Маргарет Митчелл — пионер в тестировании инструментов генеративного ИИ на предмет предвзятости. Она основала команду Этического ИИ в Google вместе с известным исследователем Тимнит Гебру, но вскоре они обе были уволены из компании. Сейчас она работает лидером по этике ИИ в стартапе Hugging Face, который сосредоточен на открытых инструментах.

Что такое новый набор данных SHADES?

Недавно Маргарет помогла создать новый набор данных, который назвали SHADES. Он предназначен для тестирования того, как модели ИИ продолжают поддерживать стереотипы. В отличие от большинства усилий по устранению предвзятости, которые сосредоточены на английском языке, этот набор данных гибок и содержит человеческие переводы, что позволяет тестировать более широкий спектр языков и культур.

Как возник набор данных SHADES?

История его создания

  1. Проект BigScience: Около четырех лет назад началась масштабная международная инициатива, где исследователи со всего мира объединились для обучения первой открытой большой языковой модели.
  2. Роль Hugging Face: Hugging Face сыграла ключевую роль в продвижении этого проекта, предоставляя ресурсы и вычислительные мощности.
  3. Создание модели Bloom: Модель, которую мы выпустили, называется Bloom, и она положила начало понятию "открытой науки".
  4. Рабочие группы: Мы создали множество рабочих групп для решения различных аспектов, среди которых была группа по оценке. Выяснилось, что оценка социального воздействия гораздо сложнее, чем обучение модели.

Что такое SHADES?

  • SHADES вдохновлен проектом Gender Shades, который рассматривал гендер и цвет кожи.
  • Наша работа фокусируется на различных типах предвзятости и их взаимодействии с такими характеристиками, как пол и национальность.

Почему важен широкий подход к языкам и культурам?

  • Модели ИИ развертываются по разным языкам и культурам.
  • Устранение предвзятости на английском языке, даже если они переведены, не соответствует решению проблем, актуальных для других культур.
  • Вы рискуете развернуть модель, которая поддерживает серьезные стереотипы в конкретном регионе.

Заключение

Работа Маргарет Митчелл и её команда помогает создать более инклюзивные системы ИИ, которые учитывают разнообразие языков и культур. Набор данных SHADES служит важным инструментом для анализа и оценки, направленным на устранение предвзятости, и демонстрирует, что борьба с предвзятостью в ИИ требует более широкого подхода.

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

Основатель более 10 стартапов в области ИТ и ИИ. Серийный предприниматель. Профессиональный управленец.