Как ИИ может помочь сохранить языки коренных народов

Возрождение языков в современном мире

Как сообщество может возродить язык, если осталось всего несколько его носителей? В наше время 3,000 языков находятся под угрозой исчезновения из-за колонизации, глобализации, принудительной культурной ассимиляции и других факторов.

Проблема исчезновения языков

Согласно Комиссии по коренным языкам Канады, «исследования показывают, что ни один коренной язык в Канаде не в безопасности и все они находятся на разных стадиях угрозы исчезновения».

Влияние искусственного интеллекта

Наше общество формируется быстрым развитием искусственного интеллекта (ИИ). Может ли ИИ помочь в сохранении коренных языков в Канаде и за ее пределами?

По данным Всемирного экономического форума, большинство ИИ-чатботов обучаются на 100 из 7,000 языков мира, при этом английский язык занимает основное место в большинстве крупных языковых моделей.

Язык в коробке

На конференции TEDx в 2023 году северно-чейеннский инженер Майкл Раннинг Вулф представил свой проект — коробку из кедра, которая выглядит как древняя, так и современная. Устройство, украшенное изображением стрекозы, было описано как «включающий в себя минимальные صوتовые языковые курсы — языковая коробка».

  • Использование технологий ИИ для обучения языку.
  • Пока в сообществе остается мало носителей, необходимо использовать ИИ для улучшения произношения и изучения новых звуков.
  • Ключевым моментом проекта является суверенитет данных коренных народов, что обеспечивает контроль над данными за коренными народами.

Доступность в цифровом мире

В Филиппинах ученый и политик Анна Мэй Ю Ламентидло создала приложение NightOwlGPT, основанное на ИИ, для поддержки коренных языков своей страны.

Она отмечает:

«Мы работаем над девятью языками, многие из которых находятся под угрозой исчезновения. Наша цель — обеспечить наличие этих языков в цифровом мире.»

Опасности контроля ИИ

Важно понимать, кто контролирует инструменты ИИ и кто от этого выигрывает. Ламентидло подчеркивает необходимость инклюзивности:

«Если мы не изменим, кто ведет разработку ИИ, мы рискуем создать новую форму колониализма.»

Разнообразие голосов

На недавнем семинаре по угрозе исчезновения языков профессор лингвистики Эмманюэль Нгуэ Ум рассказал о работе африканских лингвистов, которые используют платформу Mozilla Common Voice для создания открытых данных.

  • Цель — создать многозначный корпус данных для распознавания речи.
  • Сложности возникают из-за множества диалектов и отсутствия единой системы написания.

Итог

Проект может стать основой для интеграции ИИ в изучение языков с низкими ресурсами, но это зависит от:

  1. Финансирования.
  2. Точных данных для обучения.
  3. Желания сообществ использовать ИИ.

В конечном итоге суверенитет данных и равный доступ должны стать основой инструментов ИИ.

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

Основатель более 10 стартапов в области ИТ и ИИ. Серийный предприниматель. Профессиональный управленец.