Возрождение языков в современном мире
Как сообщество может возродить язык, если осталось всего несколько его носителей? В наше время 3,000 языков находятся под угрозой исчезновения из-за колонизации, глобализации, принудительной культурной ассимиляции и других факторов.
Проблема исчезновения языков
Согласно Комиссии по коренным языкам Канады, «исследования показывают, что ни один коренной язык в Канаде не в безопасности и все они находятся на разных стадиях угрозы исчезновения».
Влияние искусственного интеллекта
Наше общество формируется быстрым развитием искусственного интеллекта (ИИ). Может ли ИИ помочь в сохранении коренных языков в Канаде и за ее пределами?
По данным Всемирного экономического форума, большинство ИИ-чатботов обучаются на 100 из 7,000 языков мира, при этом английский язык занимает основное место в большинстве крупных языковых моделей.
Язык в коробке
На конференции TEDx в 2023 году северно-чейеннский инженер Майкл Раннинг Вулф представил свой проект — коробку из кедра, которая выглядит как древняя, так и современная. Устройство, украшенное изображением стрекозы, было описано как «включающий в себя минимальные صوتовые языковые курсы — языковая коробка».
- Использование технологий ИИ для обучения языку.
- Пока в сообществе остается мало носителей, необходимо использовать ИИ для улучшения произношения и изучения новых звуков.
- Ключевым моментом проекта является суверенитет данных коренных народов, что обеспечивает контроль над данными за коренными народами.
Доступность в цифровом мире
В Филиппинах ученый и политик Анна Мэй Ю Ламентидло создала приложение NightOwlGPT, основанное на ИИ, для поддержки коренных языков своей страны.
Она отмечает:
«Мы работаем над девятью языками, многие из которых находятся под угрозой исчезновения. Наша цель — обеспечить наличие этих языков в цифровом мире.»
Опасности контроля ИИ
Важно понимать, кто контролирует инструменты ИИ и кто от этого выигрывает. Ламентидло подчеркивает необходимость инклюзивности:
«Если мы не изменим, кто ведет разработку ИИ, мы рискуем создать новую форму колониализма.»
Разнообразие голосов
На недавнем семинаре по угрозе исчезновения языков профессор лингвистики Эмманюэль Нгуэ Ум рассказал о работе африканских лингвистов, которые используют платформу Mozilla Common Voice для создания открытых данных.
- Цель — создать многозначный корпус данных для распознавания речи.
- Сложности возникают из-за множества диалектов и отсутствия единой системы написания.
Итог
Проект может стать основой для интеграции ИИ в изучение языков с низкими ресурсами, но это зависит от:
- Финансирования.
- Точных данных для обучения.
- Желания сообществ использовать ИИ.
В конечном итоге суверенитет данных и равный доступ должны стать основой инструментов ИИ.