Cohere запускает новые модели искусственного интеллекта для преодоления глобального языкового разрыва

Обновления от Cohere и новые модели Aya

Подпишитесь на наши ежедневные и еженедельные информационные бюллетени, чтобы получать последние обновления и эксклюзивный контент о ведущих в отрасли технологиях искусственного интеллекта.

Сегодня Cohere представила две новые модели с открытым весом в рамках проекта Aya, направленного на устранение языкового пробела в базовых моделях. модели Aya Expanse 8B и 35B доступны на Hugging Face и предлагают улучшенные возможности на 23 языках.

Цели проекта Aya

Проект Aya стремится расширить доступ к моделям фундаментам на более глобальных языках:

  • Высокая производительность на 23 языках.
  • Расширение возможностей для исследователей всему миру.
  • Улучшение многоязычных решений.

Исследовательское подразделение Cohere for AI запустило инициативу Aya в прошлом году и выпустило набор данных для обучения моделей на других языках. Модель Aya 101, с 13 миллиардами параметров, охватывает 101 язык.

Продуктивность и достижения моделей Aya Expanse

Модели Aya Expanse показывают превосходство над аналогичными моделями от крупных игроков в области ИИ:

  • Aya Expanse 32B обошла Gemma 2 27B и другие модели в многоязычных тестах.
  • Aya Expanse 8B также показала лучшие результаты по сравнению с другими моделями меньшего размера.

Методы и подходы

Cohere применяет метод, называемый арбитражем данных, для обучения моделей, избегая создания некачественных синтетических данных. Данный метод позволяет учитывать:

  • Глобальные предпочтения пользователей.
  • Разные культурные и языковые точки зрения.

Компания подчеркивает важность безопасности и производительности, стремясь преодолеть существующие языковые барьеры.

Инициатива Aya и многоязычные модели

Проект Aya сосредоточен на обеспечении LLM, работающих на языках, отличных от английского. Основные проблемы включают:

  • Трудности в поиске данных для моделей на различных языках.
  • Низкое качество переводов, затрудняющее оценку производительности.

Другие разработчики также создают наборы данных для исследования LLM, включая OpenAI, который выпустил набор данных, охватывающий 14 языков.

Новые функции от Cohere

Недавние инициативы Cohere включают:

  • Добавление возможностей поиска изображений в продукт Embed 3.
  • Улучшение тонкой настройки модели Command R 08-2024.

Команда Cohere активно работает над тем, чтобы сделать искусственный интеллект доступным для всех языков и культур.

11 КОММЕНТАРИИ

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

Основатель более 10 стартапов в области ИТ и ИИ. Серийный предприниматель. Профессиональный управленец.