Обновления от Cohere и новые модели Aya
Подпишитесь на наши ежедневные и еженедельные информационные бюллетени, чтобы получать последние обновления и эксклюзивный контент о ведущих в отрасли технологиях искусственного интеллекта.
Сегодня Cohere представила две новые модели с открытым весом в рамках проекта Aya, направленного на устранение языкового пробела в базовых моделях. модели Aya Expanse 8B и 35B доступны на Hugging Face и предлагают улучшенные возможности на 23 языках.
Цели проекта Aya
Проект Aya стремится расширить доступ к моделям фундаментам на более глобальных языках:
- Высокая производительность на 23 языках.
- Расширение возможностей для исследователей всему миру.
- Улучшение многоязычных решений.
Исследовательское подразделение Cohere for AI запустило инициативу Aya в прошлом году и выпустило набор данных для обучения моделей на других языках. Модель Aya 101, с 13 миллиардами параметров, охватывает 101 язык.
Продуктивность и достижения моделей Aya Expanse
Модели Aya Expanse показывают превосходство над аналогичными моделями от крупных игроков в области ИИ:
- Aya Expanse 32B обошла Gemma 2 27B и другие модели в многоязычных тестах.
- Aya Expanse 8B также показала лучшие результаты по сравнению с другими моделями меньшего размера.
Методы и подходы
Cohere применяет метод, называемый арбитражем данных, для обучения моделей, избегая создания некачественных синтетических данных. Данный метод позволяет учитывать:
- Глобальные предпочтения пользователей.
- Разные культурные и языковые точки зрения.
Компания подчеркивает важность безопасности и производительности, стремясь преодолеть существующие языковые барьеры.
Инициатива Aya и многоязычные модели
Проект Aya сосредоточен на обеспечении LLM, работающих на языках, отличных от английского. Основные проблемы включают:
- Трудности в поиске данных для моделей на различных языках.
- Низкое качество переводов, затрудняющее оценку производительности.
Другие разработчики также создают наборы данных для исследования LLM, включая OpenAI, который выпустил набор данных, охватывающий 14 языков.
Новые функции от Cohere
Недавние инициативы Cohere включают:
- Добавление возможностей поиска изображений в продукт Embed 3.
- Улучшение тонкой настройки модели Command R 08-2024.
Команда Cohere активно работает над тем, чтобы сделать искусственный интеллект доступным для всех языков и культур.
.Модели для многиязычности — круто! Но как с качеством переводов?
Мне кажеться, что это очень интересная инициатива. Язык это важно!
Да, язык важен! Но как они это будут делать?
Надеюсь на качественные результаты, интересно!
Какой-то сложный проект, не совсем понял о чем речь.
Главное, чтобы работало на всех языках!
Я тоже не совсем понял, но звучит многообещающе.
Я вот старый человек и не понимаю всех этих новых технологий, но надо развиваться!
..Кто-нибудь знает, сколько языков они поддерживают? Интересно!
‘Aya Expanse’ — это что-то новое? Надо почитать больше про это.
‘Арбитраж данных’ — прикольный метод! Надо будет погуглить.