Французский стартап в сфере искусственного интеллекта Mistral выпустил свои первые генеративные модели искусственного интеллекта, предназначенные для работы на периферийных устройствах, таких как ноутбуки и телефоны.
Новое семейство моделей, которое Mistral называет «Les Ministraux», можно использовать или настраивать для различных приложений: от базовой генерации текста до работы в сочетании с более функциональными моделями для выполнения задач.
Доступны две модели Les Ministraux — Ministral 3B и Ministral 8B — обе из которых имеют контекстное окно на 128 000 токенов, что означает, что они могут обрабатывать примерно 50-страничную книгу.
«Наши самые инновационные клиенты и партнеры все чаще просят локальный анализ конфиденциальности для критически важных приложений, таких как перевод на устройстве, умные помощники без Интернета, локальная аналитика и автономная робототехника», — пишет Мистраль в своем блоге. «Les Ministraux были созданы, чтобы обеспечить эффективное вычислительное решение с низкой задержкой для этих сценариев».
Ministral 8B доступен для скачивания уже сегодня, хотя и исключительно в исследовательских целях. Mistral требует от разработчиков и компаний, заинтересованных в установках для самостоятельного развертывания Ministral 8B или Ministral 3B, обращаться к нему за коммерческой лицензией.
В противном случае разработчики могут использовать Ministral 3B и Ministral 8B через облачную платформу Mistral La Platforme и другие облака, с которыми стартап станет партнером в ближайшие недели. Ministral 8B стоит 10 центов за миллион токенов вывода/ввода (~750 000 слов), а Ministral 3B стоит 4 цента за миллион токенов вывода/ввода.
В последнее время наблюдается тенденция к созданию небольших моделей, которые дешевле и быстрее поддаются обучению, настройке и эксплуатации, чем их более крупные аналоги. Google продолжает добавлять модели в свое семейство небольших моделей Gemma, а Microsoft предлагает свою коллекцию моделей Phi. В последнем обновлении своего пакета Llama компания Meta представила несколько небольших моделей, оптимизированных для периферийного оборудования.
Mistral утверждает, что Ministral 3B и Ministral 8B превосходят сопоставимые модели Llama и Gemma, а также собственный Mistral 7B, в нескольких тестах искусственного интеллекта, предназначенных для оценки возможностей выполнения инструкций и решения проблем.
Парижская компания Mistral, которая недавно привлекла $640 млн венчурного капитала, продолжает постепенно расширять свой портфель продуктов искусственного интеллекта. За последние несколько месяцев компания запустила бесплатный сервис для разработчиков для тестирования своих моделей, SDK, позволяющий клиентам точно настраивать эти модели, а также новые модели, включая генеративную модель для кода под названием Codestral.
Заявленная миссия Mistral, основанной выпускниками Meta и DeepMind от Google, состоит в том, чтобы создавать флагманские модели, которые могут конкурировать с наиболее эффективными моделями на сегодняшний день, такими как GPT-4o от OpenAI и Claude от Anthropic, и в идеале зарабатывать на этом деньги. Хотя «зарабатывать деньги» оказывается непросто (как и для большинства стартапов, занимающихся генеративным искусственным интеллектом), по сообщениям, этим летом Mistral начал приносить доход.