IBM представляет программу LLM Granite 3.0 с открытым исходным кодом для корпоративного искусственного интеллекта

Подпишитесь на наши ежедневные и еженедельные информационные бюллетени, чтобы получать последние обновления и эксклюзивный контент о ведущих в отрасли технологиях искусственного интеллекта. Узнать больше


Не заблуждайтесь: корпоративный ИИ — это большой бизнес, особенно для IBM.

У IBM уже есть бизнес-книга стоимостью 2 миллиарда долларов, связанная с генеративным искусственным интеллектом, и теперь она стремится ускорить этот рост. Сегодня IBM расширяет свой корпоративный бизнес в сфере искусственного интеллекта, выпустив третье поколение моделей больших языков Granite (LLM). Ключевым элементом нового поколения является постоянное внимание к реальному корпоративному ИИ с открытым исходным кодом. Идя еще дальше, IBM гарантирует, что модели могут быть точно настроены для корпоративного ИИ с помощью возможностей InstructLab.

Новые модели, анонсированные сегодня, включают варианты общего назначения с 2 миллиардами и 8 миллиардами Granite 3.0. Существуют также модели Mixture-of-Experts (MoE), которые включают Granite 3.0 3B A800M Instruct, Granite 3.0 1B A400M Instruct, Granite 3.0 3B A800M Base и Granite 3.0 1B A400M Base. В завершение обновления IBM также создала новую группу с оптимизированными ограждениями и опциями безопасности, в которую входят модели Granite Guardian 3.0 8B и Granite Guardian 3.0 2B. Новые модели будут доступны в сервисе IBM watsonX, а также на Amazon Bedrock, Amazon Sagemaker и Hugging Face.

«Как мы упоминали в нашем последнем отчете о прибылях и убытках, совокупный доход, который мы создали на основе генеративного искусственного интеллекта, сейчас составляет более 2 миллиардов долларов за счет технологий и консалтинга», — сказал Роб Томас, старший вице-президент и главный коммерческий директор IBM, во время брифинг с прессой и аналитиками. «Когда я думаю о своих 25 годах в IBM, я не уверен, что у нас когда-либо был бизнес, который масштабировался такими темпами».

Как IBM планирует развивать корпоративный ИИ с помощью Granite 3.0

Granite 3.0 представляет ряд сложных моделей искусственного интеллекта, адаптированных для корпоративных приложений.

IBM ожидает, что новые модели помогут поддержать ряд вариантов корпоративного использования, включая: обслуживание клиентов, автоматизацию ИТ, аутсорсинг бизнес-процессов (BPO), разработку приложений и кибербезопасность.

Новые модели Granite 3.0 были обучены командой централизованной фабрики моделей данных IBM, которая отвечает за поиск и обработку данных, используемых для обучения.

Дарио Хил, старший вице-президент и директор по исследованиям IBM, объяснил, что в процессе обучения задействовано 12 триллионов токенов данных, включая как языковые данные на нескольких языках, так и данные кода. Он подчеркнул, что ключевыми отличиями от предыдущих поколений являются качество данных и архитектурные инновации, используемые в процессе обучения.

Томас добавил, что также важно понимать, откуда берутся данные.

«Частью нашего преимущества в построении моделей являются имеющиеся у нас наборы данных, уникальные для IBM», — сказал Томас. «У нас есть уникальная, я бы сказал, выгодная позиция в отрасли, где мы становимся первым заказчиком всего, что мы создаем, что также дает нам преимущество с точки зрения того, как мы создаем модели».

IBM заявляет о высоких показателях производительности Granite 3.0

По словам Гила, модели Granite добились замечательных результатов в широком спектре задач, превзойдя последние версии моделей от Google, Anthropic и других.

«То, что вы видите здесь, — это невероятно высокопроизводительные модели, абсолютно современные, и мы очень гордимся этим», — сказал Гил.

Но не только безупречная производительность отличает Granite от других. IBM также уделяет большое внимание безопасности и доверию, разрабатывая усовершенствованные модели Guardian, которые можно использовать для предотвращения взлома основных моделей или создания вредоносного контента. Различные варианты размеров модели также являются важным элементом.

«Нас это очень заботит, и мы усвоили урок из масштабирования ИИ, что стоимость вывода имеет важное значение», — отметил Гил. «Именно поэтому мы так сосредоточены на размере категории моделей, потому что она сочетает в себе производительность и стоимость вывода, что очень привлекательно для масштабирования вариантов использования на предприятии».

Почему настоящий открытый исходный код важен для корпоративного ИИ

Ключевым отличием Granite 3.0 является решение IBM выпустить модели под лицензией Apache 2.0 с открытым исходным кодом, одобренной Open Source Initiative (OSI).

На рынке существует множество других открытых моделей, таких как Llama от Meta, которые фактически не доступны по лицензии, одобренной OSI. Это различие имеет значение для некоторых предприятий.

«Мы решили, что будем предельно честны в этом вопросе, и решили выпустить лицензию Apache 2, чтобы предоставить нашим корпоративным партнерам максимальную гибкость в выполнении того, что им нужно, с этой технологией», — объяснил Гил.

Разрешительная лицензия Apache 2.0 позволяет партнерам IBM создавать свои собственные бренды и интеллектуальную собственность на основе моделей Granite. Это помогает создать надежную экосистему решений и приложений, основанных на технологии Granite.

«Это полностью меняет представление о том, как быстро предприятия могут внедрить ИИ, когда у вас есть разрешительная лицензия, которая позволяет вносить вклад, расширяет возможности сообщества и, в конечном итоге, обеспечивает широкое распространение», — сказал Томас.

От генеративного искусственного интеллекта к генеративным вычислениям

Заглядывая в будущее, IBM думает о следующем важном сдвиге парадигмы, который Гил назвал – генеративные вычисления.

По сути, генеративные вычисления относятся к способности программировать компьютеры, предоставляя примеры или подсказки, а не явно записывая пошаговые инструкции. Это согласуется с возможностями LLM, таких как Granite, которые могут генерировать текст, код и другие выходные данные на основе полученных данных.

«Эта парадигма, в которой мы не пишем инструкции, а программируем компьютер на собственном примере, является фундаментальной, и мы только начинаем понимать, что это такое, взаимодействуя с LLM», — сказал Гил. «Вы увидите, как мы инвестируем и очень агрессивно идем в направлении, где с помощью этой парадигмы генеративных вычислений мы сможем реализовать модели следующего поколения, агентные структуры и многое другое. способ программирования компьютеров как следствие революции поколения искусственного интеллекта».

Основатель более 10 стартапов в области ИТ и ИИ. Серийный предприниматель. Профессиональный управленец.