Компания Anthropic анонсировала обновление своего портфолио ИИ, включая улучшенную модель Claude 3.5 Sonnet и новую модель Claude 3.5 Haiku, а также функцию «компьютерного управления» в публичной бета-версии. Обновленный Claude 3.5 Sonnet продемонстрировал значительные улучшения, особенно в области кодирования, зафиксировав 49,0% в тесте SWE-bench Verified, то есть превзошел аналогичные решения от OpenAI и другие системы.
Claude способен взаимодействовать с компьютерными интерфейсами, имитируя действия людей — просмотр экранов, управление курсорами и ввод текста. Эта функция делает его первой передовой моделью ИИ с такими возможностями. По словам GitLab, аргументация Claude в различных сценариях использования стала более убедительной на 10% без задержек.
Новая модель Claude 3.5 Haiku сохраняет характеристики предыдущей модели, достигая 40,6% на тесте SWE-bench Verified. Anthropic подчеркивает потенциал компьютерного управления, однако призывает к осторожности, учитывая нынешние ограничения. Разработки прошли строгую оценку безопасности в сотрудничестве с Институтами безопасности ИИ США и Великобритании.