Новая модель EVI 3 от Hume позволяет настраивать голоса ИИ — как её протестировать

Запуск EVI 3

Hume AI представляет EVI 3, третью версию своего Эмпатического Голосового Интерфейса (EVI), который может взаимодействовать с пользователями с помощью разнообразных голосов, похожих на человеческие.

EVI 3, подобно голосовому режиму ChatGPT, предлагает набор заранее запрограммированных голосов AI, которые классифицированы по личностным и характерным описаниям, включая:

  • Старый Комик
  • Опытный Коуч по Жизни
  • Мудрый Волшебник
  • Мастер Подземелий
  • Давид Юм (философ 18 века)

Что важно, модель также предлагает возможность пользователям настраивать собственные голоса AI с нуля, просто описывая характеристики желаемого голоса на естественном языке.

Личности AI

Запуск EVI 3 является частью широкой инициативы среди компаний AI, стремящихся создать более личные и увлекательные модели, обучая их проявлять различные «личности». Примером может служить Claude от Anthropic, который был обучен быть вдумчивым и открытым, в то время как Grok от xAI предполагается более дерзким и с чувством юмора.

По словам Hume, целью компании является «обеспечение того, чтобы искусственный интеллект служил человеческим целям и эмоциональному благополучию». Это напоминает о многих разработках AI, таких как OpenAI, который стремится, чтобы «искусственный общий интеллект… приносил пользу всему человечеству».

Достижения EVI

В процессе демонстрации модели, я попросил её создать персонажа с усталым, но остроумным акцентом рабочего класса Великобритании. Когда голос был готов, я задал вопрос о том, почему он считает, что правительство лжет о форме Земли. Ответ был полон энергии и увлекающей лексики, как будто мы разговаривали в старинном пабе.

Будущее разговорного AI

В блоге Hume было отмечено, что запуск EVI 3 — это следующий шаг к достижению «полностью персонализированного голосового опыта AI» к концу года. Мы верим, что это важный шаг к тому, чтобы голос стал основным способом взаимодействия людей с AI.

В 1950 году математик Алан Тьюринг предложил свой тест для оценки машинного интеллекта. Прошло 75 лет, и современные AI-инструменты могут не только писать, но и говорить так, что это кажется убедительно человеческим.

Современные голосовые AI модели отличаются эмоциональной выразительностью и разнообразием, что стало отдельной областью исследований AI.

Сравнение с другими моделями

При разработке EVI 3, команда Hume сравнила производительность с некоторыми из самых мощных голосовых помощников, такими как GPT-4o и Gemini Live. По данным компании, EVI 3 превзошла конкурентов по нескольким ключевым показателям:

  • Модуляция эмоций/стиля
  • Понимание эмоций
  • Низкая задержка

Как получить доступ к EVI 3

Вы можете попробовать EVI 3 уже сегодня через демонстрацию и приложение Hume для iOS. Цены на модель еще не объявлены, а API будет доступен в ближайшие недели. Сейчас модель специализируется на английском, но будет обучена и на других языках, таких как французский и испанский.

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

Основатель более 10 стартапов в области ИТ и ИИ. Серийный предприниматель. Профессиональный управленец.