Запуск EVI 3
Hume AI представляет EVI 3, третью версию своего Эмпатического Голосового Интерфейса (EVI), который может взаимодействовать с пользователями с помощью разнообразных голосов, похожих на человеческие.
EVI 3, подобно голосовому режиму ChatGPT, предлагает набор заранее запрограммированных голосов AI, которые классифицированы по личностным и характерным описаниям, включая:
- Старый Комик
- Опытный Коуч по Жизни
- Мудрый Волшебник
- Мастер Подземелий
- Давид Юм (философ 18 века)
Что важно, модель также предлагает возможность пользователям настраивать собственные голоса AI с нуля, просто описывая характеристики желаемого голоса на естественном языке.
Личности AI
Запуск EVI 3 является частью широкой инициативы среди компаний AI, стремящихся создать более личные и увлекательные модели, обучая их проявлять различные «личности». Примером может служить Claude от Anthropic, который был обучен быть вдумчивым и открытым, в то время как Grok от xAI предполагается более дерзким и с чувством юмора.
По словам Hume, целью компании является «обеспечение того, чтобы искусственный интеллект служил человеческим целям и эмоциональному благополучию». Это напоминает о многих разработках AI, таких как OpenAI, который стремится, чтобы «искусственный общий интеллект… приносил пользу всему человечеству».
Достижения EVI
В процессе демонстрации модели, я попросил её создать персонажа с усталым, но остроумным акцентом рабочего класса Великобритании. Когда голос был готов, я задал вопрос о том, почему он считает, что правительство лжет о форме Земли. Ответ был полон энергии и увлекающей лексики, как будто мы разговаривали в старинном пабе.
Будущее разговорного AI
В блоге Hume было отмечено, что запуск EVI 3 — это следующий шаг к достижению «полностью персонализированного голосового опыта AI» к концу года. Мы верим, что это важный шаг к тому, чтобы голос стал основным способом взаимодействия людей с AI.
В 1950 году математик Алан Тьюринг предложил свой тест для оценки машинного интеллекта. Прошло 75 лет, и современные AI-инструменты могут не только писать, но и говорить так, что это кажется убедительно человеческим.
Современные голосовые AI модели отличаются эмоциональной выразительностью и разнообразием, что стало отдельной областью исследований AI.
Сравнение с другими моделями
При разработке EVI 3, команда Hume сравнила производительность с некоторыми из самых мощных голосовых помощников, такими как GPT-4o и Gemini Live. По данным компании, EVI 3 превзошла конкурентов по нескольким ключевым показателям:
- Модуляция эмоций/стиля
- Понимание эмоций
- Низкая задержка
Как получить доступ к EVI 3
Вы можете попробовать EVI 3 уже сегодня через демонстрацию и приложение Hume для iOS. Цены на модель еще не объявлены, а API будет доступен в ближайшие недели. Сейчас модель специализируется на английском, но будет обучена и на других языках, таких как французский и испанский.