Расширяя границы генерации аудио

Инновационные технологии генерации речи

Наши передовые технологии генерации речи помогают людям по всему миру взаимодействовать с более естественными, разговорными и интуитивными цифровыми помощниками и инструментами ИИ.

Значение речи

Речь играет центральную роль в человеческом общении. Она помогает людям обмениваться информацией и идеями, выражать эмоции и создавать взаимопонимание.

Развитие технологий речи

  • На протяжении последних нескольких лет мы постоянно расширяем горизонты аудиогенерации.
  • Разрабатываем модели, которые могут создавать качественную, естественную речь из разных входных данных, таких как текст, управление темпом и определенные голоса.

Продукты, использующие наши технологии

Эта технология поддерживает одноактерное аудио в многих продуктах и экспериментах Google, включая:

  • Gemini Live
  • Project Astra
  • Journey Voices
  • Авто озвучивание на YouTube

Новые функции для улучшения доступа к контенту

Совместно с партнерами по Google мы недавно разработали две новые функции, которые могут генерировать длинные многоголосые диалоги для упрощения восприятия сложного контента:

  1. NotebookLM Audio Overviews: превращает загруженные документы в увлекательные и живые диалоги. С одной кнопки два ИИ-ведущих обобщают материал пользователя, устанавливают связи между темами и ведут беседу.
  2. Illuminate: создает формальные обсуждения, генерируемые ИИ, о научных статьях, чтобы сделать знания более доступными и усваиваемыми.

Общая информация о нашем исследовании

Мы предоставляем обзор наших последних исследований в области генерации речи, которые лежат в основе всех этих продуктов и экспериментальных инструментов.

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

Основатель более 10 стартапов в области ИТ и ИИ. Серийный предприниматель. Профессиональный управленец.