Инновационные технологии генерации речи
Наши передовые технологии генерации речи помогают людям по всему миру взаимодействовать с более естественными, разговорными и интуитивными цифровыми помощниками и инструментами ИИ.
Значение речи
Речь играет центральную роль в человеческом общении. Она помогает людям обмениваться информацией и идеями, выражать эмоции и создавать взаимопонимание.
Развитие технологий речи
- На протяжении последних нескольких лет мы постоянно расширяем горизонты аудиогенерации.
- Разрабатываем модели, которые могут создавать качественную, естественную речь из разных входных данных, таких как текст, управление темпом и определенные голоса.
Продукты, использующие наши технологии
Эта технология поддерживает одноактерное аудио в многих продуктах и экспериментах Google, включая:
- Gemini Live
- Project Astra
- Journey Voices
- Авто озвучивание на YouTube
Новые функции для улучшения доступа к контенту
Совместно с партнерами по Google мы недавно разработали две новые функции, которые могут генерировать длинные многоголосые диалоги для упрощения восприятия сложного контента:
- NotebookLM Audio Overviews: превращает загруженные документы в увлекательные и живые диалоги. С одной кнопки два ИИ-ведущих обобщают материал пользователя, устанавливают связи между темами и ведут беседу.
- Illuminate: создает формальные обсуждения, генерируемые ИИ, о научных статьях, чтобы сделать знания более доступными и усваиваемыми.
Общая информация о нашем исследовании
Мы предоставляем обзор наших последних исследований в области генерации речи, которые лежат в основе всех этих продуктов и экспериментальных инструментов.