Meta запускает NotebookLlama для создания подкастов
Meta представила свою новую «открытую» реализацию вирусной функции создания подкастов под названием NotebookLlama в Google NotebookLM. Этот проект использует собственные модели Llama компании для обработки данных, что становится очевидным при его работе.
Как работает NotebookLlama
NotebookLlama способен генерировать дайджесты загруженных текстовых файлов, например, новостных статей или блогов, в формате подкаста.
- Сначала программа создает расшифровку файла, например, PDF-документа.
- После этого добавляются элементы «драматизации» и паузы.
- Наконец, стенограмма передается в открытые модели преобразования текста в речь.
Качество и ограничения
Несмотря на многие возможности, качество подкастов, созданных с помощью NotebookLlama, значительно уступает результатам NotebookLM. В образцах, которые слушали пользователи, многие заметили, что голоса звучат довольно роботизировано и иногда пересекаются в неожиданных местах.
Исследователи Meta признали, что улучшение качества возможно благодаря использованию более продвинутых моделей. Они отметили следующее на странице NotebookLlama в GitHub:
- Модель преобразования текста в речь ограничивает естественность звучания.
- Одним из альтернативных способов создания подкаста могло бы быть обсуждение интересной темы двумя агентами с составлением плана подкаста.
История попыток создания подкастов с помощью ИИ
NotebookLlama не стал первой попыткой воссоздать функцию подкастов NotebookLM. Разные проекты имели разные успехи, но даже NotebookLM столкнулся с неизбежной проблемой «галлюцинаций» в ИИ. Это означает, что подкасты, созданные с помощью ИИ, неизбежно содержат вымышленные элементы.
Заключение
Meta продолжает экспериментировать с ИИ в области создания аудиоконтента, и хотя NotebookLlama открывает новые горизонты, работа с технологиями еще требует значительных улучшений. С улучшением качества моделей, возможно, в будущем мы увидим более естественные и аккуратные подкасты.