Искусственный интеллект выходит на рынок аудиокниг.

Искусственный интеллект выходит на рынок аудиокниг.

На YouTube появилось множество книг о Гарри Поттере. Фото: YouTube.

Появляются новые новости о взаимодействии искусственного интеллекта и аудиокниг. Австралийская компания Bolinda, специализирующаяся на производстве аудиокниг, недавно анонсировала создание клона с искусственным интеллектом, который имитирует голос прославленной авторки Барбары Картленд (умершей в 2000 году).

Через два дня Spotify объявил о сотрудничестве с ElevenLabs, позволяющем авторам самостоятельно публиковать аудиокниги с озвучением, созданным с помощью ИИ.

В то же время, недавнее расследование New York Times выявило широкомасштабное использование искусственного интеллекта для нарушения авторских прав на аудиокниги на YouTube.

«Если вы поищете бестселлеры, то найдете бесплатные аудиокниги на YouTube»,— отметил генеральный директор Ассоциации авторов Америки.

Опрос 2025 года показал, что 35% пользователей аудиокниг слушали их на YouTube, из чего 23% составляют аудиокниги, озвученные с помощью ИИ.

Разработка голосовых систем на основе ИИ.

Технологии синтеза речи существуют давно; первая автоматизированная система преобразования текста в речь была создана в 1968 году в Японии. Позже, в начале 1980-х годов, IBM усовершенствовала эту технологию.

В 1986 году компания представила первое программное обеспечение для преобразования текста в речь для пользователей ПК. Первоначально эта технология была разработана для людей с нарушениями зрения, которые стали одними из первых пользователей.

С развитием технологий звуки, производимые ИИ, становятся все более естественными, что вызывает опасения относительно их воздействия на рынок аудиокниг. В 2009 году Ассоциация авторов Америки запретила функцию преобразования текста в речь на Kindle 2, ссылаясь на нарушение авторских прав.

AI anh 1

Издатели ищут способы распознавания защищенных авторским правом аудиокниг на разных платформах. Фото: Publishers Weekly.

Вам также может понравиться

Ужесточение мер безопасности пищевых продуктов для выпускных экзаменов в средней школе в 2026 году.

Многие известные авторы также выражают беспокойство по поводу автоматического преобразования текста в речь.

«В день, когда искусственный интеллект создаст идеальные аудиокниги для Kindle, у нас возникнут более серьезные проблемы, чем авторские права», — говорит писатель-фантаст и технологический эксперт Кори Доктороу.

Шведская компания Storytel, крупнейшая платформа для потокового вещания в Скандинавии, сообщила в 2024 году, что девять из десяти слушателей «не смогли различить человеческие голоса» при тестировании голосов, сгенерированных ИИ, в программе Voice Switcher.

Как и Spotify, Storytel использует технологию искусства ИИ от ElevenLabs. Функция Voice Switcher позволяет слушателям выбирать между оригинальным голосом рассказчика, тремя другими голосами, созданными ИИ, или версией известного шведского актера и рассказчика Стефана Заука, созданной с помощью ИИ.

Злоупотребление голосовым ИИ

В настоящее время клонирование голосов используется в неподобающих целях с угнетающей скоростью. В ответ на это, а также на другие технологии имитации человеческого тела с применением технологии «дипфейк», Организация Объединенных Наций в марте этого года выпустила предупреждение о незаконном использовании ИИ в коммерческих целях.

Индустрия аудиокниг также подвержена данной проблеме. В 2023 году записи, озвученные Стивеном Фраем для книг о Гарри Поттере, были использованы незаконно. Также писатель Шон Рейн обнаружил на YouTube дипфейки с его изображением, где персонаж, созданный ИИ, читал главы из его книги.

YouTube предпринял шаги по решению этой проблемы, автоматическое сканируя загружаемый контент на соответствие своей обширной базе данных. Однако существуют две сложности.

Во-первых, многие аудиокниги на YouTube не защищены авторскими правами. Во-вторых, система сканирования YouTube недостаточно эффективна для обнаружения аудиокниг.

Незначительные изменения, такие как скорость чтения, тембр голоса или добавление фоновых шумов и музыки, позволяют пиратским аудиокнигам обходить систему.

Будущее аудиокниг

Текущая ситуация с искусственным интеллектом и индустрией аудиокниг поднимает вопросы ответственности и реакции всех заинтересованных сторон. Актеры озвучивания беспокоятся о будущем своей профессии и ценности своих защищенных произведений.

Профсоюзы и активисты активно выступают за ужесточение регулирования в отношении ИИ и контента. В то же время авторы и издатели хотят, чтобы крупные платформы, как YouTube, принимали меры против нарушения авторских прав.

Законодатели, технологические компании и крупные коммерческие предприятия испытывают давление для нахождения способов обеспечения прозрачного и этичного использования технологий ИИ.

Вам также может понравиться

Создание специализированного медицинского кластера в восточной части города Хошимин.

Эта ситуация ставит перед всей издательской индустрией сложные задачи. Однако невозможно игнорировать вклад искусственного интеллекта в озвучивание для пользователей и будущее индустрии аудиокниг.

Голоса, озвученные живыми людьми, обеспечивают непревзойденное качество звучания благодаря выразительности, живости и аутентичности. В то же время более доступные и быстрые озвучивания на основе ИИ становятся всё более актуальными, особенно для людей с нарушениями зрения или конкретными неврологическими расстройствами, мешающими чтению.

Источник: https://znews.vn/ai-tham-nhap-nganh-sach-noi-post1657401.html

ОСТАВЬТЕ ОТВЕТ

Пожалуйста, введите ваш комментарий!
пожалуйста, введите ваше имя здесь

Основатель более 10 стартапов в области ИТ и ИИ. Серийный предприниматель. Профессиональный управленец.