Top.Mail.Ru

Аудиокниги будущего:
что такое синтез речи?

Аудиокниги продолжают набирать популярность. Этот формат приносит авторам Литрес Самиздат весомые плюсы: расширение аудитории и денежное вознаграждение с каждой продажи.

Обычно авторы заказывают озвучивание книги у профессиональных чтецов. Но что делать, если на такую услугу не хватает ресурсов? Есть решение, которое сэкономит время и деньги, — это технология синтеза речи. В статье объясняем, что это такое, и делимся комментариями экспертов.

Что такое технология синтеза речи

TTS — Text To Speech, технология преобразования текста в речь. Пример одного из сервисов, которые это умеют, — Yandex SpeechKit. Именно его мы используем в Литрес для автоматического озвучивания книг, чтобы помогать авторам находить новую аудиторию. Кроме этого технология позволяет создавать голосовых помощников, озвучивать контент и автоматизировать колл-центры.

С 2022 года с помощью технологии синтеза речи мы озвучили более 22 000 книг. Средняя оценка произведений за это время повысилась с 4,2 до 4,5 — и это не предел, смотрите сами:

Как работает технология синтеза речи

Создание голосовой модели

Дикторы произносят и записывают разные фрагменты текстов, на которых обучается программа. Она обращает внимание на множество звуковых характеристик, поэтому синтезированные голоса получаются естественными.

Выбор голоса

Пользователь может выбрать готовый голос из нескольких вариантов. Они различаются тембром, полом и языком. Если ни один голос не подходит, специалисты Yandex SpeechKit могут создать новый, уникальный.
Оформляя заявку в Литрес, вы можете выбрать мужской или женский голос. Модели «говорят» на русском языке с соблюдением всех правил.

Загрузка текста и преобразование в речь

Голосовые модели Yandex SpeechKit работают на технологии нейронных сетей. Перед озвучиванием модель оценивает текст целиком, что позволяет минимизировать количество искажений.
Если в вашем тексте есть сложные и/или выдуманные слова, важно заполнить словарь ударений перед озвучиванием. Так технология сможет максимально точно и верно преобразовать вашу историю в аудиоформат.
Елена Белоброва
Руководитель направления развития бизнеса ML-технологий, Yandex Cloud
В Yandex Cloud TTS умеет озвучивать на русском языке сокращения, при необходимости расшифровывая их, числительные, написанные цифрами, даты и многое другое. При этом ударения в словах расставляются автоматически с учетом правил русского языка. Для заимствованных слов и слов с несколькими вариантами, как, например, в паре «зАмок / замОк», пользователь может задать ударение с помощью разметки. Интонации определяются и расставляются с учетом текста. При необходимости их также можно скорректировать с помощью разметки.

Зачем авторам книга, озвученная синтезом речи?

4
3
2
1
Возможно, вашей аудитории удобнее слушать книги по пути на работу или во время прогулки, но аудиоверсий нет. Спросите об этой потребности своих читателей и оживите литературных героев за короткий срок.
Потенциальные слушатели станут реальными, а вы получите больше заветных оценок и отзывов на произведение. Еще один плюс: новые поклонники наверняка познакомятся и с другими вашими работами.
Новые слушатели — новые продажи, с которых авторы получают денежное вознаграждение. С вашей стороны не требуется никаких трат и усилий — только оформление заявки.

Попробовать новый формат

Бесплатно привлечь новую аудиторию

Получить роялти с продаж аудиокниги

Благодаря синтезу речи вы получите бесплатный и быстрый результат. Мы стараемся, чтобы аудиокниги были готовы в течение 1−2 недель после одобрения заявки.

Сэкономить ресурсы

Арт Гаспаров
Я решил озвучить книгу, потому что аудиоформат сегодня особенно популярен. Многим моим читателям и подписчикам нравится именно он. Авточтец Литрес дал отличную возможность превратить мою книгу в аудио быстро и понятно.

Голос диктора приятный, частично механический. Для меня это отличается от живой озвучки. Тем не менее за этим будущее как за искусственным интеллектом, который с каждым годом будет все лучше и лучше озвучивать книги. Мир меняется, нужно адаптироваться и привыкать.

Паузы соблюдались, ошибок не помню. Где-то ударения были не в нужных местах, но это не сильно резало слух. Когда знаешь, что это Авточтец, делаешь скидку.

Продажи увеличились где-то через месяц. Одна книга подтягивает другую + влияет общий фон моей активности в социальных сетях.

Какой должна быть книга, чтобы синтез речи дал крутой результат

Не все зависит от технологий, хоть они постоянно развиваются. Мы собрали несколько подводных камней — проблем, из-за которых озвучка может стать не совсем идеальной. Также делимся советами по их исправлению.
  • Проблема
    Неправильные ударения
  • Почему она возникает
    Голосовые модели учатся, но некоторые имена, редко встречающиеся, или неологизмы могут быть им незнакомы.
  • Решение
    Заполните словарь ударений при оформлении заявки: укажите неологизмы или сложные имена с правильными ударениями
  • Проблема
    Неправильная расстановка пауз и неразборчивые слова
  • Почему она возникает
    Причина может крыться в неверной пунктуации или пропущенных ошибках и опечатках.

    Второй вариант — слишком длинные и сложные предложения. В устной речи они чаще всего короткие и не осложненные множеством придаточных частей.
  • Решение
    Поможет самостоятельная вычитка или профессиональная корректура произведения.

Будущее TTS: мнение экспертов

  • Елена Белоброва
    Руководитель направления развития бизнеса ML-технологий, Yandex Cloud
    TTS очень быстро развивается. Сокращаются требования к объему аудио и качеству голоса для создания синтеза, благодаря этому создавать новые голоса в синтезе становится проще и дешевле. Увеличивается «человекоподобность» за счет совершенствования интонаций и общего улучшения звучания. Все это расширяет возможности применения технологии в разных задачах бизнеса.
  • Евгений Селиванов
    Директор по развитию бизнеса ГК «ЛитРес»
    В ближайшем будущем независимые авторы будут все больше использовать искусственный интеллект и генеративные нейросети при создании и продвижении своих книг. Технологии уже позволяют авторам получать помощь в редактуре текстов, генерации изображений и создании аудиоконтента. В перспективе сюда добавится генерация видеоконтента, что, несомненно, качественно изменит весь самиздат-сегмент рынка, предоставляя аудитории более комплексный аудиовизуальный продукт.

    Но, несмотря на все изменения, в центре творческого процесса по-прежнему будет стоять автор, просто теперь он сможет создавать самостоятельно то, что ранее требовало целой команды. Это, безусловно, открывает новые возможности для творчества и позволяет смотреть в будущее с оптимизмом.

    P. S. Кстати, изначально этот комментарий был существенно более развернутым. Нейросеть сделала саммари, а потом я его доработал. Будущее уже наступает!

Как оформить заявку на озвучивание синтезом речи в Литрес

Заявку можно подать в личном кабинете автора. Подробнее читайте в нашей базе знаний.
  • Если книга опубликована
    Напротив нужного произведения нажмите «Создать аудиоверсию» и выберите пункт с бесплатным производством. Заявку рассматривают 14 дней, после чего вы получите оповещение на электронную почту.
  • Если книга готовится к публикации
    Можно подать заявку сразу, как только вы отправите книгу на модерацию. Решение по ней будет после того, как книга пройдет этот процесс.
  • Если вы публикуете черновик
    Вы сможете подать заявку, когда черновик будет закончен и перейдет в статус электронной книги.
Была ли статья полезна для вас?

Другие статьи в нашем блоге