Искусственный интеллект научили имитировать человеческий голос

11 марта 2018, 16:12
Образование

Сотрудники пекинской компании Baidu создали роботизированную систему, которая воспроизводит человеческую речь, с точностью копируя ее уникальные свойства

Технология под названием Deep Voice функционирует на основе машинного обучения: она «тренировалась» на звуковой записи, длящейся более 800 часов и включающей в себя около 2400 разных голосов. Для эффективной работы нейросети нужно около 100 пятисекундных звуковых сигналов, при этом она может обмануть системы распознавания голоса с помощью всего десяти пятисекундных семплов.

Deep Voice точно имитирует тембр и интонации голоса. По этой причине, производимые им звуки неотличимыми от настоящих. Инновационная система, может быть использована для создания персонализированных цифровых помощников, оказания услуг по автоматическому синхронному переводу, озвучивания книг, фильмов и видеоигр. Более того, нейросеть облегчит жизнь тем, кто по каким-то причинам утратил возможность говорить, и скрасит одиночество детей, читая им сказки на ночь, когда родители уехали в командировку. Интересно, что Deep Voice умеет менять голос, делая его мужским вместо женского или добавляя ему иностранный акцент.

Обсуждения

Нам важно Ваше мнение

Новости МирТесен

Новости СМИ2

Добавить свое объявление в этот VIP-блок в Череповце

Новости СМИ2

Новости МирТесен