В Google создали самый совершенный метод синтеза речи

Новости. » » В Google создали самый совершенный метод синтеза речи

Компания создала систему Tacotron 2, которая базируется на нейросетях и читает текст как живой человек.

Ученые из компании Google к началу зимы опубликовали исследование, в котором они представили систему речевого воспроизведения текстов Tacotron 2, которая может на все 100% повторить голос человека. О разработке повествует Quartz.

В основе технологии — две нейросети глубокого обучения. Первая способна преобразовывать текст в спектрограмму, а метод WaveNet преобразует его в звуковой формат. Tacotron 2 знает большое количество нюансов, без усилий справляется со трудными в произношении словами и, читая с листа, учитывает пунктуацию. Интонацией может быть выделено слово, написанное с заглавной буквы. Это стало возможным благодаря применению технологии нейросетей.

Google занимается разработкой систем синтеза человеческой речи довольно давно. Описание алгоритма, получившего название Tacotron 2, доступно на сайте ArXiv.org, а примеры его работы можно найти на сайте компании. Tacotron 2 вполне может стать еще не менее мощным дополнением к сервису. По утверждению разработчиков, им удалось превзойти все существующие подобные технологии в плане точности воспроизведения человеческого голоса. Для этого довольно звукового файла длительностью 1 мин.

Google научил программу говорить как человек

Поделиться с друзьями!

<<
>>



Интересные новости и статьи:


Последние публикации: