Сб. Июл 20th, 2024

Компания Google обновит движок для преобразования текста в речь Speech Services на Android-устройствах, сделав звучание голосов более чистым и естественным.

По данным разработчиков, пользователям не придется ничего делать — модернизация технологии «произойдет за кулисами». Обновление «значительно улучшит» качество сгенерированной речи, особенно в отношении четкости и естественности, добавили они.

Пример текущего звучания сгенерированной речи
Пример звучания сгенерированной речи после обновления

421 голос на 67 языках получит новую речевую модель и синтезатор. Текущее звучание американского английского автоматически изменится на спич, созданный с помощью «более свежих данных».

Разработчики также показали образцы обновленных голосов на других языках.

Португальский (Бразилия) до обновления
Португальский (Бразилия) после обновления
Испанский (США) до обновления
Испанский (США) после обновления

Компания распространит обновление для Speech Services на все 64-разрядные Android-устройства через магазин приложений Google Play в течение следующих нескольких недель.

Напомним, в сентябре OpenAI представила систему распознавания речи с открытым исходным кодом Whisper, обеспечивающую транскрипцию на нескольких языках.

В августе стриминговый сервис Megogo задействовал ИИ для озвучивания видеоконтента.

В мае 2021 года Google представила нейросетевую модель LaMDA, которая общается как живой человек и поддерживает непринужденный диалог на разные темы.

Подписывайтесь на новости ForkLog в Telegram: ForkLog AI — все новости из мира ИИ!