Компания Google обновит движок для преобразования текста в речь Speech Services на Android-устройствах, сделав звучание голосов более чистым и естественным.
По данным разработчиков, пользователям не придется ничего делать — модернизация технологии «произойдет за кулисами». Обновление «значительно улучшит» качество сгенерированной речи, особенно в отношении четкости и естественности, добавили они.
421 голос на 67 языках получит новую речевую модель и синтезатор. Текущее звучание американского английского автоматически изменится на спич, созданный с помощью «более свежих данных».
Разработчики также показали образцы обновленных голосов на других языках.
Компания распространит обновление для Speech Services на все 64-разрядные Android-устройства через магазин приложений Google Play в течение следующих нескольких недель.
Напомним, в сентябре OpenAI представила систему распознавания речи с открытым исходным кодом Whisper, обеспечивающую транскрипцию на нескольких языках.
В августе стриминговый сервис Megogo задействовал ИИ для озвучивания видеоконтента.
В мае 2021 года Google представила нейросетевую модель LaMDA, которая общается как живой человек и поддерживает непринужденный диалог на разные темы.
Подписывайтесь на новости ForkLog в Telegram: ForkLog AI — все новости из мира ИИ!