OpenAI представила инструмент, который может озвучить текст голосом любого человека
-
1:16, 01 апреля, 2024
Компания OpenAI представила новый инструмент на основе искусственного интеллекта — Voice Engine.
Он может эмоционально, акцентно и реалистично озвучивать тексты голосом любого человека, имея 15-секундный образец звучания речи.
Voice Engine создавали около двух лет, но пока публичного доступа к нему нет — разработчики опасаются, что его могут использовать массово и недобродетельно, в частности для создания дипфейков.
«Мы надеемся начать диалог об ответственном применении синтетических голосов и о том, как общество может адаптироваться к этим новым возможностям. На основе этих обсуждений и результатов тестов мы примем обоснованное решение о том, стоит ли и как разворачивать эту технологию в масштабе», — отметили в компании.
ШИ-модель, с которой работает Voice Engine, также лежит в основе ChatGPT, теперь может зачитывать ответы вслух от компании OpenAI.
Компания видит несколько путей применения технологии, в частности, оказания помощи тем, кто по каким-то причинам не может читать, а также детям в обучении, поскольку естественное звучание гораздо благоприятнее в обучении, чем роботизированные голоса.
Также OpenAI предлагает использовать новую технологию для перевода видео и подкастов. Разработчики отмечают, что даже в переводе Voice Engine сохраняет естественный упор говорящего.
В компании отмечают, что новый инструмент может помочь в восстановлении голоса пациентам с внезапными или дегенеративными состояниями речевого аппарата. Кроме того, Voice Engine может позволить немым людям общаться, озвучивая естественным языком их текстовые запросы. Примеры применения с семплами на нескольких языках также представлены в блоге.
Напомним, компания OpenAI изменила политику ChatGPT, фактически разрешив использовать свои технологии в военных целях.