OpenAI, дослідницька лабораторія, відома своїми розробками в галузі штучного інтелекту, представила новий інструмент під назвою Voice Engine. Цей інструмент, який зараз тестується, може клонувати голоси людей із 15-секундного аудіо зразка.
Про це йдеться на сайті компанії.
Voice Engine використовує генеративну модель штучного інтелекту, подібну до тієї, що використовується в ChatGPT та API перетворення тексту в мову OpenAI. Ця модель навчається на величезному наборі даних, що містить ліцензовані та загальнодоступні записи.
Spotify вже використовує Voice Engine з початку вересня для дублювання подкастів різними мовами.
OpenAI вживає заходів для забезпечення етичного використання Voice Engine. Клоновані голоси маркуватимуться спеціальними нечутними для людського вуха ідентифікаторами. Доступ до інструменту буде обмежений для групи розробників, які зосередяться на низько ризикованих, соціально корисних випадках використання.
OpenAI також вимагає від користувачів діставати явну згоду людей, чиї голоси клонуються, і розкривати інформацію про те, коли голоси генеруються за допомогою штучного інтелекту.
Поява досконалої технології клонування голосу може мати негативні наслідки. Актори озвучки можуть втратити роботу, а технологія може використовуватися для створення фейкових записів, які використовуються для шахрайства.
OpenAI планує посилити безпеку Voice Engine та розширити доступ до нього, залежно від результатів пілотної програми й розроблення ефективних засобів захисту.