Nvidia відкриває код Audio2Face для розвитку реалістичних 3D-аватарів
Технологія на основі ШІ забезпечує правдоподібну анімацію обличчя та синхронізацію губ у реальному часі

Компанія Nvidia оголосила про відкриття вихідного коду своєї технології Audio2Face, що дозволяє створювати реалістичні цифрові аватари для ігор, віртуальних сервісів s 3D-застосунків.
Про це повідомляє компанія.
Audio2Face працює на базі великих мовних і мовленнєвих моделей, перетворюючи аудіосигнал на анімацію обличчя та синхронізацію губ у реальному часі. Система аналізує мовні особливості – такі, як фонеми та інтонація – і трансформує їх у набір даних, які відповідають міміці персонажа. Це дає змогу створювати як заздалегідь прописаний контент, так і динамічних ШІ-персонажів із правдоподібними емоційними реакціями.
Разом із моделями компанія відкрила й SDK, що дозволяє розробникам інтегрувати технологію у власні продукти, а також фреймворк для навчання, який дає змогу налаштовувати вже наявні моделі під конкретні сценарії використання. Отже, Nvidia робить крок до масового впровадження генеративних аватарів, які зможуть природно взаємодіяти з користувачами в різних сферах – від геймінгу до клієнтського сервісу.
Бекграунд. Раніше Mind повідомляв, що Nvidia оголосила, що вкладе в розробника ChatGPT $100 млрд інвестицій. Перші інвестиції у розмірі $10 млрд надійдуть після угоди про покупку обладнання.
Якщо ви дочитали цей матеріал до кінця, ми сподіваємось, що це значить, що він був корисним для вас.
Ми працюємо над тим, аби наша журналістська та аналітична робота була якісною, і прагнемо виконувати її максимально компетентно. Це вимагає і фінансової незалежності.
Станьте підписником Mind всього за 196 грн на місяць та підтримайте розвиток незалежної ділової журналістики!
Ви можете скасувати підписку у будь-який момент у власному кабінеті LIQPAY, або написавши нам на адресу: [email protected].