Створено нейромережу, яка вміє переозвучувати відео зі збереженням голосу та міміки

Ростислав Вонс

12 вересня, 2023, 09:32

glavcom.ua

Ростислав Вонс

Створено нейромережу, яка вміє переозвучувати відео зі збереженням голосу та міміки

HeyGen планує використовувати «хороші» дипфейки для маркетингових кампаній чи створення навчальних відео

фото з відкритих джерел

HeyGen презентувала технологію, що дозволяє будь-кому отримати особистий «дипфейк»

Компанія HeyGen презентувала технологію, що дозволяє будь-кому отримати особистий «дипфейк» – створений штучним інтелектом дубль відео, здатний декламувати практично все, що ви вводите в текстове поле. Про це повідомляє Axios.

Щоб отримати персоналізований відеоаватар, клієнти повинні надіслати HeyGen двохвилинне відео, на якому вони говорять у камеру (можна зі смартфона), а далі ввести будь-який текст у спеціальне поле (фільтр блокує відвертий або насильницький вміст).

На додаток до індивідуальних аватарів клієнта, HeyGen запропонує ряд готових до використання загальних аватарів і голосів

фото: скріншот

На додаток до індивідуальних аватарів клієнта, HeyGen запропонує ряд готових до використання загальних аватарів і голосів (вони бувають різних статей і рас).

Однак HeyGen хоче, щоб її інструмент використовували для «хороших» дипфейків, таких як маркетингові кампанії чи то створення навчальних відео.

«Ми хочемо створити генеративний відеодвигун, який замінить камери, і дозволить всім вільно створювати контент», – сказав Джошуа Сю, генеральний директор HeyGen, який шість років пропрацював у Snapchat перед тим, як запустити свій стартап наприкінці 2020 року.

Попри те, що обмежень в інструмента дуже багато (він не завжди правильно промовляє власні імена, та і рухи губ не виглядають бездоганно) – на сайті вже величезні черги, і затримки навіть при обробці невеликих за розміром відео.

HeyGen пропонує низку варіантів передплати приблизно від $50 до $150 на місяць з певною кількістю кредитів, кожен з яких придатний для однієї хвилини відео (пакети вищого класу пропонують можливість створювати довші відео з вищою роздільною здатністю).

Середня вартість становить приблизно $3 за хвилину, тоді як налаштування особистого аватара зараз коштує $199 (простіший аватар, заснований лише на фотографії, безплатний; але є також є варіант професійного аватара за $1000, який вимагає використання студії та зеленого екрана.) Безплатна пробна версія пропонує один кредит на день, але лише зі стандартними аватарами HeyGen або фото, що говорить.

Нагадаємо, британські вчені навчили штучний інтелект (ШІ) викрадати дані за допомогою розпізнавання звуків натискання клавіш на клавіатурі. Так, ШІ може вгадати введену комбінацією з точністю до 95%.

До слова, пожежники Каліфорнії (штат США) використовують штучний інтелект, щоб допомогти помітити лісові пожежі, передаючи відео з понад тисячі камер, розміщених по всьому штату.