Новий інструмент adobe імітує голос людини після 20 хвилин навчання

Попередня ↔ Наступна

Суть «проблеми» проста - VoCo досить 20 хвилин слухати голос будь-якої людини (а якщо більше, то і зовсім відмінно), після чого він здатний вимовити даними голосом все що завгодно. Якщо говорити спрощено, VoCo розбиває мова на окремі фонеми, з яких потім здатний скласти що завгодно.

По суті, VoCo повинен стати свого роду «голосовим Photoshop», а показаний на конференції приклад можна порівняти з контекстним заповненням простору зображення. VoCo і його можливості в першу чергу орієнтовані на творців подкастів, представників кіноіндустрії та інші сфери діяльності, де можливість швидко підправити аудіодоріжку, без фактичної перезапису реплік, на вагу золота.

Новий інструмент adobe імітує голос людини після 20 хвилин навчання

При цьому розробники зізнаються, що вони прекрасно розуміють, що подібний інструмент в руках шахраїв може являти собою небезпечну зброю. Цзінь зізнався. що в Adobe вже думали про впровадження в подібне аудіо цифрових водяних знаків. За його словами, вже зараз, хоча VoCo ще не готовий до релізу, людям складно розрізнити справжній голос і скомпоновану підробку, тому в компанії підходять до питання з усією серйозністю і думають над тим, як зробити відмінності легко обнаружіми.

Поділися новиною з друзями: