Суть «проблеми» проста - VoCo досить 20 хвилин слухати голос будь-якої людини (а якщо більше, то і зовсім відмінно), після чого він здатний вимовити даними голосом все що завгодно. Якщо говорити спрощено, VoCo розбиває мова на окремі фонеми, з яких потім здатний скласти що завгодно.
По суті, VoCo повинен стати свого роду «голосовим Photoshop», а показаний на конференції приклад можна порівняти з контекстним заповненням простору зображення. VoCo і його можливості в першу чергу орієнтовані на творців подкастів, представників кіноіндустрії та інші сфери діяльності, де можливість швидко підправити аудіодоріжку, без фактичної перезапису реплік, на вагу золота.
![Новий інструмент adobe імітує голос людини після 20 хвилин навчання (після) Новий інструмент adobe імітує голос людини після 20 хвилин навчання](https://images-on-off.com/images/119/noviyinstrumentadobeimitiruetgoloschelov-f6646e87.jpg)
![Новий інструмент adobe імітує голос людини після 20 хвилин навчання (людини) Новий інструмент adobe імітує голос людини після 20 хвилин навчання](https://images-on-off.com/images/119/noviyinstrumentadobeimitiruetgoloschelov-75421ec0.jpg)
При цьому розробники зізнаються, що вони прекрасно розуміють, що подібний інструмент в руках шахраїв може являти собою небезпечну зброю. Цзінь зізнався. що в Adobe вже думали про впровадження в подібне аудіо цифрових водяних знаків. За його словами, вже зараз, хоча VoCo ще не готовий до релізу, людям складно розрізнити справжній голос і скомпоновану підробку, тому в компанії підходять до питання з усією серйозністю і думають над тим, як зробити відмінності легко обнаружіми.
Поділися новиною з друзями: