Kinijos įmonė „Baidu“, dar vadinama Kinijos „Google“, paskelbė, kad atnaujino savo teksto vertimo į kalbą programą, pavadintą „Deep Voice“. Jei anksčiau ji užtrukdavo maždaug pusvalandį ar dar ilgiau, analizuodama žmogaus balsą, kad jį sugebėtų pakartoti, tai dabar „Deep Voice“ tai padaryti gali greičiau nei per minutę. Neuroninių tinklų sąveika pagrįsta sistema yra, „Baidu“ teigimu, kuriama, kad mašinos galėtų kalbėtis su žmonėmis lygiai taip pat, kaip kiti žmonės.
Sistema turi dvi dalis. Pirmajai reikia pateikti įrašytus balso pavyzdžius, kad ji galėtų juos išanalizuoti. Antroji dalis gali skaityti vartotojo pateiktą tekstą ką tik išmoktu balsu.

Tiesa, pasaulyje yra nemažai įmonių ir mokslininkų grupių, kuriančių programas, galinčias atkartoti individualaus žmogaus balso skambesį, todėl robotas-padėjėjas, kalbantis Donaldo Trumpo balsu, gal per daug ir nenustebintų.
Tačiau naujoji „Baidu“ sistema gali sukelti reikšmingų pokyčių kitose srityse. Jai tereikia pateikti maždaug 100 penkių sekundžių trukmės balso įrašų pavyzdžių, ir sistema, prašnekusi svetimu balsu, jau sugeba 95 atvejais iš 100 apgauti balso atpažinimo programinę įrangą. Ji taip pat gali manipuliuoti balsu, leisdama išgirsti, kaip tas žmogus galėtų kalbėti, pavyzdžiui, su britų akcentu.
Todėl, jei ši technologija ateityje veiktų ir išmaniuosiuose telefonuose, ji galėtų sukelti nemažų problemų. Pavyzdžiui, nusikalstamas veikas įrodantys garso įrašai keltų daug abejonių, nes juos būtų nesunku sufabrikuoti. Taip pat tapatybės vagystėse būtų galima pavogti ne tik asmens duomenis, bet ir balsą.
Neural Voice Cloning with a Few Samples, arXiv:1802.06006 [cs.CL] arxiv.org/abs/1802.06006
Daugiau:
Akustikos tyrimų taikymas: nuo popmuzikos iki architektūros ir kriminologijos
Muzikos kūrėjai gali pamėginti pagroti duetu su dirbtinio intelekto sistema
„Intel“ paskelbė netrukus išleisianti pirmuosius lustus, skirtus dirbtinio intelekto sistemoms
VDU – vienos moderniausių garso studijų Baltijos šalyse
Programinė įranga atpažįsta lietuvių kalbą
VDU mokslininkai kuria programinę įrangą, atpažįstančią lietuvių kalbą neribotai
