A gépek a fejlett hangfelismerő rendszerekkel már rengeteg adatot tudnak összegyűjteni rólunk.

Az életkorra, nemre, etnikai hovatartozásra, társadalmi-gazdasági státuszra és akár az egészségi állapotra vonatkozóan is rengeteg információt tud összegyűjteni az MI,

ami az adatgyűjtés egy új korszakát hozza el  – írta meg a Wire. Kutatók az egyének hangadatai alapján még az arcképet is képesek rekonstruálni. A Speech2Face felállított egy olyan algoritmust, amely képes megtanulni az audiovizuális adatok, a hangképzés és az arc fizikai tulajdonságai közötti összefüggéseket.

Ezekből az információkból a modell képes a hang alapján generálni a beszélő arcát.

adathalászat Security breach, system hacked alert with red broken padlock icon showing unsecure data under cyberattack, vulnerable access, compromised password, virus infection, internet network with binary code
Fotó: Shutterstock

Mivel a különböző hangfelismerő rendszerek szinte már minden ember környezetében jelen vannak, elég csak a Sirire vagy az Alexára gondolni, eljött az az időszak, amikor az MI már nemcsak a böngészési előzményeink alapján profilozza az embereket, hanem pusztán annak alapján, ahogy beszélnek. A mesterséges intelligencia és az egyre fejlettebb gépi tanulás arra a szintre jutott, amikor már nem csupán azt képesek a gépek megérteni, hogy mit mondanak nekik, hanem

kvázi meg is ismerik az adott embert.

Emiatt rendkívül fontos, hogy a vállalatok és az állami szervek nagyobb hangsúlyt fektessenek a hangadatvédelemre.

A beszédfelismerés fejlesztésének a lényege kezdetben az volt, hogy a felhasználók könnyebben tudjanak kommunikálni az okostelefonjaikkal. Mára ott tart a technológia, hogy a beszélő viselkedési mintái alapján képes a mesterséges intelligencia képet alkotni az emberről például az akcentusa, a hangmagassága vagy a beszédstílusa alapján. A hangtechnológia és a hangelemzés fejlődése, a költségek csökkenése és az adatgyűjtés és -feldolgozás teljesítményének növekedése mind azt eredményezi, hogy a hangfelismerés piaca egyre bővül.

Egyre nagyobb üzlet a hangelemzés

A Big Voice, vagyis a hangfelismeréssel és adatfeldolgozással foglalkozó iparág a ReportLinker adatai szerint

2026-ra elérheti a 20,9 milliárd dollárt.

A portál azt írja, hogy a koronavírus-járvány ágyazott meg a szegmens növekedésének. A hang- és beszédfelismerő technológiák globális piaca 2020-ban nagyjából 7,7 milliárd dolláros volt.

Szóbeli fenyegetés

A kimondott szavak és az, ahogyan elhangzanak, mind felhasználhatók az ember azonosítására

– erről Emmanuel Vincent, a francia Nemzeti Digitális Tudományos és Technológiai Kutatóintézet hangtechnológiákra szakosodott vezető kutatója beszélt. Ahol most tart a hangtechnológia, az szerinte még csak a jéghegy csúcsa.

Pusztán annak alapján, hogy a telefonunk közelében beszélünk, annyi információt gyűjthet rólunk az MI, amivel egy teljes virtuális profil készülhet. Ennek az egyik oldaláról tökéletesen célzott hirdetésekkel lehet elárasztani bárkit, de van ennek egy sokkal veszélyesebb, identitásklónozási oldala is

 – tette hozzá a kutató. Az identitásklónozás azt jelenti, hogy a tárolt hangadatok felhasználásával hekkerek megalkothatják bárki virtuális személyiségét. Ezzel például mások nevében is lehet robothívásokat generálni, erre már volt is példa a gyakorlatban.

Kyiv Mayor Vitali Klitschko visits the area close to an apartment building destroyed in a Russian airstrikes in the Shevchenkivskiy district of Kyiv, Ukraine. June 26, 2022 (Photo by Maxym Marusenko/NurPhoto) (Photo by Maxym Marusenko / NurPhoto / NurPhoto via AFP)
Fotó: Maxym Marusenko / NurPhoto via AFP

Oroszok deepfake technológiával egy Zoom-híváson keresztül Vitalij Klicsko kijevi polgármester nevében tárgyaltak a madridi és a berlini polgármesterekkel  – erről a The Guardian írt. Természetesen a spanyol és a német politikus csak egy ál-Klicskóval beszélt. Egy másik esetben szintén egy deepfake videóban Volodimir Zelenszkij ukrán elnök adta meg magát a közösségi médiában.

Hamis videón adta meg magát az ukrán elnök

Egy ukrán televíziós hírügynökség állítja, hogy az oldalát szerdán feltörték, és a hekkerek elterjesztették azt a videót, amelyben Volodimir Zelenszkij ukrán elnök letette a fegyvert az oroszok előtt.

Egy ember hangjáról elég egy harmincperces összefüggő felvételt betáplálni az MI-be, és a gépek képesek tökéletesen leutánozni a hangot. Ez nem a jövő technológiája, már bárkinek a lakásában ott lehet, és – gondoljunk az Amazon Alexa esetére – akár halott szeretteink hangján is megszólalhat.

The Google Assistant speaker and Amazon's Echo - Alexa Voice Service presented at the IFA in Berlin, Germany, 1 September 2017. Photo: Britta Pedersen/dpa-Zentralbild/ZB (Photo by BRITTA PEDERSEN / ZB / dpa Picture-Alliance via AFP)
Fotó: Britta Pedersen / DPA Picture-Alliance via AFP

A TikTok betiltására szólította fel az amerikai távközlési hatóság a Google-t és az Apple-t

Még tavaly keltett nagy felháborodást, amikor a kínai TikTok megváltoztatta az adatvédelmi irányelveit, és elkezdte gyűjteni az Egyesült Államokban élő felhasználók hanglenyomatát és más biometrikus adatokat. Az amerikai hatóságok báránybőrbe bújt farkasnak bélyegezték a ByteDance közösségi média alkalmazását és arra kérték a Google-t és az Apple, hogy távolítsák el az applikációt az alkalmazásboltjukból – erről az Engadget is beszámolt.

Egyértelmű, hogy a TikTok elfogadhatatlan nemzetbiztonsági kockázatot jelent, mivel kiterjedt adatgyűjtésével és Peking nyilvánvalóan ellenőrizetlen működésével hozzáfér a polgárok érzékeny adataihoz

 – mondta az amerikai távközlési hatóság biztosa, Brendan Carr.