Digitális szájról olvasás
Miközben egyre több feladatot bíznak emberek helyett gépekre, az automaták ügyfelekkel való kommunikációja még jócskán hagy kívánnivalót maga után. Ahhoz, hogy ezt a területet is meghódíthassák a gépek - teljesen átvéve olyan monoton munkákat, mint a jegyeladás vagy a menetrendi tájékoztatás - még komoly fejlődésre van szükség. A kutatók ma már a hang- és mozdulatfelismerés kombinálásán dolgoznak.
A közvetlenül emberek kiszolgálására tervezett gépek hőskorában még gombokkal vezérelhettük az automatákat, csakhogy komplex feladatoknál egyszerű piktogramokkal már nem lehetett leírni a funkciókat. A helyi nyelven készült feliratokat és magyarázatokat a külföldiek nem feltétlenül értik, ráadásul a kifüggesztett tájékoztatók könnyen meg is sérülhetnek.
Ezeket a problémákat a fejlesztők érintőképernyők és változó funkciójú gombok alkalmazásával igyekeztek kiküszöbölni. Itt már a magyarázó feliratok könnyen cserélhetők, így sokrétű menük is összeállíthatók, ráadásul jóval egyszerűbb a különféle nyelvek alkalmazása is.
Vannak azonban területek, ahol a műveletek összetettek ugyan, ám ezek a rendszerek mégsem alkalmazhatók, vagy nem kellően gyorsak. Egy gépkocsi különféle kezelőszerveinél például nem lehet menükkel lekötni a vezető figyelmét, noha a vezérlési feladatok egyre összetettebbek lesznek, a sokféle vasúti kedvezmény idegen nyelvű elmagyarázása pedig aligha gyorsítja a jegyváltást.
Emiatt a szakértők a hangfelismerő rendszerek integrálását tartják a jövő megoldásának. Ezek a rendszerek ugyan akár 99 százalékos felismerési pontosságra is képesek manapság, ám teljesítményük drasztikusan romlik, ha némileg eltérünk az ideális körülményektől.
Márpedig a valós élet közel sem kínál optimális működési feltételeket: az emberek nemcsak távol vannak a mikrofonoktól, de gyakran mormognak vagy valamilyen dialektusban beszélnek, nem csupán néhány száz szót használnak, ráadásul az állomásokon, autóban vagy áruházakban sokszor igen nagy a zaj is. Ilyen körülmények közt két ember egymás gesztusaiból, szájmozgásából következtet a mondanivaló lényegére, ám a gépek erre ma még képtelenek.
Német kutatók azonban már kísérleteznek a szájról olvasás digitalizálásával. Ez a módszer ugyan közel sem képes olyan hatékonyságra, mint a hangfelismerés, a két rendszer kombinálása azonban komoly teljesítménynövekedést hozhat - írja a Financial Times Deutschland.
Az egyik tesztelés alatt lévő rendszer az alsó és felső ajak mellett a szájsarkak, az orr és az áll mozgását is figyeli. Ezek jellegzetes elmozdulásából elég jól lehet bizonyos szavak kimondására következtetni.
Egy másik eljárás a különféle gesztusok felismerését integrálná a hang alapú megoldásokhoz. A fejlesztők elképzelése szerint elegendő volna rámutatni a bekapcsolni kívánt berendezésre, illetve fejmozgással aktiválni lehetne bizonyos funkciókat.
A még merészebb elképzelések szerint a jövőben még a fejünket sem kellene megmozdítanunk a különféle készülékek kezeléséhez. Egy gépjárművekben hasznosítandó módszer kamerákkal figyeli a szemet: ha ránézünk valamire, a szemfehérjén a szembogár elmozdul, ezt könnyen észleli a rendszer. Így például az autórádiónak akár tekintetünkkel is adhatunk majd utasításokat. (VG)


