Mit tud a Meta fordítóprogam?

Mintegy 200 nyelv közötti fordításra alkalmas Mesterséges Intelligenciát (MI) alkotott a Facebook-tulajdonos Meta. A fordítótechnológia fejlődése már jó ideje az MI-re alapul, a neurális gépi fordítás elég jó eredményekre képes bizonyos nyelvek között. A fő problémát azonban az jelenti, hogy míg a leggyakrabban használt nyelvek között a fordítás már akár az ingyenesen elérhető Google fordítóval is többé-kevésbé pontos, és nyelvileg is helyes eredmények születnek, a kevésbé gyakori – vagy inkább az internetes szövegek mennyiségét tekintve ritkább – nyelvek közötti fordítások már kevésbé sikerülnek jól. Sok esetben két ilyen nyelv közötti fordítás úgy születik meg, hogy az MI a kiindulási nyelvből először angolra fordít.

Hány nyelvet beszélnek a világon?

Ennek a problémának a megoldására hozta létre a Meta az NLLB-200 nevű fordítóprogramját, amely a természetes nyelvi feldolgozás (NLP) módszerével igyekszik minél több nyelv között megteremteni az átjárást. Az NLLB a No Language Left Behind (egy nyelvet sem hagyunk hátra) rövidítése, míg a 200 az MI által ismert nyelvek számát jelenti. Természetesen ez még mindig messze van az emberek által beszélt több mint 7000 nyelvtől, ám számos olyan ember előtt nyithatja meg a gépi fordítás lehetőségét, akik eddig ezt kénytelenek voltak nélkülözni, vagy csupán alacsony minőségben érhették el.

Concept,Of,Artificial,Intelligence,In,Use,As,A,Translator,,French, Concept of artificial intelligence in use as a translator, french to english. 3d illustration.
Fotó: Shutterstock

A Meta MI-je új eszközt is kapott a neurális gépi fordítás fejlesztésére, amely képes a neten megtalálni a párhuzamos szövegeket, ez a LASER3. A modell tanítását nyelvspecifikus kódolók is segítik, és lehetővé teszik, hogy nagyméretű minták szülessenek azonos mondatokból. Szemben a széles körben használt gépi fordítókkal, melyek kevesebb mint 25 afrikai nyelvet támogatnak, az NLLB-200 55 afrikai nyelvet ismer. Az új neurális gépi fordító 44 százalékos javulást ért el a korábbi legkorszerűbb programokkal szemben. Az afrikai és indiai nyelvek közötti eredmények terén a javulás mértéke még ennél is jobb, 70 százalékos.

Bár a legpontosabb megoldások hagyományosan a nyelvi párok külön-külön történő fejlesztésével jönnek létre, ezek skálázhatósága limitált. Ezt jól érzékelteti, hogy a cég korábban használt, száz nyelven működő fordítója tízezer nyelvi párral, míg a mostani 200 nyelv már 40 ezerrel működik. Ezért a cég többnyelvű megközelítést alkalmaz.

Hogyan tudjuk majd használni az NLLB-200-at az interneten?

Az NLLB-200 többek között a cég saját oldalain, így a Facebookon és az Instagramon segíti a fordításokat, de a Wikipediával is együttműködik. A cég a modell forráskódját is nyilvánossá tette, de a Meta mesterséges intelligenciával foglalkozó részlege 200 ezer dollárig terjedő adományt is nyújt azon civil szervezetek számára, amelyek a való életben történő használatra hoznak létre alkalmazásokat. Zuckerberg cége szerint idővel elkövetkezhet a különböző nyelveken a valós idejű fordítás is, a program képes lehet például automatikus feliratokat generálni a bollywoodi filmekhez, és a későbbiekben a metaverzum elérését is segítheti, kiszélesítve a felhasználók körét a szabadabb kommunikációval.

A gépi fordítás azonban továbbra is rendkívül nehéz feladat, ezen a területen akár kisebb magyar cégeknek is maradhat hely a továbbiakban is. Az MI fejlődése ugyan egyeseket néha szinte hihetetlen megállapításokra sarkall, ám bőven van még hova fejlődni, és a szektor szabályozása is számos változást hozhat.