BÉT logóÁrfolyamok: 15 perccel késleltetett adatok

A nagy AI-sztori: megérkezett a magyar egyetemisták új rémálma – vége a ChatGPT-s beadandók korának, itt az új AI-detektor

Miközben a ChatGPT és társai egyre természetesebb szövegeket írnak, sokan már azt is megpróbálják eltüntetni, hogy egyáltalán mesterséges intelligenciát használtak. Kiss Mihály szerint azonban ez egyre nehezebb lesz: magyar nyelvre fejlesztett AI-detektora már nemcsak azt jelzi, hogy gyanús egy szöveg, hanem azt is, mely részeket írhatta a gép. Ez pedig az oktatás és a munkaerőpiac számára is fordulópont lehet. A podcast állandó szakmai vendége Aczél Petra kommunikációkutató, a Széchenyi István Egyetem professzora.

A generatív mesterséges intelligencia (AI) ma már nemcsak gyorsítja a munkát, hanem sok esetben helyettesíti is azt. Egy beadandó szakdolgozat vagy akár egy céges szöveg esetében egyre nehezebb első ránézésre megmondani, valóban ember írta-e, vagy csak egy jól megfogalmazott prompt eredményét látjuk. Erre próbál választ adni Kiss Mihály Preds.hu nevű AI-detektora, amely magyar nyelven képes az AI-generált szövegek felismerésére. A rendszer különlegessége, hogy nem egyszerűen egy teljes szövegre mond ítéletet, hanem részenként elemzi azt, és statisztikai alapon a gyanús szófordulatokat, szóhármasokat is külön jelzi. A podcast állandó szakmai vendége Aczél Petra kommunikációkutató, a Széchenyi István Egyetem professzora.

A nagy AI-sztori legújabb epizódját itt tekinthetik meg:

Kiss Mihály elmondta: a projekt még 2023-ban indult szakdolgozati témaként, amikor a mesterséges intelligenciával generált szövegek felismerése még kifejezetten új kutatási területnek számított. A fejlesztés kezdetben angol nyelven zajlott, de hamar kiderült, hogy a magyar piacon gyakorlatilag nincs valóban jól működő megoldás. Bár több nemzetközi detektor ígér magyar támogatást, ezek teljesítménye messze elmarad a valós elvárásoktól.

Saját tesztjeik szerint, míg a Preds.hu közel 98 százalékos pontosságot ért el, addig egy ismert angol rendszer magyar nyelven mindössze 62 százalék körül teljesített. 

Ez már nem egyszerű különbség, hanem használhatósági határ.

A rendszer mögött komoly adatmunka áll. A fejlesztő összesen 350 ezer szöveget gyűjtött össze, amelyek 40 százaléka emberi, 60 százaléka pedig AI-generált tartalom volt. Az emberi szövegek esetében a 2021 előtti anyagok jelentették a biztosabb bázist, hiszen ezek még a ChatGPT előtti korszakból származtak. Az AI-szövegeknél pedig nem egyszerű promptolás történt: tudatosan nehéz, eltérő stílusú és különböző műfajú feladatokat adtak a modelleknek, hogy a detektor valóban a valós használati helyzetekre legyen felkészítve.

A fejlesztésben József Attila verseitől kezdve akadémiai szövegekig szinte minden szerepelt, a cél a lehető legnagyobb diverzitás volt.

Kiss Mihány magyar AI-detektora 98 százalékos pontosságot tud magáénak
Kiss Mihály magyar AI-detektora 98 százalékos pontosságot tud magáénak / Fotó: mundissima

Az oktatás lehet az első nagy piac

Aczél Petra szerint a legnagyobb azonnali igény az egyetemek és az iskolák részéről jelentkezhet. Már most is főként tanárok és oktatók használják a rendszert, különösen szakdolgozatok ellenőrzésére. Kiss Mihály szerint ez nem büntetésről szól, hanem arról, hogy a diák valóban tanuljon. Ha valaki kizárólag AI-jal íratja meg a beadandóit, akkor a munka és a gondolkodás marad ki – márpedig éppen abból születik a tudás.

A fejlesztő szerint az sem elhanyagolható, hogy a rendszer alacsony fals pozitív rátával dolgozik: 

ezer emberi szövegből mindössze öt-hét esetben jelez tévesen AI-generált tartalmat. 

Ez azért kulcsfontosságú, mert egy téves vád egy hallgató számára súlyos következményekkel járhat.

A Preds.hu jelenleg előfizetéses modellben működik, és már önfenntartóvá vált. A háttérben jelentős GPU-költségek állnak, de a teljes induló technikai ráfordítás így is nagyjából 200 ezer forint volt – a valódi befektetést inkább a hónapokon át tartó munka jelentette. Már jogi cégek is érdeklődtek a rendszer iránt, és Aczél Petra szerint a vállalatoknál is komoly értéke lehet annak, ha ellenőrizhetővé válik, hogy egy valóban kreatív, egyedi munka mennyiben emberi teljesítmény.

Részletek a beszélgetés tartalmából:

  • Hogyan lett egy szakdolgozatból piacképes AI-detektor? (02:48)
  • Mit tud a Preds.hu? (04:28)
  • Miért az oktatás lehet az első nagy felhasználói piac? (06:12)
  • 350 ezer szöveg és 98 százalékos pontosság – így tanult a modell (07:45)
  • Le lehet körözni az AI-detektorokat a fejlődő nyelvi modellekkel? (13:45)
  • Az internet több mint fele már AI-szöveg? (14:08)
  • Mennyire könnyű átverni egy AI-detektort? (20:46)
  • Ilyen egy AI-fejlesztés piaca (26:41)

A korábbi podcastjeinket itt hallgathatják meg.

Portfóliónk minőségi tartalmat jelent minden olvasó számára. Egyedülálló elérést, országos lefedettséget és változatos megjelenési lehetőséget biztosít. Folyamatosan keressük az új irányokat és fejlődési lehetőségeket. Ez jövőnk záloga.