A nagy AI-sztori: megérkezett a magyar egyetemisták új rémálma – vége a ChatGPT-s beadandók korának, itt az új AI-detektor
A generatív mesterséges intelligencia (AI) ma már nemcsak gyorsítja a munkát, hanem sok esetben helyettesíti is azt. Egy beadandó szakdolgozat vagy akár egy céges szöveg esetében egyre nehezebb első ránézésre megmondani, valóban ember írta-e, vagy csak egy jól megfogalmazott prompt eredményét látjuk. Erre próbál választ adni Kiss Mihály Preds.hu nevű AI-detektora, amely magyar nyelven képes az AI-generált szövegek felismerésére. A rendszer különlegessége, hogy nem egyszerűen egy teljes szövegre mond ítéletet, hanem részenként elemzi azt, és statisztikai alapon a gyanús szófordulatokat, szóhármasokat is külön jelzi. A podcast állandó szakmai vendége Aczél Petra kommunikációkutató, a Széchenyi István Egyetem professzora.
A nagy AI-sztori legújabb epizódját itt tekinthetik meg:
Kiss Mihály elmondta: a projekt még 2023-ban indult szakdolgozati témaként, amikor a mesterséges intelligenciával generált szövegek felismerése még kifejezetten új kutatási területnek számított. A fejlesztés kezdetben angol nyelven zajlott, de hamar kiderült, hogy a magyar piacon gyakorlatilag nincs valóban jól működő megoldás. Bár több nemzetközi detektor ígér magyar támogatást, ezek teljesítménye messze elmarad a valós elvárásoktól.
Saját tesztjeik szerint, míg a Preds.hu közel 98 százalékos pontosságot ért el, addig egy ismert angol rendszer magyar nyelven mindössze 62 százalék körül teljesített.
Ez már nem egyszerű különbség, hanem használhatósági határ.
A rendszer mögött komoly adatmunka áll. A fejlesztő összesen 350 ezer szöveget gyűjtött össze, amelyek 40 százaléka emberi, 60 százaléka pedig AI-generált tartalom volt. Az emberi szövegek esetében a 2021 előtti anyagok jelentették a biztosabb bázist, hiszen ezek még a ChatGPT előtti korszakból származtak. Az AI-szövegeknél pedig nem egyszerű promptolás történt: tudatosan nehéz, eltérő stílusú és különböző műfajú feladatokat adtak a modelleknek, hogy a detektor valóban a valós használati helyzetekre legyen felkészítve.
A fejlesztésben József Attila verseitől kezdve akadémiai szövegekig szinte minden szerepelt, a cél a lehető legnagyobb diverzitás volt.

Az oktatás lehet az első nagy piac
Aczél Petra szerint a legnagyobb azonnali igény az egyetemek és az iskolák részéről jelentkezhet. Már most is főként tanárok és oktatók használják a rendszert, különösen szakdolgozatok ellenőrzésére. Kiss Mihály szerint ez nem büntetésről szól, hanem arról, hogy a diák valóban tanuljon. Ha valaki kizárólag AI-jal íratja meg a beadandóit, akkor a munka és a gondolkodás marad ki – márpedig éppen abból születik a tudás.
A fejlesztő szerint az sem elhanyagolható, hogy a rendszer alacsony fals pozitív rátával dolgozik:
ezer emberi szövegből mindössze öt-hét esetben jelez tévesen AI-generált tartalmat.
Ez azért kulcsfontosságú, mert egy téves vád egy hallgató számára súlyos következményekkel járhat.
A Preds.hu jelenleg előfizetéses modellben működik, és már önfenntartóvá vált. A háttérben jelentős GPU-költségek állnak, de a teljes induló technikai ráfordítás így is nagyjából 200 ezer forint volt – a valódi befektetést inkább a hónapokon át tartó munka jelentette. Már jogi cégek is érdeklődtek a rendszer iránt, és Aczél Petra szerint a vállalatoknál is komoly értéke lehet annak, ha ellenőrizhetővé válik, hogy egy valóban kreatív, egyedi munka mennyiben emberi teljesítmény.
Részletek a beszélgetés tartalmából:
- Hogyan lett egy szakdolgozatból piacképes AI-detektor? (02:48)
- Mit tud a Preds.hu? (04:28)
- Miért az oktatás lehet az első nagy felhasználói piac? (06:12)
- 350 ezer szöveg és 98 százalékos pontosság – így tanult a modell (07:45)
- Le lehet körözni az AI-detektorokat a fejlődő nyelvi modellekkel? (13:45)
- Az internet több mint fele már AI-szöveg? (14:08)
- Mennyire könnyű átverni egy AI-detektort? (20:46)
- Ilyen egy AI-fejlesztés piaca (26:41)
A korábbi podcastjeinket itt hallgathatják meg.



