Közel két és fél évvel a GPT-4 piacra dobása után augusztus 7-én hivatalosan megjelent az OpenAI legújabb nagy nyelvi modellje (LLM), a GPT-5. Vérfrissítés természetesen volt időközben, legutoljára február 27-én a 4.5-ös verzió vagy becses nevén az Orion debütálásával. Az új LLM szintet lépett a mesterségesintelligencia- (MI) képességek terén, de az áttörés elmaradt. Sam Altman, az OpenAI vezérigazgatója a GPT‑5-öt világ legjobb modelljének nevezte, és úgy jellemezte, mint egy jelentős lépést a mesterséges általános intelligencia (AGI) felé vezető úton. Ugyanakkor elismerte, hogy ez még nem az az a szint, mivel nem magától tanul a használat során, ami az alapja lenne a következő lépcsőfokra való lépésnek.

Itt a GPT-5, és joggal optimisták a felhasználók / Fotó: Deemerwha Studio

Miben jobb a GPT-5 az elődöknél? Röviden: mindenben

A különféle nyelvi, logikai, programozási és multimodális teszteken a GPT-4.5 és GPT-5 teljesítményét összemérve mindenben a GPT-5 szerepel jobban. A feladatok között szerepel kódírás (HumanEval, SWE Bench), hosszú szövegben való keresés (MRCR-2), szakmai tudásteszt (MMLU) és összetett logikai következtetés (COLLIE). A leglátványosabb fejlődést a szoftvermérnöki feladatokban (SWE Lancer), a hibajavításban (SWE-Bench Verified) és a hosszú szövegekben való információkeresésben (MRCR-2) érte el.

Az egyszerre befogadott tartalom terjedelmének kapacitása a korábbi 128 ezerről 272 ezer tokenre nőtt, egy token pedig nagyjából négy karakternek felel meg. Másfelől, a felhasznált szöveg értelmezése és minősége is javult, így kevésbe érzékeny a „hallucinációra”. A GPT‑5 az első, ami ötvözi az OpenAI korábbi nullasorozatú modelljeinek mélyebbnek nevezhető gondolkodását a GPT-széria gyorsabb, de felszínesebb válasz generálásával.

Vagyis gyorsabban tud átfogóbban kutatni.

Az erre való reakciót a Duolingo részvényesi körében lehetett megfigyelni leginkább, amely minden eddiginél jobb negyedévet zárt, 30 százalékkal megtépték a papírjait, majd ugyanazon a napon a GPT-5 megjelenésének hatására ez megfeleződött. Az oka, hogy az új verzió már komplex feladatokat képes végrehajtani, például alkalmazások generálására is használható. A nyelvoktatási készség fejlődése pedig kifejezetten érzékeny pont lehet a Duolingo számára, amelynek a teljes üzleti modellje erre épül.