A mesterségesintelligencia- (MI) kutatás egyik fő célja, hogy a nagyobb nyelvi modellek egyre emberibbek legyenek, ám ehhez folyamatos fejlődésre van szükség. A ChatGPT-t fejlesztő OpenAI is pontosan ezt tűzte ki célul, nemrég bemutatott o1 modelljének hátterében pedig már olyan technikák állnak, melyek átalakíthatják az MI-versenyt, és hatással lehetnek azokra az erőforrásokra is, amelyekre az MI-cégek vágynak. Miközben a többiek próbálják beérni az OpenAI-t, a ChatGPT fejlesztése is folyamatosan lassul, mivel hatalmas mennyiségű címkézetlen adatot kell használnia.

A területén széles körben elismert Ilya Sutskever, a Safe Superintelligence (SSI) és az OpenAI társalapítója nemrég elmondta, hogy stagnálnak azok a nyelvi mintázatok és struktúrák, amelyek előre tudnák lendíteni a kutatást. Sutskever, aki korábban hitt abban, hogy több adat és számítási kapacitás segítségével hatalmas előrelépéseket lehet elérni, idén elhagyta az OpenAI-t, és új céget (az SSI-t) alapított. Szerinte most új ötletekre van szükség, mert nem elég csak több adatot használni – írja a Reuters.

A kutatók most olyan technikákkal próbálkoznak, amelyek a meglévő MI-modelleket jobban tudják működtetni, amikor használják őket.

Egy új módszer szerint a modellek több lehetőséget is átgondolnak, mielőtt választ adnának, így jobb döntéseket hozhatnak.

Ez különösen hasznos lehet bonyolult feladatoknál, mint például a matematika vagy a programozás, ahol az MI-nek „emberi” módon kell gondolkodnia. Noam Brown, az OpenAI egyik kutatója szerint, ha egy MI-modell csak 20 másodpercig „gondolkodik”, az ugyanolyan javulást hozhat, mint ha 100 000-szer nagyobb modellt tréningeznének hónapokon át. Az OpenAI ezt a módszert használta az új o1 modelljében, amely képes több lépésben megoldani a problémákat, hasonlóan az emberi gondolkodáshoz.

Más MI-cégek, mint a Google és az Anthropic, szintén dolgoznak ezen a technikán. A szakértők szerint, ha ez a megközelítés beválik, az átalakíthatja az MI-piacot, és csökkentheti a hatalmas adatigényt.