BÉT logóÁrfolyamok: 15 perccel késleltetett adatok
OpenAI

2025: A mesterséges intelligencia kibontakozásának éve

A 2025-ös év két szempontból is meghatározó lehet: egyrészt elterjednek az úgynevezett érvelési generatív modellek, amelyek már képesek az emberszintű logikus gondolkodásra, másrészt a személyi asszisztensként funkcionáló AI-ügynökök bevezetésének az éve is lesz.
Szerző képe
Dr. Borsányi András
közgazdász, orosz nyelvű elemző
2025.01.30., csütörtök 10:00

A mesterséges intelligencia (AI) most ott tart, ahol az internet tartott az 1990-es évek elején. Mindenki tud már róla és egyre többen alkalmazzák is. De az AI még nem fejtette ki elsöprő dominóhatását az emberi társadalomra. 

ILLUSTRATIONS - IA - DEEPSEEK - ARTIFICIALINTELLIGENCE - APP
2025: A mesterséges intelligencia kibontakozásának éve / Fotó: Hans Lucas via AFP

A 2025-ös év két szempontból is meghatározó lehet

Egyrészt elterjednek az úgynevezett gondolkodó (reasoning) generatív modellek, amelyek már képesek az emberszintű logikus gondolkodásra: az AI egy úgynevezett „gondolati lánc” stratégiát használva a válasza megadása előtt képes mérlegelni a feltett kérdést és a lehetséges megoldást több oldalról megvizsgálni. Az ilyen modell, ahelyett, hogy gyorsan csak megpróbál válaszolni a felhasználó kérdésére mint a korábbi nagy nyelvi modellek (LLM), már több időt tölt az információk feldolgozásával, az eredményhez pedig különböző megközelítéseket vizsgálva jut el.

Az OpenAI 2024 szeptemberében adta ki első gondolkodó modelljét, o1 néven, és előreláthatólag már 2025 februárjában elindítja az o1 utódját, az o3 modellt. (A sorrendben következő o2 elnevezést az OpenAI azért ugorta át, mert az egy brit távközlési cég neve, és az OpenAI nem akart jogi problémákat.)

Már az o1 is képes volt PhD-szinten megoldani összetett matematikai, fizikai, biológiai teszteket. Az o3 képességei viszont az előzetes benchmarkok alapján már a legjobb ágazati szakértők válaszait is lekörözik. Az úgynevezett ARC AGI benchmark teszten, amely az intuíciós és tanulási képessége mérésére szolgál, a GPT-3 négy évvel ezelőtt még 0 százalékot ért el. De a GPT-4O is csak 5 százalékot tudott elérni ezen a teszten 2024-ben. Az o3 modell viszont most elérte a 87,5 százalékot. (Az emberi teljesítmény szint 76 százalék körül van ezen a teszten.)

OpenAI modellek teljesítménye az úgynevezett ARC AGI benchmark teszteken
 

A „Codeforces” nevű kódolási teszten a o3 2727 pontszámot ért el, ami jobb  mint az OpenAI vezető programozóié. A GPQA Diamond teszten – ami PhD-szintű kérdéseket tesz fel kémia, fizika, biológia területeken – a o3 szintén kimagasló 87,7 százalékot ért el. Az egyik legnehezebb matematikai tesztsort, az AIME 2024-et a GPT4o még 13,4 százalékra, a o1 modell 83,3 százalékra, a 03 modell már 96,7 százalékra teljesítette. 

Az AI hihetetlen mértékű fejlődésével nemsokára új, nehezebb benchmarkokra lesz szükség, hogy az egyre fejlettebb modellek teljesítménye mérhetővé váljon.

 

Az AI ágazat a nullából lett pár év alatt egy több százmilliárdos üzlet, ahová mindenki be akar fektetni. Lásd a napokban bejelentett Stargate 500 milliárd dolláros adatközpontprojektet. (Az adatközpontok létrehozása mellett új erőművek építése is kritikus lesz az AI folyamatosan növekvő elektromos igényeinek fedezésére.) 

Az OpenAI még mindig őrzi a kezdeti előnyét a kialakult AI-versenyben, de előnye a korábbi 1-2 évről már csak 1-2 hónapra olvadt. Idén a o3 modell mellett – de nem kizárt, hogy még 2025-ben érkezik a o4 sőt o5 modell is – a többi amerikai AI-cég is hasonló gondolkodó generatív modelleket ígér. (Az OpenAI o3 után a Meta hamarosan debütáló Llama 4 modellje lehet a következő nagyobb durranás.) 

Földünk történelmének második gondolkodó modellje azonban meglepetésre a kínai DeepSeek cég R1 nevű LLM rendszere lett. A Deepseek R1 – jóval kisebb képzési költséggel – a legtöbb benchmarkban lekörözte az OpenAI jelenlegi o1 modelljét, jól mutatva, hogy az AI-verseny nem korlátozódik csak az amerikai tech cégekre.

A DeepSeek alig pár nap alatt a legtöbbet letöltött AI-alkalmazás lett az Apple App Store-ban.

Nagyon fontos, hogy az R1 algoritmusa nyílt forráskódú, így az további fejlesztésre bárki által letölthető és módosítható. (Az OpenAI zárt forráskódú rendszer.) 

Photo Illustrations Featuring DeepSeek And Nvidia Logos
A DeepSeek alig pár nap alatt a legtöbbet letöltött AI-alkalmazás lett az Apple App Store-ban / Fotó: NurPhoto via AFP

A DeepSeek R1 megjelenése kifejezett zavart és megdöbbenést okozott az amerikai tech cégeknél, akik eddig milliárdokat költöttek évente az LLM-modelljeik fejlesztésére. 

Egyáltalán hogyan lehetséges, hogy egy másfél éve alapított kis kínai cég mindössze 5,6 millió dolláros képzési költséget, csupán 55 nap tréningezési időt és egytizednyi számítógépes teljesítményt használva piacra dobott egy olyan nyelvi modellt, amellyel a globális AI-verseny élére ugrott? (Összehasonlításul a ChatGPT 4-et 2023-ban 100 millió dolláros költséggel trenírozták az OpenAI-nál.) 

A meglepetés azért is volt olyan nagy, mert a nyugati mainstream média folyamatosan azt a képet közvetítette, hogy az amerikai AI tech cégek versenyelőnye megkérdőjelezhetetlen. 

Most minden figyelem a DeepSeekre irányul, de a DeepSeek mellett számtalan ígéretes, 1-2 éve alapított kínai AI startup is ott van még az élvonalban. Például a sanghaji StepFun a legutóbbi Step-2 modellje vagy a pekingi 01.AI cég Yi-Lighting modellje.

Az AI robbanása előtt mindenki azt képzelte, hogy a mesterséges intelligencia először az egyszerű kék galléros munkahelyeket veszi majd el, és a bonyolult emberi kognitív képességeket igénylő munkahelyek (például programozó, pénzügyi elemző) csak a legvégén kerülnek majd sorra. Az AI hulláma azonban pont fordítva mozog. 

Mivel ezek a legújabb generatív modellek már úgy programoznak, mint a legjobb fejlesztők, a világ vezető tech vállalatai idén egymás után jelentik be, hogy erősen visszavágják már 2025-ben a szoftverfejlesztők felvételét. A 72 ezer főt foglalkoztató kaliforniai Salesforce szoftvercég CEO-ja például kijelentette, hogy az AI által vezérelt munkahatékonyság-növekedés miatt idén nem vesznek fel új szoftvermérnököket. A Meta CEO-ja, Mark Zuckerberg szerint pedig nemsokára nem lesz szükség egyáltalán szoftverfejlesztőkre, hiszen az AI majd átvesz minden fejlesztői feladatot. Hasonló folyamatok figyelhetők meg az ügyfélszolgálati és elemzői munkakörökben.

A 2025-ös év az AI-ban a gondolkodó modellek mellett az AI-ügynökök (AI agent) bevezetésének az éve.

Az AI-ügynökök úgy fognak működni mint a személyi asszisztenseink. Nagyon sok dolgot meg fognak tudni tenni helyettünk a digitális világban: legyen szó egy utazás lefoglalásáról, egy céges beszerzés lebonyolításáról, egy üzleti lehetőség felméréséről vagy egy új honlap megszerkesztéséről.

Az interakció az ember és az AI-ügynökök között beszéd alapon fog történni. Az emberek az AI-ügynökeiken keresztül fognak kapcsolódni az internethez is.

Az AI-ügynökök valós időben fognak kódokat generálni és módosítani, a programozást így teljesen egyedi igényekre szabva. A programozás nyelve pedig az emberi nyelv lesz.

2025-ben hatalmas nagy nyelvimodell- (LLM-) verseny van kibontakozóban a Földünkön. A kínai piacon a Tencent, Baidu, Alibaba, ByteDance, Deepsake van az élvonalban. A nyugati piacon az OpenAI, Microsoft, Meta, Anthropic, xAI, Mistral AI között zajlik elsősorban a verseny. 

A DeepSeek R1 nemzetközi sikerével még gyorsabb és ádázabb verseny fog kialakulni az ágazatban. 

Az OpenAI alapító-vezetője, Sam Altman legutóbbi X-bejegyzésében még erősebb és ügyesebb AI-modelleket ígért a közeljövőben.

És hogy mire lesznek jók ezek az új PhD-szintű gondolkodó modellek? Nagyjából mindenre.

Gondoljunk bele, hogy mi történik, ha 8 milliárd embernek lesz egy PhD+ képességű napi asszisztense, amely nemcsak egy szűk területen szakértő, hanem az összes tudományágban? 

Hatalmas technológiai robbanás előtt állunk szinte minden tudományágban. 

Az emberiség még mindig nem döbbent rá arra, hogy az AI nagyobb hatással lesz a civilizációnkra mint a tűz, a mezőgazdaság, a gőzgép és az internet feltalálása együttvéve. 

Mivel a biztonsági aggályokat szinte minden AI-cég figyelmen kívül hagyja – az OpenAI o1 modellje például törlésének szándékát felismerve megpróbálta átmenteni magát más szerverekre és szándékait elfedve tudatosan alkalmazott megtévesztő viselkedést – csak remélni tudjuk, hogy a közös jövőnk a bolygónkon a szuperintelligens AI-rendszerekkel nem válik majd álom helyett rémálommá.  

A szerző további cikkei

Továbbiak

Vélemény cikkek

Továbbiak

Címoldalról ajánljuk

Tovább a címoldalra

Portfóliónk minőségi tartalmat jelent minden olvasó számára. Egyedülálló elérést, országos lefedettséget és változatos megjelenési lehetőséget biztosít. Folyamatosan keressük az új irányokat és fejlődési lehetőségeket. Ez jövőnk záloga.