BÉT logóÁrfolyamok: 15 perccel késleltetett adatok
null

Berobbant az új DeepSeek-modell, mutatjuk, hogy miben jobb a riválisoknál

A kínai DeepSeek új kísérleti MI-modellt mutatott be, amely hatékonyabb a hosszabb szövegek feldolgozásában és olcsóbb a képzésben. A DeepSeek szerint az API-árakat több mint 50 százalékkal csökkentik, ami nyomást gyakorolhat a riválisokra. Az új fejlesztés a V3 és R1 modellek sikerét folytathatja.

Új fejlesztéssel hívta fel magára a figyelmet a kínai mesterségesintelligencia-piac egyik feltörekvő szereplője, a hangcsoui székhelyű DeepSeek. A vállalat legfrissebb nyelvi modelljét kísérleti kiadásként hozta nyilvánosságra, de már most hangsúlyozza, hogy a fejlesztés hatékonyabban képezhető és jobban kezeli a hosszabb szövegeket, mint a korábbi változatok.

Berobbant az új DeepSeek-modell, ami olcsóbb, gyorsabb és hatékonyabb a riválisoknál
Berobbant az új DeepSeek-modell, ami olcsóbb, gyorsabb és hatékonyabb a riválisoknál / Fotó: NurPhoto via AFP

A DeepSeek-V3.2-Exp névre keresztelt modell a cég közlése szerint egy „közbenső lépés” a következő generációs architektúrájuk felé. Ez az architektúra várhatóan a vállalat legjelentősebb termékbejelentése lesz a V3 és az R1 után, melyek év elején meglepték a Szilícium-völgyet és a technológiai befektetőket világszerte – írja a Reuters. 

A mostani kísérleti modell egyik kulcseleme a DeepSeek Sparse Attention nevű mechanizmus, 

mely csökkentheti a számítási költségeket és bizonyos típusú feladatoknál javíthatja a teljesítményt.

A cég nemcsak a technológiát, hanem az üzleti stratégiát is új alapokra helyezné. Hétfőn az X platformon közzétett bejegyzésében a DeepSeek bejelentette: több mint 50 százalékkal mérsékli API (Application Programming Interface) árait. Ez komoly piaci nyomást gyakorolhat nemcsak a hazai riválisokra – például az Alibaba Qwen modelljére –, hanem az amerikai versenytársakra, köztük az OpenAI-ra is.

Az elemzők szerint bár a V3.2-Exp nem fog akkora piaci hullámokat kelteni, mint a cég januári bejelentései, de a lépés így is jelentős. Ha a DeepSeek képes lesz újra megismételni azt, amit az R1 és a V3 modellel korábban bemutatott – vagyis magas szintű képességeket kínálni a konkurensek költségeinek töredékéért –, az alapjaiban formálhatja át a mesterségesintelligencia-piac erőviszonyait. A vállalat számára tehát a következő nagy kihívás az, hogy bebizonyítsa: a kísérleti fejlesztések nemcsak technológiai ígéretek, hanem hosszú távon is fenntartható és piacképes megoldásokat jelentenek.

Nem a saját fejlesztését használja a DeepSeek?

A DeepSeek nemrég veszélyes területre tévedt, az OpenAI pedig nem tűrte a tevékenységét: Sam Altman cége gyökeresen átalakította biztonsági gyakorlatát, miután a vállalat szerint kínai riválisa, a DeepSeek illegálisan másolta le egyik mesterségesintelligencia-modelljét. A vád szerint a DeepSeek úgynevezett distillációs technikával reprodukálta az OpenAI fejlesztését. A védelmi intézkedések élére Dane Stuckey került, aki korábban a Palantir biztonsági főnöke volt. Mellette dolgozik Matt Knight, aki az OpenAI saját nyelvi modelljeit próbálja bevetni kibertámadások elleni védekezésre. A cég igazgatótanácsához tavaly csatlakozott Paul Nakasone, az amerikai hadsereg egykori tábornoka is, aki a kibervédelem specialistája.

 

Google News Világgazdaság
A legfrissebb hírekért kövess minket a Világgazdaság.hu Google News oldalán is!

Portfóliónk minőségi tartalmat jelent minden olvasó számára. Egyedülálló elérést, országos lefedettséget és változatos megjelenési lehetőséget biztosít. Folyamatosan keressük az új irányokat és fejlődési lehetőségeket. Ez jövőnk záloga.