BÉT logóÁrfolyamok: 15 perccel késleltetett adatok
null

Berobbant az új DeepSeek-modell, mutatjuk, hogy miben jobb a riválisoknál

A kínai DeepSeek új kísérleti MI-modellt mutatott be, amely hatékonyabb a hosszabb szövegek feldolgozásában és olcsóbb a képzésben. A DeepSeek szerint az API-árakat több mint 50 százalékkal csökkentik, ami nyomást gyakorolhat a riválisokra. Az új fejlesztés a V3 és R1 modellek sikerét folytathatja.

Új fejlesztéssel hívta fel magára a figyelmet a kínai mesterségesintelligencia-piac egyik feltörekvő szereplője, a hangcsoui székhelyű DeepSeek. A vállalat legfrissebb nyelvi modelljét kísérleti kiadásként hozta nyilvánosságra, de már most hangsúlyozza, hogy a fejlesztés hatékonyabban képezhető és jobban kezeli a hosszabb szövegeket, mint a korábbi változatok.

Berobbant az új DeepSeek-modell, ami olcsóbb, gyorsabb és hatékonyabb a riválisoknál
Berobbant az új DeepSeek-modell, ami olcsóbb, gyorsabb és hatékonyabb a riválisoknál / Fotó: NurPhoto via AFP

A DeepSeek-V3.2-Exp névre keresztelt modell a cég közlése szerint egy „közbenső lépés” a következő generációs architektúrájuk felé. Ez az architektúra várhatóan a vállalat legjelentősebb termékbejelentése lesz a V3 és az R1 után, melyek év elején meglepték a Szilícium-völgyet és a technológiai befektetőket világszerte – írja a Reuters. 

A mostani kísérleti modell egyik kulcseleme a DeepSeek Sparse Attention nevű mechanizmus, 

mely csökkentheti a számítási költségeket és bizonyos típusú feladatoknál javíthatja a teljesítményt.

A cég nemcsak a technológiát, hanem az üzleti stratégiát is új alapokra helyezné. Hétfőn az X platformon közzétett bejegyzésében a DeepSeek bejelentette: több mint 50 százalékkal mérsékli API (Application Programming Interface) árait. Ez komoly piaci nyomást gyakorolhat nemcsak a hazai riválisokra – például az Alibaba Qwen modelljére –, hanem az amerikai versenytársakra, köztük az OpenAI-ra is.

Az elemzők szerint bár a V3.2-Exp nem fog akkora piaci hullámokat kelteni, mint a cég januári bejelentései, de a lépés így is jelentős. Ha a DeepSeek képes lesz újra megismételni azt, amit az R1 és a V3 modellel korábban bemutatott – vagyis magas szintű képességeket kínálni a konkurensek költségeinek töredékéért –, az alapjaiban formálhatja át a mesterségesintelligencia-piac erőviszonyait. A vállalat számára tehát a következő nagy kihívás az, hogy bebizonyítsa: a kísérleti fejlesztések nemcsak technológiai ígéretek, hanem hosszú távon is fenntartható és piacképes megoldásokat jelentenek.

Nem a saját fejlesztését használja a DeepSeek?

A DeepSeek nemrég veszélyes területre tévedt, az OpenAI pedig nem tűrte a tevékenységét: Sam Altman cége gyökeresen átalakította biztonsági gyakorlatát, miután a vállalat szerint kínai riválisa, a DeepSeek illegálisan másolta le egyik mesterségesintelligencia-modelljét. A vád szerint a DeepSeek úgynevezett distillációs technikával reprodukálta az OpenAI fejlesztését. A védelmi intézkedések élére Dane Stuckey került, aki korábban a Palantir biztonsági főnöke volt. Mellette dolgozik Matt Knight, aki az OpenAI saját nyelvi modelljeit próbálja bevetni kibertámadások elleni védekezésre. A cég igazgatótanácsához tavaly csatlakozott Paul Nakasone, az amerikai hadsereg egykori tábornoka is, aki a kibervédelem specialistája.

 

Ajánlott videók

Továbbiak

Címoldalról ajánljuk

Tovább a címoldalra

Portfóliónk minőségi tartalmat jelent minden olvasó számára. Egyedülálló elérést, országos lefedettséget és változatos megjelenési lehetőséget biztosít. Folyamatosan keressük az új irányokat és fejlődési lehetőségeket. Ez jövőnk záloga.