Új fejlesztéssel hívta fel magára a figyelmet a kínai mesterségesintelligencia-piac egyik feltörekvő szereplője, a hangcsoui székhelyű DeepSeek. A vállalat legfrissebb nyelvi modelljét kísérleti kiadásként hozta nyilvánosságra, de már most hangsúlyozza, hogy a fejlesztés hatékonyabban képezhető és jobban kezeli a hosszabb szövegeket, mint a korábbi változatok.
A DeepSeek-V3.2-Exp névre keresztelt modell a cég közlése szerint egy „közbenső lépés” a következő generációs architektúrájuk felé. Ez az architektúra várhatóan a vállalat legjelentősebb termékbejelentése lesz a V3 és az R1 után, melyek év elején meglepték a Szilícium-völgyet és a technológiai befektetőket világszerte – írja a Reuters.
A mostani kísérleti modell egyik kulcseleme a DeepSeek Sparse Attention nevű mechanizmus,
mely csökkentheti a számítási költségeket és bizonyos típusú feladatoknál javíthatja a teljesítményt.
A cég nemcsak a technológiát, hanem az üzleti stratégiát is új alapokra helyezné. Hétfőn az X platformon közzétett bejegyzésében a DeepSeek bejelentette: több mint 50 százalékkal mérsékli API (Application Programming Interface) árait. Ez komoly piaci nyomást gyakorolhat nemcsak a hazai riválisokra – például az Alibaba Qwen modelljére –, hanem az amerikai versenytársakra, köztük az OpenAI-ra is.
Az elemzők szerint bár a V3.2-Exp nem fog akkora piaci hullámokat kelteni, mint a cég januári bejelentései, de a lépés így is jelentős. Ha a DeepSeek képes lesz újra megismételni azt, amit az R1 és a V3 modellel korábban bemutatott – vagyis magas szintű képességeket kínálni a konkurensek költségeinek töredékéért –, az alapjaiban formálhatja át a mesterségesintelligencia-piac erőviszonyait. A vállalat számára tehát a következő nagy kihívás az, hogy bebizonyítsa: a kísérleti fejlesztések nemcsak technológiai ígéretek, hanem hosszú távon is fenntartható és piacképes megoldásokat jelentenek.
A DeepSeek nemrég veszélyes területre tévedt, az OpenAI pedig nem tűrte a tevékenységét: Sam Altman cége gyökeresen átalakította biztonsági gyakorlatát, miután a vállalat szerint kínai riválisa, a DeepSeek illegálisan másolta le egyik mesterségesintelligencia-modelljét. A vád szerint a DeepSeek úgynevezett distillációs technikával reprodukálta az OpenAI fejlesztését. A védelmi intézkedések élére Dane Stuckey került, aki korábban a Palantir biztonsági főnöke volt. Mellette dolgozik Matt Knight, aki az OpenAI saját nyelvi modelljeit próbálja bevetni kibertámadások elleni védekezésre. A cég igazgatótanácsához tavaly csatlakozott Paul Nakasone, az amerikai hadsereg egykori tábornoka is, aki a kibervédelem specialistája.
Portfóliónk minőségi tartalmat jelent minden olvasó számára. Egyedülálló elérést, országos lefedettséget és változatos megjelenési lehetőséget biztosít. Folyamatosan keressük az új irányokat és fejlődési lehetőségeket. Ez jövőnk záloga.