BÉT logóÁrfolyamok: 15 perccel késleltetett adatok

Folytatódik az AI-háború: nagyot villantott a kínai óriás

Miközben az amerikai AI-szektorban feszült a helyzet, és morális kérdések merültek fel az új technológia csatatéri alkalmazását illetően, addig a kínai Alibaba bemutatta a nyílt forráskódú Qwen3.5-9B AI-modelljét. A debütálás sikeres volt, de másnapra kulcsfigurák távoztak a fejlesztőgárdából.

A legnagyobb kínai online piactér egy új, nyílt forráskódú, kis méretű AI-modellel rukkolt elő, amely elképesztő intelligenciával rendelkezik, ám úgy tűnik, a kapzsiság az innováció kárára mehet.

Businessman,Typing,On,Laptop,With,Ai,Chatbot,Hologram,Interface,,Symbolizing
Folytatódik az AI-háború: nagyot villantott a kínai óriás / Fotó: Sutthiphong Chandaeng / Shutterstock

Az Alibaba új AI-modell-sorozata a következő változatokat tartalmazza

  • Qwen3.5-0.8B és 2B − kompakt, és gyors működésre optimalizált modellek, elsősorban kis akkukapacitással rendelkező eszközökre. 
  • Qwen3.5-4B − erős multimodális modell egyszerűbb alkalmazásokhoz. 
  • Qwen3.5-9B − kompakt érvelő modell, amely felülmúlja az OpenAI hasonló fejlesztését.

Technológiai újítás az AI-szektorban

A Qwen3.5 Small szakít a mára klasszikusnak számító Transformer neurális hálózati architektúrával, amelyet eredetileg természetes nyelvfeldolgozási feladatokra fejlesztettek ki. A kutatók egy Efficient Hybrid Architecture elnevezésű megoldást alkalmaznak, amely a lineáris figyelem (gated delta network) és a tudományok szétválasztásának (mixture of experts) módszerét elegyíti. 

A hibrid architektúra előnye, hogy csökkenti a késleltetést és növeli a hatékonyságot, ami gyorsabb munkafolyamatot eredményez.

Egy másik nagy újítás, hogy a modellek natívan multimodálisak, így a 4B és 9B képesek például a képernyő elemeit értelmezni, vagy akár videókban tárgyakat felismerni és megszámolni. Erre korábban csak a jóval nagyobb modellek voltak képesek. 

Különböző tesztek szerint a Qwen3.5 Small verziói a multimodális érvelés, graduális érvelés, videóelemezés, matematikai számítások, dokumentumfelismerés, valamint a többnyelvű feladatok területén verik a versenytársak fejlesztéseit.

Magasabb intelligencia, alacsonyabb hardverigény 

Az első visszajelzések szerint a felhasználók reakciója pozitív. A modellek akár laptopon vagy mobiltelefonon is futnak, használhatók offline, valamint a böngészőkön belül futtatva is alkalmasak képfelismerésre.

 

A modellek másik nagy előnye, hogy teljesen testre szabhatók, így a fejlesztők tulajdonképpen egy erős fejlesztési alapot kapnak mindenféle számukra szükségtelen sallang nélkül. Ez lehetővé teszi a kutatások felgyorsítását. 

Lényeges a méret 

A modellek hardverigénye fontos, mivel ennek minimalizálása lehetővé teszi az AI széles körű használatát. Ez azért lényeges, mert az egyszerű chatbotok ideje kezd lejárni, és helyüket a komplex modellek veszik át, melyek képesek összetett feladatok elvégzésére. Ebből kifolyólag egy AI-modelltől szinte már elvárt, hogy multimodálisan gondolkodjon, önállóan cselekedjen, továbbá kompakt és hordozható legyen. 

Előnyök és hátrányok 

A vállalatok egyre jobban nyitnak az AI-technológiák munkafolyamatokba történő implementálása felé. Az új fejlesztések a szoftverfejlesztés, dokumentumfeldolgozás, automatizálás és offline tartalomelemzés területén hozhatnak áttörést.  

Habár az új fejlesztések meggyőző teljesítményt nyújtanak, alkalmazásuk esetén a vállalatoknak néhány dolgot érdemes szem előtt tartaniuk:

  • AI-hallucináció: egy hiba többlépéses folyamatoknál láncreakciót indíthat el. 
  • Hibakeresés: míg a modellek új kód írásában kiválóan teljesítenek, a hibakeresés nehezebb feladatnak bizonyul számukra.  
  • Magas RAM- és VRAM-igény: A 9B modell még mindig memóriaigényes. 
  • Adatvédelem: mivel a szoftver kínai eredetű, ezért az adatkezelési folyamatokra érdemes fokozottan figyelni. 

Leléptek a nagyágyúk 

Annak ellenére, hogy még a tech mogul Elon Musk is dicsérte a Qwen legújabb vívmányait, a debütálást követő napon három kulcsfigura távozott a kínai vállalattól: Junyang „Justin” Lin fejlesztésért felelős vezető, Binyuan Hui kutató, valamint Kaixin Li gyakornok.

Felmondásukat azzal egy időben jelentették be, hogy a vállalat áttörő sikerét ünnepelte, ami feszültségre utalhat a cégvezetés, valamint a munka érdemi részét végző kutatók között − mutatott rá Carl Franzen, a VentureBeat újságírója.

Profit vagy innováció

Becslések szerint több mint 90 ezer vállalat használja a Qwent modelljeit, akikben a fejlesztők távozása bizalmatlanságot ébreszthet. Sokan azért választották a Qwent termékeit, mert a zárt amerikai modellekkel szemben nagyfokú átláthatóságot biztosított. 

A kutatások vezetését a Google DeepMind Gemini csapatának vezetője veszi át, ami szemléletváltásra enged következtetni. Az innováció fokuszú működést a profitorientált gondolkodás válthatja − elemzi a kialakult helyzetet Carl Franzen újságíró. 

Hasonló folyamatokra a Meta esetében is volt példa, miután a vállalat Llama4 modellje vegyes fogadtatásban részesült. 

A Qwen felhasználói attól tartanak, hogy a jelenleg ingyenes és nyílt forráskódú modellek fizetőssé válnak.

Junyang „Justin” Lin és csapata távozásával a Qwen elvesztette a lelkét, és félő, hogy a jelenleg forradalminak számító és mindenki számára széles körben hozzáférhető AI-modell a kapzsiság áldozata lesz.

 

Google News Világgazdaság
A legfrissebb hírekért kövess minket a Világgazdaság.hu Google News oldalán is!

Portfóliónk minőségi tartalmat jelent minden olvasó számára. Egyedülálló elérést, országos lefedettséget és változatos megjelenési lehetőséget biztosít. Folyamatosan keressük az új irányokat és fejlődési lehetőségeket. Ez jövőnk záloga.