BÉT logóÁrfolyamok: 15 perccel késleltetett adatok

Folytatódik az AI-háború: nagyot villantott a kínai óriás

Miközben az amerikai AI-szektorban feszült a helyzet és morális kérdések merültek fel az új technológia csatatéri alkalmazását illetőn, addig a kínai Alibaba bemutatta a nyílt forráskódú Qwen3.5-9B AI-modelljét. A debütálás sikeres volt, de másnapra kulcsfigurák távoztak a fejlesztőgárdából.

A legnagyobb kínai online piactér egy új, nyílt forráskódú, kisméretű AI-modellel rukkolt elő, amely elképesztő intelligenciával rendelkezik, ám úgy tűnik a kapzsiság az innovációra kárára mehet.

Businessman,Typing,On,Laptop,With,Ai,Chatbot,Hologram,Interface,,Symbolizing
Folytatódik az AI-háború: nagyot villantott a kínai óriás / Fotó: Sutthiphong Chandaeng / Shutterstock

Az Alibaba új AI-modell sorozata a következő változatokat tartalmazza

  • Qwen3.5-0.8B és 2B − kompakt, és gyors működésre optimalizált modellek, elsősorban kis akkukapacitással rendelkező eszközökre. 
  • Qwen3.5-4B − erős multimodális modell egyszerűbb alkalmazásokhoz. 
  • Qwen3.5-9B − kompakt érvelő modell, amely felülmúlja az OpenAI hasonló fejlesztését.

Technológiai újítás az AI-szektorban

A Qwen3.5 Small szakít a mára klasszikusnak számító Transformer neurális hálózati architektúrával, amelyet eredetileg természetes nyelvfeldolgozási feladatokra fejlesztettek ki. A kutatók egy Efficient Hybrid Architecture elnevezésű megoldást alkalmaznak, amely a lineáris figyelem (gated delta network) és a tudományok szétválasztásának (mixture of experts) módszerét elegyíti. 

A hibrid architektúra előnye, hogy csökkenti a késleltetést és növeli a hatékonyságot, ami gyorsabb munkafolyamatot eredményez.

Egy másik nagy újítás, hogy a modellek natívan multimodálisak, így a 4B és 9B képesek például a képernyő elemeit értelmezni, vagy akár videókban tárgyakat felismerni és megszámolni. Erre korábban csak a jóval nagyobb modellek voltak képesek. 

Különböző tesztek szerint a Qwen3.5 Small verziói a multimodális érvelés, graduális érvelés, videóelemezés, matematikai számítások, dokumentumfelismerés, valamint a többnyelvű feladatok területén verik a versenytársak fejlesztéseit.

Magasabb intelligencia, alacsonyabb hardware igény 

Az első visszajelzések alapján a felhasználók reakciója pozitív. A modellek akár laptopon, vagy mobiltelefonon is futnak, használhatók offline, valamint a böngészőkön belül futtatva is alkalmasak képfelismerésre.

A modellek másik nagy előnye, hogy teljesen testre szabhatók, így a fejlesztők tulajdonképpen egy erős fejlesztési alapot kapnak mindenféle számukra szükségtelen sallang nélkül. Ez lehetővé teszi a kutatások felgyorsítását. 

Lényeges a méret 

A modellek hardware igénye fontos, mivel ennek minimalizálása lehetővé teszi az AI széleskörű használatát. Ez azért lényeges, mert az egyszerű chatbotok ideje kezd lejárni és helyüket a komplex modellek veszik át, melyek képesek összetett feladatok elvégzésére. Ebből kifolyólag egy AI-modelltől szinte már elvárt, hogy multimodálisan gondolkodjon, önállóan cselekedjen, továbbá kompakt és hordozható legyen. 

Előnyök és hátrányok 

A vállaltok egyre jobban nyitnak az AI-technológiák munkafolyamatokba történő implementálása felé. Az új fejlesztések a szoftverfejlesztés, dokumentumfeldolgozás, automatizálás és offline tartalomelemzés területén hozhatnak áttörést.  

Habár az új fejlesztések meggyőző teljesítményt nyújtanak, alkalmazásuk esetén a vállalatoknak néhány dolgot érdemes szem előtt tartaniuk:

  • AI hallucináció: egy hiba, több lépéses folyamatoknál láncreakciót indíthat el. 
  • Hibakeresés: míg a modellek új kód írásában kiválóan teljesítenek a hibakeresés nehezebb feladatnak bizonyul számukra.  
  • Magas RAM és VRAM igény: A 9B modell még mindig memóriaigényes. 
  • Adatvédelem: Mivel a szoftver kínai eredetű, ezért az adatkezelési folyamatokra érdemes fokozottan figyelni. 

Leléptek a nagyágyúk 

Annak ellenére, hogy még a tech mogul Elon Musk is dicsérte a Qwen legújabb vívmányait, a debütálást követő napon három kulcsfigura távozott a kínai vállalattól: Junyang „Justin” Lin fejlesztésért felelős vezető, Binyuan Hui kutató, valamint Kaixin Li gyakornok.

Felmondásukat egyidőben jelentették be, miközben a vállalat áttörő sikerét ünnepelte, ami feszültségre utalhat a cégvezetés, valamint a munka érdemi részét végző kutatók között − mutatott rá Carl Franzen, a VentureBeat újságírója.

Profit vagy innováció

Becslések szerint több mint 90 ezer vállalat használja a Qwent modelljeit, akikben a fejlesztők távozása bizalmatlanságot ébreszthet. Sokan azért választották a Qwent termékeit, mert a zárt amerikai modellekkel szemben nagyfokú áltáthatóságot biztosított. 

A kutatások vezetését a Google DeepMind Gemini csapatának vezetője veszi át, ami szemléletváltásra enged következtetni. Az innováció fokuszú működést a profitorientált gondolkodás válthajta − elemzi a kialakult helyzetet Carl Franzen újságíró. 

Hasonló folyamatokra a Meta esetében is volt példa, miután a vállalat Llama4 modellje vegyes fogadtatásban részesült. 

A Qwen felhasználói attól tartanak, hogy a jelenleg ingyenes és nyílt forráskódú modellek fizetőssé válnak.

Junyang „Justin” Lin és csapata távozásával a Qwen elvesztette lelkét és félő, hogy a jelenleg forradalminak számító, és mindenki számára széleskörben hozzáférhető AI-modell a kapzsiság áldozata lesz.

 

Google News Világgazdaság
A legfrissebb hírekért kövess minket a Világgazdaság.hu Google News oldalán is!

Címoldalról ajánljuk

Tovább a címoldalra

Portfóliónk minőségi tartalmat jelent minden olvasó számára. Egyedülálló elérést, országos lefedettséget és változatos megjelenési lehetőséget biztosít. Folyamatosan keressük az új irányokat és fejlődési lehetőségeket. Ez jövőnk záloga.