Folytatódik az AI-háború: nagyot villantott a kínai óriás
A legnagyobb kínai online piactér egy új, nyílt forráskódú, kisméretű AI-modellel rukkolt elő, amely elképesztő intelligenciával rendelkezik, ám úgy tűnik a kapzsiság az innovációra kárára mehet.

Az Alibaba új AI-modell sorozata a következő változatokat tartalmazza:
- Qwen3.5-0.8B és 2B − kompakt, és gyors működésre optimalizált modellek, elsősorban kis akkukapacitással rendelkező eszközökre.
- Qwen3.5-4B − erős multimodális modell egyszerűbb alkalmazásokhoz.
- Qwen3.5-9B − kompakt érvelő modell, amely felülmúlja az OpenAI hasonló fejlesztését.
Technológiai újítás az AI-szektorban
A Qwen3.5 Small szakít a mára klasszikusnak számító Transformer neurális hálózati architektúrával, amelyet eredetileg természetes nyelvfeldolgozási feladatokra fejlesztettek ki. A kutatók egy Efficient Hybrid Architecture elnevezésű megoldást alkalmaznak, amely a lineáris figyelem (gated delta network) és a tudományok szétválasztásának (mixture of experts) módszerét elegyíti.
A hibrid architektúra előnye, hogy csökkenti a késleltetést és növeli a hatékonyságot, ami gyorsabb munkafolyamatot eredményez.
Egy másik nagy újítás, hogy a modellek natívan multimodálisak, így a 4B és 9B képesek például a képernyő elemeit értelmezni, vagy akár videókban tárgyakat felismerni és megszámolni. Erre korábban csak a jóval nagyobb modellek voltak képesek.
Különböző tesztek szerint a Qwen3.5 Small verziói a multimodális érvelés, graduális érvelés, videóelemezés, matematikai számítások, dokumentumfelismerés, valamint a többnyelvű feladatok területén verik a versenytársak fejlesztéseit.
Magasabb intelligencia, alacsonyabb hardware igény
Az első visszajelzések alapján a felhasználók reakciója pozitív. A modellek akár laptopon, vagy mobiltelefonon is futnak, használhatók offline, valamint a böngészőkön belül futtatva is alkalmasak képfelismerésre.
A modellek másik nagy előnye, hogy teljesen testre szabhatók, így a fejlesztők tulajdonképpen egy erős fejlesztési alapot kapnak mindenféle számukra szükségtelen sallang nélkül. Ez lehetővé teszi a kutatások felgyorsítását.
Lényeges a méret
A modellek hardware igénye fontos, mivel ennek minimalizálása lehetővé teszi az AI széleskörű használatát. Ez azért lényeges, mert az egyszerű chatbotok ideje kezd lejárni és helyüket a komplex modellek veszik át, melyek képesek összetett feladatok elvégzésére. Ebből kifolyólag egy AI-modelltől szinte már elvárt, hogy multimodálisan gondolkodjon, önállóan cselekedjen, továbbá kompakt és hordozható legyen.
Előnyök és hátrányok
A vállaltok egyre jobban nyitnak az AI-technológiák munkafolyamatokba történő implementálása felé. Az új fejlesztések a szoftverfejlesztés, dokumentumfeldolgozás, automatizálás és offline tartalomelemzés területén hozhatnak áttörést.
Habár az új fejlesztések meggyőző teljesítményt nyújtanak, alkalmazásuk esetén a vállalatoknak néhány dolgot érdemes szem előtt tartaniuk:
- AI hallucináció: egy hiba, több lépéses folyamatoknál láncreakciót indíthat el.
- Hibakeresés: míg a modellek új kód írásában kiválóan teljesítenek a hibakeresés nehezebb feladatnak bizonyul számukra.
- Magas RAM és VRAM igény: A 9B modell még mindig memóriaigényes.
- Adatvédelem: Mivel a szoftver kínai eredetű, ezért az adatkezelési folyamatokra érdemes fokozottan figyelni.
Leléptek a nagyágyúk
Annak ellenére, hogy még a tech mogul Elon Musk is dicsérte a Qwen legújabb vívmányait, a debütálást követő napon három kulcsfigura távozott a kínai vállalattól: Junyang „Justin” Lin fejlesztésért felelős vezető, Binyuan Hui kutató, valamint Kaixin Li gyakornok.
Felmondásukat egyidőben jelentették be, miközben a vállalat áttörő sikerét ünnepelte, ami feszültségre utalhat a cégvezetés, valamint a munka érdemi részét végző kutatók között − mutatott rá Carl Franzen, a VentureBeat újságírója.
Profit vagy innováció
Becslések szerint több mint 90 ezer vállalat használja a Qwent modelljeit, akikben a fejlesztők távozása bizalmatlanságot ébreszthet. Sokan azért választották a Qwent termékeit, mert a zárt amerikai modellekkel szemben nagyfokú áltáthatóságot biztosított.
A kutatások vezetését a Google DeepMind Gemini csapatának vezetője veszi át, ami szemléletváltásra enged következtetni. Az innováció fokuszú működést a profitorientált gondolkodás válthajta − elemzi a kialakult helyzetet Carl Franzen újságíró.
Hasonló folyamatokra a Meta esetében is volt példa, miután a vállalat Llama4 modellje vegyes fogadtatásban részesült.
A Qwen felhasználói attól tartanak, hogy a jelenleg ingyenes és nyílt forráskódú modellek fizetőssé válnak.
Junyang „Justin” Lin és csapata távozásával a Qwen elvesztette lelkét és félő, hogy a jelenleg forradalminak számító, és mindenki számára széleskörben hozzáférhető AI-modell a kapzsiság áldozata lesz.



