Çinli teknoloji devi Alibaba, hibrit yapay zeka alanında iddialı bir adım atarak yeni nesil model ailesi Qwen3’ü tanıttı. Şirketin açıklamasına göre Qwen3 serisi, Google ve OpenAI’ın en iyi yapay zeka modelleriyle kıyaslanabilir seviyede; bazı alanlarda ise üstün performans sergiliyor.
Qwen3 ailesi, 600 milyon ile 235 milyar arasında değişen parametre sayılarına sahip modeller içeriyor. Kullanıcılar, küçük ölçekli prototiplerden çoklu GPU kümelerine kadar farklı ihtiyaçlarına uygun çözümler geliştirebiliyor. Hibrit yapıları sayesinde bu modeller, basit taleplere hızlı yanıt verirken, karmaşık sorunlar karşısında derinlemesine akıl yürütme gerçekleştirebiliyor.
Qwen ekibi, yayımladığı blog yazısında, kullanıcıların görev bazlı kaynak kullanımını optimize edebilmesi için “düşünme” ve “düşünmeme” modlarının esnek biçimde entegre edildiğini belirtti. Bazı modellerde kullanılan Uzmanlar Karışımı (MoE) mimarisi ise görevleri alt modellere bölerek hem verimliliği artırıyor hem de işlem yükünü azaltıyor.
İki MoE modeli, Qwen3-235B-A22B ve Qwen3-30B-A3B, açık ağırlıklı olarak kullanıma sunuldu. Ayrıca, Apache 2.0 lisansı altında yayımlanan Qwen3-32B, Qwen3-14B, Qwen3-8B, Qwen3-4B, Qwen3-1.7B ve Qwen3-0.6B gibi yoğun modeller de erişime açık durumda.
Yaklaşık 36 trilyon token’lık bir veri seti üzerinde eğitilen Qwen3 modelleri, 119 dili destekliyor. Eğitim materyali olarak ders kitapları, soru-cevap veri kümeleri, kod örnekleri ve yapay zeka üretimi veriler kullanıldı. Böylece, Qwen2’ye kıyasla önemli bir performans artışı sağlandı.
Öte yandan, en büyük model olan Qwen3-235B-A22B, Codeforces, AIME ve BFCL gibi zorlu testlerde OpenAI’ın o3-mini ve Google’ın Gemini 2.5 Pro modellerini geride bıraktı. Ancak bu dev model henüz genel erişime açık değil. Daha erişilebilir olan Qwen3-32B modeli ise çeşitli performans ölçümlerinde OpenAI’ın o1 modelini geçmeyi başardı.
Qwen3 serisi; araç çağırma, talimatları izleme ve veri formatlarını doğru kopyalama gibi yeteneklerde de iddialı. Modeller, Hugging Face ve GitHub üzerinden indirilebilirken; Fireworks AI, Hyperbolic, ModelScope ve Kaggle gibi platformlar üzerinden de bulut erişimi sunuluyor. Ayrıca kullanıcılar, Qwen Chat web arayüzü ve mobil uygulamalarla doğrudan modelle etkileşim kurabiliyor.