阿里巴巴(09988)於周二凌晨發布新版通義千問Qwen3系列人工智能(AI)模型,聲稱其性能已能匹敵甚至在某些方面優於Google和OpenAI的頂尖模型。
新版Qwen3系列涵蓋2個MoE(Mixture of Experts)模型及6個Dense模型,參數量從6億至2350億不等。旗艦型號Qwen3-235B-A22B在編碼、數學及通用能力等多項基準評估中,取得與DeepSeek-R1、OpenAI o1及o3-mini、馬斯克的Grok 3、以及Google Gemini 2.5 Pro等頂尖模型相媲美的表現。
其中,小型MoE模型Qwen3-30B-A3B憑藉活化參數量僅為QwQ-32B的10%,展現出更優異的性能;而小模型Qwen3-4B的表現亦可媲美此前版本Qwen2.5-72B-Instruct。阿里巴巴亦已將六個Dense模型開源,包括Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B,並採用Apache 2.0授權協議。
Qwen3模型支持兩種思考模式:「思考模式」可逐步推理後給出更精確答案,適合處理複雜問題;「非思考模式」則提供快速回應,適用於要求即時反應的場景。通義千問表示,Qwen3在數學、程式設計及邏輯推理等領域的推理能力,已達到同規模業界最佳水平(SOTA)。