在AI编程能力竞技的全球舞台上,中国科技企业再次交出亮眼答卷。阿里巴巴最新发布的大语言模型Qwen 3.6-Plus以1452分的成绩,在Code Arena公布的React专项榜单中位列全球第二,成为首个在该领域跻身三甲的中国大模型。这一突破不仅刷新了国产模型的技术高度,更标志着中国在AI工程化应用领域实现重要跨越。
作为AI领域最具公信力的第三方评测平台,LMArena旗下的Code Arena榜单采用"双盲测试+实时对抗"机制,通过真实用户提交的复杂Web开发任务,全面评估模型在项目初始化、代码编写、调试运行等全流程的自主能力。本次React专项测试聚焦AI Coding领域最前沿的技术方向,要求模型具备完整的工程思维和端到端开发能力,其难度远超传统代码补全测试。
技术数据显示,Qwen 3.6-Plus在多项核心指标上实现突破。该模型以4分优势领先OpenAI最新发布的GPT-5.0-High(1448分),与Anthropic旗下的Claude-Opus-4.6-Thinking(1540分)的差距缩小至88分,同时以12分的优势超越Google的Gemini 3.1 Pro Preview(1440分)。在代码生成质量、工程化实现能力等关键维度,中国模型展现出与全球顶尖水平同台竞技的实力。
这款于4月2日正式发布的新一代模型,融合了原生多模态理解与强化推理能力,在代码生成和Agent智能体技术方面形成独特优势。评测显示,Qwen 3.6-Plus在参数规模仅为GLM-5、Kimi-K2.5等竞品三分之一的情况下,凭借更高效的架构设计实现了性能反超。其代码生成模块能够自动识别开发场景中的隐性需求,在复杂业务逻辑实现方面表现出色。
全球开发者社区对这一突破反应热烈。模型发布首日即引发技术论坛热议,次日便在React榜单实现登榜。在涵盖多种编程范式的Code Arena综合榜单中,Qwen 3.6-Plus同样位居国产模型首位,助力阿里巴巴在全球AI实验室排名中升至第四,形成与Anthropic、OpenAI、Google三强并立的竞争格局。
据研发团队透露,Qwen 3.6-Plus作为千问3.6系列的首发模型,后续将开源不同参数规模的版本以满足多样化需求。性能更强的旗舰模型Qwen3.6-Max已完成训练验证,预计将于近期正式发布,有望在AI工程化领域掀起新的技术浪潮。






















