阿里推出Qwen3.7-Plus模型:多模态升级,视觉语言融合开启智能体新篇章

   发布时间:2026-06-02 09:25 作者:沈瑾瑜

阿里云近日宣布,旗下千问大模型系列迎来重要升级,正式推出Qwen3.7-Plus多模态交互混合智能体。这款新模型在原有Qwen3.7基础上实现视觉与语言能力的深度融合,定位为面向复杂场景的智能体基座模型。

据技术文档披露,Qwen3.7-Plus完整保留了文本处理、代码生成、工具调用等核心能力,同时重点强化了三大技术方向:跨模态理解能力可同步处理图像、视频、屏幕截图及网页内容;视觉推理系统支持复杂场景下的逻辑分析;任务执行链路实现从感知到操作的闭环。该模型已通过阿里云百炼平台对外提供服务,开发者也可在Qwen Studio进行体验测试。

在权威评测机构Vision Arena发布的最新榜单中,阿里凭借Qwen3.7-Plus的优异表现跻身全球前五,并登顶中国区榜首。纯文本能力测试显示,该模型在编码智能体、多语言处理等维度达到行业顶尖水平,与Max级模型表现相当。多模态专项评测中,其在BabyVision、MathVision等视觉推理基准测试,以及ScreenSpot Pro、OSWorld-Verified等真实场景任务中的得分均有显著提升。

技术团队特别强调,新模型突破了传统多模态系统的交互局限,支持在图形界面、命令行界面及工具链环境中无缝切换。通过强化工具调用能力,Qwen3.7-Plus可自动完成从信息解析到操作执行的完整流程,特别适用于办公自动化、软件测试等需要跨系统协作的复杂场景。

 
 
更多>同类内容
全站最新
热门内容
本栏最新