小米凌晨官宣重磅成果！三大自研MiMo-V2系列模型上线赋能Agent时代

发布时间：2026-03-19 09:43 来源：快讯作者：李娜

小米技术官方近日宣布，正式推出三大自研MiMo-V2系列模型，涵盖旗舰Pro、全模态基座Omni以及语音合成TTS，为智能交互领域带来突破性进展。此次发布标志着小米在多模态大模型领域的技术积累进入新阶段，为Agent时代的智能化应用提供了核心支撑。

其中，Xiaomi MiMo-V2-TTS语音合成模型以全模态交互为核心设计目标，通过自主研发的Audio Tokenizer技术及多码本语音-文本联合建模架构，实现了对语音风格的精细化控制。该模型不仅支持从整体语调到局部情绪的逐层调节，还能精准还原人类说话的自然节奏，甚至在歌唱场景中也能准确捕捉音高变化与节奏韵律，展现出接近真实人类的语音表现力。这一突破为智能客服、有声内容生成等领域提供了更自然的交互解决方案。

面向复杂Agent应用场景，小米同步推出全模态基座模型Xiaomi MiMo-V2-Omni。该模型整合了文本、视觉、语音的多模态感知能力，并内置工具调用、函数执行及图形界面操作等行动模块，可无缝适配各类Agent开发框架。在匿名测试阶段，Omni模型凭借其强大的跨模态推理能力，在OpenRouter平台的日均调用量突破百万次，并在OpenClaw测评榜单中以综合得分第一的成绩领先同类模型。其低门槛接入特性显著降低了全模态Agent的开发成本，加速了智能化应用的落地进程。

针对高负载Agent工作场景，小米发布的旗舰基座模型Xiaomi MiMo-V2-Pro展现出更强性能。该模型参数量超过1万亿，支持100万 tokens的超长上下文处理，通过参数规模与算力的协同优化，实现了从代码生成到复杂任务执行的广泛能力覆盖。在全球权威大模型评测中，Pro模型以综合智能排名全球第八、国内第二的成绩，验证了其在长文本理解、逻辑推理等关键维度的技术优势。目前，Omni与Pro模型已开放API服务，并与多家主流Agent开发平台达成合作，为全球开发者提供限时免费的接口支持。

更多>同类内容