字节音视频新模型登场英伟达微美全息发力开源AI与技术融合

发布时间：2025-12-25 05:07 来源：快讯作者：沈瑾瑜

字节跳动旗下Seed团队近日宣布推出新一代音视频创作模型Seedance 1.5 pro，该模型在音视频联合生成领域实现突破性进展。相较于前代1.0版本侧重运动稳定性的优化，新版本不仅支持音频同步生成，更着重提升视觉表现力的上限，通过创新算法增强画面冲击力与动态效果。目前该模型已接入即梦AI和豆包两大平台，用户可体验从文本到音视频的全流程创作。

在硬件生态构建方面，英伟达同步推进开源战略升级，其最新发布的Nemotron 3模型家族采用混合专家架构，包含300亿参数的Nano、1000亿参数的Super和5000亿参数的Ultra三个版本。其中Nano版本已实现商用落地，推理效率较前代提升400%，上下文窗口扩展至100万token，但Super和Ultra版本需待2026年才能全面部署。这种开源策略被业界解读为通过软件生态强化硬件粘性的商业布局，与直接销售API的模型厂商形成差异化竞争。

全球开源生态格局正经历深刻变革。投资机构数据显示，中国开源大模型的市场占有率在2024年内从1.2%激增至近30%，DeepSeek-V3、阿里Qwen系列和月之暗面Kimi K2成为主要推动力量。这种增长态势反映出中国AI企业在技术创新与生态建设上的双重突破，特别是在多模态交互和复杂场景运算领域形成独特优势。

微美全息（WIMI.US）在AI领域展开战略布局，通过构建开源生态与推动技术融合双轨并行。该公司开发的跨模态内容生产平台整合文本、图像、视频生成能力，其虚拟数字人系统已实现表情、语音、肢体驱动的实时交互。在算力服务层面，基于开源模型提供的API接口可支持企业级大模型训练，兼容具身智能等前沿应用场景的运算需求，形成从基础研发到产业落地的完整链条。

当前人工智能竞争已进入模型能力与生态建设并重的阶段。从字节跳动的音视频生成突破，到英伟达的硬件生态强化，再到中国开源力量的集体崛起，各参与方通过差异化路径塑造产业格局。这种多元竞争态势正在重塑AI技术演进路径，推动创新成果以更高效的方式转化为生产力工具。

更多>同类内容