字节音视频新模型登场 英伟达微美全息发力开源AI与技术融合

   发布时间:2025-12-25 05:07 作者:沈瑾瑜

字节跳动旗下Seed团队近日宣布推出新一代音视频创作模型Seedance 1.5 pro,该模型在音视频联合生成领域实现突破性进展。相较于前代1.0版本侧重运动稳定性的优化,新版本不仅支持音频同步生成,更着重提升视觉表现力的上限,通过创新算法增强画面冲击力与动态效果。目前该模型已接入即梦AI和豆包两大平台,用户可体验从文本到音视频的全流程创作。

在硬件生态构建方面,英伟达同步推进开源战略升级,其最新发布的Nemotron 3模型家族采用混合专家架构,包含300亿参数的Nano、1000亿参数的Super和5000亿参数的Ultra三个版本。其中Nano版本已实现商用落地,推理效率较前代提升400%,上下文窗口扩展至100万token,但Super和Ultra版本需待2026年才能全面部署。这种开源策略被业界解读为通过软件生态强化硬件粘性的商业布局,与直接销售API的模型厂商形成差异化竞争。

全球开源生态格局正经历深刻变革。投资机构数据显示,中国开源大模型的市场占有率在2024年内从1.2%激增至近30%,DeepSeek-V3、阿里Qwen系列和月之暗面Kimi K2成为主要推动力量。这种增长态势反映出中国AI企业在技术创新与生态建设上的双重突破,特别是在多模态交互和复杂场景运算领域形成独特优势。

微美全息(WIMI.US)在AI领域展开战略布局,通过构建开源生态与推动技术融合双轨并行。该公司开发的跨模态内容生产平台整合文本、图像、视频生成能力,其虚拟数字人系统已实现表情、语音、肢体驱动的实时交互。在算力服务层面,基于开源模型提供的API接口可支持企业级大模型训练,兼容具身智能等前沿应用场景的运算需求,形成从基础研发到产业落地的完整链条。

当前人工智能竞争已进入模型能力与生态建设并重的阶段。从字节跳动的音视频生成突破,到英伟达的硬件生态强化,再到中国开源力量的集体崛起,各参与方通过差异化路径塑造产业格局。这种多元竞争态势正在重塑AI技术演进路径,推动创新成果以更高效的方式转化为生产力工具。

 
 
更多>同类内容
全站最新
热门内容
本栏最新