在空间智能领域,一场悄然发生的变革正引发全球关注。商汤科技最新开源的SenseNova-SI模型,以超越李飞飞团队Cambrian-S的成绩,成为首个在多项基准测试中登顶的国产开源AI。这一突破不仅标志着中国科技公司在前沿技术领域的崛起,更预示着AI发展范式正在经历深刻转型。
商汤科技联合创始人、首席科学家林达华在深度访谈中指出,当前AI行业正站在十字路口。过去三年,以Scaling Law为核心的"大力出奇迹"模式主导了技术演进,但2024年下半年以来,这种路径的边际效应显著递减。他直言:"模型分数仍在攀升,但对物理世界的理解能力却停滞不前,这种增长已触及天花板。"
这种判断与OpenAI前首席科学家Ilya Sutskever提出的"Back to Research"理念不谋而合。林达华团队选择了一条更具挑战的道路:放弃参数竞赛,转而攻克原生多模态与空间智能的底层技术。他们研发的NEO架构,从Transformer Block层面实现视觉与语言信号的深度融合,通过混合注意力机制让模型在推理时同步处理图文信息,彻底颠覆了传统拼接式架构的降维处理模式。
技术突破带来的效果立竿见影。SenseNova-SI在空间推理、三维建模等核心指标上全面领先,数据效率较同类模型提升10倍。更引人注目的是其训练方式创新——通过跨视角预测任务,让模型自主构建三维空间认知,这种"教AI搭积木"的训练方法,使其能准确识别手指数量、预测物体多视角形态,解决了长期困扰行业的"视觉幻觉"问题。
技术突破的价值最终要体现在应用层面。林达华强调"工业红线"概念:任何技术若使用成本高于创造价值,就难以实现规模化落地。为此,商汤在实时语音驱动数字人产品SekoTalk中,通过算法蒸馏技术将扩散模型推理步数从100步压缩至4步,实现64倍速度提升。这意味着消费级显卡即可实时生成高质量数字人视频,为直播、短视频等场景开辟了商业化新路径。
这场变革正在重塑AI技术生态。商汤的双轮驱动战略——底层创新与落地优化并重——已显现成效。NEO架构与SenseNova-SI的开源,为全球研究者提供了全新范式;而SekoTalk等产品的极致优化,则证明了技术突破能快速转化为生产力。林达华特别指出,中国完整的工业体系和丰富应用场景,为空间智能等前沿领域提供了得天独厚的发展土壤。
对于年轻研究者,林达华给出建议:跳出拥挤的大语言模型赛道,关注具身智能、AI for Science等新兴领域。他强调:"智能不只有语言维度,AI的终极目标是构建能理解物理世界的模型。"在这场从"读万卷书"到"行万里路"的技术迁徙中,中国科技公司已占据先机,而真正的突破,将属于那些敢于探索未知领域的创新者。























