在人工智能领域,一场深刻的变革正在悄然发生,其核心从云端算力的垄断逐渐转向终端智能的觉醒。这一转变不仅预示着更多参与者的涌入,也意味着竞争态势的多样化和复杂化。
近年来,大模型行业的认知经历了快速的迭代。以往,终端设备受限于功耗、散热和存储空间,仅能运行轻量化模型,效果并不理想。然而,DeepSeek技术的出现打破了这一僵局,它通过“小参数大智能”的路径,成功将百亿级模型压缩至终端芯片,彻底改变了端侧AI的底层逻辑。
资本市场对端侧AI概念的热烈反应也印证了这一趋势。移远通信、美格智能等端侧AI领域的龙头企业业绩表现亮眼,广和通的市场关注度也随之提升。移远通信预计2025年一季度归母净利润将达到2亿元,同比增长265.19%,主要得益于物联网需求的复苏及车载、AIoT场景的拓展。美格智能一季度净利润预计中值为4600万元,同比增长高达611%,高算力AI模组在智能汽车、无人机等领域的出货量激增。广和通虽未明确披露一季度净利润,但其股价区间涨幅达25.11%,显示出市场对5G模组及车载业务前景的乐观预期。
与此同时,云端算力领域也呈现出新的动向。头部大模型厂商的门槛已提升至万卡集群,甚至十万卡集群也在规划中。尽管大模型趋于集中,但头部厂商的预训练需求并未减少,反而有所增加。更多AI公司开始布局后训练和推理算力,产业内逐渐形成共识:未来AI算力,尤其是推理算力,将出现千倍增长,网络带宽和存储需求也将大幅增长。
DeepSeek效应正引领大模型重心转向推理。爱簿智能CEO孙玉昆表示:“端侧AI正处于一个最好的时代。”他认为,大模型的开源为端侧和边缘AI的发展带来了巨大机遇。从端侧芯片的发展来看,算力和内存带宽都有所提升;从模型能力来看,适合端侧运行的模型能力突飞猛进;从AI普及水平来看,越来越多的人开始使用端侧和边缘部署大模型的推理,个性化需求日益增多。
DeepSeek的模型迭代遵循Scaling Law,通过增加参数规模和训练数据量提升性能。然而,随着模型规模接近物理极限,单纯依赖参数扩张的边际收益递减,技术重心逐渐转向推理优化和多模态应用。DeepSeek推出的NSA机制通过优化稀疏注意力机制与硬件适配能力,显著提升了长上下文任务的训练和推理速度。
阿里云智能集团资深副总裁刘伟光指出,阿里云开发新模型的两个重要方向是Reasoning推理和全模态融合。他认为,大模型未来将向更强的推理能力演化,强化学习将不断提升思维链的能力。同时,他也强调了强化学习在后训练中的重要作用,认为未来会有更多客户基于强化学习开发AI原生应用和AI Agent。
中科曙光方面表示,DeepSeek正在引发算力产业链式反应,不仅激发了模型后训练和推理环节的算力需求,也打破了市场对高算力GPU的路径依赖,为国产GPU加速卡带来重大机遇。软硬件协同设计优化已成为AI基础设施的重要创新方向。
京华信息科技股份有限公司副总裁李思伟认为,2025年已成为AI大模型商业应用元年。然而,在过去,行业面临着“不可能三角”的问题:想要更好的智能就需要付出高昂的部署和训练成本,但客户又优先考虑安全问题,需要私有化部署,而私有化部署成本又过高。DeepSeek解决了这一问题,但仍面临安全问题和国产化技术路线等门槛。
端侧AI生态的稳定和高效是其赖以生长的基础。大模型仍处于产业发展早期阶段,技术的演进呈现出上下影响、交替迭代的趋势。中科曙光推出的DeepAI深算智能引擎方案旨在让国产AI算力更适用、更好用,赋能从十亿级模型端侧推理到千亿级模型云端训练全场景需求。该方案全面兼容CUDA、Rcom双栈生态,支持2000+算子,国产GPU单卡训推性能提升可达1倍以上。
刘伟光还提到,支撑大语言模型的基础设施能力,特别是推理服务能力,是保障AI应用服务顺畅运行的重要基础。云计算也在为AI所改变,以支持所有AI训练、推理和应用在云基础设施上更稳定、平滑、高效地运行。
中科曙光DeepAI深算智能引擎内置了DAP企业级全栈AI应用开发平台,提供多模型开放纳管、高性能推理服务等功能。企业客户可在国产AI算力底座上一站式跑通DeepSeek、阿里QwQ等大模型应用。
孙玉昆认为,面向AI的开发者面临算力不足和开发工具链支持不足两大挑战。他补充说,部署开发环境流程繁琐,很多初学者因此放弃。爱簿智能推出了AIBOOK算力本,以50TOPS端侧算力为核心,旨在区分市场已有的AI PC。该产品基于原生Linux开发环境,预装了各种实用AI应用和编程开发环境,实现AI的“开箱即用”。
在云端还是端侧的选择上,没有绝对的好与坏,这取决于客户的业务需求。端云协同是未来的主流趋势,5G、边缘计算等技术使分布式计算延迟降低,端侧AI芯片算力提升,可承担更复杂任务。模型压缩技术使小参数模型在端侧达到接近云端模型的能力水平。通过轻量化模型突破端侧算力瓶颈,结合端云一体架构实现能力的弹性扩展,正在定义AI算力的新范式。