腾讯云智算重磅升级,AI基础设施效能可靠性全面提升获DeepSeek认可

   发布时间:2025-05-21 18:06 作者:顾雨柔

在腾讯云AI产业应用峰会上,腾讯云副总裁李力揭开了腾讯云智算全新升级的面纱,此次升级旨在应对AI应用和模型爆发所带来的基础设施挑战。升级后的腾讯云智算在效能、可靠性和易用性三大核心领域实现了全面提升,为AI大模型训练、智能体部署等应用场景提供了更为坚实的基础设施支撑。

李力指出,从云计算时代迈入AI时代,云基础设施的技术演进始终围绕着实际应用场景的需求展开。随着大模型的广泛应用以及智能体、智能驾驶等场景的快速落地,腾讯云智算以AI原生为基石,致力于构建一个既安全又灵活的高性能基础设施底座,携手开发者和企业共同探索智能化转型的新路径。

在效能方面,腾讯云智算针对数据处理效率低下和资源利用率不足等痛点,推出了一系列技术创新。依托国内首个支持跨卡型GPU调度的Serverless平台,腾讯云智算实现了高达10万级的并发数据任务处理能力,请求数更是达到了行业领先的百万量级。通过腾讯云存储数据万象中的100多个预置数据处理任务模板,企业数据打标效率得以提升50%。

针对大模型训练和推理场景,腾讯云智算利用自研的星脉通讯库,使得双端口网卡带宽利用率达到峰值,相比DeepEP性能提升了30%。同时,腾讯云智算还推出了性价比更高的多机互联网络vRDMA,损耗比降至不到2%,实现了模型训练效率的近乎无损扩展。

某知名车企在采用腾讯云智算方案后,智驾模型的数据标注效率提升了50%,数据处理整体成本降低了70%,训练性能提高了30%,模型迭代周期缩短了40%。

在可靠性方面,针对AI基础设施常见的服务不稳定、扩容速度慢、访问速度慢等问题,腾讯云智算通过自研AI服务器与智能巡检系统,将千卡集群的日均故障率控制在极低的0.16%以下。借助腾讯云存储GooseFS,模型分发时间从1小时大幅缩短至20分钟。同时,腾讯云在全球拥有50多个可用区,使得AI应用服务能够就近接入,服务稳定性提升了57%,扩容速度提高了两倍。

某头部手机厂商在AI助手项目中应用该方案后,服务网络的丢包和抖动均下降了99%,服务稳定性提升了57%,同时实现了200%的扩容速度提升。

在易用性方面,为了加速智能体的规模化落地,腾讯云智算对AI原生工具链进行了全面升级。向量数据库支持向量与关键字的混合检索,能够处理千亿级数据,并支持高达500万QPS的高并发检索。腾讯云智能日志服务则提供统一日志上报与可观测大盘,支持完整链路追踪与异常快速定位。腾讯云智算还升级了覆盖大模型全生命周期的安全解决方案,确保安全事件能够在两小时内得到快速响应。

某头部房产中介平台在搜索业务中引入腾讯云向量数据库后,数据召回率增加了30%,检索时间缩短了50%。同时,依靠日志和安全能力,异常定位效率提升了30%,安全响应时间缩短了90%。

目前,腾讯云智算已广泛应用于智能体及AI应用、具身智能、自动驾驶、互联网应用等多个领域。在Gartner最新发布的生成式AI基础设施象限中,腾讯云智算的产品性能与未来潜力均位居亚太厂商之首。

腾讯云对DeepSeek开源的DeepEP通信框架进行了深度优化,使其在各种网络环境下均实现了显著的性能提升。这一技术方案也获得了DeepSeek的公开致谢,被誉为一次重大的性能加速贡献。

 
 
更多>同类内容
全站最新
热门内容
本栏最新