英伟达Blackwell GPU平台与亚马逊云科技达成合作 助力AI计算飞跃

   发布时间:2024-03-20 15:06

【巨人财经】3月20日消息,亚马逊云科技与英伟达共同宣布,英伟达在2024年GTC大会上隆重推出的全新NVIDIA Blackwell GPU平台将很快登陆亚马逊云科技。这一重磅合作将为客户提供NVIDIA GB200 Grace Blackwell Superchip以及B100 Tensor Core GPU的强大支持。

据巨人财经了解,英伟达Blackwell在亚马逊云科技的应用,将使得该平台在处理资源密集型及数万亿参数语言模型等推理工作负载方面实现质的飞跃。此次推出的NVIDIA GB200 Grace Blackwell Superchip以及B100 Tensor Core GPU是英伟达最新一代的GPU产品,其在单芯片训练方面的FP8性能是上一代架构的2.5倍,而在推理方面的FP4性能更是达到了上一代架构的5倍。

新款Blackwell GPU平台在性能上有着显著的提升。在具有1750亿个参数的GPT-3大语言模型基准测试中,GB200的性能达到了H100的7倍,训练速度则是H100的4倍。同时,在成本和能耗上,GB200相比H100降低了25倍,这一优势无疑将吸引众多客户选择使用亚马逊云科技的Blackwell平台。

亚马逊云科技将提供配置GB200 NVL72的英伟达Blackwell平台,该平台配备了72颗Blackwell GPU和36颗Grace CPU,通过第五代NVIDIA NVLink实现高速互连。结合亚马逊云科技的EFA网络、Amazon Nitro高级虚拟化系统以及Amazon EC2 UltraClusters超大规模集群等技术,客户能够轻松将应用扩展至数千个GB200 Superchips,从而满足更大规模的计算需求。

在安全性方面,亚马逊云科技与英伟达的合作也为客户提供了更强的保障。通过集成亚马逊云科技的Nitro系统、Amazon KMS以及Blackwell加密等技术,客户可以对其训练数据和模型权重实现端到端的控制,确保生成式AI应用程序在亚马逊云科技上的安全性。

此外,双方还合作开展了Project Ceiba项目,该项目是一台在亚马逊云科技上托管的AI超级计算机,搭载了20736颗GB200 Superchips芯片,并通过第四代EFA网络进行扩展。这台超级计算机能够为每个Superchip提供高达800Gbps的低延迟、高带宽网络吞吐量,计算能力高达414 exaflops。与之前计划在Hopper架构上构建Ceiba相比,性能提升了6倍。这一成果将进一步推动生成式AI领域的发展。

 
 
更多>同类内容
全站最新
热门内容
本栏最新
 
智快科技微信账号
ITBear微信账号

微信扫一扫
加微信拉群
电动汽车群
科技数码群