首页 科技 > 内容

NVIDIA凭借H100GPU打破了MLPerf基准并证明了为什么它是人工智能市场无可争议的领导者

时间:2023-11-09 15:58:26 来源:
导读 NVIDIA的H100GPU在人工智能方面处于领先地位,该公司再次在MLPerf基准测试中创造了新记录。随着HopperH100GPU实现破纪录的MLPerf生成AI性能...

NVIDIA的H100GPU在人工智能方面处于领先地位,该公司再次在MLPerf基准测试中创造了新记录。随着HopperH100GPU实现破纪录的MLPerf生成AI性能,NVIDIA继续保持AI领先地位在NVIDIA发布的最新MLPerf基准测试中,该公司强调他们创造了多项新记录,其中Eos超级计算机在短短3.9分钟内完成了基于GPT-3模型的训练基准,该模型在10亿个代币上训练了1750亿个参数。这与之前的记录相比是一个巨大的进步,之前的记录是超级计算机在10.9分钟内完成了相同的基准测试,标志着惊人的3倍提升。

现在,超级计算机所取得的成绩确实是惊人的,但其背后的主要原因是什么?

简而言之,NVIDIA尖端的HopperGPU架构与完善的软件资源相结合。Eos超级计算机目前采用10,752个NVIDIAH100TensorCoreGPU,取代了相当旧的A100,这就是性能大幅提升的原因。此外,通过开发完善的软件资源(例如有助于LLM培训的NVIDIANeMo),TeamGreen成功地从其平台中榨取了卓越的功能。

此外,文中提到的NVIDIA另一项创纪录的成就是在“系统扩展”方面取得的进步,通过各种软件优化的帮助,该公司成功地实现了93%的效率。10,752个H100GPU远远超过了6月份AI训练的规模,当时NVIDIA使用了3,584个HopperGPU。高效扩展在业界非常重要,因为实现高计算能力需要使用更多的硬件资源,而如果没有足够的软件支持,系统的效率会受到更大程度的影响。

NVIDIA在AI行业中的作用意义重大,因为该公司有能力提供人类已知的最强大的AIGPU(至少目前如此)。抛开财务方面不谈,Green团队一直在快速开发其软件资源,并与客户合作,通过保持效率和稳定性来确保其产品组合提供最佳性能。

标签: