首页 科技 > 内容

Nvidia联合举办竞赛帮助建立AI数据集以加速GPU设计

时间:2024-07-26 10:11:23 来源:
导读 尽管大型语言模型(LLM)在生成内容方面的能力令人印象深刻,但它们在设计硬件方面却不那么出色。Nvidia、佐治亚理工学院和其他公司认为,这...

尽管大型语言模型(LLM)在生成内容方面的能力令人印象深刻,但它们在设计硬件方面却不那么出色。Nvidia、佐治亚理工学院和其他公司认为,这一弱点是由于缺乏硬件设计数据来训练模型,因此组织了一场比赛来帮助创建所需的开源公共数据集。

Nvidia设计自动化研究总监任浩星(MarkRen)最近在X(前身为Twitter)上宣布了合作。任浩星表示,硬件设计专用高质量数据的短缺是“LLM辅助硬件设计的瓶颈之一”。为了解决这些不足,Nvidia和其他公司组织了ICCADLLM辅助硬件代码生成竞赛。

目前,在LLM的帮助下设计GPU和其他硬件需要“大量的人机交互”。LLM创建的设计通常要么不可综合,要么功能不全,要么过于简单或不切实际。研究人员认为,这是因为在预训练期间没有充分接触高质量的硬件设计数据。

在注意到Nvidia的一个项目使用内部大规模Verilog代码数据集取得成功后,组织者决定丰富当前的Verilog代码数据集。该竞赛旨在构建一个大规模、高质量的硬件设计代码数据集,并最终实现开源。

LLHWDesign竞赛分为两个阶段。第一阶段,数据样本收集,于2024年8月10日结束。第二阶段从8月20日到10月1日,将对第一阶段收集的数据集进行改进和微调。在第一阶段收集数据集时,竞赛参与者将从现有的Verilog数据集开始并对其进行扩展。

在第二阶段,参与者将使用数据过滤来删除低质量数据,并开发技术来自动为收集的数据样本生成更准确的描述。最后,他们将创建标签策略来帮助法学硕士的学习过程。

标签: