导读 微软的一个程序员和人工智能专家团队开发了一款名为 SpreadsheetLLM 的人工智能工具,该工具将大型语言模型功能应用于电子表格。在他们的...
微软的一个程序员和人工智能专家团队开发了一款名为 SpreadsheetLLM 的人工智能工具,该工具将大型语言模型功能应用于电子表格。在他们的研究中,该团队开发了 SheetCompressor,这是一种编码框架,可以有效地压缩电子表格以供大型语言模型 (LLM) 使用,该研究现已发布在arXiv预印本服务器上。
ChatGPT 等 LLM 广为人知,但随着越来越多的人使用它们,它们的能力差距也越来越明显。其中一个差距是这些模型理解电子表格的能力。由于电子表格的独特布局和功能,它们对 LLM 来说仍然是个谜,阻碍了它们作为商业工具的使用。
在这项新研究中,微软团队创建了一个工具,可以将电子表格重新组织成法学硕士可以用作数据源的形式。而且,正如团队所指出的,它基于他们称之为 SheetCompressor 的概念,这是一种编程工具,允许 AI 数据管理和分析电子表格中的信息。
为了实现 SheetCompressor,研究人员将其分为三个主要功能:压缩、转换和数据格式聚合。第一个功能是通过在电子表格中添加团队所描述的锚点来实现的,以帮助 LLM 理解电子表格的作用。
一旦到位,行和列将被替换为骨架表。然后使用翻译模块删除空单元格或重复值。应用 JSON 格式的无损倒排索引翻译可以实现数据格式聚合。
该团队还添加了其他模块来处理特殊情况,例如相邻单元格具有相似的数字格式。最终,该工具允许法学硕士以多种方式使用电子表格作为数据源。
研究团队表示,SpreadsheetLLM 开启了使用 LLM 技术彻底改变电子表格使用方式的大门;从自动数据输入到数据分析,再到以各种背景的人都能理解的方式呈现复杂信息。他们进一步表示,这将使电子表格及其所包含的数据更易于访问和使用。