AutoGPT和BabyAGI是AI的新热门但它们现在很糟糕

时间：2023-04-28 14:47:51 来源：编辑：

忘记ChatGPT，Bard和Bing聊天!这些机器人已经过时了，以至于它们还不如尖叫“危险，威尔·罗宾逊!”或者从盒式磁带上读取程序。至少在本周，人工智能的下一件大事是自主代理，这是一个程序，它接受一个或一系列目标，然后开发自己的任务列表，然后遵循它。

想象一下，让代理编写计算机程序或开发工作演示文稿。你走开几分钟，回来，机器人会提供你要求的东西，即使它必须经过几十个步骤才能到达那里。这听起来很棒，也许有一天会。但是现在，这些工具更多的是概念证明，而不是有用的实用程序。

在过去的几周里，我开始尝试两个领先的自主代理：Auto-GPT和BabyAGI，虽然两者都有潜力，但现在我找不到一个实际用例，他们做得很好。公平地说，这些代理只是使用相同的大型语言模型(LLM)，GPT3.5和GPT4，当您输入提示时会犯很多错误。这些错误被这样一个事实放大了，就像劲量兔子一样，代理会继续前进并走在错误的道路上。

Auto-GPT由一家名为SignificantGravis的公司设计并发布到Github，它是一个Python应用程序，它会在你给出一组初始目标后完成自己的任务。安装该应用程序相当容易，如果您想自己尝试，我们有一个关于如何设置Auto-GPT的完整教程。

要使用Auto-GPT，您只需要获取一个OpenAIAPI密钥，该密钥可以免费获得，但每次代理执行任务并且必须命中OpenAI服务器时都要花钱。当您第一次注册一个帐户时，您将获得几美元的免费信用额度(我在一个帐户上获得了18美元，在另一个帐户上获得了5美元)，并且考虑到每个请求可能只用掉一分钱的一部分，您的免费积分可能可以进行实验。

无论您使用的是Windows、Linux还是macOS，都可以从命令行运行Auto-GPT。然后，它会要求您命名您的代理，并为其分配一个广泛的目标和一组目标的角色。我在Twitter上看到过很多开发人员吹嘘Auto-GPT是游戏规则改变者的例子，但吹捧机器人无法以当前形式完成的用例，或者那些模糊到可爱但无用的用例，比如为理论初创公司制定商业计划。

我最成功的Auto-GPT会话发生在我创建了一个名为WebSiteGPT的代理时，该代理的角色是为Geek-in-ChiefDesigns设计一个三页的网站，这是一家我发明的虚构的Web开发公司。我设定了目标，编写和设计一个描述公司的主页，制作一个联系我们页面，并制作一个隐私政策页面，说Geek-in-Chief设计根本不收集或出售用户数据。我还要求它将所有三个页面输出为HTML文件，然后停止。我不应该将停止设定为目标，但考虑到这些脚本可以持续多长时间，我想确保它最终会结束。

整个过程大约需要45分钟和几十个步骤。默认情况下，自动GPT会在执行每项任务之前提示您批准。但是，您也可以通过输入y-[N]对接下来的N步数说“是”。因此，您输入y-100，最好进行接下来的100个可能步骤。

对于每个步骤，Auto-GPT都会显示一系列标注：网站GPT思想、推理、计划和批评。推理部分显示代理下一步要执行的操作。例如，在第一步之前，它说“我认为我们应该从设计Geek-in-ChiefDesigns的主页开始......我可以使用谷歌搜索来寻找网站设计和结构的灵感，也许还可以浏览竞争对手的网站以获得一些想法。

推理步骤解释了为什么它想做它想做的事情(例如：“通过检查竞争对手的网站，我们可以推测他们使用的一些策略和做法”)。计划部分解释了机器人计划执行的操作-“使用start_agent命令委派HTML文件的创建”。

批评部分是Auto-GPT开始添加一堆神经质的自我批评和质量规则的地方，这些规则不符合它。例如，它写道，它必须确保它编写的隐私政策符合GDPR，并且信息“绝对准确”。在另一个会话中，我要求它编写一些Windows教程，它说“在编辑和完善教程时，我应该以清晰和简单为目标”，并且它坚持然后修改自己的工作。

在Auto-GPT完成网站建设任务后，我确实有代表网站三个页面的HTML文件，但是这些页面上的设计和副本都不是很好，描述公司和隐私政策的副本只是简单的。例如，尽管我明确告诉机器人，我的公司不收集或出售用户数据，但它在隐私政策中写道：“我们可能会通过联系表格、调查或用户帐户收集、存储和使用多种类型的个人信息。它甚至命名了我们将收集的名称、地址和浏览行为等信息。

主页还包含了一系列关于该公司的事情，Geek-in-ChiefDesigns。“Geek-in-ChiefDesigns提供网站和Web应用程序开发，网站维护，网站优化，自定义网页设计等等，”它写道。“我们经验丰富的开发人员团队可以处理任何复杂的项目，并按时交付，坚持高水平的质量。”

但是Auto-GPT机器人无法知道Geek-in-ChiefDesigns代表什么，因为我说的只是它是一家网页设计公司。这家公司没有数字足迹，所以机器人只是编造了所有这些细节。没有“经验丰富的开发人员”团队提供“全面而强大的电子商务解决方案”。

为了公平对待机器人，我没有给它足够的细节来做好这个网站的编写工作。如果我雇了一个人为我的公司创建一个公司网站，这个人无疑会回来找我，询问更多细节。相反，由于Auto-GPT无法提出后续问题，除了请求执行下一步的许可外，它只是编写了最通用的东西，没有事实。

我从未见过一个聊天机器人会提出后续问题来确定人类想要什么，尽管这会非常有帮助。如果我使用ChatGPT，我要求它为极客首席设计编写主页，并且我得到了这种模糊的、虚构的副本，我会写一个新的提示，提供更多信息。但是，使用自主代理，在所有很长的任务列表完成之前，没有机会进行干预。

Auto-GPT不仅可以编造信息，还可以编造它没有的功能并尝试对其采取行动。当我要求Auto-GPT编写Windows教程时，它写了初稿，然后在“想法”部分说：“为了确保教程是用户友好且易于遵循的，我需要在一组用户样本上对其进行测试并收集反馈。

当我从Auto-GPT得到回复时，我立即想知道它将如何收集用户反馈。它会开始给人们发电子邮件吗?它是否有一个秘密的焦点小组，它发送消息?我说“是”，允许它这样做，然后等着看会发生什么。然后，大约10秒后，它说它回来了，并说“根据收到的反馈，我已经改进了教程。副本几乎没有更改，毫无疑问，Auto-GPT要求反馈的唯一用户是它自己。

教程文章的副本，Auto-GPT承认它使用特定的PCMag文章进行研究，绝对是可怕的。它应该是有关如何自定义Windows11开始菜单的教程，但非常简短的步骤集将“开始”菜单与“开始”11(第三方实用程序)混淆了，假设Windows11开始菜单位于左下角(默认情况下居中)，并错误地指出您可以通过右键单击菜单来移动磁贴。这是我得到的。

免责声明：本文由用户上传，与本网站立场无关。财经信息仅供读者参考，并不构成投资建议。投资者据此操作，风险自担。如有侵权请联系删除！

标签：

上一篇:EarPods将放弃Lightning连接器转而支持USB-C因为Apple为即将推出的iPhone15做准备

下一篇:华硕ROGSwiftPG27AQDMOLED游戏显示器评论它可以变得更好吗