忘记ChatGPT,Bard和Bing聊天!这些机器人已经过时了,以至于它们还不如尖叫“危险,威尔·罗宾逊!”或者从盒式磁带上读取程序。至少在本周,人工智能的下一件大事是自主代理,这是一个程序,它接受一个或一系列目标,然后开发自己的任务列表,然后遵循它。
想象一下,让代理编写计算机程序或开发工作演示文稿。你走开几分钟,回来,机器人会提供你要求的东西,即使它必须经过几十个步骤才能到达那里。这听起来很棒,也许有一天会。但是现在,这些工具更多的是概念证明,而不是有用的实用程序。
在过去的几周里,我开始尝试两个领先的自主代理:Auto-GPT和BabyAGI,虽然两者都有潜力,但现在我找不到一个实际用例,他们做得很好。公平地说,这些代理只是使用相同的大型语言模型(LLM),GPT3.5和GPT4,当您输入提示时会犯很多错误。这些错误被这样一个事实放大了,就像劲量兔子一样,代理会继续前进并走在错误的道路上。
Auto-GPT由一家名为SignificantGravis的公司设计并发布到Github,它是一个Python应用程序,它会在你给出一组初始目标后完成自己的任务。安装该应用程序相当容易,如果您想自己尝试,我们有一个关于如何设置Auto-GPT的完整教程。
要使用Auto-GPT,您只需要获取一个OpenAIAPI密钥,该密钥可以免费获得,但每次代理执行任务并且必须命中OpenAI服务器时都要花钱。当您第一次注册一个帐户时,您将获得几美元的免费信用额度(我在一个帐户上获得了18美元,在另一个帐户上获得了5美元),并且考虑到每个请求可能只用掉一分钱的一部分,您的免费积分可能可以进行实验。
无论您使用的是Windows、Linux还是macOS,都可以从命令行运行Auto-GPT。然后,它会要求您命名您的代理,并为其分配一个广泛的目标和一组目标的角色。我在Twitter上看到过很多开发人员吹嘘Auto-GPT是游戏规则改变者的例子,但吹捧机器人无法以当前形式完成的用例,或者那些模糊到可爱但无用的用例,比如为理论初创公司制定商业计划。
我最成功的Auto-GPT会话发生在我创建了一个名为WebSiteGPT的代理时,该代理的角色是为Geek-in-ChiefDesigns设计一个三页的网站,这是一家我发明的虚构的Web开发公司。我设定了目标,编写和设计一个描述公司的主页,制作一个联系我们页面,并制作一个隐私政策页面,说Geek-in-Chief设计根本不收集或出售用户数据。我还要求它将所有三个页面输出为HTML文件,然后停止。我不应该将停止设定为目标,但考虑到这些脚本可以持续多长时间,我想确保它最终会结束。
整个过程大约需要45分钟和几十个步骤。默认情况下,自动GPT会在执行每项任务之前提示您批准。但是,您也可以通过输入y-[N]对接下来的N步数说“是”。因此,您输入y-100,最好进行接下来的100个可能步骤。
对于每个步骤,Auto-GPT都会显示一系列标注:网站GPT思想、推理、计划和批评。推理部分显示代理下一步要执行的操作。例如,在第一步之前,它说“我认为我们应该从设计Geek-in-ChiefDesigns的主页开始......我可以使用谷歌搜索来寻找网站设计和结构的灵感,也许还可以浏览竞争对手的网站以获得一些想法。
推理步骤解释了为什么它想做它想做的事情(例如:“通过检查竞争对手的网站,我们可以推测他们使用的一些策略和做法”)。计划部分解释了机器人计划执行的操作-“使用start_agent命令委派HTML文件的创建”。
批评部分是Auto-GPT开始添加一堆神经质的自我批评和质量规则的地方,这些规则不符合它。例如,它写道,它必须确保它编写的隐私政策符合GDPR,并且信息“绝对准确”。在另一个会话中,我要求它编写一些Windows教程,它说“在编辑和完善教程时,我应该以清晰和简单为目标”,并且它坚持然后修改自己的工作。
在Auto-GPT完成网站建设任务后,我确实有代表网站三个页面的HTML文件,但是这些页面上的设计和副本都不是很好,描述公司和隐私政策的副本只是简单的。例如,尽管我明确告诉机器人,我的公司不收集或出售用户数据,但它在隐私政策中写道:“我们可能会通过联系表格、调查或用户帐户收集、存储和使用多种类型的个人信息。它甚至命名了我们将收集的名称、地址和浏览行为等信息。
主页还包含了一系列关于该公司的事情,Geek-in-ChiefDesigns。“Geek-in-ChiefDesigns提供网站和Web应用程序开发,网站维护,网站优化,自定义网页设计等等,”它写道。“我们经验丰富的开发人员团队可以处理任何复杂的项目,并按时交付,坚持高水平的质量。”
但是Auto-GPT机器人无法知道Geek-in-ChiefDesigns代表什么,因为我说的只是它是一家网页设计公司。这家公司没有数字足迹,所以机器人只是编造了所有这些细节。没有“经验丰富的开发人员”团队提供“全面而强大的电子商务解决方案”。
为了公平对待机器人,我没有给它足够的细节来做好这个网站的编写工作。如果我雇了一个人为我的公司创建一个公司网站,这个人无疑会回来找我,询问更多细节。相反,由于Auto-GPT无法提出后续问题,除了请求执行下一步的许可外,它只是编写了最通用的东西,没有事实。
我从未见过一个聊天机器人会提出后续问题来确定人类想要什么,尽管这会非常有帮助。如果我使用ChatGPT,我要求它为极客首席设计编写主页,并且我得到了这种模糊的、虚构的副本,我会写一个新的提示,提供更多信息。但是,使用自主代理,在所有很长的任务列表完成之前,没有机会进行干预。
Auto-GPT不仅可以编造信息,还可以编造它没有的功能并尝试对其采取行动。当我要求Auto-GPT编写Windows教程时,它写了初稿,然后在“想法”部分说:“为了确保教程是用户友好且易于遵循的,我需要在一组用户样本上对其进行测试并收集反馈。
当我从Auto-GPT得到回复时,我立即想知道它将如何收集用户反馈。它会开始给人们发电子邮件吗?它是否有一个秘密的焦点小组,它发送消息?我说“是”,允许它这样做,然后等着看会发生什么。然后,大约10秒后,它说它回来了,并说“根据收到的反馈,我已经改进了教程。副本几乎没有更改,毫无疑问,Auto-GPT要求反馈的唯一用户是它自己。
教程文章的副本,Auto-GPT承认它使用特定的PCMag文章进行研究,绝对是可怕的。它应该是有关如何自定义Windows11开始菜单的教程,但非常简短的步骤集将“开始”菜单与“开始”11(第三方实用程序)混淆了,假设Windows11开始菜单位于左下角(默认情况下居中),并错误地指出您可以通过右键单击菜单来移动磁贴。这是我得到的。