导读 OpenAI的GPT-4已成为第一个通过图灵测试的AI。至少,这是一组研究人员在一项新研究中声称的。这项研究目前可在预印本服务器arXiv上找到,尚...
OpenAI的GPT-4已成为第一个通过图灵测试的AI。至少,这是一组研究人员在一项新研究中声称的。这项研究目前可在预印本服务器arXiv上找到,尚未经过同行评审。不过,这里的结果至少可以说很有趣。
图灵测试由艾伦·图灵于1950年首次提出,旨在判断机器是否能够表现出足够好的智能,使其与人类难以区分。人工智能要想通过图灵测试,必须能够与某人交谈,并欺骗他们以为自己在与人交谈。
为了检验GPT-4能否通过图灵测试,参与该论文的研究人员要求500人与四个不同的受访者交谈。其中一位受访者是人类,另一位是20世纪60年代的人工智能ELIZA,最后两位受访者分别由GPT-3.5和GPT-4提供支持。
每次对话总共持续五分钟。根据这篇于5月发表的论文,参与者将GPT-4判断为人类的概率高达54%。正因如此,研究人员声称大型语言模型确实通过了图灵测试。
另一方面,人类参与者的得分为67%,而GPT-3.5的得分为50%,而ELIZA的得分是22%,因为ELIZA是预先设定了响应,并且没有LLM来支持它,所以只有22%的时间被判定为是人类。因此,GPT-4的图灵测试结果很有趣。
当然,很多人担心图灵测试是否过于简单。它旨在确定机器的智能。然而,在欺骗人类让他们认为自己正在与另一个人交谈方面,原始智力并没有发挥那么大的作用。
相反,人工智能必须能够模仿人类在互动过程中依赖的社会情感因素。当然,这一消息可能会引发人们对人工智能危险性的更多担忧,甚至连人工智能教父都对此表示担忧。
最终,这项研究和GPT-4的图灵测试结果突显了人工智能在GPT时代发生了多大的变化,以及人类如何接近人工智能。