Meta推出了一款名为“Voicebox”的新人工智能工具,声称该工具代表了人工智能驱动的语音生成领域的突破。然而,该公司目前还不会向公众公开它,因为这样做可能会带来灾难性的后果。
Voicebox目前能够生成六种语言的语音音频片段(所有这些语言都源自欧洲),并且根据Meta的一篇博客文章,它是同类中第一个能够完成超出其范围的任务的人工智能模型。经过专门训练来完成“。Meta声称,Voicebox几乎在每个领域都轻松胜过竞争对手的语音生成人工智能。
那么它到底有什么能力呢?好吧,对于初学者来说,它可以使用短至两秒的样本音频文件,输出相当准确的文本到语音复制,这种能力看似无害,但如果落入坏人之手,就会产生巨大的破坏性潜力。
人工智能的可疑力量
即使抛开互联网上利用ChatGPT和其他AI工具所做的狡猾的事情(Voicebox听起来确实对任何制作虚假复仇色情内容的人来说都是一个福音),这种技术实际上可以启动一个战争。
毕竟,大多数主要公众人物,包括政客,都有大量的录音在互联网上流传。整理现任政治领导人的一些演讲片段并使用Voicebox制作出他们声音的惊人逼真的复制品并不困难-然后可以将其用于邪恶目的。
马克·扎克伯格
当然,这样的工具已经存在,但它们不太令人信服。您可能在社交媒体上看过有趣的视频,其中乔·、唐纳德·特朗普和巴拉克·奥巴马等人据说一起玩《堡垒之夜》。笑起来很好,但音频很难令人信服。它模仿了每位总统游戏玩家的举止,足以让他们辨认出来,但又没有模仿得那么好,以至于任何有头脑的人都不会相信这是他们。
不过,Meta显然相信它的新工具至少足以愚弄大多数人,因为它明确不会向公众发布Voicebox,而是发表了一篇研究论文,并详细介绍了一个分类器工具,该工具可以识别Voicebox生成的语音与真实语音人类的言语。Meta将分类器描述为“非常有效”——尽管并非完全有效。
发声机
当然,虽然Meta热衷于强调它认识到Voicebox等工具的“潜在的误用和意外伤害”,但重要的是不要忽视人工智能语音生成在未来可能带来的潜在好处。
Voicebox——名副其实——可以为静音或无法交流的人提供更加自然的语音,消除由物理学家史蒂芬·霍金闻名的现有文本到语音“机器人声音”造成的一些交互障碍。它还可以进行实时翻译,让我们离目前只存在于科幻小说中的“万能翻译器”设备又近了一步。
还有其他应用程序;更小,但同样有用。Meta在其博客文章中解释说,Voicebox可用于编辑和改进录制的语音。如果您录制了一些音频,但发音错误或被背景噪音打断,Voicebox可以隔离有问题的片段并使用您的声音“重新录制”一段语音片段。令人印象深刻,而且只是有点可怕。
无论如何,很高兴看到Meta在这里采取了认真、深思熟虑的方法。微软疯狂地渴望将BingAI推向一切,这已经不止一次让它陷入困境,而OpenAI向世界推出ChatGPT则在过去的一年里引发了各种奇怪的事情。我们正处于人工智能淘金热之中,这些工具正在进入我们生活的方方面面。
对这项技术的重要性有一点谨慎、耐心和尊重是值得欢迎的——尽管我怀疑Meta会在Voicebox上呆太久,因为股东们无疑会想知道它能为他们赚多少钱……