首页 互联网 > 内容

GoogleI/O2024期间最重要的AI公告

时间:2024-05-18 09:25:47 来源:
导读 没有人感到惊讶的是,谷歌在GoogleI/O的第一天宣布了大量人工智能产品。节目现已全部结束,但我们仍然对谷歌发布的令人难以置信的公告感到...

没有人感到惊讶的是,谷歌在GoogleI/O的第一天宣布了大量人工智能产品。节目现已全部结束,但我们仍然对谷歌发布的令人难以置信的公告感到震惊。毫无疑问,2024年对于Gemini来说是重要的一年,而本次公告只是强调了这一事实。那么,GoogleI/O期间最大的人工智能公告是什么?这是一个概要。

在我们开始之前,如果您想了解更多大大小小的公告,那么您应该查看我们的GoogleI/O回顾。它深入探讨了该公司宣布的内容的实质内容。

GoogleI/O2024期间最重要的AI公告

如果我们列出该公司发布的每一个AI公告,那么这篇文章将会很长,您需要在GoogleI/O2025之前阅读它!因此,我们将列出谷歌给我们的最具突破性的公告。这些功能将广泛供人们使用,并对您使用Google产品、提高工作效率或任何组合的方式产生重大影响。

双子座1.5Pro/闪存

从公告开始,谷歌向我们介绍了其最新型号Gemini1.5Pro。这是该公司最先进的模型,并且正在推广到该公司的多种人工智能产品。

Gemini1.5Pro在所有关键领域都对旧版Gemini进行了改进。它的处理速度更快、更智能、功能更强大。最值得注意的是扩展的上下文窗口。Gemini1.5Pro最多可接受100万个代币。这是闻所未闻的,这意味着它可以根据提示吸收更多信息。我们谈论的是一整本书系列的文本、几个小时的音频、一整小时的视频等等。想象一下上传整个播客并获得所讨论内容的简洁摘要。除此之外,谷歌还正在测试Gemini1.5Pro的200万代币版本。

与此同时,Google还发布了Gemini1.5Flash。这基本上是Gemini1.5Pro的精简版。它更快、更紧凑、更高效。尽管如此,它仍然有100万个代币的限制。

Gmail应用程序中的人工智能功能

Gmail是世界上最受欢迎的电子邮件客户端之一,Google通过一些令人惊叹的Gemini集成使其变得更好。首先,Gmail获得了摘要功能。这很简单。如果您收到冗长的电子邮件威胁,并且不想阅读所有电子邮件,则可以使用摘要功能来获取所有电子邮件的简洁且易于阅读的摘要。显然,如果您想查看电子邮件线程的所有详细信息,您可以通读电子邮件。然而,在大多数情况下,您只需要快速总结所有内容即可。

免费用户将会感到失望,因为只有当您是Workspace客户或使用GoogleOneAIPremium订阅时才能使用此功能。

另一个很棒的功能是Gmail问答功能。这将允许您向双子座询问有关电子邮件主题内容的问题。那么,双子座就能为你解答这些问题。如果你们就比较房价进行来回对话,你可以问双子座一些问题,比如“哪位潜在买家给了我最好的报价?”双子座应该能够回答你这个问题。

询问Google照片

目前,谷歌照片拥有一些相当疯狂的人工智能,但这并不意味着该公司无法改进它。有了Gemini,为GooglePhotos提供支持的人工智能现在更加先进。

该公司推出了“询问照片”功能,令人印象深刻。基本上,您可以向双子座询问某些可能与您拍摄的图像和视频有关的广泛问题。谷歌举了一个例子,询问一个孩子这些年来游泳方面的进步如何。Gemini将能够查看您的照片,识别孩子的身份,识别他们游泳的所有照片和视频,并为您提供他们进展情况的时间表。这只是此功能实用性的一个示例。

广告

此选项将固定在Google相册应用的底部栏上。

阿斯特拉计划

这是双子座力量的极其令人印象深刻的展示。在演示过程中,该公司展示了ProjectAstra,这是一款为Gemini提供一双眼睛的工具。谷歌将在某个时间将其实施到Gemini应用程序中。

激活该功能后,您将在应用程序中看到取景器。双子座将能够识别取景器中的内容。在谷歌给出的一个例子中,一位谷歌工程师问双子座,他们办公桌上的哪件物品会发出噪音。然后工程师指着一个扬声器,双子座能够识别出扬声器发出噪音。此外,他们还在屏幕上画了一个箭头,指向扬声器的高音扬声器。在工程师询问那是什么后,Gemini能够识别出这是扬声器的高音扬声器,并描述了它是什么。

广告

这只是一个例子。工程师还能够通过将相机指向室外来让Gemini识别他们的位置。双子座能够识别出他们位于城市的哪个部分。

既然我们谈论的是双子座,你几乎可以问它任何你想问的问题。您可以向它询问有关取景器中的项目的问题,要求它根据它们创建内容等等。

该公司表示,ProjectAstra的部分功能将于今年晚些时候登陆Gemini应用程序。然而,我们不知道这些功能是什么,所以我们必须等待。

图像3

如果您不知道,所有使用Gemini生成的图像都使用Google的专有图像模型Imagen。该公司推出了Imagen3,它最先进的型号。有了它,人们可以制作出更加真实的图像,并添加了精细的细节。因此,如果您热衷于人工智能图像生成,那么这将是一件令人兴奋的事情。它追求照片写实主义,并且实现了这一目标。

广告

维奥

更进一步,谷歌还推出了其视频生成平台。这会让人们想起OpenAI的视频生成平台Sora。Sora能够创建一些非常逼真的视频剪辑。

在GoogleI/O大会上,该公司公布了自己对视频生成的看法。这是一个可以创建极其逼真的视频剪辑的平台。它能够创建超出Sora60秒限制的高质量1080p剪辑。目前,我们不确定何时会向公众公开。然而,当它发生时,我们确信我们将在互联网上看到大量人工智能生成的视频。

Google搜索的视频问题

将此功能视为视频的GoogleLens。您可以将录音发送给Google,并向Gemini询问有关该视频的问题。问题可以是关于其中的任何内容。双子座将能够识别视频中发生的情况并据此回答问题。

谷歌在GoogleI/O期间举了一个例子,演示者根据损坏的转盘的视频向谷歌提出了一个问题。双子座能够识别出转盘的哪个部分损坏了,并为她提供了如何修复它的信息。此功能符合Google最初的愿景,即让Gemini跨文本、音频、视频和图像进行推理。

这个功能的可能性是无限的,它将使那些无法完全输入问题的人更容易使用谷歌。

宝石

这项新功能是定制您的Gemini体验的好方法。Gem是Gemini的个性化版本,您可以出于非常具体的原因使用它。例如,如果您想创建专门用于创建故事的Gemini定制版本,您可以为此创建一个gem。

在Gem创建者中,您可以描述您想要创建哪种类型的聊天机器人。您可以输入类似“故事创作者,创作具有神秘人物和曲折情节的故事”之类的内容。当您这样做时,Gemini将开始为该聊天机器人创建指令集。

不仅如此,您还可以让Gemini在其他Google产品中访问您的文件。例如,如果您允许Gemini访问您的Google文档,并且您有故事的故事草稿,Gemini将能够通读这些草稿,以便了解您希望它写什么样的故事。

您可以创建多个宝石,因此您可以出于不同的原因使用它们。该功能将于今年晚些时候推出。

Gemini驱动的诈骗电话检测器

如果您想保护自己免遭诈骗,那么这是一个很棒的功能。我们都习惯在接到电话后收到诈骗通知。不过,有些电话确实会接通,如果是诈骗,Google将能够在通话过程中向您发出警告。

双子座将能够监听您的电话,并确定打电话给您的人是否试图以某种方式欺骗您。例如,如果您接到银行电话,银行要求您将钱转入安全帐户(银行永远不会这样做),Gemini将能够标记该电话并告诉您这可能是一个。

这样做的巧妙之处在于所有处理都在设备上进行。因此,您不必担心Google监听您的谈话。所有数据仍然存储在您的设备本地。

笔记本LM升级

NotebookLM是一种帮助孩子学习和研究的教育工具。它是在2023年GoogleI/O大会期间宣布的。现在,NotebookLM正在进行相当大的更新。

此功能称为音频概述。它将通读您加载的材料,并围绕它提出教育性讨论。教育讨论将以播客形式进行,由两个人交谈。它将模拟真实的对话,以便孩子们可以更好地与之联系。

不仅如此,您还可以对讨论提出更改建议,Gemini将实时进行更改。例如,如果您创建有关木星卫星的讨论,但您想要更改它以使其使用篮球类比,则可以键入该讨论。之后,双子座将重建教育讨论以适应这一点。

Workspace应用程序之间更紧密的集成

目前,Google的Workspace应用程序(如文档、表格、幻灯片、Gmail等)可以相互集成。然而,谷歌正在加强这种整合,而Gemini则是用来加强这种整合的虎钳。您将能够要求Gemini对您的工作区中的文件执行某些操作。

例如,如果您希望Gemini查看您的电子邮件、查看您已完成的服务的发票,并将该发票中的信息粘贴到Google文档中,您就可以做到这一点。这只是这种紧密集成的一个例子。

标签:
最新文章