谷歌将其Gemini Nano AI模型集成到Chrome桌面版中

在周二举行的Google I/O 2024开发者大会上,谷歌宣布正在将其最小的AI模型Gemini Nano直接集成到Chrome桌面客户端中,从Chrome 126版本开始。

公司表示,这将使开发人员可以利用设备端模型来提升其自己的AI功能。例如,谷歌计划利用这一新功能来为Gmail中的现有“帮我写”工具提供动力,这个功能来自Workspace实验室。

公司表示,最近在Chrome中对WebGPU和WASM支持的工作使这些模型能够在各种硬件设备上以合理的速度运行。

在周二宣布之前的简报会上,谷歌Chrome产品管理总监Jon Dahlke指出,谷歌正在与其他浏览器供应商进行讨论,以在其浏览器中启用这一功能,或类似功能。

“我们已经开始与其他浏览器进行接触,并将为开发人员开放早期预览计划,” Dahlke在周二的声明中写道。“有了webGPU,WASM和Gemini集成到Chrome,我们相信Web已经准备好迎接AI。“

然而,我怀疑大多数Chrome竞争对手不会只想要使用谷歌的AI模型。更明智的做法是让浏览器 - 以及开发人员 - 能够选择运行他们选择的模型。谷歌显然会选择在其应用程序中运行Gemini,但这些模型足够小,可以让开发人员为其应用程序选择任何他们想要的模型。

然而,谷歌的赌注是在Chrome中启用一些高级API,使用其Gemini模型来翻译,标题和转录浏览器中的文本。

“为了提供此功能,我们调整了我们最高效的Gemini版本并优化了Chrome,” Dahlke在今天I/O开发者主题演讲中说。“现在我们希望给您在Chrome中访问Gemini模型的能力。我们的愿景是为您在Chrome中提供最强大的AI模型,以便触达数十亿用户,而无需担心提示工程,调优,容量和成本。您所需要做的就是调用几个高级API - 翻译,标题,转录。这对于网络是一个重大改变,我们希望能够做到。”

对于开发人员,谷歌现在也使用内置的Gemini Nano模型来为Chrome DevTools控制台中的一些新功能提供动力。由于这个原因,Chrome开发工具现在可以在控制台中解释错误并提供调试解决方案。

我们将推出一份人工智能新闻简报!点击此处注册,从6月5日开始在您的收件箱中接收。