技术

Gemini Live升级:直观的相机引导,自然语音

国阳 August 21, 2025 14:00

谷歌宣布对 Gemini Live 进行升级,带来更直观的摄像头引导、更自然的语音以及与谷歌应用更深层次的连接。

从 Pixel 9 到 Pixel 10:Gemini Live 更智能

Gemini Live 最初随 Pixel 9 一同亮相,利用人工智能提供自然流畅的对话体验。一年后,谷歌扩展了支持的语言和国家/地区,并集成了摄像头和屏幕,让 Gemini 可以与你一起“看”世界。

geminilivembg_hero.width-1200.format-webp.jpg

现在,随着 Pixel 10 的推出,Gemini Live 已升级为一款功能全面的 AI 助手,它更加直观、更具表现力,并且与许多 Google 应用紧密集成。

屏幕上的可视化助手

在共享摄像头时,Gemini 不仅会查看画面,还会直接在屏幕上高亮显示,为您进行指导。

例如,如果您在挑选运动鞋时遇到困难,Gemini 可以帮您找到与您描述的服装搭配的那双。或者,如果您在工具箱里寻找某种工具,Gemini 也能直接帮您找到所需的那一个。

该功能将于 8 月 28 日起在 Pixel 10 上推出,然后在接下来的几周内扩展到其他 Android 和 iOS 设备。

连接更多 Google 应用

Gemini Live 现在可以在对话中直接管理日历、提醒事项、笔记和购物:

与谷歌日历同步,方便您安排日程。

在 Google Keep 中创建购物清单。

在 Google Tasks 中设置提醒。

未来,Gemini 将与“信息”、“电话”、“时钟”等应用进行更深入的整合,并扩展其在谷歌地图中的功能。例如,在询问火车路线后,您可以让 Gemini 向您的朋友发送短信,告知您“晚点 10 分钟”,而无需中断您的旅程。

声音更加自然、富有表现力

Gemini Live 已更新,采用全新语音模型,改进了语调、节奏和音高,带来自然逼真的真人对话体验。用户可以:

请双子座说话慢点以便记笔记,或者在赶时间的时候说快点。

您可以随意改变自己的声音,或者用尤利乌斯·凯撒的声音讲述罗马帝国的故事,创造生动的叙事体验。

说话时要使用更恰当的情绪,例如,在讨论压力大的话题时,要用平静的语气。

Gemini Live 旨在打造一款全面的人工智能助手

这些升级使 Gemini 更接近其成为日常个人 AI 助手的愿景:了解你周围的世界,帮助你完成事情,并与你一起探索新的想法。

国阳