谷歌I/O 2025开发者大会：AI生态新时代，Gemini引领模型即平台革命

发布时间：2025-05-21 19:51 来源：华尔街见闻作者：华尔街见闻

在科技巨头纷纷押注人工智能（AI）的浪潮中，谷歌于近日举办的2025年度I/O开发者大会上，宣布了其AI战略的重大推进。谷歌不仅展示了AI技术的全面革新，还揭示了AI如何深度融入其核心业务，特别是搜索服务与AI助手Gemini，标志着AI技术从信息检索工具向通用智能体的跨越。

大会上，谷歌CEO桑达尔·皮查伊（Sundar Pichai）强调了Gemini模型的核心地位，称其为“迄今为止我们最强大的通用AI模型”。Gemini 2.5 Pro的发布，伴随着一系列技术突破和应用创新，彰显了谷歌在AI领域的加速布局。据皮查伊透露，自上次I/O大会以来，谷歌已推出十多款模型和20项AI功能，发货速度创历史新高。

在AI Studio的重大更新中，谷歌引入了URL Context功能，使模型能够从多个链接中提取上下文信息，增强了函数调用与搜索推理能力。新实验项目Stitch能够通过文本提示自动生成App UI设计，并即时转化为代码，极大地降低了开发门槛。这一创新不仅限于静态设计，而是可编辑的真实界面，可直接导出至Figma或IDE中继续开发。

谷歌还展示了Keynote Companion——一个由Gemini构建的虚拟形象“Casey”，它能监听关键词并实时更新UI，与地图整合，通过语音指令展示地点、寻找Wi-Fi咖啡馆并提供导航服务。Casey支持异步函数调用，实现了更自然的多轮对话体验，展现了AI在会议主持和辅助方面的潜力。

在Android平台，谷歌推出了Androidify应用，用户可通过自拍图像结合Gemini模型描述人物特征，生成可爱的Android机器人形象。同时，利用Gemini的多模态能力（文本+图像）与Imagine 3模型，实现了图像生成的新突破。云端处理适合高性能任务，而设备端则使用Gemini Nano提供轻量级功能，如摘要和重写。新UI系统Material 3 Expressive增强了界面的趣味性，如“饼干”形状按钮，为用户带来全新体验。

谷歌宣布将在Chrome浏览器、搜索以及Gemini App中推出智能体模式（Agent Mode）。智能体可以与浏览器和其他软件进行交互，谷歌研究的AI智能体Mariner现在能够同时管理多达10个任务，用户只需展示一次任务，它就会学习并用于未来案例。皮查伊现场演示了Gemini App中的智能体模式，通过语音指令帮助用户找公寓，展示了AI在日常生活中的应用。

谷歌还发布了名为Google Beam的新产品，这是一个AI驱动的视频通信平台，利用六个摄像头阵列捕捉拍摄对象，AI视频模型实时拼接视图，渲染成类似3D的画面，创造3D人物。该系统拥有毫米级精度的头部追踪技术，以每秒60帧的速度实时渲染，为用户带来面对面的视频聊天体验。

在AI翻译方面，Gemini 2.5 Pro即将实现实时翻译功能。谷歌高层现场演示了从英语到印地语的实时翻译，展示了AI在跨语言沟通方面的能力。同时，Gemini 2.5 Pro还具备针对提示注入等网络攻击的保护措施，提高了AI的安全性。

谷歌的AI战略不仅限于技术和产品创新，还包括商业化的推进。谷歌与惠普合作，将Google Beam系统商业化，预计今年晚些时候推出首批设备。谷歌还展示了Android XR智能眼镜和头显Moohan，支持沉浸式地图、视频播放和交互式Gemini AI等功能，为用户带来全新的AR/VR体验。

谷歌的AI之旅正步入一个充满无限可能的新时代，从个人助手到企业级应用，从信息检索到通用智能体，AI正深刻改变着我们的生活方式和工作方式。谷歌作为这一变革的引领者，正以其强大的技术实力和创新能力，推动AI技术不断向前发展。

更多>同类内容