谷歌I/O 2025开发者大会:AI生态新时代,Gemini引领模型即平台革命

   发布时间:2025-05-21 19:51 作者:华尔街见闻

在科技巨头纷纷押注人工智能(AI)的浪潮中,谷歌于近日举办的2025年度I/O开发者大会上,宣布了其AI战略的重大推进。谷歌不仅展示了AI技术的全面革新,还揭示了AI如何深度融入其核心业务,特别是搜索服务与AI助手Gemini,标志着AI技术从信息检索工具向通用智能体的跨越。

大会上,谷歌CEO桑达尔·皮查伊(Sundar Pichai)强调了Gemini模型的核心地位,称其为“迄今为止我们最强大的通用AI模型”。Gemini 2.5 Pro的发布,伴随着一系列技术突破和应用创新,彰显了谷歌在AI领域的加速布局。据皮查伊透露,自上次I/O大会以来,谷歌已推出十多款模型和20项AI功能,发货速度创历史新高。

在AI Studio的重大更新中,谷歌引入了URL Context功能,使模型能够从多个链接中提取上下文信息,增强了函数调用与搜索推理能力。新实验项目Stitch能够通过文本提示自动生成App UI设计,并即时转化为代码,极大地降低了开发门槛。这一创新不仅限于静态设计,而是可编辑的真实界面,可直接导出至Figma或IDE中继续开发。

谷歌还展示了Keynote Companion——一个由Gemini构建的虚拟形象“Casey”,它能监听关键词并实时更新UI,与地图整合,通过语音指令展示地点、寻找Wi-Fi咖啡馆并提供导航服务。Casey支持异步函数调用,实现了更自然的多轮对话体验,展现了AI在会议主持和辅助方面的潜力。

在Android平台,谷歌推出了Androidify应用,用户可通过自拍图像结合Gemini模型描述人物特征,生成可爱的Android机器人形象。同时,利用Gemini的多模态能力(文本+图像)与Imagine 3模型,实现了图像生成的新突破。云端处理适合高性能任务,而设备端则使用Gemini Nano提供轻量级功能,如摘要和重写。新UI系统Material 3 Expressive增强了界面的趣味性,如“饼干”形状按钮,为用户带来全新体验。

谷歌宣布将在Chrome浏览器、搜索以及Gemini App中推出智能体模式(Agent Mode)。智能体可以与浏览器和其他软件进行交互,谷歌研究的AI智能体Mariner现在能够同时管理多达10个任务,用户只需展示一次任务,它就会学习并用于未来案例。皮查伊现场演示了Gemini App中的智能体模式,通过语音指令帮助用户找公寓,展示了AI在日常生活中的应用。

谷歌还发布了名为Google Beam的新产品,这是一个AI驱动的视频通信平台,利用六个摄像头阵列捕捉拍摄对象,AI视频模型实时拼接视图,渲染成类似3D的画面,创造3D人物。该系统拥有毫米级精度的头部追踪技术,以每秒60帧的速度实时渲染,为用户带来面对面的视频聊天体验。

在AI翻译方面,Gemini 2.5 Pro即将实现实时翻译功能。谷歌高层现场演示了从英语到印地语的实时翻译,展示了AI在跨语言沟通方面的能力。同时,Gemini 2.5 Pro还具备针对提示注入等网络攻击的保护措施,提高了AI的安全性。

谷歌的AI战略不仅限于技术和产品创新,还包括商业化的推进。谷歌与惠普合作,将Google Beam系统商业化,预计今年晚些时候推出首批设备。谷歌还展示了Android XR智能眼镜和头显Moohan,支持沉浸式地图、视频播放和交互式Gemini AI等功能,为用户带来全新的AR/VR体验。

谷歌的AI之旅正步入一个充满无限可能的新时代,从个人助手到企业级应用,从信息检索到通用智能体,AI正深刻改变着我们的生活方式和工作方式。谷歌作为这一变革的引领者,正以其强大的技术实力和创新能力,推动AI技术不断向前发展。

 
 
更多>同类内容
全站最新
热门内容
本栏最新