Google I/O 2026:被迫务实的一届
谷歌赢回了叙事,但还没赢回信任
5 月 19 日,加州山景城的 Shoreline 露天剧场,皮查伊站在台上没有再提”通用人工智能就在地平线上”。他说的是这样一句话:
“我们正处在 AI 周期中,人们想要在日常产品里看到价值的阶段。”
这句话其实定义了整届大会的基调。和过去两年那种高谈 AGI、把每场发布会都讲成”人类文明转折点”的谷歌相比,这是一种明显的收敛。原因不复杂——OpenAI 在三个月前发了 GPT-5.5,Anthropic 一个月前发了 Claude Opus 4.7,字节的视频生成模型在国际榜单上把谷歌按在地上摩擦了好几个月,苹果也在为下一代 Siri 谈合作。
谷歌不能再讲故事了,它必须发货。
这是一届被迫务实的大会。皮查伊把它定义为”智能体化的 Gemini 时代”开端,但更准确的描述应该是:谷歌终于承认自己是个产品公司,而不是研究机构。
下面把这次发布会的核心内容掰开来讲一遍——什么是真东西,什么只是 PPT,谷歌赢在哪里,输在哪里,以及对不同的人意味着什么。
一、Gemini 3.5 Flash,但”便宜”叙事崩了
主会场最实在的发布是 Gemini 3.5 Flash 模型当天上线。
价格
token 1.5 美元,输出 9 美元。上下文窗口 100 万 token。在多项面向智能体和编程任务的评测里,这一代 Flash 击败了自家上一代的 Pro,而且输出速度快了大约 4 倍。听起来很猛。但这里有一个被海外开发者社区第一时间挑出来的问题:Flash 不再便宜了。
历史上,谷歌的 Flash 系列和 Pro 系列价差通常在 10 倍以上,定位就是”够用、便宜、快”。这一代把价差收窄到 3 倍,等于把”便宜款”整体上移到了”中端”价位带。横向对比
.5 输入 5 美元、输出 30 美元;Claude Opus 4.7 输入 5 美元、输出 25 美元。Flash 仍然有性价比优势,但已经不是”碾压式便宜”,而是”用速度换价格”。更需要泼冷水的是,在最硬的题目上,Gemini 3.5 Flash 没能赢。在涉及真实代码库改写、复杂数学、抽象推理的几个权威评测里,Opus 4.7 和 GPT-5.5 仍然小幅领先。皮查伊在台上口头预告”下个月会发 Gemini 3.5 Pro”——本身就说明这次大会在模型层面其实是半场发布。
还有一个文档里写得很小声、但开发者会被坑的细节
3.5 Flash 的接口不支持”电脑操作”功能,如果要做浏览器或桌面自动化,你被迫去用上一代的预览版模型。这是非常典型的谷歌式体验断层。评价
,不是 PPT。在高并发、需要工具调用、多模态理解的工作负载里,Gemini 3.5 Flash 是当下”性价比 + 速度”最强的组合。但如果你的业务在乎严格推理、长时间任务的稳定性、真实大型代码库的改写,Opus 4.7 仍然是更稳的选择。没有任何一个模型现在是绝对赢家。二、Gemini Spark ChatGPT Agent 的反击,但”几周后”才上线
如果说 Gemini 3.5 Flash 是这届大会的发动机,那 Gemini Spark 就是它装上的车。
Spark 是一个全天候跑在谷歌云上的个人智能体。你不用挂着手机或电脑,它在云端的虚拟机里自己干活。默认接通 Gmail、日历、Drive、文档、表格、幻灯片、YouTube、地图;通过开放协议还接了 Canva、OpenTable、Instacart 等第三方服务。
它有三种触发模式
、可被”教会”的技能、定时或事件触发的自动化。你甚至可以给它专门开一个 Gmail 邮箱,直接发邮件派活。跟 OpenAI、Anthropic、微软的同类产品相比,Spark 有一个结构性优势:它本就坐在谷歌自家应用上,不需要靠”识别屏幕”来操作软件,直接走应用接口。这意味着稳定性高很多,但代价是出了谷歌的围墙就立刻退化——它只能在已经接通的应用里干活。
听起来不错,但有两个问题。
问题一,落地节奏一如既往慢。发布当天只对”受信任测试者”开放,下周才轮到顶级订阅用户的测试版,普通用户得等几周到几个月。桌面版、本地文件操作、邮件短信和浏览器操控——“今年夏天”。
问题二,谷歌自己的话术经不起推敲。官方反复强调 Spark 是”自主的,但完全在你的掌控之下”。这话在管理学语境里早就是个老笑话
AI 或者管人的领导都希望下属能独立完成所有事,又最好完全按自己的预期来做。这两件事在物理上不能同时成立,谷歌也没成立。评价
的产品方向是对的,谷歌也有 OpenAI 和 Anthropic 都没有的结构性优势——9 亿月活的 Gemini 应用、24 亿 Workspace 用户。但”对的方向”不等于”能交付”。等真实可用版本铺到普通用户手里之后再评估。三、Gemini Omni,但有最大的播放入口
视频生成模型 Gemini Omni 是这届的另一个重头戏。
定位是”从任何输入生成任何东西”,起步是视频。文字、图片、视频、音频可以混合输入,单次推理,后续可以对话式编辑。
第一款 Omni Flash 当天起对订阅用户开放,集成进 Gemini 应用、谷歌自家的视频工具 Flow、YouTube Shorts 的混剪功能和 YouTube Create。接口将在”未来几周”开放给开发者。每段输出限制 10 秒——官方说这是部署考虑,不是模型上限。
谷歌还特别强调
Omni 输出都打了不可见水印,可以在 Gemini 应用、Chrome、谷歌搜索里验证。OpenAI、ElevenLabs、韩国 Kakao 已经加入这个水印标准。这件事其实是这届大会里少数让人觉得谷歌在做”全行业基础设施”而不仅是自家产品的事。但纯生成质量上,Omni 仍然落后字节的 Seedance 2.0 和快手的可灵 3.0。字节的视频模型在国际视频生成榜单上长期占据第一,Omni 的产品演示视频很漂亮,但独立横评一致认为质量上不是第一梯队。
谷歌的杀手锏不是质量,是入口。Omni 直接进 YouTube Shorts、Flow、Gemini 应用、谷歌搜索——几亿用户的播放入口体量,是中国玩家短期内不可能匹配的。
评价
”分发吃质量”的典型谷歌打法。如果你做内容创作,Omni 不会让你做出最好看的 AI 视频,但会让你的视频最快被分发出去。四、搜索的最大改版,开放网络的崩塌
如果让我只挑一件这届大会真正改变全球互联网生态的事,毫无疑问是搜索。
皮查伊自己称之为”搜索 25 年来最大的一次升级”。AI 模式上线一年,月活已经 10 亿;搜索结果顶部的 AI 摘要月活 25 亿。这次发布的东西大致有四件:
第一,搜索框本身被重新设计。框体动态扩展,支持文字、图片、文件、视频、浏览器标签页混合输入。
第二,顶部 AI 摘要和完整对话模式打通。看到摘要可以一键续上完整对话,上下文继承。
第三,“信息智能体”上线。用户可以在搜索里创建多个后台智能体,全天候盯着网络。比如帮你追租房列表、限量球鞋发售、行业新闻。
第四,生成式界面。复杂问题搜索结果不再是网页列表,而是实时生成的小应用。一个被反复演示的例子
”黑洞如何影响时空”,搜索结果直接渲染出一个可以拖动的 3D 时空模型。这一切对谷歌自己是良性循环——用户在谷歌内部就把事办完了,购物、信息、决策、行动全在 Gemini 体系里发生。配套的还有”统一购物车”——你在谷歌搜索、Gemini、YouTube、Gmail 里发现的所有商品共用一个购物车,Nike、Sephora、Target、沃尔玛、Shopify 商家都已经接入。
但对外部网络,这是一次系统性抽血。
有几组比较硬的数据。一家国际 SEO 工具公司用 30 万关键词和搜索后台数据做的研究:触发顶部 AI 摘要的查询,排名第一的链接点击率从 2023 年 12 月的 7.3% 跌到 2025 年 12 月的 1.6%,下降约 58%。印度商学院和卡内基梅隆大学的两位研究者在今年一二月做的随机化田野实验也得出类似结论:1065 名美国用户中,触发 AI 摘要的查询出站点击下降 38%,完全不点击就离开的比例从 54% 升至 72%。
The Verge 的编辑写得最直白:“谷歌想替你做完所有事,只用一个搜索框……但谷歌做完所有事,也意味着它赖以生存的网络在它自己脚下坍塌。如果搜索不再给出版商导流……搜索本身又能从哪里学到东西?”
这是一个内嵌矛盾:谷歌的 AI 越强,它能引用的外部知识源就越枯竭。
监管层面,欧盟数字市场法案已经要求谷歌在 7 月 27 日合规期之前与竞争对手分享匿名化搜索数据。美国这边,Penske 媒体集团二月已经提交了联邦反垄断诉讼,直接指控谷歌”蚕食”出版商流量。这是少数可能对抗这一刀的力量。
评价
、也最危险的发布。重要,因为它从根本上改变了普通人和信息打交道的方式;危险,因为它正在结构性地破坏自己赖以为生的生态。如果你做内容、做媒体、做 SEO 相关业务,这件事的优先级远在 Spark 之上。五、安卓 17 和”Gemini 智能” AI
安卓 17 的主要内容其实在 5 月 12 日提前一周的”安卓秀”上讲完了,主会场没怎么碰。安卓被重新定义为”智能系统,不是操作系统”。
跟苹果”Apple Intelligence”对应的叙事叫”Gemini 智能”。核心能力四件
、自然语言生成可交互组件、清理填充词的语音输入、跨应用自动填表。举个被反复演示的例子
,Gemini 自动找书、打开购物应用、填好购物车、等你确认。硬件门槛挺高
、12GB 内存、旗舰处理器。首批支持的设备是三星 Galaxy Z Fold 8、Galaxy S26、Pixel 10。Pixel 9 不支持。这里有一个对苹果不太友好的事实:Gemini 智能在演示视频里已经领先 Apple Intelligence 至少一代。苹果 2024 年承诺的”主动 Siri + 应用意图”到现在还是半成品。所以在大会前一个月,谷歌云的负责人在另一场发布会上官宣:
“我们正在和苹果合作,作为他们的首选云供应商,基于 Gemini 技术为苹果开发下一代基础模型。这些模型会驱动未来的 Apple Intelligence 功能,包括今年晚些时候推出的更个性化的 Siri。”
这是 AI 时代最重要的一件事
”嵌入”了苹果的核心产品 Siri。短期内苹果保持品牌主导,但长期看,苹果在这个时代没能自己造出一个有竞争力的 AI 模型,这是一个时间窗口的关键性丧失。谷歌自己呢?它有信用问题。Pixel 10 上的”魔法暗示”功能当初被宣传成”情境 AI 的开端”,结果大多数 Pixel 10 用户根本没意识到这功能存在。Gemini 智能会不会成为下一个”魔法暗示”,要看真实发货之后的体验,而不是演示视频。
六、智能眼镜,但落得太晚
谷歌联合三星、Warby Parker 和 Gentle Monster 发布了基于安卓的”智能眼镜”。先出”音频版本”(没有显示屏),2026 年秋季上市。带显示屏的版本”以后”。
跟现场试用的科技媒体反馈是这样的
”变成超级英雄”,结果连名字元数据都被改错了。更关键的是,这个市场已经不是空白的。第三方研究机构的全球智能眼镜出货量追踪显示,Meta 在 2025 下半年市占率已经从 73% 进一步扩大到 82%,全球智能眼镜出货量同比增长 139%。这意味着 Meta 不是占着不动,而是在用行业最快的速度跑赢市场。
谷歌加三星的赌注是”时尚优先而非规格优先”——选 Warby Parker(经典款)和 Gentle Monster(潮牌)两个品牌切入。这个思路是对的,Meta 的 Ray-Ban 系列就是这么起家的。但 Warby Parker 和 Gentle Monster 在中国市场的认知度极低,对亚洲市场不太友好。
评价
。“音频先行”在 2026 年看起来很保守,带显示屏的版本如果再拖到 2027 年才上,可能就真错过窗口期了。七、开发者工具,翻车的发布
这是开发者最关心的一节,也是大会期间舆论最大的一节。
谷歌发了一个叫 Antigravity 2.0 的开发者平台,直接砍掉了原来的 Gemini 命令行工具和 IDE 扩展,所有功能统一到 Antigravity 上。新平台包括
(基于 VS Code 改造,内置浏览器,可以让 AI 自己做视觉验证)、命令行工具、软件开发包、托管智能体接口。产品哲学很激进:“未来 90% 的代码由 AI 写,集成开发环境的主角不再是文本编辑器,而是智能体编排面板。“这个赌注 GitHub Copilot 和 Cursor 都没敢做。
但发布当天就翻车了。
强制自动升级把很多开发者的本地工程目录搞乱,文件浏览器、编辑器、终端全部不见——配置文件路径改了,扩展全部失效。技术媒体抓到一条很扎心的开发者评论:“散发着外行人把代码推到生产环境的味道。”
谷歌当晚紧急放出独立 IDE 安装包,允许用户回到”传统编辑器 + AI 助手”模式;版本号回滚。紧接着推出一个补丁,修一个智能体会把开发者手写的代码”判定为低效”然后自动回滚的 bug。这是一个”智能体越权”的活样本——它替你做了你不想让它做的事。
更早的时候(今年 4 月),安全研究人员还在 Antigravity 1.x 里找到过一个可以远程执行代码的漏洞
,绕过安全模式,执行任意命令。谷歌已经修补。但这件事说明,智能体化的开发环境攻击面比传统开发环境大得多——因为它会真的”自己干活”。老的 Gemini 命令行工具会在 6 月 18 日停止为消费级订阅用户服务。企业版不受影响。
横向比较一下
、内置浏览器视觉验证这类新东西上,Antigravity 暂时领先;在大型生产仓库的稳定性上,Claude Code 仍然是首选,海外开发者社区一致认为 Opus 4.7 在”不破坏既有代码”上更可靠;在 GitHub 原生集成上,Copilot 无人能敌。评价
2.0 在产品哲学上是正确但激进的赌注。但赌注正确不等于执行正确——强制升级、智能体误回滚、文档质量缺失、命令行还没做到功能对齐,谷歌”对开发者不够友好”的老问题在这次发布里以”智能体优先”的新形式重现。谷歌习惯于把自己的产品哲学强加给开发者,而不是先证明它能稳定工作。如果你是开发者,我的建议是:
-
6 月 18 日之前完成老命令行工具的迁移,同时备份旧版本桌面应用,以防强制升级再次搞坏环境。
-
新项目可以试 Antigravity 2.0,享受快速度、大上下文、并行智能体、内置视觉验证的好处。
-
生产环境别立刻迁,继续用 Claude Code 或 GPT-5.5,给 Antigravity 三个月磨合期。
-
如果你做安卓开发,新版 AI Studio 加入了原生 Kotlin 支持、安卓命令行工具、跨平台迁移智能体(从 React Native、iOS、Web 自动迁到原生 Kotlin),这是这一届最实用的工具。
八、自研芯片
这一节比较硬核,但不讲不行——这是谷歌在 AI 战里最不依赖叙事的优势。
谷歌的自研 AI 芯片这次发了两款
、一款用于推理。训练芯片
9600 颗芯片、2PB 共享高带宽内存。每美元训练性能是上代的 2.7 到 2.8 倍。推理芯片
,片上缓存是上代的 3 倍。每美元推理性能比上代高 80%。更关键的是网络:单个数据中心 13.4 万颗芯片,跨站点超过 100 万颗组成一个统一集群。
谁在用?
-
Anthropic 已经承诺最多使用 100 万颗谷歌自研芯片来训练 Claude——这是史上单一客户最大的订单。
-
Meta、Salesforce、Midjourney、Replit 在跑生产负载。
-
苹果 Siri 的下一代要跑在 Gemini 上,数据是否走苹果自己的私有云还是谷歌数据中心仍不明,但代表客户已经签了。
这意味着什么呢?谷歌已经构建了一个英伟达没办法直接攻击的垂直栈
+ 数据中心网络 + 自家最强模型 + 顶级客户(包括竞争对手 Anthropic 和苹果)。英伟达卖的是通用 GPU,谷歌卖的是”AI 一站式解决方案”。摩根士丹利在大会后维持对谷歌母公司 Alphabet 的”增持”评级,4 月把目标价上调到 375 美元——这反映了华尔街已经叙事性地把谷歌从”搜索广告公司”重新定位为”AI 全栈公司”。
这是这次大会最坚固的一块。
九、几个被忽略但值得一提的小动作
-
代码修补员
发的智能体,自动找代码漏洞并修。用调试器、源码浏览、工具链定位根本原因。邀请制测试中。 -
跨行业 AI 水印
、Kakao、ElevenLabs 加入。这是少数让人觉得谷歌在做”行业基础设施”的事。 -
天气预测
演示了对 2025 年飓风梅丽莎的提前路径预测,提前预警牙买加。 -
NotebookLM
Workspace 整合,高校 18 岁以上学生可以在谷歌课堂里自建笔记本。这仍然是谷歌这两年最被低估的产品,在”基于真实文档的可信回答 + 音频概要”这个小赛道上,它领先 Claude 项目和 ChatGPT 自定义机器人。
十、命名灾难
讲到这里得吐一句。
前面写了多少个产品名字了?Gemini 3.5 Flash、Gemini Omni、Gemini Spark、Gemini 智能、每日简报、Antigravity、Antigravity IDE、Antigravity 命令行、Antigravity 开发包、AI Pro、AI Plus、AI Ultra、Nano Banana、Flow、Stitch、谷歌图片应用、统一购物车、Halo、代码修补员、AI 水印、NotebookLM……
彭博一位专栏作者在社交媒体上吐槽得很到位:“我想做张图。那是 Nano Banana。还是谷歌图片?不,是谷歌 Flow。Gemini Omni 是多模态的,我想。”
科技媒体接了一刀:“也许我们可以建议谷歌着手开发一款新模型,能把各种输入材料变成黄金,包括铅。”
这不是产品策略,这是谷歌内部市场团队失控的样本。研究项目的名字这次被收回了,但消费产品名字反而爆炸。原因是各个产品线的负责人都想拿到自己的命名权,而 CEO 没有任何意愿去做这种内部强制收敛。
总评,但不漂亮的进步
谷歌这届大会用一句话总结的话:它终于赢回了叙事,但还没赢回信任。
赢回的部分:
-
Gemini 3.5 Flash 是实实在在的模型进步,价格和速度的组合在很多场景下确实是当下最优。
-
自研芯片加上 Anthropic、苹果这两个顶级客户,构建了英伟达打不到的垂直护城河。
-
搜索的改版从产品策略上完成了 OpenAI 和 Perplexity 给它出的考题。
-
反向嵌入苹果 Siri 是 AI 时代最隐蔽也最有杀伤力的一击,意味着谷歌在消费端 AI 分发战里赢得了一个不该赢的位置。
-
华尔街用真金白银的评级和目标价上调,印证了叙事的重置。
没赢回的部分:
-
几乎所有亮眼功能都是”未来几周到几个月开放”,这届大会的”已发布率”在谷歌历届里偏低。
-
Antigravity 发布当天就翻车,暴露了”谷歌习惯于把自己的产品哲学强加给开发者”的老问题。
-
命名混乱到了广告业内人士都拿来嘲笑的程度,产品哲学不统一。
-
在最硬的 AI 题目(数学、抽象推理、大型代码库改写)上,模型仍然不是第一名。
-
搜索的改版正在结构性地破坏开放网络生态——出版商流量下滑、内容创作者收入受损、AI 知识源越来越窄——这是一个谷歌自己也不知道怎么解的内在矛盾。
-
智能眼镜晚了至少一年,Meta 已经在这个市场拿到了 82% 份额。
和对手的相对位置:
-
对 OpenAI
、基础设施、企业基本盘上占优;在最硬推理上仍小幅落后;在视频生成上两家都落后字节;在智能体上互相追平。 -
对 Anthropic
在编程智能体和企业信任上仍小幅领先,但 Anthropic 选择跑在谷歌芯片上——这本身让谷歌的整个栈受益于对手的成功,堪称竞合的完美样本。 -
对微软
365 Copilot 在企业销售渠道上仍有 1 到 2 年领先;谷歌的 Workspace 加上苹果 Siri 是同时翻盘消费端的两根杠杆。 -
对 Meta
Meta 的 Ray-Ban 系列仍有 82% 份额且体验最熟;谷歌加三星用”时尚优先”切入,胜负要到 2027 年看销量。 -
对苹果:谷歌用 Gemini 反向嵌入了苹果的 Siri,这是这次大会最值得记住的一件事之一。短期苹果保持品牌主控,长期看苹果失去了一次自研 AI 突破的窗口。
所以这届到底是进步还是停滞?
是进步,但是不漂亮的进步。谷歌不再用”通用人工智能永生”叙事掩盖发货延迟,转而用搜索、Workspace、安卓、云的规模和自研芯片的硬件优势硬碰硬。Gemini 3.5 Flash 加上新一代自研芯片加上苹果合作的组合,使谷歌在 AI 时代第一次让市场把它放到与 OpenAI 同梯队、甚至可能略胜一筹的位置。这是 2023 年那场翻车以来最重要的叙事翻转。
但同时,谷歌的执行短板没解决——Antigravity 的强制升级翻车、产品命名爆炸、演示和落地之间的间隔依旧偏长、“演示美丽落地拖延”的老阴影仍然挥之不去。
这是一届”谷歌终于赢回了叙事,但还没赢回开发者信任和用户每日心智”的大会。下半年 Gemini 3.5 Pro、Gemini Spark、苹果新 Siri 这三件事的实际发货质量,才会决定 2026 这次叙事翻转能不能落地成结构性胜利。
如果稳定交付,这篇文章里大多数槽点会自动消化;如果继续重复”演示漂亮、落地拖延、强制升级翻车”的老剧本,2027 年的大会大概率还得再”被迫”一次。
我个人的判断是,这是十年来谷歌离自己重新拿回科技行业心智最近的一次——但也只是离得近,还没拿到。