AI 周报 · 2026年5月19日–5月26日

发布于:2026-05-27 · #AI #Weekly #Google #Gemini
  • • 本周由 Google I/O 2026(5月19–20日)主导:DeepMind 直接跳过 3.2 推出 Gemini 3.5 Flash(GA 同日上线,$9 每百万 token,反超自家 3.1 Pro 多项基准),同步发布 Omni 视频生成模型、24/7 个人代理 Gemini Spark、Antigravity 2.0、Aluminium OS(Googlebook)以及搜索框 25 年来最大改版。

  • • Anthropic 同日在伦敦开 Code w/ Claude 大会、以”超过 3 亿美元”(The Information / TechCrunch 报道)收购 SDK 工具厂 Stainless,并将 KPMG(27.6 万员工)、PwC 等顾问巨头纳入 Claude 部署;Bartz v. Anthropic 15 亿美元版权和解公平听证已于 5 月 14 日审结但未当庭裁定。

  • • 监管侧:欧盟 5 月 7 日达成 AI Act Omnibus 政治协议,将 Annex III 高风险义务推迟至 2027 年 12 月,本周 5 月 19 日委员会就高风险分类指南启动公众咨询;中国 DeepSeek 把 V4-Pro 75% 折扣永久化(5 月 23 日 Bloomberg:输出价由 降至$0.87/M);GitHub Copilot 6 月 1 日全面转 token 计费、且于 5 月 20 日把 Gemini 全系从 Web Chat 下架。


一、Google I/O 2026(最高优先级)

1. Gemini 3.5 Flash 正式发布——“小模型”首次反超自家 Pro

  • 来源:Google Keyword Blog | 日期:2026-05-19

  • • DeepMind 直接跳过 3.2 命名,5 月 19 日同日 GA 上线 Gemini 3.5 Flash,定价 输入、$9.00/M 输出(缓存输入 $0.15/M),上下文 100 万 token、输出 65 k。在 Terminal-Bench 2.1(76.2%)、MCP Atlas(83.6%)、GDPval-AA(1656 Elo)等编码/Agent 基准上超过 Gemini 3.1 Pro,输出速度约为同级前沿模型的 4 倍。3.5 Pro 推迟至 6 月。

2. Gemini Omni Flash:从任何输入生成视频的多模态模型

  • 来源:Google Keyword Blog | 日期:2026-05-19

  • • Pichai 主旨演讲原话:“Gemini Omni is our new model that is capable of generating samples in any output modality from any input. We’re starting with video outputs”。Omni Flash 即日起在 Gemini app、Google Flow、YouTube Shorts Remix 与 YouTube Create(18+)开放,AI Plus/Pro/Ultra 全球可用,开发者 API 数周后跟进,所有产物带 SynthID 水印。

3. Gemini Spark:24/7 后台个人代理 + Agent Payments Protocol

  • 来源:Google Cloud Blog | 日期:2026-05-19

  • • Spark 跑在专属 GCloud VM + Antigravity harness 上,由 3.5 Flash 驱动,可代理执行 Gmail/Docs/Sheets/Slides 及 30+ 第三方服务(Canva、OpenTable、Instacart、Uber 等)任务,先向美国 Google AI Ultra 订阅者推送。配套发布 Agent Payments Protocol (AP2):为代理消费设单笔批准、消费上限和商家白名单。AI Ultra 入门价由 降至$99.99/月,新增 $200/月高端档。

4. Google Search 25 年最大改版:AI Mode 突破 10 亿月活,“智能搜索框”上线

  • 来源:Google Keyword Blog | 日期:2026-05-19

  • • Liz Reid 宣布 AI Mode 一年内 MAU 突破 10 亿,搜索框迎来 25 年来最大升级:可输入文字/图片/文件/视频/Chrome 标签页,支持多轮对话与”Information Agents”持续在后台监控网页变化(如房源、球鞋发售)。Gemini 3.5 Flash 成为 AI Mode 默认模型,Personal Intelligence 扩展至 200 个国家 98 种语言。Information Agents 今夏向美国 AI Pro/Ultra 订阅者开放。

5. Google Antigravity 2.0 + Managed Agents API

  • 来源:Google Cloud Blog | 日期:2026-05-19

  • • Antigravity 升级为独立桌面 App,支持并行子代理、定时任务、与 AI Studio/Android/Firebase 深度集成;同步推出 Managed Agents API——一次调用即在 Google 托管的 Linux 沙箱里开出可推理、执行代码、浏览网页的远程 Agent。Antigravity 内 3.5 Flash 经过协同优化,速度据称达普通 API 的 12 倍。

6. CodeMender:Antigravity 上的 AI 代码安全代理

  • 来源:Google Cloud Blog(Thomas Kurian)| 日期:2026-05-19

  • • DeepMind 孵化的 CodeMender 接入 Gemini Enterprise Agent Platform:“autonomously identifies vulnerabilities within your code… recommends precise fixes, securely tests them, and can apply patches”,需用户批准后才落地。

7. DeepMind Co-Scientist 多代理科研系统发布并登 Nature

  • 来源:Google DeepMind Blog | 日期:2026-05-19

  • • Co-Scientist 是一组基于 Gemini 的 Agent(生成、相近性、反思、Meta-review、调度),以”想法锦标赛”方式迭代提出并验证科学假设,研究员可通过 labs.google/science 申请”Hypothesis Generation”实验。同期推出 Science Skills,把 30+ 生命科学数据库(UniProt、AlphaFold DB、AlphaGenome API、InterPro)接入 Antigravity。

8. Android XR 智能眼镜全家桶官宣,秋季先发音频版

  • 来源:Google Keyword Blog | 日期:2026-05-19

  • • 与 Samsung、Warby Parker、Gentle Monster 合作的”音频眼镜”今秋开卖;显示眼镜随后。功能包括 Gemini 实时问答、转向导航、外语翻译、Uber 叫车,可同时配 Android / iOS 手机。XREAL 同步在大会上演示 Project Aura(有线 XR 眼镜,70° FoV,X1S+骁龙双芯,附 Catalyst 开发者计划夏季发开发包)。

9. Aluminium OS / Googlebook:ChromeOS 正式被取代

  • 来源:Wikipedia / Daring Fireball(综合 Android Show I/O Edition)| 日期:2026-05-12–19

  • • Google 在 I/O 前 Android Show 上宣布以 Android 17 为内核的 Aluminium OS(开发代号,正式名稍后揭晓)取代消费版 ChromeOS,新硬件品牌为 Googlebook。首批 OEM:Acer、ASUS、Dell、HP、Lenovo + 三星 Galaxy Book(One UI Book 9 皮肤);芯片覆盖 Intel/Qualcomm/MediaTek。Gemini 深度集成,并推出”Magic Pointer”——抖动光标即触发上下文 AI 建议。

10. Workspace 全面升级:Google Pics 图像编辑 + Docs Live 语音脑暴

  • 来源:Google Keyword Blog(Pichai keynote)| 日期:2026-05-19

  • • 新工具 Google Pics 在 Drive/Docs/Slides 内提供逐对象级别的图像生成与编辑;Docs Live 允许用户”verbally brain dump”,今夏向订阅者推出,并扩展到 Gmail、Keep 的语音能力。Daily Brief 接入 Gemini App 提供晨报。Workspace 还集成 Gemini Spark 企业版以及上述 CodeMender。

11. WeatherNext 协助 NHC 提前 5 天预测飓风 Melissa 五级登陆

  • 来源:Google DeepMind Blog | 日期:2026-05-19

  • • DeepMind 披露 WeatherNext 在 2025 年 10 月帮助 NHC 提前 5 天高置信度预测了飓风 Melissa 从 1 级快速增强至 5 级登陆牙买加;NHC 2025 年度核验报告将 WeatherNext 评为路径与强度单项最佳模型。

12. Ask YouTube + Universal Cart:AI 在内容与电商的两个新入口

  • 来源:Google Keyword Blog | 日期:2026-05-20

  • Ask YouTube 提供结构化对话式视频搜索(长视频+Shorts 混排);Universal Cart 整合 Gemini App、YouTube、Gmail 的购物车,建立在 Google Wallet 之上,能跨商家比价、检查兼容性、推送降价,夏季先上美国搜索与 Gemini App。


二、其他大模型 / 大厂动态

13. Anthropic 收购 Stainless:把官方 SDK 与 MCP 服务器工具链买下来

  • 来源:Anthropic | 日期:2026-05-18

  • • Anthropic 5 月 18 日宣布收购 2022 年成立的 SDK 自动化公司 Stainless。TechCrunch 引述 The Information 报道(2026-05-18):“The Information reported last week that the company was in talks to acquire Stainless…for more than $300 million”。Stainless 自首批 Claude API 起便代生成 TypeScript/Python/Go/Java/Kotlin SDK,并支撑 OpenAI、Google 等同行;收购后托管型 SDK 生成服务将逐步停服,开发者已生成的 SDK 仍可使用。这是 Anthropic 半年内第 4 起收购(Bun、Vercept、Coefficient Bio、Stainless),明显瞄准”代理操作系统”垂直整合。

14. Code w/ Claude 伦敦站:dreaming 记忆机制、Claude Security 公测

  • 来源:MIT Technology Review | 日期:2026-05-21

  • • 5 月 19–21 日 Anthropic 在伦敦举办开发者大会。新功能 dreaming 让 Claude Code 代理把任务过程写成”笔记”,再由系统跨任务整合归纳,长期意图是让代理”自我改进”;同时把 Claude Code/Opus API 限额提高、Managed Agents 新增 multiagent orchestration、outcomes、webhooks。Anthropic 还把 Claude Security 公测开放给企业,并扩展 Project Glasswing——其内部安全平台据多家媒体报道使用未发布的 Mythos preview 模型批量发现 1 万+严重 0day。Spotify、Delivery Hero 等被请上台分享团队重组经验。

15. KPMG 把 Claude 部署给 27.6 万员工,PwC 跟进

  • 来源:Anthropic Announcements | 日期:2026-05-14 / 19

  • • 5 月 14 日 PwC 宣布部署 Claude 重塑技术与并购交易;5 月 19 日 KPMG 宣布跨业务及 27.6 万名员工战略联盟全员上 Claude,两家大型咨询机构同周官宣,使 Claude 在专业服务渠道形成事实标准。

16. OpenAI–Dell 合作把 Codex 带入企业混合云与本地

  • 来源:OpenAI Newsroom | 日期:2026-05-20

  • • OpenAI 5 月 20 日与 Dell Technologies 联合宣布,把 Codex 编程代理带入企业混合云与本地数据中心环境,目标是金融、医疗等监管行业。同日,OpenAI 还推出独立的 AI 内容溯源工具:兼容 C2PA、采用 SynthID 水印,并预览一个公开验证站点(先支持 OpenAI 自家生成图)。

17. ChatGPT 个人理财(Pro 用户预览)

  • 来源:OpenAI Newsroom | 日期:2026-05-18

  • • OpenAI 向美国 Pro 用户预览 ChatGPT 个人理财:可安全连接银行/信用卡账户,生成消费看板,基于个人财务上下文回答问题;先在 Web 和 iOS 推出。

18. DeepSeek 把 V4-Pro 的 75% 折扣永久化,输出价砍到 $0.87/M

  • 来源:Bloomberg | 日期:2026-05-23

  • • 原本将于 5 月底失效的 V4-Pro 75% 限时折扣被官方永久化。Bloomberg 报道(2026-05-23):“V4-Pro API output tokens now cost $3.48 at launch one month ago”——即输入价 、输出$0.87/M、缓存命中 $0.003625/M,仅为同级闭源模型的零头,进一步压低开源前沿模型的入场门槛。

19. DeepSeek 首轮外部融资估值传至 500 亿美元,国资 + 腾讯入局

  • 来源:South China Morning Post | 日期:2026-05-08(本周持续发酵)

  • • DeepSeek 即将完成成立以来首轮外部融资,估值上看 500 亿美元,由”大基金三期”AI 子基金牵头,腾讯、Hillhouse 在内的多家机构参与;本周配合 V4 永久降价,被视为对前沿厂商进一步施压。

20. Meta 启动 8000 人裁员,2026 全年 capex 区间上调至 $145 B

  • 来源:NPR | 日期:2026-05-20

  • • 5 月 20 日 Meta 启动覆盖 “10 percent of its workforce — or about 8,000 people”(NPR 引用)的裁员。Meta Q1 2026 SEC 10-Q 同期披露:“We anticipate 2026 capital expenditures…to be in the range of $115–135 billion”——整个区间整体上抬 100 亿美元。CNBC 引扎克伯格内部备忘录:“AI is the most consequential technology of our lifetimes. The companies that lead the way will define the next generation”。配合 Muse Spark 模型与”Model Capability Initiative”员工追踪工具引发内部不满。


三、开发者工具与代码 Agent

21. Cursor 3.0 + Composer 2.5 双发布:从 IDE 转为”代理工作台”

  • 来源:Cursor Blog | 日期:2026-05-18

  • • Cursor 4 月推出 3.0 后,5 月 18 日发布自研模型 Composer 2.5,定价 输入、$2.50/M 输出(Fast 变体 $15),主打长任务持续工作与复杂指令执行;首周双倍配额。5 月 13 日还上线多仓库环境管理与版本回滚审计,5 月 11 日为 Bugbot 推出”Default/High/Custom”用力等级。5 月 22 日 Cursor 进入 Gartner 企业级 AI 编码代理 Magic Quadrant 领导者象限。

22. GitHub Copilot Web 端下架全部 Gemini 模型

  • 来源:GitHub Changelog | 日期:2026-05-20

  • • GitHub 把 Copilot Web Chat 的 Gemini 全系、GPT-5.2 Codex、GPT-5.4 nano 全部下架,仅保留 OpenAI 与 Claude 系。VS Code、JetBrains、CLI 端未受影响。配合此前 5 月 14 日澄清的退款政策与 5 月 17 日把 GPT-5.3-Codex 设为 Business/Enterprise 默认模型,意味着 Copilot 短期内成为”OpenAI 优先、Anthropic 其次”。

23. Copilot 全计划 6 月 1 日转为 token 计费

  • 来源:GitHub Blog | 日期:2026-05(公告本周持续生效)

  • • GitHub 宣布 6 月 1 日 Copilot 个人与企业计划全面切换为按 token 消费的 AI Credits 计费——Pro 仍 月含10 额度、Pro+ 含39 额度、Business 座含19 额度,代码补全保持免费。Opus 4.7 倍率自 5 月 1 日从 7.5× 提至 15×,年度订阅按到期续约切换。该变化叠加 4 月 20 日新订阅暂停、5 月 20 日退款窗口关闭,让 Copilot 的”无限月费”时代彻底结束。


四、监管 / 政策 / 版权

24. 欧盟 AI Act Omnibus 政治协议落地,高风险义务推迟到 2027 年 12 月

  • 来源:Council of the EU | 日期:2026-05-07(落地影响在本周持续)

  • • 5 月 7 日欧盟立法机构达成 AI Act Omnibus 协议:Annex III 高风险系统义务由 2026 年 8 月 2 日推迟至 2027 年 12 月 2 日;嵌入式 Annex I 产品义务推迟至 2028 年 8 月 2 日;监管沙盒义务延后一年;新增对”nudifier”应用与 CSAM 生成的禁令,自 2026 年 12 月 2 日生效。

25. 欧盟委员会 5 月 19 日就高风险 AI 分类指南启动公众咨询

  • 来源:欧盟委员会 | 日期:2026-05-19

  • • 与 I/O 同日,欧盟委员会发布 AI Act 高风险分类指南草案、并就 AI 透明度义务(Article 50,含合成内容水印)启动公众咨询,搭配 12 月 2 日水印过渡新窗口,给 Stable Diffusion、Sora、Gemini Omni 等生成式厂商带来明确合规时间线。

26. Bartz v. Anthropic 15 亿美元和解公平听证审结,索赔率达 92.77%

  • 来源:Authors Alliance | 日期:2026-05-14(本周仍未当庭裁定)

  • • 5 月 14 日 Martínez-Olguín 法官在旧金山主持 Bartz v. Anthropic 公平听证:原告律师汇报索赔率从 4 月 30 日的 91.3% 升至 92.77%,350 名作者有效退出(涉 1,802 部作品);法官集中追问律师费(25% 即 3.75 亿美元)和成本储备机制,未当庭裁定,表示将”尽快出短令”。Susman Godfrey 在新闻稿中确认:“Anthropic will pay approximately $3,000 per class work”,这是美国史上最大版权和解案,6 月 11 日开始计算分配。


五、AI 安全 / 社会影响 / 行业落地

27. Anthropic Project Glasswing:用 Mythos preview 发现万级 0day

  • 来源:综合 BleepingComputer / TestingCatalog / ITSecurityNews 报道 | 日期:2026-05-26

  • • 多家媒体本周捕捉到 Anthropic 内部 Claude Code/Security UI 中出现 claude-mythos-1-preview 字符串,并简短暴露过启用开关。Project Glasswing 报告称 Mythos preview 在前期扫描中识别出 1 万+ 高危/严重零日漏洞。Anthropic 引述:“The advantage will belong to the side that can get the most out of these tools”,警告短期内攻击方受益、长期需防御方加速。Mythos 尚未正式 GA。

28. OpenAI 与美国能源部合作:把前沿模型接入国家实验室

  • 来源:OpenAI | 日期:2026-05-19(与 White House Genesis Mission 同期)

  • • OpenAI 与 DOE 签署合作,承诺将前沿模型与算力开放给国家实验室,配合白宫”Genesis Mission”活动;同时与 Los Alamos 国家实验室开展多模态 AI 在实验室安全使用的评估,把”2026 科学之年”主张落地(不涉及武器/核安全用途)。

29. Anthropic Claude for Small Business:把 AI 塞进 QuickBooks/HubSpot 工作流

  • 来源:9to5Mac | 日期:2026-05-13(本周持续推广)

  • • Anthropic 推出 Claude for Small Business——一组连接器与现成 Workflow,把 Claude 嵌入 QuickBooks、PayPal、HubSpot、Canva、Docusign、Google Workspace、Microsoft 365 等中小企业常用工具,可一键执行薪资、月结、销售活动、催收发票等流程;附带 14 节免费 AI 素养课。

30. Microsoft Build 2026 Session 目录上线,全面 AI 化但本周无突发公告

  • 来源:Thurrott / TechRadar | 日期:2026-05 持续更新

  • • Build 2026 定档 6 月 2–3 日,首次回到旧金山 Fort Mason,仅限 2,500 名开发者现场。Nadella 主旨演讲;主题围绕 Copilot 新能力、GitHub 平台、Azure AI Foundry、负责任 AI 与 Windows 开发者优化。本周微软主要节奏在 Windows Insider 例行 build(5 月 14、15、19、22 日发布),暂未提前剧透模型层面的重大公告。

31. 中国 AI 落地:Qwen App 接入 100M+ 月活,本周持续推送电商代理化

  • 来源:CNBC / SCMP 综述 | 日期:本周持续

  • • 阿里 Qwen App 月活破 1 亿后,本周继续把 Taobao、Fliggy、外卖、支付等链路接入 AI 对话;DeepSeek V4 永久降价 + Huawei Ascend 950 supernode 量产倒计时,是中国”模型+自研芯片”双引擎本周最显眼的进展。注:相关具体融资估值数据本周仍属传闻范畴,建议观望。

32. Meta WhatsApp “Incognito Chat”上线,与 Instagram E2EE 下线形成反差

  • 来源:Malwarebytes Labs | 日期:2026-05-25

  • • Meta 一边在 WhatsApp 上线基于 Private Processing 的 Incognito Chat(与 Meta AI 的临时对话、消息默认消失),一边自 2026-05-08 起取消 Instagram DM 端到端加密。两套”AI 私密”叙事在同一公司形成矛盾信号,提醒用户:营销词≠技术保证。


总结

本周是 2026 年最密集的”AI 大事周”之一。Google I/O 把焦点彻底压在 Agent + 多模态 + 硬件平台:Gemini 3.5 Flash 用”小模型反超 Pro”重写了 Flash/Pro 的产品逻辑学;Spark + AP2 + Information Agents 共同把”24/7 后台代理”做成了消费品;Aluminium OS/Googlebook 则像是十年来第二次大平台押注(继 Android 之后)。Anthropic 同步在伦敦摆出”代理操作系统”姿态——以 3 亿美元+收购 Stainless 拿下 SDK/MCP 生成层、靠 dreaming 让 Claude Code 长期”自我改进”、靠 Mythos preview 把安全与攻防价值具象化。开发者端最戏剧化的反转来自 GitHub Copilot:从 4 月开始的”暂停订阅 + 抬升 Opus 倍率”演变到 5 月 20 日 Web 端清退全部 Gemini,加上 6 月 1 日全面 token 化计费,标志着”AI 编程订阅制”时代基本结束。监管侧,欧盟把高风险 AI 义务”推迟一年半”的简化协议本周持续落地,而 Bartz 15 亿美元版权案进入最后裁定窗口——AI 训练数据合法性的全球范本即将板上钉钉。

下周观察重点:① Google 兑现 Gemini 3.5 Pro 6 月发布;② Microsoft Build 6 月 2–3 日,看 Copilot/Azure AI Foundry 是否回应 Antigravity 与 Spark;③ Anthropic Mythos 是否走向 GA;④ Bartz 案最终命令;⑤ DeepSeek 融资与新模型节奏。