AI 周报 · 2026/05/12–05/19:Google I/O 2026 重磅来袭,Claude Mythos 设定新标杆,欧盟 AI 法案大幅延期
本周关键词:Google I/O 2026、Gemini 3.2 Flash 泄露、Claude Mythos 漏洞共享解禁、Bartz v. Anthropic 15 亿美元和解听证、欧盟 AI 法案 16 个月延期、DeepSeek V4 持续发酵、AI 编程工具贴身肉搏。
一、Google I/O 2026 与 Google/DeepMind 动态
1.《Google I/O 2026 开幕:5 月 19 日主题演讲聚焦 Gemini、Android XR 与 Aluminium OS》
来源:Engadget|日期:2026-05-19
Google 年度开发者大会 I/O 2026 于 5 月 19 日上午 10 点 PT 在山景城 Shoreline Amphitheatre 正式开幕,由 CEO Sundar Pichai 与 DeepMind CEO Demis Hassabis 联袂主持,会期持续两天。本届主题演讲完全聚焦 AI,重点公布 Gemini 模型升级、Android XR 智能眼镜首发、Aluminium OS 桌面系统以及 Search/Workspace 中的 agentic 能力扩展。
2.《Android Show: I/O Edition 抢先发布——Googlebook 笔记本新品类与 Gemini Intelligence》
来源:Engadget|日期:2026-05-12
I/O 主会议前一周,Google 通过预录的 Android Show 提前披露多项重磅更新:全新笔记本品类 Googlebook(首批由 Acer、ASUS、Dell、HP、Lenovo 制造,秋季上市)、“Gemini Intelligence” 系统级 AI 整合、Chrome auto browse、Gboard Rambler 语音清理、Android Auto 智能回复、AI 生成桌面小组件 (Create My Widget) 以及无线 iPhone-to-Android 数据迁移工具。Aluminium OS 为其内部代号。Google 全球公关 Peter Du 向 The Verge 表示官方品牌将”今年晚些时候公布”。
3.《Gemini 3.2 Flash 泄露:性能逼近 3.1 Pro、价格仅 1/2,I/O 2026 前夕悄然现身》
来源:Build Fast with AI|日期:2026-05-13
开发者于 5 月 5 日在 iOS Gemini app 与 Google AI Studio 中发现未公布的 Gemini 3.2 Flash 模型,并在 LM Arena 上跑出隐匿基准;泄露 API 价格为输入 $0.25/M tokens、输出 $2.00/M tokens(Gemini 3 Flash 为 3.00),知识截止日期更新至 2026 年 1 月,部分创意编码任务超越 Gemini 3.1 Pro。Polymarket 押注 I/O 上正式发布概率高达 96%。同时一个名为 “Liquid Glass” 的 Gemini UI 重设计也被截图,并出现”Agents (Beta)“侧栏 tab。
4.《Google “Gemini Spark”(前身 Project Remy)APK 泄露:24/7 个人 AI Agent》
来源:9to5Google|日期:2026-05-14
9to5Google 在 Google app v17.23 测试版中发现 Gemini Spark 品牌(内部代号 Remy),onboarding 文案明确说明:“Gemini Spark 将使用您的连接应用、技能、聊天、任务、登录网站、Personal Intelligence、位置等信息……虽然在执行敏感操作前会请求许可,但它可能会在不询问的情况下分享您的信息或进行购买。” 该 agent 被定位为”工作、学习与日常生活的 24/7 个人助手”,预期 I/O 主题演讲正式发布——这是 Google 对 Project Astra 愿景的首次产品化。
5.《Alex Heath:Google 将在 I/O 推出新 Gemini,但落后于 Anthropic Mythos》
来源:Sources.news|日期:2026-05-14
科技媒体人 Alex Heath 引述消息源称,Google 即将在 I/O 上发布的新 Gemini 模型大约处于 OpenAI GPT-5.5 同级别,明显落后于 Anthropic Mythos;Google 内部对编码任务追赶有”真实压力”。Heath 提示”不要期待 Gemini 3 那样的代际飞跃”。
二、其他主流模型与 AI 平台动态
6.《Anthropic 解禁:Mythos cybersecurity 模型合作伙伴可对外共享发现》
来源:Reuters / KFGO|日期:2026-05-18
Anthropic 5 月 18 日宣布修订原立场,允许 Project Glasswing 计划中使用 Claude Mythos Preview 模型的合作伙伴(Amazon、Microsoft、Nvidia、Apple、Google、JPMorgan 等)对外披露参与该项目的身份,并按”负责任披露”惯例向其他企业安全团队、行业组织、监管机构、开源维护者、媒体与公众分享发现、工具和代码。Mythos 自 4 月 7 日宣布以来已自主发现包括 OpenBSD 27 年历史 RCE、FreeBSD 17 年 NFS RCE (CVE-2026-4747) 在内的数千 0-day。
7.《OpenAI 推出 ChatGPT 个人理财:通过 Plaid 连接 12,000+ 金融机构》
来源:TechCrunch|日期:2026-05-15
OpenAI 5 月 15 日为美国 ChatGPT Pro 用户上线 Finances 个人理财预览,通过 Plaid 集成 Schwab、Fidelity、Chase、Robinhood、American Express、Capital One 等 12,000+ 金融机构。提供组合表现、消费、订阅、即将到期账单仪表板。据 OpenAI 官方公告:“超过 2 亿用户每月会到 ChatGPT 询问预算、投资问题、不同路径比较和理财规划”;新版 GPT-5.5 在该垂直领域大幅减少幻觉。该工具不可代下单、付款、报税。
8.《OpenAI 推出 Codex 移动 App:随时随地审核 AI 代码 agent》
来源:OpenAI 官方博客|日期:2026-05-14
OpenAI 5 月 14 日将 Codex 加入 ChatGPT 移动 App(预览版),用户可以在手机上审阅工作、批准命令、引导对话线程,并实时跟进 laptops、devboxes、远程环境中的长时间编程任务。同时为企业团队扩展远程 SSH、hooks、access tokens 和 HIPAA 支持。
9.《OpenAI 推出 GPT-5.5-Cyber:面向关键基础设施防御者的限定预览》
来源:OpenAI / Releasebot|日期:2026-05-15
OpenAI 5 月 15 日推出 GPT-5.5-Cyber 限定预览版,并扩展 Trusted Access for Cyber (TAC),为已认证的防御方提供更宽松的工具权限以支持漏洞分诊、恶意软件分析、红队演练和补丁验证。此举回应了同期 Anthropic Mythos 引发的网络安全 AI 竞赛。
10.《Anthropic 上调 Claude Code 每周限额 50%,持续至 7 月 13 日》
来源:Anthropic / Releasebot|日期:2026-05-13
为应对 OpenAI Codex 同日发布的”企业用户切换可获 2 个月免费”促销,Anthropic 同步宣布 Claude Code 每周用量限额提升 50%,所有 Pro、Max、Team 和按席位计费的 Enterprise 用户立即生效,持续至 2026 年 7 月 13 日。同期 Anthropic 已宣布与 SpaceX Colossus 1 数据中心独家合作,将在月内新增 300+ MW 容量、220,000+ NVIDIA GPU。
11.《Claude Code 5 月大更新:Opus 4.7 默认 Fast Mode、background sessions、MCP 加速》
来源:Anthropic / Releasebot|日期:2026-05-15
Anthropic 在 5 月中下旬发布 Claude Code 一系列重要可靠性与工作流更新:Fast mode 默认升级到 Opus 4.7(旧版可通过环境变量 CLAUDE_CODE_OPUS_4_6_FAST_MODE_OVERRIDE=1 回退);新增 claude agents 多项 flag;后台会话支持 /resume,长任务完成提示包含耗时(如 “Agent completed 3h 2m 5s”);plugin marketplace 升级;MCP/SDK 启动加速最多 2 秒;修复 75 秒 API 不可达启动卡顿等问题。Claude Code 现已原生支持 1M 上下文窗口(之前为 200k 预览)。
三、开发者工具与 Agent 生态
12.《Cursor Composer 2.5 上线:性能对标 Opus 4.7 与 GPT-5.5,新增云端并行 agent》
来源:Lushbinary / Cursor|日期:2026-05-18
Cursor 5 月 18 日发布 Composer 2.5,定价 $0.50/M 输入、$2.50/M 输出,基准评测对标 Anthropic Opus 4.7 与 OpenAI GPT-5.5。新增 cloud agent 开发环境、Microsoft Teams 集成、“Build in Parallel” 并行任务功能,使 Cursor 在多 agent 编码工作流上正面对标 Claude Code。
13.《GitHub Copilot 转向用量计费:6 月 1 日起重度 agent 用户成本飙升》
来源:GitHub|日期:2026-05-12
GitHub 5 月 12 日更新公告,宣布 Copilot 将从 2026 年 6 月 1 日起对 agentic 工作流转向 usage-based billing:每席位订阅费不变,但 agent 模式将按使用量额外计费,重度用户费用显著上升;代码补全和 Next Edit Suggestions 维持原状。同时推出 Copilot Max 套餐面向高强度个人开发者,并在退役年付计划。
14.《GitHub Copilot 桌面 App 进入技术预览:跳出 IDE 的原生 agent 工作流》
来源:DevOps.com / GitHub|日期:2026 年 5 月中
GitHub 推出 Copilot 桌面 App 技术预览版(Windows / macOS / Linux),为 agentic 开发工作流提供 GitHub 原生体验,可在 IDE 之外独立运行长任务并联动仓库;同周 Copilot CLI 1.0.49(5 月 18 日发布)新增 /chronicle search、/rubber-duck、OAuth callback port pinning、Alpine Linux 支持以及 MCP server 的 OAuth 客户端静态持久化。
15.《Recursive Superintelligence 以 6.5 亿美元出鞘:Richard Socher + Peter Norvig 进军递归自我改进 AI》
来源:TechCrunch|日期:2026-05-14
You.com 创始人 Richard Socher 联手 Peter Norvig、Cresta 联创 Tim Shi 创立 Recursive Superintelligence,于 5 月 14 日宣布带 6.5 亿美元启动资金从隐身模式出来。目标是构建能够自主识别自身弱点并重新设计自己、无需人类介入的”递归自我改进”AI——这是当代 AI 研究的”圣杯”。Socher 接受 TechCrunch 采访时表示团队进展可能让”产品发布周期从年变为季度”。
16.《Osaurus:开源 Apple-only LLM 服务器,让 Mac 在本地与云端模型间无缝切换》
来源:TechCrunch|日期:2026-05-15
前 Tesla 与 Netflix 工程师 Terence Pae 推出开源 LLM 服务器 Osaurus,专为 Mac 优化,让用户在本地与云端模型之间切换并将文件和工具保留在自有硬件上。沙箱隔离运行限定 AI 操作范围,运行本地模型需至少 64GB 内存。
四、中国 AI 生态
17.《ByteDance Doubao-Seed-2.0-lite 全模态升级:可视听联合推理,可”看屏幕做事”》
来源:AIbase|日期:2026-05-06(本周持续发酵)
火山引擎本月正式推出 Doubao 全模态理解新版本 Seed-2.0-lite,首次实现视频、图像、音频、文本的原生统一理解;在物理、医学等复杂学科推理上超越 2 月 Pro 版本,可在电竞场景持续分析比赛视频与语音长达 25 小时并自动生成战术复盘图。该模型新增 GUI 理解与执行能力,可”识别按钮和菜单并像人一样点击、拖拽、输入”,完成端到端任务闭环。Volcano Engine 在北京车展同期披露 Doubao 已上车 145 款车型、超 700 万辆,覆盖梅赛德斯-奔驰全电 GLC、上汽奥迪 E7X 等合资车型。
18.《ByteDance 宣布 Doubao 付费订阅:68/200/500 元三档,将向高复杂任务收费》
来源:Caixin Global|日期:2026-05-05(本周延续)
苹果 App Store 显示 Doubao 即将推出 68 元(标准)/200 元(增强)/500 元(专业)三档月度订阅,重点针对 PPT 生成、数据分析、视频生产等复杂任务;基础版仍免费。根据 QuestMobile 数据,Doubao 3 月 MAU 达 3.45 亿,居中国 AI app 之首,Q1 净增 1 亿。中国 AI 市场首次出现”国民级”产品尝试 C 端付费——Baidu Ernie Bot 此前已于 2025 年 4 月放弃付费墙。
19.《Alibaba 预告 Qwen3.7 系列:Max-Preview 与 Plus-Preview 登上 LM Arena 全球第 13 与第 16》
来源:South China Morning Post|日期:2026-05-19
阿里巴巴 5 月 19 日在 LM Arena 上首次释放 Qwen3.7-Max-Preview 与 Qwen3.7-Plus-Preview,分别在文本和视觉能力上排名全球第 13、第 16,登顶现役中国 AI 模型榜首(仍落后于 Claude、Gemini、GPT 顶级版本)。这是 Qwen3.6 系列 4 月发布一个月后的快速跟进;Max/Plus 系列继续以闭源 API 形式提供,与 Alibaba 走向”商业化优先”的策略一致。
20.《DeepSeek V4 Preview 上线持续发酵:1.6T 总参 / 49B 激活,1M 上下文,开源 MIT》
来源:Hugging Face / DeepSeek|首发 2026-04-24,5 月持续评测
DeepSeek V4 系列预览版(Pro 1.6T 总参/49B 激活 + Flash 284B/13B 激活)持续刷榜:GSM8K 92.6、GPQA Diamond 90.1、SWE-bench Verified 80.6、MMLU-Pro 87.5。V4-Pro API 输入 $1.74/M(cache miss)、输出 $3.48/M;V4-Flash 仅 $0.14/$0.28,与 cache-hit $0.028 让其成为本周企业团队评测重点。基于华为 Ascend 芯片训练,使 SMIC 港股本周早期一度上涨 10%。原 deepseek-chat / deepseek-reasoner 别名将于 7 月 24 日停服。
五、AI 版权、监管与政策
21.《Bartz v. Anthropic 15 亿美元和解听证落幕:opt-in 升至 92.77%,法官短期内将批准》
来源:Publishers Weekly|日期:2026-05-14
旧金山联邦法庭 5 月 14 日 75 分钟公平性听证会上,Judge Araceli Martínez-Olguín 暂未签署美国史上最大版权和解,但氛围明显倾向通过。7 名异议者各获 2 分钟陈述;首席律师 Justin Nelson 透露 opt-in 比率从 4 月的 91.3% 升至 92.77%,每部作品约 3,000–3,100 美元赔付不变。法官给 Anthropic 至 5 月 21 日提交不超 2 页补充材料解释为何不应接受逾期 opt-out。预计下周即获最终批准;这将是 AI 训练数据合规成本的全行业新基线。
22.《EU 立法机构 5 月 7 日达成 AI Act 修订:高风险系统延期 16 个月,但生成内容水印仅延 4 个月》
来源:欧盟理事会|日期:2026-05-07(本周持续解读)
欧洲议会、欧盟理事会与欧盟委员会三方 5 月 7 日凌晨 4
23.《加州北区法院新规:当平台 AI 对广告内容拥有”最终权威”,可被认定为虚假陈述的发起者》
来源:Crescendo AI 综述|日期:2026 年 5 月初
加州北区联邦法院一项里程碑判决认定:当平台 AI 对组装后的广告内容拥有”最终决定权”,该平台可在 SEC Rule 10b-5 证券法下被视为虚假陈述的制造者。这为 Meta、Alphabet、Snap、TikTok、X 等部署生成式 AI 投放系统的平台带来重大新法律风险,预计将引发广告审核与责任归属流程的全行业重设计。
六、AI 安全、社会影响与行业应用
24.《Stanford HAI 发布 2026 AI Index:生成 AI 三年达 53% 普及率,中美差距缩至 2.7%》
来源:Stanford HAI|日期:2026-05-13
斯坦福以人为本人工智能研究院(HAI)5 月 13 日发布第 9 版 AI Index 年报,12 项关键发现包括:生成 AI 三年内达成 53% 全球人口采用率,远超 PC 和互联网;2026 年初美国消费者从生成 AI 获取的年价值达 1,720 亿美元;2025 年全球企业 AI 投资 5,817 亿美元(同比 +130%),美国 2025 年 AI 私募投资 2,859 亿美元,相当于中国(124 亿美元)的 23.1 倍以上;中美顶级模型差距收窄至 2.7%;全球 AI 数据中心电力容量达到 29.6 GW,足以满足整个纽约州峰值用电;机器人仅能完成 12% 家务任务。
25.《Cisco 财报:AI 订单全年指引上调至 90 亿美元,股价上涨 15%,同时裁员近 4,000 人》
来源:CNBC|日期:2026-05-13
Cisco 5 月 13 日财报营收 158.4 亿美元(+12% YoY),并披露”今年迄今已接到 53 亿美元的 AI 基础设施与超大规模数据中心订单,全年订单指引从 50 亿美元上调至 90 亿美元”,盘后股价飙涨 15%;同日 CEO Chuck Robbins 在博客中宣布”我们将在 Q4 减少不到 4,000 个工作岗位,相当于全员的 5% 以下”,重整成本 10 亿美元(其中 4.5 亿计入 Q4),裁员从 5 月 14 日开始。这是本周又一典型的”AI 推动业绩、同时 AI 推动裁员”案例。
26.《Reuters:美国商务部 CAISI 已与 DeepMind、Microsoft、xAI 达成新模型预部署评估协议》
来源:AI-Weekly 综述(援引 Reuters)|日期:2026-05-12
美国商务部下属 Center for AI Standards and Innovation(CAISI)本周宣布与 Google DeepMind、Microsoft、xAI 达成协议,将在新模型发布前接受联邦机构评估——这是 White House 早先”放手”立场的明显反转。Mythos 等前沿模型可能被列入新的预部署审查范畴。
27.《MIT Open Learning 推出 AI 教育新项目:免费入门课程加 AI 个性化辅导》
来源:MIT News|日期:2026-05-12
MIT Open Learning 5 月 12 日上线全新 AI 教育项目,配备 AI 驱动的个性化学习路径与一门面向全球学习者免费的入门课程,旨在应对 Stanford HAI 报告中”超过 80% 的美国中学和大学学生在学业中使用 AI,但只有一半的中学制定了 AI 政策,仅 6% 的教师认为政策清晰”的教育治理短板。
28.《Novo Nordisk 与 OpenAI 达成战略合作:AI 渗透从药物发现到供应链全业务》
来源:Crescendo AI 综述|日期:2026 年 5 月初
丹麦制药巨头 Novo Nordisk 与 OpenAI 达成战略合作,计划在 2026 年底前将 AI 整合到药物发现、临床试验、生产、供应链与商业运营全链条,加速对肥胖和糖尿病新疗法的识别。CEO Mike Doustdar 表示目标是”为科学家提供超能力,而不是取代他们”,但承认 AI 将抑制未来招聘增长。这是制药行业本周最具规模的端到端 AI 整合公告。
总结
本周 AI 行业进入两个截然不同的”势能”区间:模型层呈现”美方激进发布、中方加速跟进、欧盟监管退一步”的三方拉锯。Google 在 I/O 2026 前夕通过 Android Show 和 Gemini 3.2 Flash 泄露已经吸走全球大量注意力,但 Alex Heath 等媒体人冷静指出,Google 这次的 Gemini 升级”约等于 GPT-5.5、明显落后于 Mythos”——AI 第一梯队差距首次让 Anthropic 拉开身位。Anthropic 的 Mythos 模型继续以”找出 27 年 OpenBSD 漏洞、17 年 FreeBSD CVE”为卖点重塑赛道,并开始向合作伙伴解禁共享权限,与 OpenAI 同日推出的 GPT-5.5-Cyber 形成明面对垒。
开发者工具层面,本周的核心戏剧是 OpenAI Codex 与 Anthropic Claude Code 在 5 月 13 日同一天展开正面叫板:前者用”切换送 2 个月免费”挖企业用户,后者用”周限额上调 50%“和”Opus 4.7 默认 Fast Mode”反击;与此同时 Cursor Composer 2.5、GitHub Copilot 桌面 App 与转向用量计费、Windsurf $200 Max 套餐同期发布,AI 编程工具的竞争正从模型分高低进入”商业模式 + 接管深度”贴身肉搏。
监管侧最值得关注的是欧盟 AI Act 在 5 月 7 日凌晨达成的延期协议——高风险系统延 16 个月、AI nudifier 与 CSAM 全面禁止;以及 Bartz v. Anthropic 15 亿美元和解大概率本月内最终落锤,这将是 AI 训练数据合规成本的全行业基线。中国生态继续在低价高性能开源(DeepSeek V4)、闭源商业化(Qwen3.7、Doubao 订阅)、多模态 agent(Doubao-Seed-2.0-lite GUI 执行)三条路线上同时推进。
社会与产业冲击也在本周集中显化:Cisco 同时上调 AI 订单全年指引到 90 亿美元、宣布近 4,000 人裁员;Stanford HAI Index 将”AI 普及率 53%、美国 1,720 亿美元年消费价值、数据中心 29.6 GW 用电”等关键数据写入历史;Novo Nordisk 与 OpenAI 全业务整合显示 AI 已从”加价工具”升级到”运营底座”。
下周看点:Google I/O 主题演讲完整内容(5/20 Marketing Live 收尾)、Microsoft Build 2026(6/2–6/3 旧金山)以及 Bartz v. Anthropic 法官最终签字时点。请持续关注本公众号下周更新。