AI 周报 | 4.21–4.28:GPT-5.5 与 DeepSeek V4 同周登场,AI 圈大洗牌

发布于:2026-04-29 · #AI #Weekly #LLM #Agent

报告周期:2026 年 4 月 21 日 – 4 月 28 日|共 24 条精选新闻|涵盖国际 + 国内

本周是 2026 年迄今最密集的一周 AI 新闻——OpenAI 发布 GPT-5.5、DeepSeek 时隔 15 个月推出 V4 预览版、腾讯混元 Hy3、阿里 Qwen3.6、月之暗面 Kimi K2.6 同台竞技;商业侧,Microsoft 与 OpenAI 修订合约让 OpenAI 上 AWS 成为现实,英伟达市值首破 5 万亿美元SpaceX 抛出 600 亿美元收购 Cursor 的选择权改写编程工具格局;同时 Anthropic 与 Google、Amazon 双线绑定,资本与算力的合纵连横进入白热化。以下是按主题整理的 24 条核心新闻。


一、大模型发布与技术突破

1. OpenAI 发布 GPT-5.5 旗舰模型,距 GPT-5.4 仅 6 周

来源:OpenAI 官方 / CNBC|日期:2026-04-23
GPT-5.5(代号 “Spud”)在 Terminal-Bench 2.0 拿下 82.7%、FrontierMath 1–3 级 51.7%,Artificial Analysis 智能指数 60 分位列行业第一。同步推出 GPT-5.5 Pro 与 GPT-5.5 Thinking,首日开放 Plus/Pro/Business/Enterprise 用户,4 月 24 日开放 API。OpenAI 同时披露 ChatGPT 周活已突破 9 亿、Codex 活跃用户 400 万、付费业务用户 900 万。

2. DeepSeek V4 预览版发布并开源,引入 DSA 稀疏注意力

来源:DeepSeek 官方 / 量子位 / Bloomberg|日期:2026-04-24
V4 Pro(1.6 万亿总参 / 49B 激活)V4 Flash(2840 亿 / 13B 激活) 两版,原生支持 100 万 token 上下文。新引入的 DSA 稀疏注意力让 1M 场景下单 token FLOPs 仅为 V3.2 的 27%、KV cache 仅 10%。API 价格延续低价:Flash 输出 2 元/百万 tokens、Pro 输出 24 元/百万 tokens。该版本是 DeepSeek 首次完全使用华为昇腾 950 集群训练的旗舰模型,距上次大版本更新隔了 15 个月。

3. 腾讯混元 Hy3 preview 发布并开源,295B MoE 架构

来源:新浪财经 / 证券时报|日期:2026-04-23
腾讯首席 AI 科学家姚顺雨负责的 Hy3 preview 是混元基础设施”推倒重建”后的首个模型,总参数 295B、激活 21B、最大 256K 上下文,主打快慢思考融合。在腾讯云 TokenHub 上输入价低至 1.2 元/百万 tokens,整体推理效率提升 40%,已在元宝、QQ、CodeBuddy、腾讯文档首发上线。

4. 阿里通义 Qwen3.6-27B 开源,反超 397B 旧旗舰

来源:IT 之家 / MarkTechPost|日期:2026-04-22
Qwen3.6-27B 是 Qwen3.6 家族首个开源稠密多模态模型(Apache 2.0),原生 262K 上下文(可扩展至 1.01M),混合 Gated DeltaNet 与传统自注意力。在多项 agentic coding 基准上全面超越前代 Qwen3.5-397B-A17B(参数量是其 15 倍的 MoE 模型),GPQA Diamond 拿下 87.8 分。同周阿里还发布闭源旗舰 Qwen3.6-Max-Preview。

5. Moonshot 月之暗面发布 Kimi K2.6,业界最大开源模型

来源:MarkTechPost / SiliconANGLE|日期:2026-04-21(GA 上线)
1T 参数 MoE(每 token 激活 32B)、384 个专家、原生 256K 上下文。SWE-Bench Verified 80.2%、Terminal-Bench 2.0 66.7%、Humanity’s Last Exam 带工具 54.0 分(超 GPT-5.4 与 Claude Opus 4.6)。Agent Swarm 子系统从 100 智能体扩展到 300 子智能体、4000 步协调。因访问高峰,月之暗面 4 月 22 日致歉并将所有用户当月额度恢复至 100%。

6. Anthropic 本周无新模型发布,承诺 Claude 永远不投放广告

来源:Anthropic 官方|日期:2026-04-24 / 04-28
Claude Mythos 仍仅限 Project Glasswing 受限预览(约 11–40 家组织),Anthropic 明确表示不会公开 GA 发布。本周公司侧动态:与 NEC 合作建设日本最大 AI 工程师劳动力、任命澳新区域总经理开设悉尼办公室,以及发布博客明确”广告激励与真正有用的 AI 助手不相容”,承诺 Claude 永远不引入广告


二、AI 公司商业动态:千亿美元级合纵连横

7. Microsoft 与 OpenAI 修订合作协议,OpenAI 可登陆任意云

来源:OpenAI/Microsoft 官方 / TechCrunch|日期:2026-04-27
Microsoft 仍是 OpenAI 主要云合作伙伴但不再独家,OpenAI 现在可在任何云服务商提供其全部产品;Microsoft 对 OpenAI IP 授权延长至 2032 年但变非独家;OpenAI 给 Microsoft 的 revenue share 持续到 2030 年但设有总额上限。Amazon CEO Andy Jassy 同日宣布 OpenAI 模型将在数周内通过 AWS Bedrock 提供。Microsoft 股价当日下跌约 3%。

8. Google 确认对 Anthropic 投资最高 400 亿美元,承诺 5GW 算力

来源:CNBC / 路透|日期:2026-04-24
首期 100 亿美元按 3500 亿美元估值入场,其余 300 亿与里程碑挂钩;Google Cloud 同时承诺未来 5 年向 Anthropic 提供 5GW 算力,强化 Claude 与 Agent 生态的资源底座。

9. Amazon 追投 Anthropic 50 亿美元,签署千亿美元 AWS 算力协议

来源:Crunchbase News|日期:2026-04-22
Amazon 本轮追投 50 亿、未来还将追加多达 200 亿,加上此前 80 亿美元;配套协议规定 Anthropic 未来 10 年将向 AWS 采购超 1000 亿美元算力,是迄今最大规模的 AI 基础设施承诺之一。

10. 英伟达市值首破 5 万亿美元,AI 芯片股全线狂飙

来源:CNBC|日期:2026-04-24
英伟达股价收盘上涨 4.3% 至 208.27 美元,市值历史性突破 5 万亿美元。同日 Intel 单日涨 24%(1987 年以来最大涨幅)、AMD 涨 14%、高通涨 11%,费城半导体指数创历史新高。

11. DeepSeek 首次外部融资:腾讯+阿里拟投 18 亿美元,估值 200 亿美元

来源:新浪科技 / 21 世纪经济报道|日期:2026-04-22 至 24
The Information 与路透报道腾讯、阿里合计拟投 18 亿美元估值由初期 100 亿美元上调至超 200 亿美元(约 1365 亿元人民币)。这是 DeepSeek 成立以来首次外部融资,标志梁文锋长期”不引入外部资金”立场转变。背景是核心研发人员近期被字节、腾讯、小米挖角。

12. 前 DeepMind 研究员 David Silver 创立 Ineffable Intelligence,11 亿美元种子轮刷新欧洲纪录

来源:路透 / WHBL|日期:2026-04-27
估值 51 亿美元,红杉与 Lightspeed 领投,英伟达、Google 与英国”主权 AI”基金跟投,是欧洲史上最大种子轮融资。

13. Robinhood Ventures 7500 万美元购入 OpenAI 普通股

来源:GlobeNewswire|日期:2026-04-22
Robinhood 旗下 Ventures Fund I 公开宣布 7500 万美元购入 OpenAI 普通股,是 OpenAI 在 3 月底完成 1220 亿美元、估值 8520 亿美元创纪录融资后罕见的二级市场披露。

14. 千里科技与阶跃星辰共建”原生智驾基座模型”

来源:北京日报 / 证券时报|日期:2026-04-22
千里科技(601777.SH)与阶跃星辰从基座模型预训练阶段就深度融合通用语料与智驾感知数据。同期成立由千里、阶跃、爱芯元智、天数智芯组成的”千里联盟”,公布2026 年底智驾搭载量 100–130 万辆、2028 年达 800 万辆的目标,并计划 2030 年实现 30 万辆 Robotaxi 全球落地。


三、AI 开发者工具与 Agent 生态

15. SpaceX 抛出 600 亿美元收购 Cursor 选择权,打断 500 亿融资

来源:CNBC / Bloomberg / TechCrunch|日期:2026-04-21
SpaceX(已与 xAI 合并)获得在年内以 600 亿美元收购 Cursor 母公司 Anysphere 的选择权,否则向 Cursor 支付 100 亿美元合作费。该协议直接打断了 Cursor 原计划本周以 500 亿美元估值完成的 20 亿美元 Series E 融资。Cursor 将利用 SpaceX 的 Colossus 超算扩大其自研 Composer 模型训练。

16. Microsoft 365 Copilot Agent Mode 在 Word/Excel/PPT 全面 GA

来源:Microsoft / WindowsForum|日期:2026-04-22
用户输入高层目标,Agent 自动拆解多步执行计划并在文档内原地完成(重写 Word 长文、构建 Excel 透视、按企业模板重建 PPT)。面向现有 30 美元/用户/月的 Microsoft 365 Copilot 订阅用户开放,无额外费用。

17. Cognition 推出 Devin Review,洽谈 250 亿美元估值新一轮融资

来源:Cognition 官方 / SiliconANGLE / Bloomberg|日期:2026-04-23 / 04-27
Devin Review 是基于 AI 的 PR 代码审查工具,可智能 diff 重排、生成红/黄/灰三级 bug 检测报告,支持 npx devin-review {pr-link} CLI 调用。Bloomberg 同期报道 Cognition 正以约 250 亿美元估值再融资数亿美元,估值较 2025 年 9 月(102 亿美元)翻倍以上。

18. GitHub Copilot Cloud Agent 启动速度再提 20%,代码审查将开始计费

来源:GitHub Blog|日期:2026-04-27
通过 GitHub Actions 自定义运行器镜像预构建环境,Cloud Agent 在 3 月已实现 50% 提升基础上再快 20%。同日 GitHub 公告:自 2026-06-01 起,Copilot Code Review 将在新的 AI Credits 用量计费模型下双重计费——既消耗 AI Credits,也消耗 GitHub Actions runner 分钟。

19. Snowflake 推 “Agentic Enterprise” 控制平面,新增 Claude Code 插件

来源:SiliconANGLE|日期:2026-04-21
Snowflake 将平台定位为企业级 AI Agent 中央控制层,通过 MCP 协议与 ACP 跨外部数据系统协作(AWS Glue、Databricks、PostgreSQL),新增 VS Code 集成、Anthropic Claude Code 插件与 Python/TypeScript SDK。Snowflake 称自 Cortex Code 推出以来已有过半客户使用。

20. Anthropic “Project Deal” 让 Claude 在内部市场进行真实金钱交易

来源:Anthropic 推文 / Times of AI|日期:2026-04-24
在旧金山办公室搭建商品市场,由 Claude 代员工买卖、协商、定价并完成真实金钱交易,评估 LLM 代理在多方议价、价格策略与自主决策上的现实表现,是 Computer Use 路线的延伸研究。


四、行业应用落地:从医疗到工厂

21. OpenAI 推出 ChatGPT for Clinicians 临床医生免费版

来源:OpenAI / Fierce Healthcare|日期:2026-04-22
面向美国 verified 医生、护士执业者、PA、药剂师免费开放,使用 GPT-5.4 模型,专为临床文档、转诊信、医学文献研究设计。物理顾问审查超 70 万条回复,6924 次真实测试中 99.6% 被评为”安全准确”;同步发布 HealthBench Professional 基准——GPT-5.4 得 59.0 分,跑赢人类医生(不限时联网情况下)。

22. 火山引擎北京车展发布汽车 AI 方案,豆包大模型上车超 700 万辆

来源:中新社 / 科技日报|日期:2026-04-24
新一代基于 Agentic AI 架构的 AI 座舱套件方案。火山引擎披露已与 100% 主流车企合作,搭载豆包大模型的智能汽车超 700 万辆,覆盖 50+ 品牌、145 款车型;豆包日均完成超 3000 万次座舱交互,搭载量稳居行业第一。

23. Sony AI “Project Ace” 乒乓球机器人战胜职业选手登《自然》封面

来源:Sony AI / Nature|日期:2026-04-23
论文 “Outplaying Elite Table Tennis Players with an Autonomous Robot” 介绍全球首个能在物理世界以专业人类选手水平进行乒乓球比赛的自主机器人。2025 年 12 月以来对四名职业/精英选手测试中赢下三人;2026 年 3 月对三名新职业选手均至少胜一场,是 AI 首次在常见竞技体育项目达到专家级表现。

24. 德国 Sereact 完成 1.1 亿美元 B 轮,机器人大脑已部署 BMW、戴姆勒卡车

来源:PYMNTS|日期:2026-04-27
斯图加特 AI 机器人公司 Sereact 完成 1.1 亿美元 B 轮,Headline 领投。其 Cortex”机器人大脑”基于 10 亿次真实工厂”取放”操作训练,每 5.3 万次干预一次故障,已部署于 BMW 和戴姆勒卡车产线。


五、政策、版权与可持续发展

25. Bartz v. Anthropic 15 亿美元书籍版权和解最终批准听证

来源:Authors Guild|日期:2026-04-23
加州北区联邦法院召开最终公平性听证会。该 15 亿美元和解(覆盖约 50 万部作品、平均每部约 3000 美元)是美国版权史上最大集体和解。Anthropic 已支付首笔 3 亿美元,下一笔 3 亿美元应在 4 月 22 日前到账,剩余款项分两期到 2027 年 9 月前付清。

26. 欧盟拨款 6320 万欧元支持 AI 在健康与儿童在线安全领域创新

来源:欧盟委员会|日期:2026-04-21
通过”数字欧洲计划”资助 AI 在医疗与在线安全(特别是儿童保护、深度伪造检测)领域的创新部署,是 AI Continent Action Plan 落地的一部分。同周 4 月 28 日 AI Omnibus 召开第三轮三方谈判,议会版本拟将高风险 AI 系统合规义务从 2026 年 8 月推迟到 2027 年 12 月。

27. MIT 推出 EnergAIzer:数秒预测 AI 工作负载耗电

来源:MIT News|日期:2026-04-27
MIT 与 MIT-IBM Watson AI 实验室联合发布的方法可在数秒内预测特定 AI 模型在某 GPU 上的能耗。研究援引劳伦斯伯克利国家实验室估计——到 2028 年美国数据中心耗电将达全国 12%,新工具将帮助算法开发者部署前评估能耗。

28. 剑桥团队 Science Advances 论文:类脑芯片有望降 AI 能耗 70%

来源:ScienceDaily / 剑桥大学|日期:2026-04-23
基于改性氧化铪的纳电子器件同时处理与存储信息(仿神经元行为),避免数据在传统冯诺依曼架构中频繁搬运,原型测试显示能耗最高降低 70%

29. Anthropic 推出”经济指数调查”,月度追踪 AI 对就业的真实影响

来源:Anthropic|日期:2026-04-22
经济研究团队发起每月一次的调查,通过 Anthropic Interviewer 工具向随机抽样的 Claude 用户询问 AI 是否正在改变其工作。同期发布配套报告,对 12 月通过 Interviewer 收集的 81000 份开放式问卷进行经济学分析,旨在比传统劳动力市场指标更早捕捉 AI 引发的就业结构变化。

30. ICLR 2026 在里约召开,Microsoft 接收逾 100 篇论文

来源:Microsoft Research|日期:2026-04-23 至 27
第 14 届国际学习表征大会在里约 Riocentro 召开,是本周全球 AI 学术界焦点。Microsoft 接收超 100 篇论文,Stanford AI 实验室、牛津 OII、帝国理工等机构均有多篇展示。会议同期举办 RSI(递归自我改进)研讨会等多个对齐与安全相关 workshop,Google 展示了 TurboQuant 算法用于降低 KV 缓存量化的内存开销。


总结:基础设施重组、价格战升级、Agent 走向真实经济

本周三条主线值得长期跟踪。第一,基础设施在重组——Microsoft-OpenAI 解绑、Anthropic 同时绑定 Google 与 Amazon、DeepSeek 完全用昇腾训练 V4,意味着”模型公司+云”的强耦合时代正在终结,多云和主权算力成为头部玩家的标准配置。第二,模型价格战与开源逼近闭源同时发生——DeepSeek V4 Flash 输出仅 2 元/百万 tokens、Kimi K2.6 在 Humanity’s Last Exam 反超闭源旗舰、Qwen3.6-27B 用 27B 稠密模型干掉自家 397B MoE,开源/中国模型与闭源前沿的差距已缩短至 3–6 个月,价格差距却在扩大。第三,Agent 不再是 demo——Anthropic 让 Claude 在办公室真实买卖、Microsoft 把 Agent Mode 推入 7 亿 Office 用户日常、Snowflake 通过 MCP 把 Claude Code 接入企业数据底座、SpaceX 用 600 亿美元期权押注 Cursor,编程与企业工作流是 Agent 经济价值最先兑现的两个赛道

下一个值得期待的节点是 5 月初:Claude Mythos 是否会改变”不公开 GA”的立场?xAI Grok 5 是否如期 Q2 落地?DeepSeek V4 正式版与昇腾 950 超节点能否在下半年继续重塑成本曲线?我们下周见。


本周报数据截至 2026 年 4 月 28 日,所有新闻均经多源交叉验证。如发现信息更新或差异,请以官方源为准。