AI 周报|2026.4.28 – 5.5
本周最大变量是分销而非模型。 OpenAI 与 Anthropic 在 5 月 4 日同一天分别联手 TPG/Brookfield/Bain/Advent 与 Blackstone/Goldman/H&F,各自成立 100 亿与 15 亿美元规模的”企业 AI 部署合资公司”,把工程师塞进 PE 投组合的中型企业里——这是前沿 AI 公司绕开传统咨询、直取存量企业市场的全新分销范式。与此并行,Anthropic 估值传闻冲到 9000 亿美元、超越 OpenAI;Cerebras 招股书更新冲刺 IPO;OpenAI–微软结束云独家;AWS Bedrock 上线 OpenAI 模型与 Codex;Mistral 抛出新旗舰 Medium 3.5;中国侧 DeepSeek 完成股权重组并降价、寒武纪与科大讯飞披露财报、华为云发布 AI CITY 2.0;欧盟 AI Act Omnibus 谈判破裂,8 月高风险条款仍如期生效。本期 30+ 条新闻按主题分类整理。
一、大模型与头部公司动态
OpenAI 与微软重订协议,结束云独家、IP 许可延至 2032
来源:OpenAI 官方博客 / Microsoft Blogs / CNBC|日期:2026-04-27(新闻周延续至 28 日)
微软不再是 OpenAI 独家云供应商,OpenAI 可在任何云上向客户交付产品;微软 IP 许可延至 2032 年但变非独家,营收分成至 2030 年并设上限,且与 AGI 触发条款脱钩。微软仍保留 OpenAI 重大股东身份。Sam Altman 称这开启”伙伴关系下一阶段”。
OpenAI 模型与 Codex 登陆 AWS Bedrock
来源:AWS Blog / OpenAI 官方|日期:2026-04-28
AWS “What’s Next 2026” 大会上推出三项 limited preview:GPT-5.5、GPT-5.4 经 Bedrock API 提供;Codex on Bedrock 支持 CLI、桌面应用与 VS Code 扩展;Bedrock Managed Agents 由 OpenAI 提供动力。延续 OpenAI 此前承诺消耗 2GW Trainium 算力的协议。
OpenAI 推出 Advanced Account Security 模式
来源:OpenAI 官网|日期:2026-05-04
ChatGPT 推出可选高级账户安全模式:抗钓鱼登录、关闭邮箱/短信找回(强制 passkey、安全密钥、恢复密钥)、缩短会话时长、自动豁免训练数据,覆盖 Codex;Trusted Access for Cyber 用户须在 2026 年 6 月 1 日前强制启用。
Mistral 发布旗舰 Medium 3.5、Vibe 远程 Agent 与 Le Chat Work Mode
来源:The Decoder / Mistral 官方|日期:2026-05-01
Medium 3.5 为 128B 密集架构、256k 上下文,融合聊天/推理/编码于单一模型,含 reasoning_effort 开关,以 Modified MIT License 开放权重,4 张 GPU 即可自部署,API 价 $1.50/M 输入、$7.50/M 输出。Vibe 是可异步并行的云端 Agent,本地 CLI 会话可”传送”上云;Le Chat Work Mode 提供敏感动作前显式批准的多步骤工作流。
Anthropic 重申 Claude 永久无广告
来源:Anthropic News|日期:2026-05-04
Anthropic 再次明确 Claude 不内嵌任何广告:用户不会看到赞助链接、回答不受广告主影响、不含未请求的第三方植入。承袭 2 月 Super Bowl 立场,本次扩展讨论”如何在不靠广告的前提下扩大访问”。
Anthropic 推出创意软件连接器,原生对接 Blender、Adobe、Ableton
来源:TestingCatalog(基于 Anthropic 官方 X)|日期:2026-04-28
Claude 原生连接 Blender、Autodesk Fusion、Adobe Creative Cloud、Ableton、Splice、Affinity by Canva,可调试场景、批量改对象、跨软件传输资产。同期与 RISD、Ringling、Goldsmiths 等院校合作首批试点。
Google 在车上大规模铺开 Gemini:通用汽车 400 万辆车纳入
来源:GM News|日期:2026-04-28
GM 把 Gemini 推送到 2022 款及以上配备 Google built-in 的 Cadillac、Chevrolet、Buick、GMC——美国约 400 万辆合资格车辆,是 Gemini 业界最大规模车载部署之一。Gemini Live 后续上线,年内 GM 还将推出基于 OnStar 数据微调的自研助手。
Google TV 上线 Nano Banana 与 Veo 视频生成
来源:TechCrunch|日期:2026-04-29
Gemini Tab “Create” 按钮支持 Nano Banana(语音替换服装/背景)和 Veo(生成短片或动画化静态图像),首发美国 Gemini-enabled TCL 电视。Google Photos 同步集成 Gemini 搜索、Remix 风格化与 Dynamic Slideshows。
Google I/O 2026 定档 5 月 19–20 日线上举办
来源:Google I/O 官网|日期:本周更新
开发者大会确认 5 月 19–20 日通过线上 Keynote 与会议形式举行,正好在本期周报窗口结束后两周。本周尚无超出预告页的发布会内容披露。
xAI 准备把 Grok Voice 推上 Apple CarPlay
来源:9to5Mac|日期:2026-05-02
最新版 iOS Grok 应用已植入 CarPlay 占位入口”Grok Voice mode coming soon to CarPlay”。Grok 已是 Tesla 内置功能,入驻 CarPlay 将使其与 ChatGPT、Perplexity 一道成为支持苹果车机的第三个主流 AI 聊天应用。
Meta 闭源新模型 Muse Spark 引发投行重启叙事
来源:CNBC|日期:2026-04-28
Muse Spark(4 月 8 日发布、原代号 Avocado)是 Meta 由 Alexandr Wang 领导的 Superintelligence Labs 推出的首款闭源模型,标志公司从 Llama 开源路线转向商业化付费 API。Truist 称”九个月内重建了 Meta 整个 AI 栈”。Meta 同期宣布 5 月 20 日裁员约 8000 人(占员工 10%),维持 1150–1350 亿美元 AI 资本开支指引。
二、企业 AI 部署 JV:本周最大商业变量
OpenAI 联合 TPG/Brookfield/Bain/Advent 成立 “The Deployment Company”,募资 40 亿美元,估值 100 亿美元
来源:Bloomberg|日期:2026-05-04
独立合资公司由 19 家投资者合计注入超 40 亿美元,post-money 估值 100 亿美元,OpenAI 控股。专注帮助中型企业部署 OpenAI 模型与代理。
Anthropic 联手 Blackstone、Goldman、Hellman & Friedman 设立 15 亿美元企业 AI 服务公司
来源:CNBC / TechCrunch / Fortune|日期:2026-05-04
Anthropic、Blackstone、H&F 各出 3 亿美元,Goldman 出 1.5 亿,General Atlantic、Apollo、GIC、Sequoia 跟投。Anthropic 工程师将驻场 PE 投组合的中型企业,围绕 Claude 重新设计工作流,直接对标麦肯锡、埃森哲的 AI 转型咨询业务。
三、融资、并购与 IPO
Anthropic 估值或冲 9000 亿美元,超越 OpenAI
来源:Bloomberg / CNBC / TechCrunch|日期:2026-04-29
六名信源称 Anthropic 收到多家机构 preemptive bids,估值区间 8500–9000 亿美元,融资规模或达 400–500 亿美元,被视为 IPO 前最后一轮私募。较 2 月 G 轮 350 亿美元 pre-money 估值翻倍以上。当前年化营收已逼近 400 亿美元。一家欲投 50 亿的机构甚至尚未与 CFO 见上面。
Cerebras 更新招股书,目标募资 35 亿美元,估值上限 266 亿
来源:CNBC / TechCrunch|日期:2026-05-04
计划 Nasdaq 发行 2800 万股,区间 $115–125,估值上限 266 亿美元,较 2 月 H 轮 230 亿再上调。2025 Q4 营收同比 +76% 至 5.1 亿美元,净利 8790 万。预计成 2026 年迄今最大科技 IPO。
Bret Taylor 旗下客服 Agent 公司 Sierra 完成 9.5 亿美元 E 轮,估值 158 亿
来源:CNBC / SiliconANGLE|日期:2026-05-04
由 Tiger Global 和 Google GV 领投,Benchmark、Sequoia、Greenoaks 跟投。post-money 估值 158 亿美元,较去年秋的 100 亿大幅上调。
法律 AI 平台 Legora 估值飙至 56 亿美元,英伟达 NVentures 入场
来源:TechCrunch / Crunchbase|日期:2026-04-30
完成 5000 万美元 D 轮 extension,由 NVentures 与 Accel 共同领投,Atlassian、Adams Street、Barclays 跟投。ARR 突破 1 亿美元,覆盖 50 个市场 1000 多家律所/法务团队。对比 Harvey 上月已达 110 亿美元估值,欧美法律 AI 双雄正面对决加剧。
推理云 DeepInfra 完成 1.07 亿美元 B 轮,每周处理近 5 万亿 tokens
来源:SiliconANGLE|日期:2026-05-04
500 Global 与前 Google 早期工程师 Georges Harik 共同领投,Nvidia、Samsung Next、Supermicro、Felicis、Peak6 跟投。营收自 2026 年初已 3 倍增长。
Netomi 完成 1.1 亿美元 C 轮,AI 客服已部署 United、Delta、DraftKings
来源:Tech Startups|日期:2026-04-30
由 Accenture Ventures 领投,Adobe Ventures 等参与。资金用于扩展主动式 AI 客服基础设施。
Nebius 6.43 亿美元收购推理优化公司 Eigen AI
来源:Nebius 官方 / SiliconANGLE|日期:2026-05-01
9800 万美元现金 + 380 万股 A 类股,整合进 Nebius Token Factory。Eigen AI 出自 MIT HAN Lab,仅 20 名员工——单员工估值约 3200 万美元。
Cisco 约 4 亿美元收购以色列 AI 安全公司 Astrix Security
来源:SecurityWeek / Calcalist|日期:2026-05-04
Astrix 专注 AI 代理与非人身份(NHI)安全,覆盖 API key、service account、OAuth token,将整合进 Cisco Identity Intelligence、Secure Access、Duo 与 Splunk。
SAP 同日宣布收购 Dremio 与 Prior Labs
来源:SAP News / SiliconANGLE|日期:2026-05-04
Dremio 让 SAP Business Data Cloud 成为 Apache Iceberg 原生平台;Prior Labs 将获 SAP 未来 4 年 10 亿欧元投入,建设欧洲领先的 Tabular Foundation Model 实验室。两笔交易金额未披露,预计 Q2/Q3 2026 完成。
四、AI 开发者工具与 Agent 生态
GitHub Copilot in Visual Studio 4 月更新:云代理 + 调试 Agent
来源:GitHub Blog|日期:2026-04-30
新增 Cloud Agent(IDE 内启动云代理、自动建 Issue 与 PR)、用户级自定义 Agent、Debugger Agent(用真实运行时验证修复);扩展 Agent Skills 发现路径,兼容 .claude/skills/ 与 .agents/skills/。
Cursor Security Review 进入 Beta,企业版上线模型控制系统
来源:Cursor Changelog|日期:2026-04-30 – 05-04
Teams/Enterprise 推出 Security Reviewer(每个 PR 自动审查 prompt injection、隐私风险等)和 Vulnerability Scanner。5 月 1 日推 Team Marketplace(打包 MCP servers/skills/subagents/rules/hooks)。5 月 4 日为 Enterprise 管理员提供模型粒度允许/阻止列表,配 50%/80%/100% 软硬限额告警。
Replit CEO 透露年化收入逼近 10 亿美元,NRR 达 300%
来源:TechCrunch|日期:2026-05-01
Amjad Masad 在 StrictlyVC 透露:从 2024 全年 280 万美元营收到接近 10 亿 ARR;Stripe 集成上线后流水以三位数百分比月环比增长,Net Revenue Retention 高达 300%。称 Anthropic 在核心 agentic loop 上”undefeated”。Replit 计划保持独立、考虑反向投资客户。
Jama Software 推出业内首个工程管理 MCP Server
来源:GlobeNewswire|日期:2026-05-04
Jama Connect 9.35 上线 MCP Server,可在 Claude、Codex、Cursor、GitHub Copilot、Visual Studio 等客户端中调用,结合 Traceability Information Model 进行规约驱动开发,强制执行权限与审计要求;可扩展至 1000 万 item / 1 亿 instance。
Workday 发布首个面向联邦 HR 的 PAR Agent
来源:Workday / Asanify|日期:2026-04-28
Personnel Action Request Agent 自动化招聘、晋升、调岗、薪酬变更等流程,按 OPM 政策验证数据。Workday 估算可使处理周期从 22–45 天压缩至 9–18 天,1 万员工的机构每年可省下约 6.4 万工时、356 万美元。
IBM Think 2026 聚焦 Agentic AI,Krishna 预测年度 AI Capex 逼近万亿美元
来源:IBM Think Newsroom|日期:2026-04-29 开幕
CEO Arvind Krishna 称 2026 年全球 AI 基础设施 capex 将逼近 1 万亿美元;强调企业必须打通 finance/legal/sales/back office 端到端流程、用 Agent 串起跨系统工作流。
五、中国 AI 生态
DeepSeek 梁文锋持股升至 34%,V4 系列连续大幅降价
来源:腾讯新闻 / 南方都市报|日期:2026-04-28
杭州深度求索注册资本由 1000 万增至 1500 万元,梁文锋持股从 1% 跃升至 34%。同时 DeepSeek V4-Pro 限时 2.5 折(5 月 5 日前),全系列输入缓存命中价降至原价 1/10——V4-Flash 缓存命中价低至每百万 tokens 0.02 元,Pro 为 0.025 元(仅为 Pro 原价的 1/40)。
寒武纪 Q1 营收同比增 159.56%,归母净利润大涨 185%
来源:新浪财经|日期:2026-04-29 披露
营收 28.85 亿元,归母净利润 10.13 亿元(+185.04%),扣非净利 9.34 亿元(+238.56%),经营现金流由 -13.99 亿转正为 +8.34 亿。研发费用率由 24.53% 降至 11.23%。同日因原材料库龄计提存货跌价 2.46 亿元。
科大讯飞 2025 年报:海外业务暴涨 275%,开放平台 Token 调用量同比 +4241%
来源:新浪科技|日期:2026-04-29
2025 年营收 271.05 亿元(+16.12%),归母净利 8.39 亿元(+49.85%),研发投入 53.64 亿(占营收 19.79%);海外业务收入同比增长 275%,讯飞开放平台第三方开发者大模型日均 Tokens 调用量同比 +4241%。Q1 2026 仍亏损 1.70 亿,主因研发与销售费用增加 3.49 亿。
百度 2025 年 AI 业务收入约 400 亿,文心一言月活破 2 亿
来源:新浪科技|日期:2026-04-29
全年营收 1291 亿元,AI 业务约 400 亿元;Q4 总营收 327 亿元(+5%),AI 业务占一般性业务收入 43%。CFO 何海建披露自 2023 年 3 月文心发布以来已在 AI 投入超百亿元。文心一言月活破 2 亿,正集成医疗、出行、教育、电商等近百项服务。
第九届数字中国建设峰会开幕:2025 年 Token 累计调用约 21100 万亿
来源:中新网|日期:2026-04-29 开幕
峰会汇聚 400+ 企业、6000+ 展品,新技术新产品首展率超 65%。国家数据局披露:2025 年我国系统软件、AI 产生的数据量达 26.92ZB,首次超过物联感知数据量;全年 Token 累计调用量约 21100 万亿,从年初日均超万亿增至年末 100 万亿。
华为云发布 AI CITY 2.0 全栈架构
来源:环球网(新浪转载)|日期:2026-04-29
在数字峰会”城市 AI 云论坛”上,华为云发布 AI CITY 2.0 架构,明确 AI 公共云作为城市智能体核心基底定位,覆盖底层基建、能力引擎、场景落地、终端触达四层。
AI 算力公司基流科技递表港交所,冲刺”AI Infra 第一股”
来源:界面新闻 / 新浪财经|日期:2026-04-29
清华系基流科技递交港股招股书,国泰君安国际独家保荐。近期完成 C+D 轮共近 20 亿元,D 轮后估值 13 亿美元。截至 4 月 20 日,提供技术支持的 GPU 卡数超 9 万张、在线运维算力超 34000 PFLOPS。营收三年 CAGR 304.5%。
腾讯/蚂蚁展出”能说会做”智能体:30 秒生成可分享小程序
来源:中新网|日期:2026-04-30
腾讯 WorkBuddy、QClaw 智能体可依自然语言指令自动完成文档处理、生成网站;蚂蚁”灵光”App 可一句话 30 秒生成可交互、可分享的小程序;中国移动”移动星厨”由 3 台机器人协同完成无人餐厅工作流;宇树机器人速度突破 10 米/秒。
自变量机器人发布全球首个”世界统一模型”WALL-B
来源:深圳新闻网|日期:2026-04-28
自变量机器人发布新一代具身智能基础模型 WALL-B,宣称为全球首个基于”世界统一模型架构(WUM)“的具身基础模型,将视觉、语言、动作、物理预测置于同一网络联合训练。已与 58 同城合作进入家庭服务场景。
上海”模速空间”周年成果:国产大模型词元周调用量首次反超海外
来源:中新网|日期:2026-04-30
3 月国产 AI 大模型词元周调用量达 7.359 万亿,全球调用榜前 4 名均为国产大模型;入驻企业出海占比超 30%,已与金砖国家完成 30+ 场国际交流合作。
六、AI 行业落地与就业影响
OpenAI 推出 ChatGPT for Clinicians 与 HealthBench Professional
来源:EyeWorld Weekly|日期:2026-05-01
OpenAI 发布”ChatGPT for Clinicians”,定位”支持文书撰写和医学研究等临床任务”,对美国持证医师、NP、PA 和药剂师免费开放。同步发布 HealthBench Professional——覆盖诊疗咨询、文书撰写、医学研究三类用例的开源临床基准。
Magic Circle 律所 Slaughter and May 全所部署 Harvey AI
来源:Legal IT Insider / Artificial Lawyer|日期:2026-04-30
英国 Magic Circle 顶级律所宣布将 Harvey 全平台部署到所有业务线,覆盖并购、尽调、监管研究、文档分析等多司法辖区事项。继 A&O Shearman、Linklaters(选 Legora)、Freshfields(选 Anthropic)后,Magic Circle 五大所中又一家明确 AI 合作伙伴。
Harvey AI 宣布在芝加哥开设新办公室
来源:ABA Journal|日期:2026-04-30
Harvey 7 月将在芝加哥开设新办公室,贴近 DLA Piper、Dentons US、Mayer Brown、Winston & Strawn 等当地客户。
支付与银行业押注”用 AI 反 AI 欺诈”
来源:Payments Dive|日期:2026-04-28
Nacha Smarter Faster Payments 大会上,Sardine、Featurespace(Visa 旗下)等高管表示,AI 生成的电话与合成身份攻击让传统反欺诈规则失效。银行内部新模型上线周期长达 18 个月,而欺诈分子可几小时内迭代——Featurespace 客户中心今年遭遇大规模 AI 生成语音通话攻击。
Suno 寻求 D 轮融资,估值或冲 50 亿美元
来源:Digital Music News|日期:2026-05-04
据 Forbes 匿名信源,AI 音乐头部 Suno 正寻求 D 轮,估值超 50 亿美元。截至 2 月 ARR 已达 3 亿美元、付费订阅 200 万。同时招聘 Legal Operations Leader,疑似进入 AI 法律工具市场。
Q1 2026 科技业裁员近 8 万人,约半数归因 AI 与自动化
来源:Tom’s Hardware / Nikkei Asia|日期:2026-04-29
2026 年 1–4 月科技业累计裁员 78,557 人,76% 集中在美国,47.9%(37,638 人)被归因于”AI 与工作流自动化导致的人力需求下降”。Oracle 4 月 1 日单日裁员约 1 万人(最终或达 3 万,TD Cowen 估算可省 100 亿美元投向 AI 数据中心);Meta 4 月 24 日宣布裁员 8000 人;Snap 计划削减约 1000 人。
Salesforce 计划聘 1000 名应届生,Gartner 调查显示 85% 客服领导反而扩充人工坐席
来源:CX Today|日期:2026-04-29
Marc Benioff 公开宣布 Salesforce 计划聘用 1000 名应届毕业生”建设和运营最新 AI 系统”。Gartner 调查显示 85% 客服与支持业务领导者正在增加人工坐席职责——成为”AI 是否消灭入门级岗位”辩论的关键反例。
七、监管、版权与隐私
欧盟 AI Act Omnibus 三方谈判破裂,8 月高风险条款仍如期生效
来源:IAPP|日期:2026-04-29
4 月 28 日约 12 小时的政治三方对话未能就修订达成一致。原定 Annex III 高风险系统义务推迟至 2027-12-02、Annex I 嵌入式推迟至 2028-08-02 的妥协未落地。AI Act 原定 2026-08-02 高风险系统合规期限继续法律生效。下一轮谈判暂定 5 月 13 日。Modulos、Bird & Bird、DLA Piper 同期均发布合规警示。
白宫拟出行政令成立 AI 工作组,研拟模型上市前政府审查
来源:Bloomberg / NYT|日期:2026-05-04
白宫官员上周已与 Anthropic、Alphabet/Google、OpenAI 高管沟通该方案细节。这是继 3 月白宫《AI 国家政策框架》之后的进一步举措。
印度马哈拉施特拉邦批准 1000 亿卢比 AI 政策 2026
来源:综合公告|日期:2026-04-29
首席部长 Devendra Fadnavis 领导的内阁通过 AI Policy 2026,配套规模约 1000 亿卢比(约 12 亿美元)。政策定位”主权云 + 工作流嵌入”,配套大型 AI 数据中心激励、本地推理合规与公共服务部署。
AI 版权诉讼追踪:OpenAI MDL 2000 万条输出日志披露 + Anthropic 15 亿美元和解听证排定
来源:Norton Rose Fulbright|日期:2026-05-05
S.D.N.Y. 在 3 月 9 日已下令 OpenAI 在 MDL 案中披露全部 2000 万条输出日志;Bartz v. Anthropic 15 亿美元和解案最终公平听证排定 5 月 14 日,被确认为美国史上最大版权和解;GEMA 起诉 OpenAI 歌词记忆案在慕尼黑地区法院已裁定 OpenAI 担责。
八、能源、环境与重要研究
加州 300+ 数据中心带来”水危机”——单设施日耗百万加仑级
来源:Times of San Diego / Inside Climate News|日期:2026-05-04
加州正向 300+ 数据中心规模迈进。Imperial Valley 拟建 100 亿美元、330MW 设施在峰值夏季日可耗水约 100 万加仑(相当于 1 万人日常用水)。UC Riverside 估计:2030 年全美数据中心需新增 6.97–14.51 亿加仑/天的水容量。
MIT 论文 EnergAIzer:GPU 功耗估算从”小时级”压缩到”秒级”
来源:MIT × MIT-IBM Watson AI Lab|日期:2026-04-27(论文)
EnergAIzer 在真实 AI 工作负载测试中相对真实功耗误差仅约 8%,与传统耗时数小时方法精度相当,但将估算速度从小时级压缩到秒级,使数据中心调度和 GPU 配置的迭代设计成为可能。
Stanford HAI AI Index 2026 本周延伸解读:美国私人 AI 投资是中国的 23 倍
来源:IEEE Spectrum|日期:本周持续解读至 2026-05-04
AI 数据中心装机容量已升至 29.6 GW,相当于纽约州峰值用电;Grok 4 训练估算碳排放 72,816 吨 CO₂e;运行 GPT-4o 推理的年度用水量可能超过 120 万人饮水需求;2025 年美国私人 AI 投资达 2859 亿美元,约为中国(124 亿)的 23 倍。
Anthropic 81000 人 159 国 AI 态度大型质性研究
来源:Psychology Today|日期:2026 年 4 月底
全球最大规模 AI 态度调查(81000 人、159 国、70 种语言、由 AI 完成访谈)发现:重度依赖 AI 进行情感支持的用户对”过度依赖”的恐惧是非依赖者的 3 倍。同期 2025 神经行为研究指出,使用 LLM 撰写论文的参与者在 4 个月内表现出更低的脑活跃度、更弱的语言质量和最弱的文本”自我归属感”。
九、本周总结
本周最值得记住的不是哪个新模型,而是”分销范式”的同步切换。 5 月 4 日 OpenAI 与 Anthropic 同日宣布与全球顶级 PE 机构成立企业 AI 部署合资公司,把工程师塞进中型企业里,这是前沿 AI 公司第一次系统性挑战麦肯锡、埃森哲所代表的传统咨询模式——AI 公司不再只卖 API,而是把分销与 PE 的”投后赋能”绑成新业态。配合 OpenAI–微软结束云独家、AWS Bedrock 开通 OpenAI 渠道、Anthropic 估值传闻冲到 9000 亿美元、Cerebras 招股书更新冲刺百亿 IPO,算力供给、模型分发与企业落地三条曲线同步重定价。
中国侧叙事则更聚焦在”效率与规模”:DeepSeek V4 的 1/40 价格、上海模速空间的国产词元调用反超、寒武纪与基流科技指向的 AI Infra 链条加速资本化,加上数字中国建设峰会披露的 21100 万亿 Token 年度调用量,构成与美国”千亿美元 capex 竞赛”完全不同的成本曲线。在监管层面,欧盟 AI Act Omnibus 谈判破裂意味着 8 月高风险条款的合规闹钟没有按下推迟键——所有部署招聘、绩效、监控、晋升类 AI 系统的企业必须重新校准时间表。最后一条暗线是水:加州 300 个数据中心的百万加仑日耗,与 MIT EnergAIzer 把 GPU 功耗估算从小时级压到秒级的研究形成耐人寻味的对照——真正决定 2027 年 AI 能否扩张的,可能是水电而非参数。下周看点:Google I/O 2026(5 月 19–20 日)前夕的预热、Cerebras 路演定价、Anthropic 是否正式接受 9000 亿美元 term sheet。