一、算力底座:英伟达财报再超预期,AI基建高景气延续

2026年5月21日,英伟达公布2027财年第一财季财报,数据全面超出市场预期:一季度营收816.2亿美元,同比增长85%;数据中心业务收入752亿美元,同比增长92%,继续贡献公司绝大部分收入。公司预计二季度收入中值约910亿美元,并宣布追加800亿美元股票回购。

黄仁勋在财报中特别强调了一个新概念——ACIE(AI Cloud, Industrial & Enterprise)市场,覆盖制造、金融、医疗、能源等实体企业。他判断工业及企业端覆盖经济规模可达50万亿至80万亿美元,长期ACIE业务增速将优于超大规模客户业务。这意味着AI算力的主战场正在从互联网巨头向实体产业纵深迁移。

与此同时,AI服务器零部件短缺问题日益突出。纬颖总经理林威远指出,存储、高阶PCB板、MLCC等关键零部件供货全面吃紧,”有成套零部件才有机会出货”——在GPU逐渐放量的2025-2026年,供应链能否跟上,将直接决定AI算力交付的真实速度。

二、Token经济:DeepSeek掀起价格战,运营商入局

5月22日,DeepSeek宣布V4-Pro模型API价格永久降至每百万输入Token仅需2.5分钱,比原计划恢复原价后打了2.5折,成为中国乃至全球大模型供应商中价格最低的一家。这一表态背后折射出一个深层变化:通用模型层的定价权正从”技术稀缺性”让位于”规模运营效率”。

更值得关注的是,中国电信、中国移动、中国联通三大运营商近期陆续推出Token套餐,覆盖个人、家庭、开发者和中小微企业客户。运营商将Token纳入套餐体系,本质上是把AI算力包装成类似流量包的标准化产品——算力服务正式进入”按Token收费”的普惠阶段。

据OpenRouter数据,上周(5月18日至24日)全球AI大模型总调用量达28.9万亿Token,环比增长7.4%,连续五周上涨。其中中国AI大模型周调用量达9.223万亿Token,环比增长19.89%,增速显著高于美国(4.93万亿Token,环比+16.27%)。

三、盈利拐点:国产大模型从”烧钱”到”赚钱”

如果说2025年是国产大模型的”军备竞赛年”,那么2026年正在成为”盈利验证年”。近期多家港股上市的大模型概念股交出了关键答卷:

  • 智谱(02513.HK):2025年API收入达1.9亿元,同比暴增292.6%;截至2026年3月,API平台ARR已达17亿元,年初至今增长6.4倍。市场预计2026年全年营收将飙升至约32亿元。
  • MiniMax(0100.HK):2025年全年营收7904万美元,同比增长158.9%,毛利率跃升至25.4%,国际收入占比超70%。2026年2月ARR已突破1.5亿美元。
  • 商汤(0020.HK):2025年总营收突破50亿元,生成式AI业务收入36.3亿元,同比增长51%,占比飙升至72.4%。下半年EBITDA首次转正。
  • 明略科技(2718.HK):率先实现经调整净利润扭亏,Agentic Services首年收入即突破1亿元。
  • 迅策(3317.HK):2025年营收12.85亿元,同比翻倍增长103.28%,4月Token ARR季度环比暴增300%。

摩根大通分析师在5月22日的中国AI行业调研中给出核心判断:”部分AI应用开始展现出具有商业价值的初步迹象,特别是在工作流密集和数据饱满的垂直领域。”量子位智库报告显示,中国日均Token调用量已突破140万亿,两年间增长超千倍,头部产品的留存曲线正在从”尝鲜型”转向”工具型”。

四、模型竞赛:Google与智谱同日亮剑

5月20日,Google在I/O 2026大会上正式发布Gemini 3.5 Flash,作为3.5系列首款轻量级模型,成本仅为同类顶尖模型的一半甚至三分之一,输出速度高达289 tokens/秒,约为其他前沿模型的4倍。该模型在四大基准测试中均优于前代Gemini 3.1 Pro,部分指标领先GPT-5.5和Claude Opus 4.7。

两天后的5月22日,智谱面向企业客户推出GLM-5.1高速版API,输出速度达到每秒400 token。这意味着原本需要写作者连续伏案数天才能完成的文字量,模型可在1分钟内交付。

速度竞赛的背后,是模型能力正在从”能做多好”转向”能做多快、多便宜”——这恰恰是规模化落地的关键前提。

五、半导体新规则:华为”韬定律”

5月25日,在IEEE国际电路系统研讨会ISCAS 2026上,华为董事、半导体业务部总裁何庭波发表”韬(τ)定律”,这是中国在全球半导体领域首次提出指导产业发展的新原则。

“韬定律”并非停留在理论阶段。据何庭波介绍,在过去6年的实践中,基于该定律,华为已成功设计和量产了381款芯片,覆盖千行百业的需求。这一发布改变了全球半导体竞赛的叙事方式——从跟随者到规则制定者,中国半导体正在争取话语权。

六、Agent与具身智能:下一个战场

DeepSeek近期官网上线Agent Harness产品经理和研发工程师岗位,方向为代码智能体产品,内部对标Claude Code,团队使命定为”Model + Harness = Agent”。这表明国产大模型厂商正加快从单纯模型能力输出,向AI Coding和开发者工作流入口延伸。

特斯拉监督版FSD入华信号也在增强。特斯拉中国发布多个智能驾驶测试相关岗位,覆盖北京、上海、广州、深圳等城市,涉及实车测试、法规跟踪和Autopilot整车级测试,为FSD在中国市场的本土化落地做准备。

AI硬件公司Hark完成超7亿美元A轮融资,投后估值达60亿美元,NVIDIA、AMD、Intel等悉数参投。该公司致力于开发具备持久记忆的高度个性化智能系统,计划今年夏季推出首批AI产品。

写在最后

站在2026年5月的节点回望,AI产业正在经历一场静默而深刻的范式迁移:算力从稀缺走向商品化,模型从炫技走向降本,应用从尝鲜走向工具化,企业从烧钱走向盈利验证。国家发改委明确”指导国产大模型加大力度适配国产算力芯片”,政策、资本、技术三重共振之下,中国AI产业正在进入一个更务实、更可持续的新阶段。

Token经济的深水区,拼的不再是谁的模型参数更大,而是谁能在真实场景中持续创造价值。