AI产业周观察：从Token经济到盈利拐点 | Dios App

一、算力底座：英伟达财报再超预期，AI基建高景气延续

2026年5月21日，英伟达公布2027财年第一财季财报，数据全面超出市场预期：一季度营收816.2亿美元，同比增长85%；数据中心业务收入752亿美元，同比增长92%，继续贡献公司绝大部分收入。公司预计二季度收入中值约910亿美元，并宣布追加800亿美元股票回购。

黄仁勋在财报中特别强调了一个新概念——ACIE（AI Cloud, Industrial & Enterprise）市场，覆盖制造、金融、医疗、能源等实体企业。他判断工业及企业端覆盖经济规模可达50万亿至80万亿美元，长期ACIE业务增速将优于超大规模客户业务。这意味着AI算力的主战场正在从互联网巨头向实体产业纵深迁移。

与此同时，AI服务器零部件短缺问题日益突出。纬颖总经理林威远指出，存储、高阶PCB板、MLCC等关键零部件供货全面吃紧，”有成套零部件才有机会出货”——在GPU逐渐放量的2025-2026年，供应链能否跟上，将直接决定AI算力交付的真实速度。

二、Token经济：DeepSeek掀起价格战，运营商入局

5月22日，DeepSeek宣布V4-Pro模型API价格永久降至每百万输入Token仅需2.5分钱，比原计划恢复原价后打了2.5折，成为中国乃至全球大模型供应商中价格最低的一家。这一表态背后折射出一个深层变化：通用模型层的定价权正从”技术稀缺性”让位于”规模运营效率”。

更值得关注的是，中国电信、中国移动、中国联通三大运营商近期陆续推出Token套餐，覆盖个人、家庭、开发者和中小微企业客户。运营商将Token纳入套餐体系，本质上是把AI算力包装成类似流量包的标准化产品——算力服务正式进入”按Token收费”的普惠阶段。

据OpenRouter数据，上周（5月18日至24日）全球AI大模型总调用量达28.9万亿Token，环比增长7.4%，连续五周上涨。其中中国AI大模型周调用量达9.223万亿Token，环比增长19.89%，增速显著高于美国（4.93万亿Token，环比+16.27%）。

三、盈利拐点：国产大模型从”烧钱”到”赚钱”

如果说2025年是国产大模型的”军备竞赛年”，那么2026年正在成为”盈利验证年”。近期多家港股上市的大模型概念股交出了关键答卷：

智谱（02513.HK）：2025年API收入达1.9亿元，同比暴增292.6%；截至2026年3月，API平台ARR已达17亿元，年初至今增长6.4倍。市场预计2026年全年营收将飙升至约32亿元。
MiniMax（0100.HK）：2025年全年营收7904万美元，同比增长158.9%，毛利率跃升至25.4%，国际收入占比超70%。2026年2月ARR已突破1.5亿美元。
商汤（0020.HK）：2025年总营收突破50亿元，生成式AI业务收入36.3亿元，同比增长51%，占比飙升至72.4%。下半年EBITDA首次转正。
明略科技（2718.HK）：率先实现经调整净利润扭亏，Agentic Services首年收入即突破1亿元。
迅策（3317.HK）：2025年营收12.85亿元，同比翻倍增长103.28%，4月Token ARR季度环比暴增300%。

摩根大通分析师在5月22日的中国AI行业调研中给出核心判断：”部分AI应用开始展现出具有商业价值的初步迹象，特别是在工作流密集和数据饱满的垂直领域。”量子位智库报告显示，中国日均Token调用量已突破140万亿，两年间增长超千倍，头部产品的留存曲线正在从”尝鲜型”转向”工具型”。

四、模型竞赛：Google与智谱同日亮剑

5月20日，Google在I/O 2026大会上正式发布Gemini 3.5 Flash，作为3.5系列首款轻量级模型，成本仅为同类顶尖模型的一半甚至三分之一，输出速度高达289 tokens/秒，约为其他前沿模型的4倍。该模型在四大基准测试中均优于前代Gemini 3.1 Pro，部分指标领先GPT-5.5和Claude Opus 4.7。

两天后的5月22日，智谱面向企业客户推出GLM-5.1高速版API，输出速度达到每秒400 token。这意味着原本需要写作者连续伏案数天才能完成的文字量，模型可在1分钟内交付。

速度竞赛的背后，是模型能力正在从”能做多好”转向”能做多快、多便宜”——这恰恰是规模化落地的关键前提。

五、半导体新规则：华为”韬定律”

5月25日，在IEEE国际电路系统研讨会ISCAS 2026上，华为董事、半导体业务部总裁何庭波发表”韬（τ）定律”，这是中国在全球半导体领域首次提出指导产业发展的新原则。

“韬定律”并非停留在理论阶段。据何庭波介绍，在过去6年的实践中，基于该定律，华为已成功设计和量产了381款芯片，覆盖千行百业的需求。这一发布改变了全球半导体竞赛的叙事方式——从跟随者到规则制定者，中国半导体正在争取话语权。

六、Agent与具身智能：下一个战场

DeepSeek近期官网上线Agent Harness产品经理和研发工程师岗位，方向为代码智能体产品，内部对标Claude Code，团队使命定为”Model + Harness = Agent”。这表明国产大模型厂商正加快从单纯模型能力输出，向AI Coding和开发者工作流入口延伸。

特斯拉监督版FSD入华信号也在增强。特斯拉中国发布多个智能驾驶测试相关岗位，覆盖北京、上海、广州、深圳等城市，涉及实车测试、法规跟踪和Autopilot整车级测试，为FSD在中国市场的本土化落地做准备。

AI硬件公司Hark完成超7亿美元A轮融资，投后估值达60亿美元，NVIDIA、AMD、Intel等悉数参投。该公司致力于开发具备持久记忆的高度个性化智能系统，计划今年夏季推出首批AI产品。

写在最后

站在2026年5月的节点回望，AI产业正在经历一场静默而深刻的范式迁移：算力从稀缺走向商品化，模型从炫技走向降本，应用从尝鲜走向工具化，企业从烧钱走向盈利验证。国家发改委明确”指导国产大模型加大力度适配国产算力芯片”，政策、资本、技术三重共振之下，中国AI产业正在进入一个更务实、更可持续的新阶段。

Token经济的深水区，拼的不再是谁的模型参数更大，而是谁能在真实场景中持续创造价值。