导语
7月的AI圈像被按下了快进键。国产大模型用实际成果回答了那个悬了两年多的疑问——万亿参数到底能不能靠国产芯片跑起来?而大洋彼岸,一家硅谷芯片初创用8亿美元融资告诉市场:AI推理的牌桌,不只英伟达有资格坐。与此同时,Anthropic在IPO前亮出了科研自动化的野心,微信把AI助手塞进了14亿人的对话框。今天的日报,带你看懂这些变化背后的信号。
1. 美团LongCat-2.0:国产算力的万亿参数答卷
6月30日,美团正式发布并开源新一代大模型LongCat-2.0——总参数1.6万亿的MoE架构模型,在五万卡国产算力集群上完成了从预训练到推理的全流程闭环。这是业界首次实现万亿参数模型”英伟达含量为零”的训推全链路。
技术层面有几个值得关注的细节:模型平均激活约48B参数、原生支持1M超长上下文、预训练数据超30T tokens。在SWE-bench Pro上取得59.5分,超越Gemini 3.1 Pro与Claude Opus 4.6,Terminal-Bench 2.1达到70.8分。此前LongCat-2.0预览版在OpenRouter平台的调用量已跻身全球前三。
探索者视角:LongCat-2.0的意义不止于参数竞赛。它证明了一套完整的国产AI基础设施——从芯片到算子适配、分布式通信、容错恢复——已经能支撑前沿模型的稳定训练。如果”国模+国芯”这条路径持续成立,那么全球大模型产业的供应链格局将在未来两到三年内发生实质性变化。不过需要冷静看待的是,GPT-5量级的竞争尚未到来,国产算力在更极端的训练规模下仍需验证。
2. Etched走出隐身模式:用8亿美元押注AI推理新芯片
硅谷芯片初创公司Etched于6月30日正式走出隐身模式,交出的不是PPT路线图,而是一颗在台积电N4P工艺上首次流片即成功的AI推理芯片。公司宣布已累计融资8亿美元(最近一轮5亿美元、估值50亿美元),投资方包括Peter Thiel、Jane Street、Two Sigma,以及Andrej Karpathy、Geoffrey Hinton、李飞飞等AI领域旗帜性人物。
目前Etched已获得超10亿美元的客户签约订单,首批机架将于今夏发货,系统已在运行DeepSeek、Qwen、Mamba、Llama等主流模型。
探索者视角:AI产业的稀缺资源正从”训练算力”转向”推理容量”。几乎所有生产环境的推理负载都跑在英伟达GPU上,而推理成本正成为AI商业化的核心瓶颈。Etched选择了”Transformer专用芯片”这条差异化路线——不追求通用性,但在特定架构的推理吞吐和能效上做到极致。这有点像当年挖矿芯片相对于通用GPU的故事。有意思的是,Hinton和李飞飞这样的学者也出现在投资者名单中,说明学术界同样看好专用推理芯片的前景。
3. Anthropic推出Claude Science:科研自动化的一次大胆押注
Anthropic于7月1日正式发布Claude Science——一个面向科学家的AI工作平台,整合60余个科学数据库,覆盖基因组学、蛋白质组学、结构生物学和化学信息学等领域。其核心设计思路是让AI代理端到端运行分析,并由独立的审核代理检查引文和计算结果——直击AI模型”捏造数据”的痛点。
产品亮点在于可追溯性:每一张数据图都附带生成代码、环境信息和完整对话历史,研究者数月后仍可追溯任何结果的来龙去脉。Claude Science支持在本地macOS/Linux或远程集群运行,大型敏感数据无需离开实验室环境。
与此同时,Anthropic估值已达9650亿美元,已向SEC保密提交S-1招股书,预计最早今年秋季登陆纳斯达克,将成为全球首个上市的前沿大模型实验室。
探索者视角:Anthropic的路径越来越清晰——不做消费级Chatbot,而是用”专业工具+垂直场景”构筑差异化壁垒。从Claude Code(编程)、Claude Cowork(法律/企业协作)到Claude Science(科研),每一款产品都瞄准一个高价值、高壁垒的专业领域。这种策略的好处是客户黏性极高、付费意愿强;风险在于——近万亿美元的估值,最终需要这些垂直工具的营收来支撑。Claude Science能否打开制药和生物科技的钱包,将是检验模型的关键一战。
4. 微信「小微」开启内测:超级App的AI Agent化
6月20日起,微信8.0.75版本灰度测试原生AI助手「小微」。用户可在主界面左上角看到绿色眼睛入口,或通过右滑唤起。小微底层采用腾讯自研WeLM模型(MoE架构),部分任务由DeepSeek辅助。它能操作微信原生功能(发消息、转账、发朋友圈),调用小程序完成点餐、打车、挂号等全链路服务,甚至支持一句话生成个人专属轻量化工具。
业内预计小微将在2026年第三季度向更多用户正式开放。而微信及WeChat合并月活已达14.32亿。
探索者视角:微信小微的真正看点不是AI能力本身,而是”入口×生态”的乘积效应。一个内嵌在14亿人每日必开App中的AI助手,天然解决了其他AI产品最大的难题——用户触达和习惯养成。数百万个小程序构成了一个已经验证的商业闭环,小微要做的是用自然语言替换”搜索→点击→操作”的路径。当然,灰度测试阶段的反馈显示功能完成度仍有限,这也是意料之中——微信对核心体验的打磨向来谨慎,慢比快好。
5. 谷歌发布Nano Banana 2 Lite与Gemini Omni Flash:多模态生成加速
谷歌在7月1日推出了Nano Banana 2 Lite(迄今最快、最经济的AI图像生成模型,4秒出图)和Gemini Omni Flash(视频生成与编辑模型)。Gemini Omni最突出的特性是对话式编辑——用户用自然语言描述修改需求,模型自动完成视频编辑,大幅降低非专业用户的创作门槛。
探索者视角:谷歌在多模态赛道的打法越来越清晰:不是做一个超强的单一模型,而是构建一个从轻量到旗舰的分层产品矩阵。Nano Banana 2 Lite解决”快和便宜”,Gemini Omni Flash解决”视频创作”,各自卡位不同场景。对话式视频编辑这个方向尤其值得关注——它把视频制作从”学软件”变成了”说需求”,这才是AI真正改变创作范式的路径。不过,谷歌必须面对的问题是:这些工具的变现路径是什么?广告?API调用?还是与Google Cloud的捆绑?
6. 英伟达Blackwell刷新DeepSeek V4推理纪录:单Token成本降至1/5
英伟达于6月30日宣布,在Blackwell平台上通过全栈推理优化,DeepSeek V4模型的单Token成本已降至上线初期的五分之一,单GPU吞吐量最高提升20倍。Baseten、Cognition、Cursor、Together AI等头部推理服务商已基于NVIDIA推理软件栈实现显著性能提升。
探索者视角:这个新闻和技术突破本身值得关注,但更值得思考的是英伟达的叙事策略。当行业热议”Etched们要取代GPU做推理”时,英伟达用一组数据回应:同样的模型,在我这跑,成本还能再降80%。这不是在证明推理芯片没前途,而是在暗示——软件栈和生态的护城河,比制程工艺更深。NVIDIA Dynamo、TensorRT LLM这些推理框架的持续优化,正在把单次硬件购买的竞争,变成”硬件+软件+持续性能复利”的体系化竞争。
7. 产业快讯速览
-
软银完成对OpenAI第二笔100亿美元后续投资:作为300亿美元总投资计划的一部分,第三笔100亿美元将于10月1日完成。OpenAI也在同步推进:推理成本已削减一半以上,ChatGPT非英语用户占比首次过半。
-
亚马逊云科技斥资10亿美元成立AI前线派驻工程部:直接派工程师入驻客户企业,帮助搭建和落地AI系统。这是从”卖工具”到”驻场共建”的战略升级。
-
我国具身智能产业高速增长:1-5月销售收入同比增长22.4%,优必选全尺寸超仿生人形机器人U1正式发布。八部门联合推动工业互联网高质量发展,目标2030年核心产业增加值突破2.5万亿元。
-
腾讯WorkBuddy进入广东政务系统:湾擎·WorkBuddy预发布,面向广东全省公务员开放使用,全国首个省级政务智能中枢平台上线试运行。
-
飞书发布多维表格智能体:让AI以团队成员身份常驻业务表,从日常数据表格出发配一个智能体,用自然语言驱动数据分析和流程自动化。
-
苹果Creator Studio:整合Final Cut Pro、Logic Pro和Pixelmator Pro的订阅套件,强调设备端AI的视频编辑与图像生成能力。
结语
今天的AI产业图景呈现出三条清晰的脉络:算力基础设施的多元化(国产芯片突破、专用推理芯片崛起、英伟达软件栈持续进化)、AI工具的专业化下沉(科研、政务、创作、编程等垂直场景的深度渗透),以及超级应用的Agent化(微信小微、飞书智能体代表的”AI原生入口”趋势)。
一个值得长期观察的问题是:当万亿参数模型在国产芯片上稳定运行、当专用推理芯片开始批量出货、当AI助手进入14亿人的日常——AI产业的成本结构、竞争格局和用户行为,将在未来12个月内发生怎样的变化?
以上就是今天的AI日报,明天见。