AI 芯片与基建

国产 AI 算力与芯片自主 2026

天际研究 · AI 实验室 · 2026.06.24 · 全文 14 页 · 预览 3 页

摘要

截至 2026 年 6 月下旬,国产 AI 算力正从"能用"向"好用、被资本重定价"切换。标志性信号有三:其一,资本侧,壁仞科技于 6 月 8 日纳入港股通后,6 月 25 日尾盘急拉近 18%、盘中触及 70.75 港元创上市新高,叠加 BIRENSUPA 接入 DeepSpeed 生态,显示南向资金对"国产 GPU 第一股"的重估;寒武纪融资余额升至约 259.7 亿元(占流通市值约 2.93%),较年初约 154 亿翻升约七成,两融维持高位。其二,生态侧,软硬协同闭环成型——DeepSeek-V4(4 月发布,上下文 128K 扩至 1M)由华为昇腾超节点(昇腾 950)全面支持、寒武纪同步适配;壁仞壁砺 166 系列深度适配 GLM-5、MiniMax M2.5、DeepSeek-V4、Qwen 等头部模型并获安全可靠 I 级认证。其三,全球侧,OpenAI 联手博通于 6 月 24 日发布自研推理 ASIC"Jalapeño",9 个月完成流片、推理成本有望降约 50%,印证"推理定制化、去 GPU 单一依赖"成为中美共同主线。本报告以产业综述视角,梳理算力自主的供给、生态、估值与风险四条主线。

关键发现

01资本重估加速:壁仞科技 6 月 8 日纳入港股通,6 月 25 日尾盘急拉近 18%、盘中高见 70.75 港元创上市新高,叠加 BIRENSUPA 接入 DeepSpeed 开源主线,南向资金对国产 GPU 龙头给出溢价。
02软硬协同闭环成型:壁砺 166 系列深度适配 GLM-5(744B/40B 激活,支持 DeepSeek 稀疏注意力)、MiniMax M2.5、DeepSeek-V4、Qwen 等头部模型,并获 2026 安全可靠测评 I 级认证。
03旗舰模型全面拥抱国产算力:DeepSeek-V4(4 月发布,上下文由 128K 扩至 1M)由华为昇腾超节点(昇腾 950)全面支持,寒武纪等同步完成适配,CUDA→国产栈的迁移路径走通。
04全球推理走向定制化:OpenAI 联手博通于 6 月 24 日发布自研推理 ASIC「Jalapeño」,9 个月完成流片、推理成本有望降约 50%,将于千兆瓦级数据中心与微软等部署。
05资金面维持高热:寒武纪融资余额升至约 259.7 亿元(占流通市值约 2.93%),较年初约 154 亿翻升约七成,两融高位反映情绪与筹码集中并存的双刃。
06主线确立:推理成本、模型适配深度、生态开源协同成为国产算力价值的三大锚点,单纯制程/算力峰值已非唯一估值依据。

引言:从“能算”到“被重定价”

过去十二个月,国产 AI 算力的叙事完成了一次质变。2025 年的核心问题是「能不能跑起来」——国产 GPU 能否承接训练与推理负载;到 2026 年年中,问题已变成「好不好用、值多少钱」。两条曲线同时上行:一条是工程曲线,主流国产芯片对前沿大模型的适配从「能跑」走向「跑得快、跑得稳、跑得省」;另一条是资本曲线,二级市场以港股通扩容、两融高位、龙头股价创新高的方式,对这套自主栈进行重新定价。

本报告维持原有论点与结构,以 2026 年 6 月下旬的最新事件刷新数据与判断。我们认为,国产算力自主已越过「可用性拐点」,正进入「生态与估值共振」阶段,但其可持续性取决于三件事:推理成本能否持续压降、模型适配能否保持深度、以及资金热度回归后基本面能否接棒。

资本侧:港股通重估与两融高位

资本市场是这一季最直观的温度计。壁仞科技于 6 月 8 日正式纳入港股通,南向资金获得直接通道;6 月 25 日,该股尾盘急拉近 18%、盘中高见 70.75 港元,创自 1 月 2 日上市以来新高,当日成交额约 12.8 亿港元。催化剂不仅是资金面——同日公司宣布自研 BIRENSUPA 软件栈完成对 DeepSpeed 底层加速后端的适配并合入开源主线,使其成为 DeepSpeed 原生支持的又一加速后端,生态背书与股价共振。

A 股侧,寒武纪两融维持高位:截至 6 月 23 日,融资余额约 259.7 亿元,占流通市值约 2.93%,较年初(1 月初约 154 亿元)增长约七成。两融高位是一把双刃剑:它既反映市场对国产算力主线的高度认同,也意味着筹码集中、波动放大,一旦情绪退潮,杠杆资金的回撤会被放大。本报告提示,资本侧的热度应与基本面(出货、毛利、适配深度)交叉验证,而非孤立解读。

生态侧:软硬协同闭环正在成型

如果说 2025 年国产算力缺的是「模型愿意适配」,2026 年上半年这道坎已被跨过。两个标志性事件:

其一,旗舰模型主动拥抱国产栈。DeepSeek-V4(4 月 24 日发布,上下文由 128K 扩展至 1M,约十倍跃升)由华为昇腾超节点(昇腾 950)全面支持——通过融合算子与多流并行降低 Attention 计算与访存开销,在 8K 输入下昇腾 950 超节点可达约 20ms TPOT、单卡 Decode 吞吐约 4700 TPS;寒武纪等也同步完成适配。这意味着从 CUDA 到 CANN 等国产软件栈的迁移路径被打通。

其二,国产 GPU 的模型适配走向「广度+深度」。壁仞壁砺 166 系列深度适配 GLM-5(744B 参数、40B 激活,支持 DeepSeek 稀疏注意力)、MiniMax M2.5、DeepSeek-V4(4 月 25 日完成适配验证与优化)及 Qwen、Step 等头部模型,并在 2026 安全可靠测评(第 2 号)中获 I 级认证。适配从「点对点」走向「平台级」,vLLM 插件、BIRENSUPA 软件栈成为承载工程优化的底座。生态闭环一旦成型,客户迁移成本与厂商护城河同步上升。

📄 完整报告

完整报告共 14 页 · 仅向合格投资人与合作伙伴定向提供

以上为公开预览。完整版包含以下章节，依合规要求不在公开页提供、亦不提供免费下载——请联系天际同事索取。

🔒供给侧:制程、封装与产能的三重约束
🔒全球对照:Jalapeño 与推理 ASIC 的范式转移
🔒竞争格局:昇腾、寒武纪、壁仞与第二梯队
🔒风险与情景:出口管制、估值透支与适配可持续性
🔒展望:2026 下半年的三个关键变量

联系天际索取完整报告 →

本报告为天际资本 AI 实验室出品的产业研究，基于公开信息整理，不构成投资建议；不含基金业绩、AUM 或募资要约。