返回研究报告
AI 医疗

AI 医疗投资拐点 2026:诊疗大模型与 AI 制药的双线突破

天际研究 · AI 实验室 · 2026.06.25 · 全文 11 页 · 预览 3 页

摘要

2026 年上半年,AI 医疗从"演示"走向"可验证、可入临床、可融资"的拐点。诊疗大模型一线,百川 Baichuan-M4 在 HealthBench 知识类指标全面登顶,并将幻觉率压到 3.3% 的行业最低水平;临床落地侧,环境式记录公司 Abridge 完成 3 亿美元 E 轮、估值约 53 亿美元,部署超 150 家医疗系统;Tempus AI 的房颤预测 ECG-AI 模型完成三中心、4017 例多中心验证并发表于《Heart Rhythm》,标志医疗 AI 从"可用"走向"循证"。AI 制药一线,谷歌系 Isomorphic Labs 完成 21 亿美元 B 轮(累计约 26 亿美元);英矽智能与 SK 生物制药达成总额最高 25 亿美元的神经免疫合作(首付与近期里程碑仅约 1800 万美元、后端权重极高),并完成 AI 设计的 NLRP3 抑制剂 ISM8969 首例人体给药。资本市场上,晶泰科技与英矽智能作为港股双锚,既验证了商业化与盈利的可能性,也暴露了估值的高波动。本报告认为,2026 年的"双线突破"标志 AI 医疗进入由临床证据与现金里程碑共同定价的新阶段,而非单纯由模型能力定价。数据更新至 2026-06-27。

关键发现

  • 01诊疗大模型进入'循证'阶段:百川 Baichuan-M4 在 HealthBench 知识类指标全面登顶,幻觉率降至 3.3% 的行业最低,刷新可靠性上限。
  • 02环境式临床记录成为最快变现赛道:Abridge 完成 3 亿美元 E 轮、估值约 53 亿美元(a16z 领投),四个月内部署医疗系统由约 100 家增至 150+,印证'减负型 AI'的付费意愿。
  • 03医疗 AI 拿到循证里程碑:Tempus AI 的房颤预测 ECG-AI 模型在三中心、4017 例患者中完成多中心验证并发表于《Heart Rhythm》,支撑其 2024 年 FDA 授权的真实世界有效性。
  • 04AI 制药一级市场重定价:Isomorphic Labs 完成 21 亿美元 B 轮(Thrive 领投,累计约 26 亿美元),将'AI 优先药物设计'推向规模化平台叙事。
  • 05BD 结构后端化:英矽智能与 SK 生物制药达成总额最高 25 亿美元的神经免疫合作,但首付与近期里程碑仅约 1800 万美元,显示药企为 AI 资产付费仍以临床进展为兑现前提。
  • 06AI 设计药物迈入人体:英矽 AI 生成的脑渗透型 NLRP3 抑制剂 ISM8969 于 2026 年 6 月完成首例人体给药(与 Hygtia 合作),从概念到 FIH 的速度成为新基准;港股晶泰科技(02228)、英矽智能(03696)成为估值双锚,验证盈利可能性同时暴露高波动。

引言:从'能说'到'能验证'的拐点

过去两年,AI 医疗的故事主要由模型能力书写——更高的考试分数、更流畅的问诊对话。2026 年上半年,叙事发生了根本转变:决定估值的不再只是'模型多聪明',而是三件可被外部检验的事——临床证据、监管路径、现金里程碑

这一转变在两条主线上同时发生。诊疗大模型一线,百川 Baichuan-M4 在 HealthBench 知识类指标全面登顶,并把幻觉率压到 3.3% 的行业最低水平,把'可靠性'而非'流畅性'变成竞争焦点;与此同时,Abridge 用 3 亿美元 E 轮、约 53 亿美元估值证明,真正能立刻收费的是'替医生减负'的环境式记录,而 Tempus AI 用一篇发表于《Heart Rhythm》的多中心验证,把医疗 AI 推进到'循证'门槛。AI 制药一线,Isomorphic Labs 的 21 亿美元 B 轮、英矽智能与 SK 的最高 25 亿美元合作,以及 ISM8969 的首例人体给药,共同标志'AI 设计药物'从 PPT 走向临床。

本报告维持原有判断:2026 是 AI 医疗的投资拐点。但拐点的本质,是定价权从'模型 demo'转移到'可验证的临床与商业事实'。

诊疗大模型:可靠性成为新护城河

诊疗大模型的竞争重心,正从'能不能答对'转向'答错的概率有多低'。在医疗场景,一次幻觉可能直接转化为临床风险,因此幻觉率已成为比榜单分数更硬的指标。

百川 Baichuan-M4 是这一逻辑的最新代表:它在 HealthBench 的知识类指标上全面登顶,并将幻觉率降至 3.3%,刷新此前 M3 系列(约 3.5%)的纪录(arXiv 2606.08982)。这意味着头部团队的优化目标已从'更博学'转向'更不犯错',把可靠性做成护城河。

但模型能力只是入口,真正决定商业化速度的是落地形态。Abridge 给出了最清晰的答案:它把大模型用在'环境式临床记录'——在医患对话现场,自动生成可计费的临床文档,直接为医生减负。2026 年,Abridge 完成由 a16z 领投的 3 亿美元 E 轮,估值升至约 53 亿美元,部署医疗系统在四个月内从约 100 家增至 150 家以上。这说明:在诊疗大模型赛道,'替医生省时间'的刚需,比'替医生看病'的愿景更早跑通付费模型。

循证医疗 AI:Tempus 与监管级证据

如果说环境式记录解决的是'效率',那么诊断与预测类 AI 解决的是'准确性',而后者必须用循证医学的标准来检验。2026 年 6 月,Tempus AI 公布其房颤(AF)预测 ECG-AI 模型的多中心验证结果,并发表于心律学顶刊《Heart Rhythm》。

这项研究覆盖三个地理上不同的临床中心、共 4017 名 65 岁以上、既往无房颤、无起搏器/除颤器史的患者;模型给出的一年期房颤/房扑风险评分超过预设性能阈值,为该软件 2024 年获得的 FDA 授权提供了真实世界有效性支撑。

其意义在于:它把医疗 AI 从'内部测试集表现好'推进到'多中心、可发表、支撑监管授权'的循证门槛。对投资人而言,这类'监管级证据 + FDA 路径'的资产,定价逻辑已接近器械/诊断公司,而非纯软件公司——这也是 2026 年医疗 AI 估值分化的根源:有循证证据者享受确定性溢价,仅有 demo 者被重新打折。

📄 完整报告

完整报告共 11 页 · 仅向合格投资人与合作伙伴定向提供

以上为公开预览。完整版包含以下章节,依合规要求不在公开页提供、亦不提供免费下载——请联系天际同事索取。

  • 🔒AI 制药:从 21 亿美元 B 轮到首例人体给药
  • 🔒BD 结构解码:为何 25 亿美元合作的首付只有 1800 万
  • 🔒港股双锚:晶泰科技与英矽智能的估值再校准
  • 🔒风险与变量:监管、数据与临床转化的三重不确定性
  • 🔒投资框架:用'临床证据 × 现金里程碑'给 AI 医疗定价

本报告为天际资本 AI 实验室出品的产业研究,基于公开信息整理,不构成投资建议;不含基金业绩、AUM 或募资要约。