AI抗体设计工具全景图：从结构预测到从头设计

最后编辑于 2026年5月26日

AI抗体设计工具全景图：
从结构预测到从头设计

作者：贝叔 | 且来山笔记

文献来源：Vecchietti LF*, Wijaya BN*, et al. “Artificial intelligence-driven computational methods for antibody design and optimization.” mAbs 2025;17(1):2528902 | CC BY-NC 4.0

引言：一张图看懂AI抗体设计的任务拆解

抗体药物研发有一道”计算设计”的关口——从靶点确定、抗体结构预测，到序列优化、从头生成binder，每一步都有对应的AI模型在尝试替代或加速传统实验。

值得注意的是，这些AI工具的设计范围已从传统全长单克隆抗体扩展到多种抗体药物形式，包括纳米抗体（VHH）、scFv（单链可变片段）、双特异性抗体等，也为ADC（抗体偶联药物）、CAR-T等更广泛的生物药开发场景提供了可能性。

2025年6月，来自Max Planck安全与隐私研究所（MPI-SP）和韩国科学技术院（KAIST）的团队，在 mAbs 期刊发表了一篇26页的系统性综述，将这个领域的AI工具拆解为五大任务：

结构预测 → 表示学习 → 序列设计 → 无条件生成 → 限制抗原的条件生成

沿用五大任务的组织框架，对于综述所列超过100个模型，本文总结各阶段的三个问题：

这类工具解决什么问题？（在药物研发流程中的定位）
它们用了什么方法？（技术路线，不涉及数学公式）
现在还有哪些硬伤？（决策时要心中有数的局限性）

第一类：结构预测工具

解决的问题

传统上，抗体三维结构依赖X射线晶体学、Cryo-EM等实验手段，成本高、周期长。AI结构预测工具的目标：给一条氨基酸序列，自动推算出它的3D折叠构型，从而替代部分实验前的结构验证工作。

在抗体设计管线中，结构预测是所有后续工作的基础——没有精确的结构，亲和力评估、分子对接、序列优化都无从谈起。

代表工具清单

工具名	机构/来源	主要能力	抗体专属？
AlphaFold2（AF2）	DeepMind/Google	通用蛋白结构预测，业界基准	❌（通用）
AlphaFold3（AF3）	Google DeepMind	支持蛋白-小分子、蛋白-核酸复合物预测	❌（通用）
RoseTTAFold2（RF2）	Baker Lab / IPD	扩展RF的三轨网络，预测精度接近AF2	❌（通用）
ESMFold	Meta AI	无需多序列比对（MSA）快速推断	❌（通用）
IgFold	Gray Lab / JHU	专为抗体设计的快速结构预测，无需MSA	✅
ABodyBuilder3	Oxford / Exscientia	对IgFold架构增强，精度更优	✅
ImmuneBuilder	Oxford	覆盖抗体+TCR+纳米抗体的一站式结构预测	✅
RF2 Antibody	Bennett et al. / Baker Lab	在抗体结构数据上微调RF2，当前抗体结构预测最优	✅
tFold	Tencent AI Lab	支持抗体及抗原-抗体复合物预测	✅
DeepAb	Gray Lab / JHU	深度学习预测抗体骨架+CDR，结合Rosetta能量优化	✅

需要知道的局限

核心瓶颈：数据太少。
SAbDab（全球最大抗体结构数据库）目前仅收录约9,600个抗原-抗体复合物结构。考虑到聚类去冗余后，有效训练样本更少。这直接限制了所有抗体专用模型的预测精度上限，尤其体现在CDR（高变区）的预测上——而CDR恰恰是抗体结合特异性的核心。

即使是AF3和RF2 Antibody，在预测CDR H3环（最多变、最难预测的一环）时，仍存在明显误差。

第二类：表示学习工具（抗体语言模型）

解决的问题

如果说结构预测工具解决的是”看懂形状”，表示学习工具解决的是”理解语义“——把抗体序列或结构，压缩成一个包含生物学意义的低维向量，供下游的亲和力预测、序列优化、相似度搜索等任务调用。

对研发管线而言，表示学习是连接”有海量序列数据”和”想做精准优化”之间的桥梁。

代表工具清单

工具名	主要方法	输入类型	核心应用场景
AntiBERTy	BERT架构，无监督预训练	序列	抗体序列嵌入，亲和力预测辅助
AntiBERTa2	RoBERTa架构	序列	改进版AntiBERTy，更大规模预训练
AbLang	两个独立BERT模型（重链/轻链各一）	序列	抗体序列掩码填充，突变建议
IgLM	生成式GPT-2风格，可控生成	序列（物种+链类型 token 前缀）	生成类人抗体序列，设计多样性库
Ig-VAE	变分自编码器，结构重建	结构	结构空间搜索，用于无条件生成
GearBind	图神经网络结构编码器	结构	预测结合亲和力，已验证对SARS-CoV-2 Omicron有效
CSSP	对比学习（类CLIP），序列+结构联合编码	序列+结构	结合预测，抗原特异性评估
ESM-2（用于抗体）	Meta蛋白语言模型	序列	Hie et al. 用两轮突变实验验证亲和力提升

需要知道的局限

序列数据充裕，结构数据匮乏。
OAS（观测抗体空间数据库）收录了数十亿条抗体序列，因此基于序列的语言模型训练数据不是问题。但结构编码器需要3D数据，而抗体结构数据少得多（还是SAbDab那9,600个的瓶颈）。

当前的工程补救方案：用AI生成合成结构数据。 业界已普遍采用IgFold、ABodyBuilder3等工具批量生成合成结构，再用于训练结构编码器（如Ig-VAE、GearBind）。这本质上是一种”用AI预测的数据训练AI”的路线，精度会有传导性折损——每经过一轮合成数据的训练，误差可能逐级放大，需审慎评估。

第三类：序列设计工具

解决的问题

在已知抗原-抗体复合物结构的前提下，在固定骨架结构上重新设计氨基酸序列，以提升结合亲和力、稳定性、可开发性等属性。这是目前最成熟、实验验证最多的AI应用场景之一。

对应药物研发流程中的先导化合物优化阶段：已经有了一个可以结合靶点的抗体，现在要让它更好。

代表工具清单

工具名	技术路线	CDR范围	湿实验验证
ProteinMPNN	图神经网络，自回归序列预测	通用蛋白（可用于抗体）	✅（广泛）
ESM-IF1	GVP+Transformer	通用蛋白	✅
AbMPNN	ProteinMPNN微调版，抗体专用	全CDR	✅
AntiFold	ESM-IF1微调版，抗体专用	全CDR	✅
IgDesign（IgMPNN）	ProteinMPNN衍生，给定抗体骨架+抗原设计CDR	CDRH	✅
proseLM	结构感知语言模型（适配backbone coords）	全CDR / 全Fv	✅（25.4% CDRH成功率）
Shanker et al.	结构上下文感知LM + 进化式迭代优化循环	CDR突变建议	✅（lab-in-the-loop）

需要知道的局限

成功率：看起来光鲜，实际要打折。
proseLM在已知复合物结构前提下优化CDR的成功率是25.4%——听起来不错。但换到更难的任务（设计整个Fv可变域），成功率直接降到约2%。

另一个隐患：几乎所有序列设计工具都需要已知的抗体-抗原复合物实验结构作为输入。这意味着，在没有晶体结构数据的早期研发阶段，这类工具的直接应用场景有限。

第四类：无条件生成工具

解决的问题

不依赖特定靶点信息，直接生成”看起来像抗体”的序列或结构。用途是建立多样性库或者隐式地对特定抗原生成候选（当训练数据全都来自某一靶点的已知结合子时）。

这类工具更接近”创意生成”而非”定向设计”，目前在管线中多用于扩充候选池，为下游筛选提供更多原料。

代表工具清单

工具名	方法	生成范围	特点
IgLM	生成式语言模型，可控（物种+链）	全序列	可生成多样性库，物种可控
dWJS	离散游走-跳跃采样	CDR/全序列	速度快，作为lab-in-the-loop的序列设计后端
RefineGNN	图神经网络，序列-结构协同设计	单CDR	迭代生成，计算效率高
AbDiffuser	扩散模型，AHo编号系统，帧平均化处理	全抗体序列+结构	抗体专用扩散，处理可变长度难题，已验证HER2结合
IgDiff	FrameDiff微调，抗体专用	抗体结构	生成类抗体结构，后续需序列设计
BetterBodies	VAE + 强化学习指导扩散	CDRH3序列	专门提升SARS-CoV-2刺突RBD结合亲和力
Angermueller et al.	VAE + 分类/回归器，三轮迭代	单域抗体（VHH）	高通量平台反馈闭环，验证了SARS-CoV-1/2结合

需要知道的局限

缺乏靶向性，筛选成本高。
无条件生成的最大问题是”撒网式”策略——生成数量多，但与特定靶点的相关性无法保证。即使在HER2这样有大量已知binder数据的场景中，AbDiffuser也要先建立分类器来区分binder和non-binder，再从数千候选中挑16个做验证。这套流程对高通量实验平台有较高要求。

第五类：限制抗原的条件生成工具（核心）

解决的问题

这是全场最难、最有价值的任务：给定一个靶点蛋白（含特定表位），从头生成能特异性结合它的抗体序列和结构。

对应药物研发的最早期阶段——在还没有任何已知binder的情况下，直接让AI”造”出一个抗体分子。这是AI制药在抗体领域的终极目标，也是当前研究最密集、进展最快的方向。

代表工具清单：GNN架构

工具名	核心方法	设计范围	实验验证
HERN	层级图表示（粗粒度+精细粒度），迭代生成paratope	CDRH3（paratope）	仅in silico
MEAN	条件图翻译，多轮渐进全量推断	单CDRH	仅in silico
dyMEAN	MEAN扩展，端到端全原子设计，含对接模块	全CDR/全Fv	仅in silico
HTP	ESM-2 + EGNN，四级层级训练	全CDR	仅in silico
GeoAB	NeRF生成模板 + 异质GNN精修	CDR序列+结构	仅in silico（结构真实性更好）

需要知道的局限：GNN架构

绝大多数GNN方法假设抗原-抗体复合物的对接构象是已知的。 这意味着它们更适合在已有复合物结构的基础上进行优化，而非真正的从头设计。这是与扩散模型类工具的一个关键区别——后者尝试在生成过程中同时解决对接问题，更具挑战性但也更有前景。对于全新靶点（无任何已知binder结构）场景，GNN架构工具的直接适用性有限。

代表工具清单：扩散模型架构

工具名	核心方法	设计范围	实验验证
DiffAb	联合扩散（序列+Cα坐标+朝向），IPA注意力	单/多CDR	仅in silico
AbDPO	DiffAb + DPO能量偏好优化	CDR，低能量候选	仅in silico
DiffForce	DiffAb + 可微分力场引导采样	单CDR	仅in silico
AbX	得分扩散，含进化/物理/几何约束	全CDR	仅in silico
RFdiffusion Antibody ⭐	RFdiffusion微调，抗体复合物数据	VHH / scFv，全CDR	✅ 原子精度湿实验验证

代表工具清单：其他架构

工具名	核心方法	特点	实验验证
Sculptor	Ig-VAE + 表位引导场生成	专用于纳米抗体设计	✅（蛇毒素binder验证）
MaskedDesign	DockGPT对接 + IgMPNN序列设计	百万级候选筛选，1.8%成功率	✅（高通量）
ADesigner	几何神经网络 + 序列-结构协同精修	一次性推断	仅in silico
IgGM	ESM-PPI + 多级网络架构	抗原条件生成，全CDR	仅in silico
tFold-Ag	tFold + 序列恢复头	抗体-抗原复合物结构预测+设计	仅in silico

需要知道的局限

真实验证数据揭示的现实：成功率极低，但趋势向好。

方法设计类型实验规模成功率

proseLM 复合物结构已知，优化CDRH 未披露 ~25%

proseLM 复合物结构已知，设计全Fv 未披露 ~2%

MaskedDesign 仅CDRH3 百万级筛选 10.6%

MaskedDesign 全CDRH 百万级筛选 1.8%

RFdiffusion Antibody 全从头设计高通量9,000个极低（具体未披露）

AbDiffuser 已知binder池，16个验证 16个 57.1%为强binder

⚠️ 评估标准不统一，横比需谨慎：各研究组的实验验证方案差异极大——AbDiffuser从16个候选中筛选验证，MaskedDesign从百万级中筛选，成功率的分母完全不同。同一行”1.8%”和”57.1%”看起来前者更低，但背后的筛选规模差了5个数量级，无法直接横向比较。行业亟需统一的benchmark数据集和评估共识。

结论：越难（从头设计），成功率越低。但RFdiffusion Antibody已经在全从头设计上实现了原子精度的实验验证，这是里程碑级进展——尽管还需要高通量筛选配合。

另一个关键挑战是对接（Docking）：在非结合构象下预测抗原-抗体对接位置，是当前整个领域的技术瓶颈。现有多数方法绕过了这个问题（假设对接构象已知），而真正解决它才能实现真正的端到端设计。

方法	设计类型	实验规模	成功率
proseLM	复合物结构已知，优化CDRH	未披露	~25%
proseLM	复合物结构已知，设计全Fv	未披露	~2%
MaskedDesign	仅CDRH3	百万级筛选	10.6%
MaskedDesign	全CDRH	百万级筛选	1.8%
RFdiffusion Antibody	全从头设计	高通量9,000个	极低（具体未披露）
AbDiffuser	已知binder池，16个验证	16个	57.1%为强binder

总结：该如何用这张全景图

按研发阶段选工具

研发阶段	主要需求	推荐工具类别	成熟度
靶点确认后，结构解析前	预测抗体或复合物3D结构	结构预测（IgFold、RF2 Antibody、tFold）	★★★★☆
先导抗体优化阶段	提升已知binder的亲和力、稳定性	序列设计（ProteinMPNN、proseLM、AbMPNN）	★★★★☆
多样性库构建	扩充候选池，提供不同骨架选项	无条件生成（IgLM、AbDiffuser）	★★★☆☆
全新靶点，无已知binder	从头生成靶向binder	抗原条件生成（RFdiffusion Antibody、DiffAb）	★★☆☆☆

三个优先级排序建议

① 当前可信赖入管线：结构预测 + 已知binder优化

这两类工具的湿实验验证最多、成功率相对可接受，可以作为现有管线的辅助加速工具。

② 中期关注：无条件生成 + lab-in-the-loop框架

以dWJS、Shanker et al.为代表的迭代优化方法，将AI建议与湿实验反馈融合，是将AI工具融入研发闭环的实际路径。

③ 长远布局：抗原条件全从头设计

RFdiffusion Antibody代表了这个方向的当前最高水位。距离真正进管线还有距离，但已经是可以认真追踪的技术方向，尤其是对新靶点（无已知binder）场景。

两个贯穿始终的硬约束

数据瓶颈：SAbDab ~9,600个复合物结构，是所有抗体专用模型的天花板。数据增强（合成数据、负样本库建设）是短期内绕不过的工程问题。
评估标准不统一：各研究组的实验验证方案差异极大——有的用96个候选做低通量验证，有的筛9,000个做高通量，成功率的分母完全不同，横向比较意义有限。行业需要统一的benchmark数据集和评估共识。

文献信息

标题：Artificial intelligence-driven computational methods for antibody design and optimization

作者：Vecchietti LF*, Wijaya BN*, et al. （MPI-SP / KAIST / IBS 联合团队）

期刊：mAbs. 2025;17(1):2528902

DOI：https://doi.org/10.1080/19420862.2025.2528902

开放获取：CC BY-NC 4.0

作者：贝叔 | 且来山笔记
本文为文献解读，所有数据与结论以原文为准

贝叔

贝叔生物学学习者软件工业从业者基因组学大数据探索者新药开发践行者 AI应用记录者且来山是回不去的故乡

分类：

AI生命探索者

标签：

抗体优化

抗体研发数据库全景

和铂医药的AI叙事：首款AI候选药物LET003公布临床前数据

且来山AI笔记

AI抗体设计工具全景图：从结构预测到从头设计

AI抗体设计工具全景图：
从结构预测到从头设计

引言：一张图看懂AI抗体设计的任务拆解

第一类：结构预测工具

解决的问题

代表工具清单

需要知道的局限

第二类：表示学习工具（抗体语言模型）

解决的问题

代表工具清单

需要知道的局限

第三类：序列设计工具

解决的问题

代表工具清单

需要知道的局限

第四类：无条件生成工具

解决的问题

代表工具清单

需要知道的局限

第五类：限制抗原的条件生成工具（核心）

解决的问题

代表工具清单：GNN架构

需要知道的局限：GNN架构

代表工具清单：扩散模型架构

代表工具清单：其他架构

需要知道的局限

总结：该如何用这张全景图

按研发阶段选工具

三个优先级排序建议

两个贯穿始终的硬约束

Previous Post

Next Post

发表回复取消回复

AI抗体设计工具全景图：从结构预测到从头设计

AI抗体设计工具全景图：从结构预测到从头设计

引言：一张图看懂AI抗体设计的任务拆解

第一类：结构预测工具

解决的问题

代表工具清单

需要知道的局限

第二类：表示学习工具（抗体语言模型）

解决的问题

代表工具清单

需要知道的局限

第三类：序列设计工具

解决的问题

代表工具清单

需要知道的局限

第四类：无条件生成工具

解决的问题

代表工具清单

需要知道的局限

第五类：限制抗原的条件生成工具（核心）

解决的问题

代表工具清单：GNN架构

需要知道的局限：GNN架构

代表工具清单：扩散模型架构

代表工具清单：其他架构

需要知道的局限

总结：该如何用这张全景图

按研发阶段选工具

三个优先级排序建议

两个贯穿始终的硬约束

Previous Post

Next Post

发表回复 取消回复

AI抗体设计工具全景图：
从结构预测到从头设计

发表回复取消回复