AI抗体设计工具全景图:从结构预测到从头设计
AI抗体设计工具全景图:
从结构预测到从头设计
作者:贝叔 | 且来山笔记
引言:一张图看懂AI抗体设计的任务拆解
抗体药物研发有一道”计算设计”的关口——从靶点确定、抗体结构预测,到序列优化、从头生成binder,每一步都有对应的AI模型在尝试替代或加速传统实验。
值得注意的是,这些AI工具的设计范围已从传统全长单克隆抗体扩展到多种抗体药物形式,包括纳米抗体(VHH)、scFv(单链可变片段)、双特异性抗体等,也为ADC(抗体偶联药物)、CAR-T等更广泛的生物药开发场景提供了可能性。
2025年6月,来自Max Planck安全与隐私研究所(MPI-SP)和韩国科学技术院(KAIST)的团队,在 mAbs 期刊发表了一篇26页的系统性综述,将这个领域的AI工具拆解为五大任务:
结构预测 → 表示学习 → 序列设计 → 无条件生成 → 限制抗原的条件生成
沿用五大任务的组织框架,对于综述所列超过100个模型,本文总结各阶段的三个问题:
- 这类工具解决什么问题?(在药物研发流程中的定位)
- 它们用了什么方法?(技术路线,不涉及数学公式)
- 现在还有哪些硬伤?(决策时要心中有数的局限性)
第一类:结构预测工具
解决的问题
传统上,抗体三维结构依赖X射线晶体学、Cryo-EM等实验手段,成本高、周期长。AI结构预测工具的目标:给一条氨基酸序列,自动推算出它的3D折叠构型,从而替代部分实验前的结构验证工作。
在抗体设计管线中,结构预测是所有后续工作的基础——没有精确的结构,亲和力评估、分子对接、序列优化都无从谈起。
代表工具清单
| 工具名 | 机构/来源 | 主要能力 | 抗体专属? |
|---|---|---|---|
| AlphaFold2(AF2) | DeepMind/Google | 通用蛋白结构预测,业界基准 | ❌(通用) |
| AlphaFold3(AF3) | Google DeepMind | 支持蛋白-小分子、蛋白-核酸复合物预测 | ❌(通用) |
| RoseTTAFold2(RF2) | Baker Lab / IPD | 扩展RF的三轨网络,预测精度接近AF2 | ❌(通用) |
| ESMFold | Meta AI | 无需多序列比对(MSA)快速推断 | ❌(通用) |
| IgFold | Gray Lab / JHU | 专为抗体设计的快速结构预测,无需MSA | ✅ |
| ABodyBuilder3 | Oxford / Exscientia | 对IgFold架构增强,精度更优 | ✅ |
| ImmuneBuilder | Oxford | 覆盖抗体+TCR+纳米抗体的一站式结构预测 | ✅ |
| RF2 Antibody | Bennett et al. / Baker Lab | 在抗体结构数据上微调RF2,当前抗体结构预测最优 | ✅ |
| tFold | Tencent AI Lab | 支持抗体及抗原-抗体复合物预测 | ✅ |
| DeepAb | Gray Lab / JHU | 深度学习预测抗体骨架+CDR,结合Rosetta能量优化 | ✅ |
需要知道的局限
核心瓶颈:数据太少。
SAbDab(全球最大抗体结构数据库)目前仅收录约9,600个抗原-抗体复合物结构。考虑到聚类去冗余后,有效训练样本更少。这直接限制了所有抗体专用模型的预测精度上限,尤其体现在CDR(高变区)的预测上——而CDR恰恰是抗体结合特异性的核心。即使是AF3和RF2 Antibody,在预测CDR H3环(最多变、最难预测的一环)时,仍存在明显误差。
第二类:表示学习工具(抗体语言模型)
解决的问题
如果说结构预测工具解决的是”看懂形状”,表示学习工具解决的是”理解语义“——把抗体序列或结构,压缩成一个包含生物学意义的低维向量,供下游的亲和力预测、序列优化、相似度搜索等任务调用。
对研发管线而言,表示学习是连接”有海量序列数据”和”想做精准优化”之间的桥梁。
代表工具清单
| 工具名 | 主要方法 | 输入类型 | 核心应用场景 |
|---|---|---|---|
| AntiBERTy | BERT架构,无监督预训练 | 序列 | 抗体序列嵌入,亲和力预测辅助 |
| AntiBERTa2 | RoBERTa架构 | 序列 | 改进版AntiBERTy,更大规模预训练 |
| AbLang | 两个独立BERT模型(重链/轻链各一) | 序列 | 抗体序列掩码填充,突变建议 |
| IgLM | 生成式GPT-2风格,可控生成 | 序列(物种+链类型 token 前缀) | 生成类人抗体序列,设计多样性库 |
| Ig-VAE | 变分自编码器,结构重建 | 结构 | 结构空间搜索,用于无条件生成 |
| GearBind | 图神经网络结构编码器 | 结构 | 预测结合亲和力,已验证对SARS-CoV-2 Omicron有效 |
| CSSP | 对比学习(类CLIP),序列+结构联合编码 | 序列+结构 | 结合预测,抗原特异性评估 |
| ESM-2(用于抗体) | Meta蛋白语言模型 | 序列 | Hie et al. 用两轮突变实验验证亲和力提升 |
需要知道的局限
序列数据充裕,结构数据匮乏。
OAS(观测抗体空间数据库)收录了数十亿条抗体序列,因此基于序列的语言模型训练数据不是问题。但结构编码器需要3D数据,而抗体结构数据少得多(还是SAbDab那9,600个的瓶颈)。当前的工程补救方案:用AI生成合成结构数据。 业界已普遍采用IgFold、ABodyBuilder3等工具批量生成合成结构,再用于训练结构编码器(如Ig-VAE、GearBind)。这本质上是一种”用AI预测的数据训练AI”的路线,精度会有传导性折损——每经过一轮合成数据的训练,误差可能逐级放大,需审慎评估。
第三类:序列设计工具
解决的问题
在已知抗原-抗体复合物结构的前提下,在固定骨架结构上重新设计氨基酸序列,以提升结合亲和力、稳定性、可开发性等属性。这是目前最成熟、实验验证最多的AI应用场景之一。
对应药物研发流程中的先导化合物优化阶段:已经有了一个可以结合靶点的抗体,现在要让它更好。
代表工具清单
| 工具名 | 技术路线 | CDR范围 | 湿实验验证 |
|---|---|---|---|
| ProteinMPNN | 图神经网络,自回归序列预测 | 通用蛋白(可用于抗体) | ✅(广泛) |
| ESM-IF1 | GVP+Transformer | 通用蛋白 | ✅ |
| AbMPNN | ProteinMPNN微调版,抗体专用 | 全CDR | ✅ |
| AntiFold | ESM-IF1微调版,抗体专用 | 全CDR | ✅ |
| IgDesign(IgMPNN) | ProteinMPNN衍生,给定抗体骨架+抗原设计CDR | CDRH | ✅ |
| proseLM | 结构感知语言模型(适配backbone coords) | 全CDR / 全Fv | ✅(25.4% CDRH成功率) |
| Shanker et al. | 结构上下文感知LM + 进化式迭代优化循环 | CDR突变建议 | ✅(lab-in-the-loop) |
需要知道的局限
成功率:看起来光鲜,实际要打折。
proseLM在已知复合物结构前提下优化CDR的成功率是25.4%——听起来不错。但换到更难的任务(设计整个Fv可变域),成功率直接降到约2%。另一个隐患:几乎所有序列设计工具都需要已知的抗体-抗原复合物实验结构作为输入。这意味着,在没有晶体结构数据的早期研发阶段,这类工具的直接应用场景有限。
第四类:无条件生成工具
解决的问题
不依赖特定靶点信息,直接生成”看起来像抗体”的序列或结构。用途是建立多样性库或者隐式地对特定抗原生成候选(当训练数据全都来自某一靶点的已知结合子时)。
这类工具更接近”创意生成”而非”定向设计”,目前在管线中多用于扩充候选池,为下游筛选提供更多原料。
代表工具清单
| 工具名 | 方法 | 生成范围 | 特点 |
|---|---|---|---|
| IgLM | 生成式语言模型,可控(物种+链) | 全序列 | 可生成多样性库,物种可控 |
| dWJS | 离散游走-跳跃采样 | CDR/全序列 | 速度快,作为lab-in-the-loop的序列设计后端 |
| RefineGNN | 图神经网络,序列-结构协同设计 | 单CDR | 迭代生成,计算效率高 |
| AbDiffuser | 扩散模型,AHo编号系统,帧平均化处理 | 全抗体序列+结构 | 抗体专用扩散,处理可变长度难题,已验证HER2结合 |
| IgDiff | FrameDiff微调,抗体专用 | 抗体结构 | 生成类抗体结构,后续需序列设计 |
| BetterBodies | VAE + 强化学习指导扩散 | CDRH3序列 | 专门提升SARS-CoV-2刺突RBD结合亲和力 |
| Angermueller et al. | VAE + 分类/回归器,三轮迭代 | 单域抗体(VHH) | 高通量平台反馈闭环,验证了SARS-CoV-1/2结合 |
需要知道的局限
缺乏靶向性,筛选成本高。
无条件生成的最大问题是”撒网式”策略——生成数量多,但与特定靶点的相关性无法保证。即使在HER2这样有大量已知binder数据的场景中,AbDiffuser也要先建立分类器来区分binder和non-binder,再从数千候选中挑16个做验证。这套流程对高通量实验平台有较高要求。
第五类:限制抗原的条件生成工具(核心)
解决的问题
这是全场最难、最有价值的任务:给定一个靶点蛋白(含特定表位),从头生成能特异性结合它的抗体序列和结构。
对应药物研发的最早期阶段——在还没有任何已知binder的情况下,直接让AI”造”出一个抗体分子。这是AI制药在抗体领域的终极目标,也是当前研究最密集、进展最快的方向。
代表工具清单:GNN架构
| 工具名 | 核心方法 | 设计范围 | 实验验证 |
|---|---|---|---|
| HERN | 层级图表示(粗粒度+精细粒度),迭代生成paratope | CDRH3(paratope) | 仅in silico |
| MEAN | 条件图翻译,多轮渐进全量推断 | 单CDRH | 仅in silico |
| dyMEAN | MEAN扩展,端到端全原子设计,含对接模块 | 全CDR/全Fv | 仅in silico |
| HTP | ESM-2 + EGNN,四级层级训练 | 全CDR | 仅in silico |
| GeoAB | NeRF生成模板 + 异质GNN精修 | CDR序列+结构 | 仅in silico(结构真实性更好) |
需要知道的局限:GNN架构
绝大多数GNN方法假设抗原-抗体复合物的对接构象是已知的。 这意味着它们更适合在已有复合物结构的基础上进行优化,而非真正的从头设计。这是与扩散模型类工具的一个关键区别——后者尝试在生成过程中同时解决对接问题,更具挑战性但也更有前景。对于全新靶点(无任何已知binder结构)场景,GNN架构工具的直接适用性有限。
代表工具清单:扩散模型架构
| 工具名 | 核心方法 | 设计范围 | 实验验证 |
|---|---|---|---|
| DiffAb | 联合扩散(序列+Cα坐标+朝向),IPA注意力 | 单/多CDR | 仅in silico |
| AbDPO | DiffAb + DPO能量偏好优化 | CDR,低能量候选 | 仅in silico |
| DiffForce | DiffAb + 可微分力场引导采样 | 单CDR | 仅in silico |
| AbX | 得分扩散,含进化/物理/几何约束 | 全CDR | 仅in silico |
| RFdiffusion Antibody ⭐ | RFdiffusion微调,抗体复合物数据 | VHH / scFv,全CDR | ✅ 原子精度湿实验验证 |
代表工具清单:其他架构
| 工具名 | 核心方法 | 特点 | 实验验证 |
|---|---|---|---|
| Sculptor | Ig-VAE + 表位引导场生成 | 专用于纳米抗体设计 | ✅(蛇毒素binder验证) |
| MaskedDesign | DockGPT对接 + IgMPNN序列设计 | 百万级候选筛选,1.8%成功率 | ✅(高通量) |
| ADesigner | 几何神经网络 + 序列-结构协同精修 | 一次性推断 | 仅in silico |
| IgGM | ESM-PPI + 多级网络架构 | 抗原条件生成,全CDR | 仅in silico |
| tFold-Ag | tFold + 序列恢复头 | 抗体-抗原复合物结构预测+设计 | 仅in silico |
需要知道的局限
真实验证数据揭示的现实:成功率极低,但趋势向好。
方法 设计类型 实验规模 成功率 proseLM 复合物结构已知,优化CDRH 未披露 ~25% proseLM 复合物结构已知,设计全Fv 未披露 ~2% MaskedDesign 仅CDRH3 百万级筛选 10.6% MaskedDesign 全CDRH 百万级筛选 1.8% RFdiffusion Antibody 全从头设计 高通量9,000个 极低(具体未披露) AbDiffuser 已知binder池,16个验证 16个 57.1%为强binder ⚠️ 评估标准不统一,横比需谨慎:各研究组的实验验证方案差异极大——AbDiffuser从16个候选中筛选验证,MaskedDesign从百万级中筛选,成功率的分母完全不同。同一行”1.8%”和”57.1%”看起来前者更低,但背后的筛选规模差了5个数量级,无法直接横向比较。行业亟需统一的benchmark数据集和评估共识。
结论:越难(从头设计),成功率越低。但RFdiffusion Antibody已经在全从头设计上实现了原子精度的实验验证,这是里程碑级进展——尽管还需要高通量筛选配合。
另一个关键挑战是对接(Docking):在非结合构象下预测抗原-抗体对接位置,是当前整个领域的技术瓶颈。现有多数方法绕过了这个问题(假设对接构象已知),而真正解决它才能实现真正的端到端设计。
总结:该如何用这张全景图
按研发阶段选工具
| 研发阶段 | 主要需求 | 推荐工具类别 | 成熟度 |
|---|---|---|---|
| 靶点确认后,结构解析前 | 预测抗体或复合物3D结构 | 结构预测(IgFold、RF2 Antibody、tFold) | ★★★★☆ |
| 先导抗体优化阶段 | 提升已知binder的亲和力、稳定性 | 序列设计(ProteinMPNN、proseLM、AbMPNN) | ★★★★☆ |
| 多样性库构建 | 扩充候选池,提供不同骨架选项 | 无条件生成(IgLM、AbDiffuser) | ★★★☆☆ |
| 全新靶点,无已知binder | 从头生成靶向binder | 抗原条件生成(RFdiffusion Antibody、DiffAb) | ★★☆☆☆ |
三个优先级排序建议
① 当前可信赖入管线:结构预测 + 已知binder优化
这两类工具的湿实验验证最多、成功率相对可接受,可以作为现有管线的辅助加速工具。
② 中期关注:无条件生成 + lab-in-the-loop框架
以dWJS、Shanker et al.为代表的迭代优化方法,将AI建议与湿实验反馈融合,是将AI工具融入研发闭环的实际路径。
③ 长远布局:抗原条件全从头设计
RFdiffusion Antibody代表了这个方向的当前最高水位。距离真正进管线还有距离,但已经是可以认真追踪的技术方向,尤其是对新靶点(无已知binder)场景。
两个贯穿始终的硬约束
- 数据瓶颈:SAbDab ~9,600个复合物结构,是所有抗体专用模型的天花板。数据增强(合成数据、负样本库建设)是短期内绕不过的工程问题。
- 评估标准不统一:各研究组的实验验证方案差异极大——有的用96个候选做低通量验证,有的筛9,000个做高通量,成功率的分母完全不同,横向比较意义有限。行业需要统一的benchmark数据集和评估共识。
文献信息
标题:Artificial intelligence-driven computational methods for antibody design and optimization
作者:Vecchietti LF*, Wijaya BN*, et al. (MPI-SP / KAIST / IBS 联合团队)
期刊:mAbs. 2025;17(1):2528902
DOI:https://doi.org/10.1080/19420862.2025.2528902
开放获取:CC BY-NC 4.0
本文为文献解读,所有数据与结论以原文为准