跳转至主要内容

且来山AI笔记

定义”AI找靶点”:疾病、多模态数据、标准化评测

Avatar photo 贝叔
最后编辑于 2026年4月28日

2026年4月20日,Nature Reviews Drug Discovery(NRDD,医药界顶刊中的顶刊,影响因子101.8)发表了一篇重磅综述,剖析了AI时代新药靶点发现可以采用的方法、数据集和评估标准:

Target identification and assessment in the era of AI(AI时代的靶点识别与评估)。

也是在四月,同一个团队在Scientific Reports发表文献,详细介绍了AI药物靶点发现的多模态模型TargetPro,以及评估靶点发现模型能力的基准评测体系TargetBench:

Advancing target discovery through disease-specific integration of multi-modal target identification models and comprehensive benchmarking system

NRDD综述由英矽智能(Insilico Medicine)团队牵头,联合Astellas、UNM等机构学者共同完成;Scientific Reports文章则主要来自英矽智能团队。作为AI制药领域最前沿的玩家之一,英矽智能正在用多篇重磅文章,努力建立一个”英矽宇宙”——从AI制药的成功案例开始、到能力平台介绍,直到尝试定义这个行业的标准。

本文主要通过对Scientific Reports文章进行解读,理解靶点发现的问题和方法。

一、TargetBench:行业内第一个标准化评测体系

TargetBench为行业内的靶点发现模型提供一个尺子,所有的新药靶点发现模型可以同台竞技。而对于AI制药企业来说,可以向用户提供一个清晰的框架来理解和相信模型的能力,从而更好的推进决策。

1. TargetBench的核心逻辑:

评测维度 说明
恢复已知靶点的能力 模型能否把已经被临床验证的靶点排在前列?
发现高质量新候选的能力 模型能否提出真正有价值的新靶点?

简单总结,TargetBench根据靶点是否有药物进入临床,作为区分靶点成药性的指征;通过评估靶点发现模型预测靶点成药性的能力,评测模型。

以真实临床获批 / 在研靶点为正样本、高置信无效 / 失败基因为负样本;为了避免回顾测试时,”数据泄露”导致模型预测能力异常,团队对数据进行了时间拆分。

2. 评估模型能力的指标体系:

(1) 核心排序指标(衡量”找得准”)

AUPRC:正样本召回精度(靶点任务更重要,基线≈0.35)

Top-K Recall(K=100/200/500):前 K 个预测中真实临床靶点占比(核心临床指标,TargetPro 达 71.6%)

(2) 临床转化指标(衡量”用得上”)

指标 说明 TargetPro
结构可用性 新候选靶点有已知 3D 晶体结构比例 95.7%
成药性评分 可药口袋 / druggable 结构比例 86.5%
药物可复用性 已有获批药物可重定位比例 46%
机制清晰度 与疾病通路直接关联比例 89%

(3) 评测结论

TargetBench首次实现疾病分层、临床金标准、多指标互补的靶点模型客观对比。通过对多模态靶点预测模型Open Targets Platform、TargetPro,以及多个通用大语言模型(LLMs)进行比较;基于多模态数据、针对特定疾病特异性建模的模型,优于通用大语言模型和单纯依赖组学数据建模的模型。

二、TargetPro:疾病特异性建模

TargetPro 是干活的模型,它以疾病特异性为特点,先完成 22 项多模态特征标准化整合与降噪筛选,再通过集成机器学习模型逐病训练打分,依托 TargetBench 标准化基准数据集与统一评价指标,完成分层交叉验证、模型性能量化、靶点优先级排序,最终结合成药性与临床价值完成候选靶点分层评估与结果迭代。

1. 数据底座

TargetPro的数据底座是PandaOmics平台积累和处理的22项不同的特征数据,涵盖组学数据、科学文献、临床记录及经费资助,用于捕捉目标疾病之间的关联关系。其中12项来自组学的数据、10项来自文本的数据

🔬 组学类评分(12 项)— 侧重基因–疾病的生物学关联强度

1. GWAS 共定位评分:疾病易感位点与基因调控区域共定位概率

2. eQTL 评分:基因表达受疾病风险位点调控的显著性

3. 突变致病性评分:基因上有害突变频率与功能影响

4. 拷贝数变异(CNV)评分:肿瘤中扩增 / 缺失与疾病关联

5. 差异表达(RNA-seq)评分:疾病 vs 正常组织 mRNA 变化倍数与显著性

6. 蛋白质丰度评分:蛋白水平与疾病相关性(蛋白质组)

7. 甲基化评分:启动子甲基化异常与疾病关联

8. 通路富集评分:基因在疾病相关通路中的重要性(KEGG/GO)

9. 蛋白互作(PPI)评分:与核心疾病蛋白的相互作用强度

10. 细胞系 / 类器官功能评分:基因敲除 / 过表达对疾病表型影响

11. 基因必要性评分:疾病细胞存活依赖度(CRISPR 筛选)

12. 保守性与进化约束评分:基因功能重要性与疾病保守性

📚 文本挖掘类评分(10 项)— 侧重文献 / 专利 / 临床证据热度与因果性

13. 总体提及热度(Attention):PubMed / 专利 / 临床试验中基因–疾病共现次数

14. 趋势热度(Trend):近 2–5 年发表量增长斜率

15. 热度突变(Spike):是否出现突发性研究高峰(如重大突破)

16. 因果证据评分:文献中 “cause/mediate/induce” 等因果表述频率

17. 机制清晰度评分:基因–疾病通路机制描述的完整性与一致性

18. 临床关联评分:与患者预后、分期、药物反应的相关性报道

19. 药物可药性文本评分:文献中 “inhibitor/agonist/druggable” 提及强度

20. 专利覆盖评分:基因作为靶点的专利数量与布局广度

21. 专家关注度评分:领域高影响力作者 / 机构的研究集中度

22. 疾病特异性共现评分:排除泛疾病噪声后,基因与目标疾病的精准共现度

算法 选择理由
CatBoost 无偏提升分类,擅长处理类别型特征
LightGBM 高效梯度提升决策树
Random Forests 集成学习的经典选择
XGBoost 可扩展的树提升系统
Elastic Net 弹性网络正则化 + 变量选择

2. 初始版本覆盖38种疾病

分属五个领域:肿瘤学(Oncology)、代谢性疾病(Metabolic)、免疫性疾病(Immune)、纤维化疾病(Fibrotic)、神经系统疾病(Neurological)。每种疾病的发生机制不同,呈现不同的特点。

3. 模型建立和使用

1

多模态特征预处理

汇总 22 项基因组、转录组、蛋白互作、表观遗传、文献临床、结构成药特征,做缺失值填充、归一化、去冗余,按不同疾病做特征初筛。

2

疾病差异化建模训练

为 38 种疾病单独构建子模型,采用 XGBoost / 轻量级集成算法,依据疾病生物学特征自动分配特征权重,以临床验证正负靶点集做监督训练。

3

标准化基准对照

接入 TargetBench 统一评测库,使用固定的 1287 个临床正靶点、3856 个高置信负靶点作为金标准,规避数据集差异带来的评价偏差。

4

分层交叉验证

采用疾病分层 5 折交叉验证,防止数据泄露与样本偏倚,同步计算 AUROC、AUPRC、Top-K 召回率等核心指标。

5

全基因组靶点打分排序

对人类全部编码基因输出 0~1 量化评分,按疾病特异性得分降序排列,形成靶点候选列表。

6

多维度二次评估

叠加可成药性、组织特异性、安全风险、通路核心度、专利竞争格局,对高分靶点做临床转化潜力分级。

7

结果输出与模型迭代

输出优先级靶点清单与模型性能报告,用湿实验验证反馈反向优化特征权重与模型参数,形成闭环迭代。

4. 性能数据

• TargetPro整体Top-K精确率:71.6%

• 较领先的大语言模型方法性能提升 1.7-5.5倍

• 预测的新候选靶点中:95.7%具备可用蛋白质三维晶体结构,86.5%被归类为可成药靶点且有对应临床证据支持,46%与其他适应症已获批药物相关(存在老药新用机会)

三、贝叔总结

文中使用”target identification”而不是”target discovery”,一字之差,精确的反映出AI模型和研究人员工作的分工。模型给出的是潜在靶点的评分排序,最终还是人去做决定。

AI是最好的望远镜。但它不能代替我们决定往哪里看——也不能代替我们在看到之后,判断那个东西到底值不值得追。

至于英矽智能希望定义行业标准,贝叔是乐见更多的中国企业去设置Benchmark,引领全球产业进步。而进一步的,TargetBench做的这些工作以外,还有什么因素需要考虑?只以是否进入临床试验作为正负样本,会不会错杀真正原始的创新?多模态数据统一为22个指标,这22个指标所代表的简化逻辑以及相互之间的关联,怎么影响最终的预测结果?

参考资料

[1] Ren F, et al. A small-molecule TNIK inhibitor targets fibrosis in preclinical and clinical models. Nature Biotechnology, 2024. DOI: 10.1038/s41587-024-02143-0

[2] Ren F, Pun FW, et al. Advancing target discovery through disease-specific integration of multi-modal target identification models and comprehensive benchmarking system. Scientific Reports, 2026. DOI: 10.1038/s41598-026-47765-3

[3] Pun FW, Podolskiy D, et al. Target identification and assessment in the era of AI. Nature Reviews Drug Discovery, 2026. DOI: 10.1038/s41573-026-01412-8

[4] Insilico Medicine官方新闻稿. Insilico Medicine Advances AI-Driven Target Discovery with Validated TargetPro-TargetBench Framework. 2026-04-20.

作者:贝叔 | 且来山笔记

Avatar photo
贝叔

贝叔 生物学学习者 软件工业从业者 基因组学大数据探索者 新药开发践行者 AI应用记录者 且来山是回不去的故乡

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注