一周两笔融资,AI虚拟细胞的产业化启航
一周两笔融资,
AI虚拟细胞的产业化启航
作者:贝叔 | 且来山笔记
2026年6月的第一周,无界进化和百曜科技前后脚宣布融资新闻,虚拟细胞从科幻名词成为AI制药界新宠。
在他们背后站着的,是晶泰科技(AI制药老小龙)、顺为资本(雷军系)、红杉中国、松禾资本,以及中科院动物所、国新创投基金(国家队)、道彤资本、云启资本、峰瑞资本(多家AI制药小龙的投资人)、BV百度风投。
不同风格、不同禀赋、不同诉求的基金,却在同一周内集体转向,进入虚拟细胞这个赛道。那么虚拟细胞到底是什么?能给新药开发带来什么不一样的变化?
一、从AI药物发现到虚拟细胞
过去一代AI制药工具——从AlphaFold到RoseTTAFold,从Schrödinger到英矽智能——解决的核心问题是分子发现,通过分子层面的结构与性质预测,更快更省钱地寻找更好的分子。但药物成功的唯一终点是在人体内有效;药物研发历史的记录上,是大量候选药在分子层面足够优秀却在细胞和生理层面没有达到预期,临床试验成功率长期维持在5%~8%的低位。
AI虚拟细胞想尝试的,就是从系统级交互的视角去审视药物候选分子:能否用AI对整个细胞进行建模,让它成为一个可以做”虚拟实验”的计算系统? 它不仅能真实地反映细胞的状态,还能对药物作用、基因变化、环境变化等扰动条件,给出准确的计算预测。
2024年12月,斯坦福大学Charlotte Bunne团队、基因泰克和陈-扎克伯格基金会(CZI)联合在《Cell》发表了题为”How to Build the Virtual Cell with Artificial Intelligence: Priorities and Opportunities”的里程碑论文,系统提出了AIVC的愿景与路径。论文定义:AI虚拟细胞是基于多尺度、多模态大型神经网络模型,能够精准模拟细胞及其组成成分在不同状态下动态行为的计算系统。
实现路径依赖三类数据的融合:
已知基因调控关系、通路数据库、蛋白质相互作用网络
基因序列、蛋白质结构、染色质状态
单细胞RNA测序数据、扰动实验结果、时序细胞状态转变数据
二、同赛道,两条路:百曜与INFevo的技术路线拆解
同样叫虚拟细胞,同样去模拟细胞的动态行为,百曜和INFevo的实现路径在关键节点上存在明显差异。
| 维度 | 百曜科技(Bio-Compass) | INFevo(无界进化) |
|---|---|---|
| 出身 | 中科院动物所”指南针联盟”,学术孵化 | 晶泰科技(2228.HK)工业孵化,Spin-off |
| 模型基础 | GeneCompass(1.26亿单细胞数据,融合4种生物学先验知识)→ CellGraphCompass → CellPolaris | 自研基础大模型 OCOO(整合生物领域SOTA模型) |
| 技术路径 | 先验知识注入型:把已知的基因调控关系、启动子序列、共表达网络作为先验显式融合进模型训练 | 干湿闭环型:AI预测 → 自动化实验验证 → 数据回馈模型,强调模型与湿实验的实时迭代 |
| 湿实验能力 | 建设中(AI Cell Laboratory平台) | 核心优势:依托晶泰科技成熟的机器人实验室基础设施 |
从公开信息已知,前者的模型整合了先验知识驱动,在数据稀缺的场景下直接整合了人类的知识和经验,能够在可理解可解释的路径上探索更大空间;后者的模型优势是干湿实验闭环后快速产生的海量数据,能够发现更多常规生信分析没有发现的隐性规则。
两者的起跑线虽有”经验主义”与”数据主义”的差异,但终点都在指向同一个目标——用硅基智能逼真重塑碳基生命的复杂系统。
三、其他探路者
百图生科(BioMap)
百度风投背景的AI4S企业百图生科,在2025年获得全球首届虚拟细胞挑战赛决赛全能冠军。百图的参赛模型 xTrimoSCPerturb,是其千亿参数蛋白质基础模型 xTrimo 向细胞层级的延伸。技术路径的本质是千亿级参数生物学大模型,模型底座强,但细胞层级的原生训练数据积累仍是待验证项。百图尚未以AIVC为主要商业叙事,虚拟细胞目前更多是其生物学大模型平台能力延伸的展示。
Arc Institute
美国非营利研究机构,由陈-扎克伯格基金会(CZI)资助,与斯坦福、UC Berkeley、UCSF联合。2025年6月公开发布AI虚拟细胞模型STATE。STATE 的双模型架构将任务一拆为二:SE(State Embedding)在1.67亿个细胞的观测数据上训练,负责表征单细胞状态;ST(State Transition)在逾1亿个扰动数据上训练,负责预测干预后的细胞群体变化。STATE 全部开源,同时发起全球虚拟细胞挑战赛,充当这个赛道的”基准制定者”角色。
Xaira Therapeutics
David Baker(2024年诺贝尔化学奖得主)参与联合创办,融资超10亿美元。2026年3月发布 X-Cell:49亿参数,扩散模型架构,训练数据为”数十亿基因组学干预数据点”,在扰动预测任务上性能达现有最佳模型的5倍。X-Cell 是目前参数量最大的虚拟细胞模型,且已通过 AWS SageMaker 提供API调用,是第一个实现工业级产品化部署的AIVC。Xaira的策略是:X-Cell作为底层引擎,向上支撑自研的药物发现和细胞治疗管线。
Tahoe Therapeutics
Tahoe 的 Mosaic 计划,目标是通过大规模单细胞测序+CRISPR等基因扰动实验,主动生成AI训练所需的高质量时序扰动数据集——”先造数据,再炼模型”。2025年10月发布的 Tahoe-x1 是30亿参数的扰动预训练模型,全开源。Tahoe 的理解是:AIVC的瓶颈不在模型架构,而在数据质量与因果性。
Recursion Pharmaceuticals
上市公司(NASDAQ: RXRX),最早用AI分析细胞的公司之一。不同于其他机构,Recursion对细胞的表征采用形态学数据:当其他人在用”文字(基因序列/转录组)”读懂细胞时,Recursion 在用”相片(细胞形态学)”观察细胞。他们的做法是高通量显微成像——对细胞在各种扰动下的形态学变化拍照,用AI从图像中提取特征,推断扰动产生的系统性影响。Recursion拥有的海量细胞表型数据库 PhenoMap 和 BioHive-2 超算,为虚拟细胞研究开创了表型一派。
四、AIVC离”真正有用”还有多远?
AIVC 的最终目标可以用一句话表达:给定一个细胞状态和一个干预,精准预测细胞将如何变化。资本的进入,可以加速数据、算法、算力的飞速迭代,但诚如大家对第一代AI制药企业的观察和追问,AIVC的价值兑现,还有不小的坎要跨过。
🔬 模型层面
目前的数据多是”静态的、单细胞层面的”,缺乏”动态的、时间序列的、空间的”多组学数据。Transformer架构很难完美处理细胞内三维空间、浓度梯度的非线性变化。扰动预测在不同细胞类型、不同扰动类型、不同时间点、不同空间位置上的泛化性,是虚拟细胞预测结论可否被信赖的基础。
📊 数据层面
基因组、转录组、翻译后修饰、空间位置、代谢物水平、细胞形态等多模态数据的对齐、整合、建模、规模化采集,是虚拟细胞模型走向全景细胞模拟器的重要指标。
💊 应用层面
虚拟细胞要从挑战赛排名或论文中,转化为工业级的虚拟药物筛选平台,需要在真实药物项目中预测出可以经过湿实验验证的候选分子或靶点,才能真正嵌入药物开发的流程,成为人类征服疾病的利器。
虚拟细胞的意义毋庸置疑,但它是一场属于长期主义者的长跑。
我们必须承认:细胞远比分子复杂。分子的状态空间是有限的,可以通过量子化学公式去计算、去穷举;而细胞的状态空间则是开放且混沌的,它随时间和环境进行着永无止境的动态演化。这绝不是简单堆砌”几百亿参数”就能毕其功于一役的线性游戏,而是需要海量多模态数据、下一代AI架构、以及高通量机器人实验体系三者同频共振的系统工程。
2026年夏天的这两笔融资,或许只是硅基生命科学史上的一个小浪头。但当干湿闭环的齿轮开始加速,虚拟细胞终将从论文的讨论章节,真正演变为人类征服复杂疾病的终极利器。
作者:贝叔 | 且来山笔记