从机理建模到混合模型:AI正在如何重塑上游细胞培养开发
上游工艺已进入“高维时代”
在这样的高维空间中,OFAT方法缺乏扩展性,而传统DoE在变量超过8-10个后组合数量迅速膨胀,既难以覆盖真实工艺空间,也难以识别关键交互效应。上游开发正由“经验+实验”转向以模型驱动决策为核心的新阶段。AI与先进建模的引入,并非替代实验,而是辅助我们在高维、不完全可观测的系统中更有效地理解、预测和决策。
三类建模方法 - 机理、数据与混合
- 机理模型:基于质量守恒和生物动力学(如Monod动力学、物料衡算),参数具备生物学意义,可解释性和外推能力强,适用于生长、代谢切换、温度shift等机制主导问题。
- 数据驱动模型(如PCA、PLS、ANN、SVM):擅长处理高维、多变量耦合数据,提取过程变量与输出表型之间的统计关联,其中部分模型具备较强的非线性建模能力,因而在CQA等难以完全机理化描述的问题中应用广泛,但整体可解释性相对有限、对数据质量依赖较高。
- 混合模型:将机理约束与机器学习能力结合,在可解释性与预测性能之间取得平衡,被普遍认为是“最具工业落地潜力”的方向。
Case 1 机理建模指导温度切换与补料策略优化
在模型建立并完成参数拟合后,研究进一步利用该动力学模型开展过程参数预测与筛选,系统评估不同降温时点(TS‑VCD)与补料强度组合对培养过程和最终滴度的影响。
在此基础上,模型评估了五种不同的TS‑VCD×Feed组合,预测结果表明,在较高VCD条件下进行降温并配合增强补料,有助于显著提高最终抗体滴度(图 1),且预测与实测结果高度一致(R²≈0.80-0.98)。该案例表明,机理建模不仅能够解释温度切换引发的代谢与生产力变化,还可在实验前对工艺策略进行定量筛选,对温度‑代谢强耦合问题具有显著工程优势。
图1 不同降温时点与补料策略下的抗体滴度预测与实测结果对比
Case 2 数据建模预测并调控糖型分布
ANN模型在训练与验证数据集上的平均绝对误差约1.25 %。如图2所示,在不同半乳糖和锰离子补料条件下,模型能够准确预测糖型由低半乳糖化结构GnGn(G0F)向GnGnF/AGnF(G1F),再到AAF(G2F)的整体迁移趋势,且预测结果与实验测量在各主要糖型比例上保持高度一致(图2C)。
图2 ANN对糖型分布的预测能力验证
在糖型调节剂推荐上,HyClone Glycan Supplement(SH31210)可提供一种在不影响细胞生长和产量的前提下,定向降低G0F并提高G1F/G2F等目标糖型比例的添加剂。将此类物料与模型预测相结合,进一步提升糖型调控策略的可执行性,推动CQA从“经验调整”走向“模型指导”。
Case 3 混合建模用于培养基开发与CQA预测
基于GBR模型结果,研究针对Run 625数据对实现目标电荷变体分布的培养基组合进行了预测与筛选。模型以原研对照分子的电荷变体分布为目标(酸性变体 24.97±0.54 %,碱性变体11.41±1.44 %),预测Fe的最优范围为10–25 ppm(最佳值约20 ppm),Zn的最优范围为5.5–12.5 ppm(最佳值约5.5 ppm)。按照模型推荐条件,开展fed-batch验证实验。结果显示,补充条件下酸性变体显著向目标区间移动(图 3A),同时碱性变体比例维持在与原研对照一致的水平(图 3B),整体电荷变体分布成功复现参考分子特征。与此同时,补充Fe和Zn并未对整体细胞培养性能产生负面影响(图3C、3D、3F)。
图3 混合模型指导的培养基优化对电荷变体及细胞培养性能的影响
在该混合建模框架中,模型识别出的关键金属离子与培养基因子,并不直接要求改变配方结构,而更强调对“有效成分稳定性”的控制。HyClone Metallica通过对原材料中关键微量元素的系统表征与精确分选,使模型识别出的质量驱动因子在工业实现中具备可重复性和可控性。与此同时,HyClone CCMD服务可提供培养基与补料定制化开发方案,使培养基成分从统计识别走向工程落地。
AI走向模型驱动的上游开发新范式
教学课程
市场活动
资料下载
产品

收藏
询价