科研人员构建出多模态多任务酶筛选平台。近日,中国科学院上海营养与健康研究所建立了端到端筛选目标酶的多任务计算框架,提高了功能酶的预测与发现效率,并应用于真菌毒素降解酶的挖掘。
近年来,深度学习在酶的结构、功能与性质的大规模预测方面取得了进展。然而,由于缺乏面向多模态输入和多任务输出的统一建模能力,现有方法难以满足高性能功能酶筛选的需求。针对这一挑战,研究团队设计并开发了CACLENS框架,将CGC门控机制、对比学习与交叉注意力等方法深度融合,构建出可同时执行多项预测任务的一体化酶筛选平台。
CACLENS能够以较低的计算成本同时完成反应类型分类、酶EC号预测与反应可行性评估三项关键任务,并在多个任务上展现出优势。具体而言:在反应类型分类中,清洗处理ADP/ATP/H+等常见辅因子后,模型性能优于现有方法;在EC号预测方面,整体表现超过主流模型CLEAN;在反应可行性评估中,即使采用偏向ESP与EnzRank的评估策略,CACLENS仍取得更佳结果,并能稳健处理未见过或与训练集序列相似度较低的酶。
针对真菌毒素玉米赤霉烯酮(ZEN),研究以CACLENS的多任务联合预测结果为基础,在大规模序列空间中筛选出10个潜在降解酶候选体。研究通过基因合成、异源表达与纯化获得相应酶蛋白,并对其降解性能开展实验验证。结果表明,约一半的候选酶具有对ZEN的催化活性,其中ZD4与ZD7能够在体外体系中降解超过90%的ZEN。
整体来看,CACLENS在三项任务中均展现出预测能力,证明其在功能酶筛选方面具有应用潜力。这一成果为多领域的新型功能酶挖掘提供了技术支撑,并为未来构建智能化酶工程设计平台、深入挖掘真菌毒素降解新酶奠定了基础。
相关研究成果在线发表在《先进科学》(Advanced Science)上。研究工作得到国家自然科学基金和国家重点研发计划等的支持。

基于多任务模型的新功能酶智能挖掘与筛选框架

ZEN与ZOL及其降解产物的色谱图
研究团队单位:上海营养与健康研究所

