4月9日,模型中国科学院深圳先进技术研究院定量合成生物学全国重点实验室、物制闻科合成生物学研究所娄春波团队与北京大学定量生物学中心钱珑团队合作在国际学术期刊Science Advances上发表题为"Discovery of Diverse and 造新High-quality mRNA Capping Enzymes through a Language Model-enabled Platform"的研究论文,报道了全球首个面向合成生物学元件挖掘与生物制造应用的学网大语言模型——"SYMPLEX",并将SYMPLEX模型应用于mRNA加帽酶基因的科学挖掘,展示了大语言模型赋能生物制造的巨大潜力。
该模型通过融合领域大语言模型训练、合成生物专家知识对齐和大规模生物信息分析,实现了从海量文献中自动化挖掘功能基因元件,并精准评估其工程化应用潜力。研究团队将SYMPLEX应用于mRNA疫苗生物制造关键酶——加帽酶的挖掘,成功获得多种高性能新型加帽酶。第三方公司实验验证显示,这些酶在催化效率上超越国际头部企业New England Biolabs(NEB)商业化加帽酶2倍以上,显著提升了mRNA疫苗生产率和成本效益。此项成果不仅为合成生物学元件设计提供了AI驱动的新范式,更展现了大语言模型等人工智能技术在生物制造中的广阔应用前景。