搜索

您的关键词

学院新闻
       近日,Cell出版社旗下Trends in Biotechnology 杂志在线发表了河南农业大学农学院陈震与姬祥课题组联合发表题为“AI sheds new light on genome editing”的综述论文。该研究系统综述了深度学习技术在基因组编辑领域中的应用与发展。
       目前,人工智能,尤其是深度学习技术,极大地革新了生物数据的获取与分析方式,推动了生物技术、医学和农业等多个领域的突破。数十年来,"序列-结构-功能"范式始终指导着蛋白质研究。如今,深度学习正通过蛋白质表征学习重塑这一范式-其不仅能破译复杂生物模式,更实现了AI驱动的蛋白质设计与改造(图1)。以CRISPR/Cas系统为主的基因组编辑技术已在基础研究、农业育种和生物医药等领域展现出巨大的应用潜力,然而如何高效发现、设计与改造新型基因组编辑工具仍是难以解决的领域瓶颈。
       本研究系统综述了人工智能与基因组编辑交叉领域中的前沿进展,首先详细阐述了深度学习技术在基因组编辑工具的挖掘、改造与设计中的应用并探讨了其优缺点。传统序列比对工具如BLAST和HMMER在识别远缘同源蛋白时因序列差异大而效果受限,而深度学习结合“序列–结构–功能”范式,通过蛋白质三维结构的预测和分析,大幅提升了识别能力。随着AlphaFold DB等高质量结构数据库的开放,科学家们开展了大规模结构聚类和结构同源搜索,成功挖掘出多种新型的CRISPR相关蛋白;AI蛋白质工程方法实现了基因编辑蛋白的快速进化。传统的高通量突变筛选和理性设计耗时费力,机器学习辅助的定向进化和零样本蛋白设计为这一难题提供了新的解决思路:即在实验数据不足时,直接用深度学习模型预测有益突变,大大降低了对实验筛选数据的依赖。零样本方法利用预训练模型预测有益突变,快速锁定潜在突变位点,而少样本方法结合少量实验数据与主动学习策略,可以显著提高突变的成功率;深度生成式AI模型为基因编辑工具的从头设计开辟了新路径。大语言模型通过学习大量序列数据,能够设计出自然界尚不存在的全新基因编辑器。扩散模型更能生成符合功能需求的三维蛋白结构。虽然目前多数设计案例仍处于初步验证阶段,但生成式AI展示了设计复杂“分子机器”的巨大潜力,为基因编辑技术的未来发展奠定了坚实基础。针对现有进展,本研究最后讨论了领域内面临的诸多挑战(包括技术局限性、可解释性不足以及潜在的伦理风险)。
图1  深度学习在基因组编辑中的应用
       河南农业大学/小麦玉米两熟高效全国重点实验室25级博士生秦兆辉和邓兆龙为共同第一作者,陈震和姬祥教授为共同通讯作者,李成伟教授和王道文研究员为共同作者。该研究获得了国家自然科学基金、国家重点研发计划和河南省自然科学基金等项目的资助。