近日,我院
殷冬梅教授团队和上海交通大学
韦朝春教授团队联合在植物学领域权威期刊《
Plant Biotechnology Journal 》上发表了题为“
A near complete genome of Arachis monticola, an allotetraploid wild peanut”的研究成果。该研究结合ONT超长读段,二代测序和Hi-C等多种测序技术,发布了更新的近乎完整基因组Amon2.0版本。
花生(
Arachis hypogaea L.)是世界上最重要的油料和经济作物,完整的参考基因组组装对于花生遗传驯化和分子育种具有重要的意义。
A.monticola是介于二倍体野生花生和四倍体栽培花生之间的唯一的四倍体野生种,处于重要的驯化地位。
殷冬梅教授团队在2018年发布了第一个
A.monticola基因组(Amon1.0),但由于当时测序和组装技术限制,无法完全覆盖复杂重复序列区域,基因组仍然存在大量缺口。 为此,该团队采用ONT超长读段(Oxford Nanopore Technologies ultra-long read),MGI二代和Hi-C技术,更新了高质量基因组Amon2.0。该基因组总大小为2.56 Gbps,Contig N50为68.3Mbp,仅包含34个缺口;11条染色体有两个完整的端粒序列,其余9条染色体有一个完整的端粒序列;所有染色体都有着丝粒序列,其中13条染色体有完整的着丝粒序列;LAI指数为21.27,达到了基因组重复区域组装的金标准质量。
Amon2.0的基因组和亚基因组不平衡表达特征
该基因组共有83.96%序列被注释为重复元件,主要是长末端重复(LTR)逆转录元件(65.3%)和DNA转座子(12.03%);共有75226个蛋白质编码基因,74.6%具有功能注释,91.2%含有至少一个已知的结构域。Amon2.0填充了248Mbp的未知序列,且整个基因组高度连续,碱基准确度超过99.9%。这些指标表明Amon2.0中两个亚基因组的连续度和完整度都优于Amon1.0。Amon2.0与栽培花生Tifrunner参考基因组相比,共检测到10818个结构变异(SV),一些SV影响了附近基因(例如LRK10L和ARF3)的结构和表达。Amon2.0基因组中,AA和BB亚基因组特异表达基因分别为7682和10718个;AABB共有基因的表达水平显著高于AA或BB特异表达基因。16007个单拷贝同源基因的表达水平显示,亚基因组间具有不对称表达的趋势。
总之,该研究发布了四倍体野生种基因组Amon2.0近完成图,该基因组具有更高的连续性、完整性和准确性,为我们进一步了解花生属和豆科植物的驯化和进化提供基础,也为花生功能基因挖掘和分子育种提供重要的基因组数据信息资源。
上海交通大学
薛泓嶂博士和河南农业大学
赵凯博士为论文共同第一作者。河南农业大学殷冬梅
教授和上海交通大学
韦朝春教授和为论文共同通讯作者。
张新友院士和
Rajeev K. Varshney院士等人参与指导了本项工作。该研究得到了国家自然科学基金联合重点项目、河南省重点研发、河南省产业技术体系、河南农业大学高层次人才等项目资助。
编辑/钱青秀 签审/殷贵鸿