行业资讯

北京大学现代农业研究院团队破译“岷江百合”超大基因组和适应性进化机制

 时间:2025-07-03

百合(Lilium)是百合科百合属植物,其优雅的花姿、馥郁的芬芳和丰富的象征意义(纯洁、高贵)闻名于世。全球约有120个野生种百合,主要分布在北半球温带,经过长期杂交育种已形成东方百合、亚洲百合等著名花卉,是切花、盆花和庭院绿化的主角,具有极高的观赏、药食同源和经济价值。岷江百合(Lilium regale)原产于我国四川省岷江河谷,别名帝王百合(Royal Lily),以健壮的株型、硕大的花朵、迷人的花色而著称。20世纪初英国植物猎人威尔逊在我国四川地区发现岷江百合,盛赞其为“百合之王”,认为其观赏价值远超当时欧洲栽培的任何百合。19世纪后期,肆虐欧洲百合产业的百合花叶病毒几乎摧毁了所有栽培品种,而岷江百合对该病毒具有天然免疫力。随后威尔逊将岷江百合种子和鳞茎运至英国,园艺育种家将岷江百合与各种百合种质进行杂交,培育出了抗逆性、抗病性和香气更佳的新品种,从而挽救了当时濒临崩溃的欧洲的百合产业。现今,欧美几乎所有观赏百合的品种都能追溯到岷江百合的贡献。因此,岷江百合的历史,是一部从中国深山走向世界花园,并彻底改变全球百合产业的传奇。不幸的是,近年来由于过度采挖和栖息地破坏等原因,岷江百合这一中国特有物种正面临严重的生存威胁,野生种群急剧萎缩。因此,破译和研究岷江百合基因组对于我国野生濒危百合资源的保护利用、栽培百合的品种改良,百合药食同源价值的开发利用等意义重大。

然而,百合基因组异常庞大(通常介于30 ~ 48 Gb),约是人类基因组(30亿个碱基)的10~16倍,水稻基因组的70~120倍,且往往高度杂合,这使得百合基因组破译的难度远超多数动植物基因组,阻碍了百合的功能基因鉴定、分子育种和保护生物学研究。超大基因组的解析涉及的数据量和算法复杂性,对生信算法、计算机存储和算力有极高的要求,因而组装百亿-千亿碱基级别的基因组仍然是现代基因组学中最具挑战性的任务之一。近期兰州百合(The Innovation 2024)和泸定百合(Nat. Commun 2025)基因组草图的相继发布,标志着百合研究正式迈入了全基因组时代。但是与多数植物基因组相比,百合属植物基因组学研究仍处在初期,高质量基因组序列依然缺少,且亟需在组装质量和连续性上进行提高。重要的是,百合基因组如何进化到如此之庞大,其基因组是否具有特殊的适应性进化机制,百合超大基因组是如何实现其硕大染色体结构和功能的维持,以及如何实现基因的正确调控等这一系列的进化生物学和遗传学问题需要高质量的百合基因组序列分析进行回答。

73814903193eebc3f7a1695bb31dd39c.png

2025年7月1日,国际著名学术期刊《Nature Communications》在线发表了北京大学现代农业研究院、潍坊现代农业山东省实验室郭立研究员团队题为Genomic and epigenomic insight into giga-chromosome architecture and adaptive evolution of royal lily (Lilium regale) 的研究论文,该研究破译了目前百合最高质量和连续性的染色体级别基因组 (35.6 Gb),分析了百合基因组扩张与转座元件(TE)尤其是长末端重复序列转座子(LTR)的扩增密切相关,阐明了岷江百合庞大基因组的扩张机制。此外,该研究基于多组学数据,揭示了岷江百合维持特大基因组结构和功能的表观调控机制,为研究百合功能基因组学、遗传育种和基因组进化提供了宝贵的参考基因组资源。

09825cba3a8ab6ac6df68ff141cd71de.png

1. 岷江百合超大染色体级别基因组序列的组装和分析

本研究首先基于PacBio HiFi和高覆盖度Hi-C测序数据,组装了岷江百合的染色体级别高质量基因组。该基因组总长度为35.6 Gb,组装连续度指标contig N50为32.22Mb,组装一致性质量值QV为63.80,是迄今已报道的最高质量的百合基因组序列。岷江百合12条染色体大小为2.02-4.30Gb不等,共编码78,147个基因。基因共线性分析表明岷江百合与单子叶植物祖先分化以后经历了两次全基因组复制(WGD)事件,并证实了其与兰州百合和泸定百合基因组具有相似的WGD历史。此外,研究发现基因串联重复在岷江百合适应性进化中起到的重要作用。百合基因组呈现与萜类合成、抗性应答等相关基因家族显著扩张,反映其在生境适应中的遗传基础。此外,其特有的RNA剪接相关基因可能是适应长基因剪接需求的演化结果。

61ad5fa555890aa66a9ae7d002988dff.png

2. 岷江百合基因组进化历史与基因组扩张机制

该研究进一步揭秘了岷江百合基因组庞大的原因,发现其基因组80%以上为重复序列,其中72.3%是LTR类逆转录转座子,是岷江百合基因组扩张的主要驱动因素(图2)。完整LTR在基因组区域热点形式的密集插入代表着可能的LTR爆发。组蛋白免疫沉淀测序数据分析则表明,H3K9Me2组蛋白修饰可能导致了大量重组形成的单独LTR在基因组中的残留。该研究对基因组注释得到的67,862个高置信基因进行了分析,发现了LTR插入对内含子长度的重大贡献,进而揭示超长内含子对岷江百合超长基因形成的贡献。

45cfb1aa38a10a0f12850218fe61b04d.png

3. 岷江百合超大基因组选择性剪切的表观调控机制

最后,研究团队解析了岷江百合基因组结构和功能维持的调控机制。首先,借助三代全长转录组数据,本研究总共鉴定了2580个基因可变剪切事件,剪切百分比差异基因在转座子密度、CHG甲基化水平和组蛋白富集等方面均存在差异,揭示了转座子插入与CHG甲基化共同调控剪接活跃性,不同保守程度的基因在剪接活性与稳定性间取得平衡(图3)。其次,本研究利用Hi-C数据模拟了百合染色质折叠的三维模型,揭示了大基因组细胞核内特别的染色质折叠以及强烈的“跨染色体互作”,与花生等植物中清晰分离的染色质区域不同。此外还检测到大量TAD-like染色质拓扑结构,其中H3K9Me2修饰在百合TAD边界的富集,揭示了转座子对于TAD边界可能的贡献(图3)。总之,本研究通过进化基因组学和多组学联合分析揭示了百合应对大基因组的压力的适应性进化机制,揭示了转座子在基因组扩张、结构维持、基因调控等动态进程中的主导作用(图4)。

da5fcf40be33891350bd5514c77e7382.png

4. 转座子活动主导的岷江百合基因组扩张和

适应性进化模式示意图

综上所述,本研究公布了岷江百合的高质量染色体级别基因组,也是目前最高质量和连续度的百合参考基因组,标志着百合基因组学迈进新的阶段。本研究不仅填补了超大基因组植物在基因组组装与功能理解上的空白,也提供了重要的百合遗传、育种和保护生物学研究资源,推动我们对于大型基因组演化机制、植物复杂性状的调控网络的理解。这一成果将进一步加快提升百合功能基因组学研究和精确改良,也必将加速推动我国野生百合资源的保护、百合种质创新和花卉产业的高质量发展。


行业资讯
  • “绿色生态农业论坛”暨国家现代农业与食品前沿产业技术创新战略联盟2023年会在雄安新区成功举办

    “绿色生态农业论坛”暨国家现代农业与···

  • 芯片育种公司双绿源获隆平生物数千万元战略投资

    芯片育种公司双绿源获隆平生物数千万元···

  • 祝贺!联盟成员周俭民研究员获2023未来科学大奖生命科学奖!

    祝贺!联盟成员周俭民研究员获2023···

  • 华中农大张启发院士/南京农大万建民院士团队“背靠背”克隆出水稻显性雄性不育基因

    华中农大张启发院士/南京农大万建民院···

  • 祝贺!联盟成员董莎萌教授

    祝贺!联盟成员董莎萌教授

  • 联盟秘书长张兴平博士在第七届国际瓜类作物学术大会上做主旨报告

    联盟秘书长张兴平博士在第七届国际瓜类···