数据结构论坛

首页 » 分类 » 常识 » Nature重磅黄三文团队发表2篇论文
TUhjnbcbe - 2025/4/7 18:26:00
中科与白癜风患者同在 https://jbk.39.net/yiyuanfengcai/tsyl_bjzkbdfyy/5081/

泛基因组(Pan-genome)是一个物种内所有基因组信息的总和,它比单一参考基因组涵盖了更多的遗传多样性。

近年来,科学家已经获得了多个作物的泛基因组。如何利用这些更为全面的基因组信息培育下一代良种,成为科学家们关心的课题。

北京时间年6月8日晚23时,《自然》在线发表了中国农业科学院深圳农业基因组研究所(以下称“基因组所”)黄三文团队有关泛基因组的两项研究成果。

一篇论文中,他们首次获得了番茄的图泛基因组,并借此找回了番茄育种中“丢失的遗传力”,为解析生物复杂性状的遗传机制提供了新思路。论文评审专家认为,“这项工作是对图泛基因组概念最全面的分析。”“图泛基因组将可能成为基因组分析和作物基因组育种的标准,在这个意义上,这篇论文是奠基性的(foundational)”。

另一篇论文中,他们首次解析了二倍体马铃薯的泛基因组,研究了茄科茄属(GenusSolanum)的物种进化,破解了马铃薯如何结薯的分子机制,并为杂交马铃薯育种改良提供了丰富的遗传变异信息。评审人认为,这项研究展示了泛基因组学的力量,能为其他作物泛基因组研究提供参考方法。

意味着更准确更详尽

“在一个物种内,有些基因是某些个体所特有的。比如任意两个番茄所含有的基因是不完全相同的,基因不同可能导致口感不同。”论文通讯作者黄三文在接受《中国科学报》采访时解释道,番茄有很多品种,如大果番茄、樱桃番茄和醋栗番茄等,如果只是用大果番茄的参考基因组进行研究,那其中不会包含樱桃番茄和醋栗番茄特有的基因组信息。

黄三文说,把一个物种所有的基因都找到,并按照顺序排列,就形成了泛基因组。而图泛基因组(graphpangenome)是借助数学和计算机中被称为图(graph)的数据结构来展示一个物种所有的基因排列和结构。

论文第一作者、基因组所副研究员周姚告诉《中国科学报》,由于泛基因组比单一参考基因组更加准确和详尽地代表了整个物种的遗传多样性,而详尽和准确的变异对下游的遗传学分析提供了完美的基础,所以借助泛基因组做研究不容易漏掉重要的基因和信息。

“此前有很多作物都获得了泛基因组图谱,如水稻、玉米、小麦、大麦、棉花、番茄、油菜等。这次我们首次获得了番茄的图泛基因组,并第一次完成了二倍体马铃薯的泛基因组。”黄三文说。

在关于番茄图泛基因组的研究中应用了“图”这个概念。“图是数学和计算机科学中一种常见的数据结构。已有研究发现,利用该数据结构整合泛基因组,可以减少单一基因组带来的参考基因组偏差问题。”周姚说,为了构建一个准确的图泛基因组,他们首先利用高准确率的三代测序技术重新组装了骨架基因组,其组装质量在完整性、连续性和准确性等指标上均优于之前的版本。

随后,他们选取了31份具有代表性的番茄材料进行了组装,并鉴定出相关的遗传变异;在整合已公布的结构变异和短片段测序信息后,最终构建了来自个番茄基因组的图泛基因组。

法国农业科学研究院研究员MathildeCausse认为,图泛基因组资源对番茄遗传和基因组研究非常重要,促进了后续的基因定位。这篇文章将成为番茄研究领域里的基石。

二倍体马铃薯泛基因组论文的第一作者、基因组所博士生唐蝶告诉《中国科学报》,为了获得高质量的二倍体马铃薯泛基因组,他们挑选了地方栽培种、野生种、近缘野生种等44份具有代表性的二倍体马铃薯种质进行了重测序和基因注释,最终完成了第一个二倍体马铃薯泛基因组。

审稿人评价说,马铃薯泛基因组的构建和分析结果令人印象深刻。这项研究展示了基于广泛选材的“马铃薯组”和“类马铃薯组”泛基因组学的力量,能为其他作物泛基因组研究提供参考方法。

绘图:黄怡可

好吃的番茄:找回“丢失的遗传力”

黄三文告诉记者,作物的性状由遗传因素和环境因素的共同作用而决定。科学家用“遗传力”这个概念表示一种作物的性状受遗传调控的比例。遗传力越高,说明性状的决定过程中遗传因素占比越大,环境因素占比越小。

在未来的作物育种中,基因组选择技术将被广泛应用。当番茄还是幼苗的时候,就对它的基因组进行测序,以此来预测它是否抗病、产量如何、好吃不好吃等。

然而,现在的预测还不是很准。“这是因为调控上述复杂性状的基因有很多,有些基因的作用明显,其遗传力容易被检测到;而另一些基因的作用比较微弱,这些基因难于检测到的遗传力被称为‘丢失的遗传力’。”黄三文说,“遗传力丢失”是一个经典的数量遗传学问题,即通过遗传标记估计的遗传力以及通过全基因组关联分析(GWAS)发现的所有相关基因所贡献的遗传力总和均低于实际的遗传力。

“找回这些丢失的遗传力,将有助于理解复杂性状的遗传机制。”周姚说,遗传力是研究基因型与表型相关性的基础,如何更准确和系统地找到更多的决定表型的遗传变异是作物育种中的基础问题。无论是分子标记辅助育种还是分子设计精准育种,都需要大量的已知功能的遗传变异来指导品种选择或改良。

“目前认为遗传力丢失的主要原因有以下几个:遗传标记与真实影响表型的基因之间存在着不完全连锁,导致模型估计产生偏差;稀有等位基因的贡献不易被察觉;某个基因的不同突变表现出相同的表型使得遗传分析遗漏;基因与基因的互作和基因与环境的互作增加了分析的复杂性。传统短片段测序可对长度较小的变异进行鉴定,但对复杂结构变异的检测能力较差,无法全面评估复杂结构变异对遗传力的具体影响。”论文共同第一作者、基因组所张智洋说。

此前,在人类中遗传力丢失问题研究最为丰富。但受限于技术,这些研究主要

1
查看完整版本: Nature重磅黄三文团队发表2篇论文