Nature | 一个完整的人类基因组序列就在眼前

艾斯特 彩虹万事屋

研究人员添加了2亿个脱氧核糖核酸碱基对和115个蛋白质编码基因,但他们尚未对Y染色体进行完全测序。




Picture——英国剑桥旁的韦尔科姆桑格研究所人类基因组序列切片的可视化



20年前,当人类基因组计划和生物技术公司Celera Genomics宣布人类基因组测序时,序列并不真正完整。大约15%丢失了:技术限制使得研究人员无法计算出某些DNA片段是如何组装在一起的,尤其是那些有许多重复字母(或碱基对)的片段。科学家随着时间的推移,解决了一些难题,但是最近的人类基因组,遗传学家从2013年开始用作参考,仍然缺少8%的完整序列。


现在,由大约30个机构组成的国际合作组织—— dubbed T2T-CHM13的研究人员已经填补了这些空白。在5月27日的预印本中加州大学圣克鲁斯分校的基因组学研究人员卡伦·米加(Karen Miga)和她的同事报告说,他们已经对其余部分进行了测序,在此过程中发现了约115个编码蛋白质的新基因,总数为19969个。

马里兰州贝塞斯达美国国家生物技术信息中心的生物信息学专家金·普鲁特(Kim Pruitt)说:“对问题领域有所解决是令人兴奋的。”他称这一结果为“重要的里程碑”。



Miga预计,遗传学研究人员将很快发现任何新测序的区域和可能的基因是否与人类疾病有关。“当人类基因组问世时,我们还没有准备就绪的工具,”她说,但是关于新测序基因功能的信息现在应该来得更快,因为“我们已经积累了大量的资源”。

她希望未来的人类基因组序列将涵盖一切,包括新测序的部分——而不仅仅是易于阅读的部分。现在参考基因组已经完成,一些技术障碍已经解决,这应该会更容易。“我们需要在基因组学方面达到一个新的标准,这个标准不是特殊的,而是常规的。


References

Nurk, S. et al. Preprint at bioRxiv doi.org/10.1101/2021.05.26.445798 (2021).

文章推荐