作为一半以上地球人类赖以生存的粮食作物,水稻最近有了一份超级泛基因组图谱。深圳科学家组装了251份高质量的水稻基因组,获得了迄今为止植物界群体规模最大的基因组学研究成果。
近日,《细胞生物学(Cell Research)》杂志上发表了由中国农业科学院(深圳)农业基因组研究所(下称“基因组所”)牵头组织,与中国农业大学、南京农业大学、中国水稻研究所、中国科学院遗传与发育生物学研究所等单位联手完成的《水稻超泛基因组图谱》,帮助人类更好地了解水稻功能基因和利用种质资源。
栽培水稻历史
已有1万多年
专家表示,泛基因组是指一个物种内所有基因组信息的总和,相比单一参考基因组,泛基因组信息包含了丰富的遗传多样性,可有效降低参考基因组偏差对遗传变异检测的影响。
为了更好地研究稻属的遗传变异,科研人员从5年前开始启动这项研究。
考古学研究成果揭示,人类最早栽培水稻的历史距今已有逾1万年。“水稻驯化的过程中经历了高强度的人工选择,导致栽培稻相对于野生稻祖先遗传多样性减少,成为目前培育水稻品种的制约因素之一。”该研究的第一作者、基因组所研究员商连光告诉记者,特别是近15年,水稻培育更侧重于高产,产量平均提升了13.33%,却丧失了更多的有利基因,比如一些抗病、氮高效基因。
测序数据多达
9.42万亿字节
水稻是中国第一大粮食作物,中国也是世界上最早种植水稻的国家。在水稻基因组学研究上,中国一直走在世界前列。20年前,中国科学家独立绘制完成并成功“解读”了水稻基因序列,这也是人类第一次在基因组层面认识了水稻。
“稻属供应了地球一半以上人类的口粮,但其实只有亚洲稻和非洲稻两个种,它们之间不仅是地理上远隔重洋,从基因组学研究上看也是独立起源,有着生殖隔离。”商连光表示,此前的研究不仅没有实现亚洲稻、非洲稻的系统化比较和研究,两种野生稻中还存有大量的遗传变异未被发掘,也未能实现群体水平最完整的序列多样性分析。这项研究通过地理分布来源、基因型和表型变异精心选择了251份水稻材料,其中包括了202份亚洲栽培稻、28份普通野生稻、11份非洲栽培稻和10份短舌野生稻。
这项研究涉及数据非常庞大,仅高深度、长读长(也称“三代测序”)测序数据多达9.42万亿字节(TB)。5年来,该研究已完成构建4个水稻泛基因组。
该研究的并列第一作者、基因组所在读博士生李笑霞表示,研究人员利用基因组所和中国水稻研究所提供的超算平台,对251份水稻核心种质资源的原始测序数据进行基因组组装、基因组注释等分析工作,进而构建了目前植物中群体规模最大、基因组注释最充分、研究最为系统的稻属超级泛基因组。
251份水稻资源
种植在大鹏基地
通过这项研究,科研人员不仅获得了一份高质量的稻属泛基因组图谱,并整合数据开发了在线网站,让科研人员能高效方便地利用这些海量的基因组学数据。通过数据检索,科研人员可根据研究需要,高效地获得特定水稻品种基因组序列、基因在群体中的变化。
种质资源收集是保障国家粮食安全的“国之重器”。目前,科研人员将这251份水稻资源种植在深圳大鹏新区的中国农业科学院深圳综合试验基地。商连光表示,这些水稻之间差异甚大,最高的2米,最矮的仅70厘米,都是非常具有代表性的全球核心种质资源。结合这项研究所取得的高质量组学数据,育种人员可充分利用这251份水稻资源,进行优异基因聚合,创制新的育种材料,实现更高水平的分子设计育种,加速完成将更多优质、高产、广适、绿色水稻的良种材料把握在自己手中的使命。(记者 张妍)
关键词: 水稻超级泛基因组图谱 细胞生物学 中国农业科学院 中国农业大学