我国林业科学家日前完成了包括毛竹叶片、笋和萌发种子等在内的毛竹全长cDNA文库构建,并精确测定了1万余条基因序列。这是公共数据库中继水稻和拟南芥以外,第三大植物全长cDNA数据信息资源,取得了林业领域基因组学研究的重大突破。
有关专家表示,该项目第一次提供了大量竹亚科基因序列信息,填补了禾本科植物比较基因组学研究空白,为进一步开展基因组测序计划提供了有效的基因注释依据。
科学家们在完成毛竹全长cDNA文库构建并精确测定1万余条基因序列的同时,还首次根据毛竹大规模的基因序列统计了毛竹基因的一些基本信息,包括GC含量、密码子使用偏好性、简单重复序列、小分子RNA和转座子的统计等。另外,科学家们根据鉴定到的42组禾本科同源基因,进行了系统发育树分析,分析显示毛竹与水稻具有最近的进化关系。这为禾本科植物的进一步研究提供了极其重要的信息。
同时,作为大规模开展毛竹基因组测序的关键性基础研究工作,科学家们还顺利完成了两套高质量、高覆盖率的毛竹BAC文库构建工作,为全面开展毛竹基因组测序研究的各项预研工作作好了准备。
毛竹是世界上最重要的竹类植物之一,也是我国分布范围最广、种植面积最大、经济价值最高的竹种,在禾本科植物中占有特殊地位。而禾本科类植物是人类获取食物和潜在可再生能源的主要来源。为了进行更全面的比较基因组学的研究,科学工作者需要不断积累来自于不同种类的禾本科植物的基因信息和基因组信息。目前,在公共数据库中,禾本科的大多数亚科(超过100个种类)都有大量相应的基因组信息或表达信息,只有竹亚科(包含约1000多个种类)仅有少量的序列信息。毛竹全长cDNA文库构建的完成和1万余条基因序列的精确测定填补了这一方面的空缺。
毛竹全长cDNA文库构建和基因序列精确测定,是毛竹基因组测序研究重大科研项目的第一部分。该项目由财政部、科技部支持,国家林业局行业科研专项立项重点支撑,中国林业科学研究院、国际竹藤网络中心与中国科学院国家基因研究中心合作承担。