摘要
哺乳动物的基因组中能转录出成千上万的长链非编码RNA(lnc RNA),这些新发现的RNA分子已经被证实参与了各种各样复杂的生物过程.目前大多数哺乳动物的lnc RNA的参考注释并不完全,这限制了对lnc RNA的进化以及接下来的功能研究.本研究组利用9个物种6种组织的转录组测序数据,成功地构建出一个完备的哺乳动物lnc RNA的参考注释集合(约4142~42558条lnc RNA).基于这些lnc RNA,做了一系列的进化研究,发现30%~99%的lnc RNA在基因组上是保守的,这些保守的lnc RNA中仅有20%~27%也能在转录层面保守,这与编码基因的保守性形成鲜明对比:保守的编码基因约有48%~80%能在转录层面保守.随后,基于lnc RNA的表达量数据成功地构建出其在9个物种中的系统发生树,通过对系统发生树的对比分析发现,lnc RNA的进化速率明显比编码基因快,且在不同的组织间有很大差别.将此项研究中得到的lnc RNA的集合以及其保守和进化的数据收集到Phylo NONCODE数据库中(http://www.bioinfo.org/phylo Noncode),这将成为研究非编码RNA进化及功能的非常有用的资源.
出处
《中国科学:生命科学》
CSCD
北大核心
2016年第2期167-177,共11页
Scientia Sinica(Vitae)
基金
国家自然科学基金(批准号:91229120)资助