【正确答案】现状:已有众多各具特色的数据库和软件资源。TRANSFAC数据库是一个真核生物顺式调控元件和反式作用因子数据库,数据搜集的对象从酵母一直到人类,而且全部是来自实验证实的数据。JASPAR收集有注释的、高质量的多细胞真核生物转录因子结合部位的开放数据库。TRED数据库收集了哺乳动物转录调控元件的数据库,对人、小鼠、大鼠等物种的启动子区域有相对完整的注释。DBTSS由东京大学人类基因组中心维护。目前包含的TSS标签已达个,涵盖了人和小鼠的全长cDNA。这些TSS标签是从33种不同的细胞类型或培养条件下获得的。TRRD数据库的数据来源于已发表的科学论文。每一个TRRD的条目里包含特定基因各种结构-功能特性,包括转录因子结合位点、启动子、增强子、沉默子的位置以及基因表达调控模式等。
不足:①大多数数据库对于数据的创新、精确性和准确性缺少权威评价,数据过多、重复、分类较粗等;②人类公共数据库中,只有极少数被实验证实的顺式作用元件,绝大多数基因的转录调控区或启动子仍然未知;③采用人类基因组信息来预测植物、真菌等远缘物种的基因结构时,数据准确性不高,但目前针对植物、真菌等的生物信息学数据库远没有人类的全面和完善;④真核生物的顺式作用元件比原核生物的复杂,需要考虑多种因素;⑤基因的转录不仅具有时空性和组织特异性,还呈现网络化,基因转录调控网络的预测方法还较少。因此,高效的实验方法和设计良好的预测软件仍是生物学家面临的严峻课题。
【答案解析】