-
题名面向时序基因表达数据的双聚类算法
被引量:3
- 1
-
-
作者
杨蜜静
尚学群
许涛
王淼
-
机构
西北工业大学计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2013年第8期2308-2314,共7页
-
基金
国家"973"计划资助项目(2012CB316203)
国家自然科学基金资助项目(61272121)
-
文摘
对某种生物而言,在某段连续时间内共表达的基因预示着其在同时完成某一生物过程或其间存在某种调控关系;而目前在基因表达数据上的大多数双聚类算法都是针对非连续样本点的情况提出的,对于连续样本点(样本之间存在顺序关系)的情况很少涉及。因此在考虑连续样本点的情况下,提出了一种在时序基因表达数据上挖掘极大一致趋势共表达基因集的双聚类算法TCBicluster。在每个时间点产生行常量共表达基因集,进而构造以时间点为顶点、以相邻时间点间满足一致性要求的共表达基因集为边的权值图,并采用扩展连续时间点的方式对权值图进行双聚类挖掘,使用有效的剪枝策略提高算法效率。实验证明,TCBicluster算法比RAP及CC-TSB算法更能有效挖掘极大一致趋势共表达双聚类且具有较高的效率和良好的可扩展性。
-
关键词
时间点连续
基因共表达
一致趋势
双聚类
-
Keywords
time-continuous
gene co-expression
coherent evolution
bicluster
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于离散时序基因表达数据的双聚类算法
被引量:1
- 2
-
-
作者
许涛
尚学群
杨蜜静
王淼
-
机构
西北工业大学计算机学院计算机软件与理论系
-
出处
《计算机应用研究》
CSCD
北大核心
2013年第12期3551-3556,3567,共7页
-
基金
国家"973"计划资助项目(2012CB316203)
国家自然科学基金资助项目(61272121)
-
文摘
目前应用于基因表达数据上的双聚类算法大多是基于真实数据提出的,因此易受噪声干扰,且这些算法很少考虑样本间的时序性。提出了一种有效的时间点连续的双聚类挖掘算法DTCB,从离散的时序基因表达数据中挖掘出时间点连续的最大共表达双聚类。该算法使用了一种新的数据离散化方法,同时提出了三种在离散数据集下基因间的共表达关系;为了提高挖掘效率,DTCB使用了有效的剪枝和输出策略,可以在不产生候选集的情况下一次性挖掘出所有的最大共表达双聚类。通过实验分析,证明DTCB具有高效的性能和良好的鲁棒性,且结果具有较好的统计和生物意义。
-
关键词
时序基因表达数据
双聚类
共表达
时间点连续
离散化
-
Keywords
time-series gene expression data
bicluster
co-expression
time-continuous
discretization
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
TP301.6
[自动化与计算机技术—计算机系统结构]
-