基于显露子串挖掘的基因序列模体识别算法被引量：2

Motif identification algorithm for gene sequences based on emerging substrings mining

下载PDF

导出

摘要染色质免疫共沉淀技术将模体识别问题拓展到了全基因组范围,但因数据量过大,传统的模体识别算法往往运算过慢从而无法很好地解决此问题。为了解决传统算法的缺点,提出一种用于Ch IP-seq数据的替换显露子串寻找问题的算法Fast ESE,通过测试集和控制集的比对找出显露子串并搜索其(l,d)替换实例组成相应的位置概率矩阵,再使用权重信息量对这些子串进行聚类,最终找出集合中的替换显露子串。使用真实的Ch IP-seq数据对该研究算法进行有效性验证,实验结果表明,Fast ESE可以在合理时间内有效解决Ch IP-seq中的模体识别问题。 Recently,the development of chromatin immunoprecipitation technique has extended the motif identification problem to the genome?wide range,but the traditional motif identification algorithms runs too slowly and hard to solve this largescale data problem.In order to solve the shortcomings of the traditional algorithms,a substituted emerging substring search algorithm named FastESE applied to ChIP?seq data is proposed in this research.The emerging substrings are found out by comparing the test dataset and the control dataset,and then its substituted instances are searched to constitute the corresponding position probabilistic matrix.The weighted information content is adopted to cluster these substrings,and Finally,discover the substituted emerging substrings.The effectiveness of proposed algorithm was verified with the real ChIP?seq data.The experimental results show that the FastESE can deal with the motif identification problem in the ChIP?seq data in a proper time.

作者张懿璞闫茂德侯俊阚丹会 ZHANG Yipu;YAN Maode;HOU Jun;KAN Danhui(School of Electronics and Control Engineering,Chang’An University,Xi’an 710064,China;School of Information Engineering,Chang’An University,Xi’an 710064,China)

机构地区长安大学电子与控制工程学院长安大学信息工程学院

出处《现代电子技术》北大核心 2017年第12期6-10,共5页 Modern Electronics Technique

基金国家自然科学青年基金(61501058) 陕西省自然科学青年基金(2016JQ6075) 中央高校基本业务费(310832161008)

关键词染色质免疫共沉淀显露子串模体识别 FastESE chromatin immunoprecipitation emerging substring motif identification FastESE

分类号 TN911.34 [电子电信—通信与信息系统] TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

同被引文献15

1高志鹏,尤俊生.一种基于SVM分类器的RAR文件碎片识别方法[J].计算机科学,2015,42(B10):84-86. 被引量：1
2袁定莲,冯径,沈晔,张涛.基于自相似的气象数据分类识别方法[J].计算机应用,2015,35(A02):93-97. 被引量：3
3赵思思,阮宁娟,庄绪霞.LEO轨道危险碎片天基光学观测技术[J].红外与激光工程,2015,43(B12):163-167. 被引量：3
4宋薇,冯诗淇,石晶,徐蓉,王功长,李滨宇,刘瑜,李双,曹睿,蔡红星,张喜和,谭勇.基于散射光谱的空间碎片分类研究[J].光谱学与光谱分析,2015,35(6):1464-1468. 被引量：7
5邓芳.大型物联网电子设备的海量数据高效挖掘方法研究[J].现代电子技术,2016,39(4):159-162. 被引量：18
6曾卫平,郑文心,彭勇,黄玮,蒋莉.基于MBD设计的产品数据属性映射研究与实现[J].机械设计与制造工程,2016,45(2):42-47. 被引量：2
7孙浩,吴斌,周旭华.利用光电模拟数据的空间碎片经验力补偿评估[J].光电工程,2016,43(4):1-7. 被引量：1
8翟光,赵琪,张景瑞.空间碎片在轨识别与精确定位方法[J].红外与激光工程,2016,45(B05):169-176. 被引量：11
9李秋红,辛长江,陈双贵,许康生,闫万生.机场地磁场测量及数据处理[J].地震工程学报,2016,38(A01):44-48. 被引量：6
10毛国君,胡殿军,谢松燕.基于分布式数据流的大数据分类模型和算法[J].计算机学报,2017,40(1):161-175. 被引量：54

引证文献2

1温爱红,兰英,严南.大数据库不均衡数据碎片分类识别算法分析[J].机械设计与制造工程,2018,47(6):82-86. 被引量：1
2顾明.数据库数据分类压缩算法研究[J].电子测试,2021,32(11):65-66. 被引量：2

二级引证文献3

1李巍伟,何宁,王宗强,梁红艳,张鑫,张劲.基于开放平台的民航大型主机跟踪数据存储和查询[J].信息记录材料,2022,23(8):179-182. 被引量：1
2陈炼松,张亮,黎飞,班定东.新能源汽车远程监控数据压缩系统研究[J].汽车电器,2024(1):12-14.
3杨永娇.ORACLE数据库自动化碎片整理研究与应用[J].自动化与仪器仪表,2019(8):223-226. 被引量：5

1杨薇,刘若水.染色质免疫共沉淀-测序(ChIP-Seq)技术及数据分析方法介绍[J].河南科学,2014,32(8):1440-1444. 被引量：2
2李彩霞,周集良,曹奇英,顾爱萍,刘琳琅.基于上下文的位置预测研究[J].计算机应用研究,2008,25(11):3325-3327.
3马安光.文件时间问题——2003年第6期题解[J].程序员,2003(8):105-106.
4郭成,李连庆.遗传算法的Matlab7.0程序实现[J].淮海工学院学报（自然科学版）,2010,19(3):21-24. 被引量：3
5袁晓辉,朱红,袁兆山.Internet 中的超文本超媒体技术[J].合肥工业大学学报（自然科学版）,1997,20(2):39-44. 被引量：1
6张凤霞.拓展组合逻辑电路的设计方法[J].天中学刊,2001,16(2):90-90. 被引量：1
7Michael Santarini.ASIC原型构建：是做还是买?[J].电子设计技术 EDN CHINA,2006,13(2):58-58.
8阙政.雨伞、篮球、姨妈巾……未来还有什么不可共享?[J].新民周刊,2017,0(22):28-31.
9Jamie Kane,Andrew Wang.如何选择核级流体系统元件供应商[J].中国核工业,2009(9):36-37.
10张砚青,杨泽.浅析脱口秀节目的构成与各角色分析[J].传播与版权,2015(8):98-99.

现代电子技术

2017年第12期

浏览历史

内容加载中请稍等...

基于显露子串挖掘的基因序列模体识别算法被引量：2

同被引文献15

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于显露子串挖掘的基因序列模体识别算法 被引量：2

同被引文献15

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于显露子串挖掘的基因序列模体识别算法被引量：2