带约束最长公共子序列快速算法被引量：7

A fast algorithm of constrained longest common subsequence

下载PDF

导出

摘要带约束最长公共子序列(CLCS)问题有很深的生物学应用背景,常被用来表示同源基因序列相似性的度量,但计算CLCS时间代价很高,最早的CLCS算法的时间复杂度为O(rn4),目前,最快的CLCS算法的时间复杂性为O(rn2).运用对偶原理将带约束最长公共子序列问题转换为带约束最小覆盖集问题,并建立带权的ref树结构,构造包含约束序列的约束覆盖子集,约简带约束覆盖子集并从中搜索关键路径,再通过关键路径构造CLCS,该算法将算法时间复杂度提升到O(nlogn+(q+r)L),r是约束序列的长度,q是两序列序偶的个数,L是两序列的最长公共子序列(LCS)长度. The constrained longest common subsequence problem has deep background applications in biology. It is often used to express the measurement of similarity in homologous gene sequences, hut the time complexity on computation of constrained longest common subsequence（CLCS） is high. The time complexity of the original CLCS algorithm is O（rn^4 ）, while presently the time complexity of the fastest CLCS algorithm is O（rn^2）. We use the principle of primal-dual which will convert CLCS to the constrained minimal covering set problem, and then establish ref tree structure with weight, structure constrained covering subset which contains the constrained sequence. We also reduce constrained covering subset and search critical paths from it,and finally structure CLCS through critical paths. The time complexity of this algorithm will be upgraded to O（nlogn＋（q＋r）L）, where the r is length of the constrained sequence, o is the number of ordered hairs of the two given sequences and L is the longest common subsequence（LCS） length of the two given sequences.

作者业宁朱大铭张倩倩沈丽容

机构地区山东大学计算机科学与技术学院南京林业大学信息科学技术学院

出处《南京大学学报（自然科学版）》 CAS CSCD 北大核心 2009年第5期576-584,共9页 Journal of Nanjing University（Natural Science）

基金国家自然科学基金(60573024) 江苏省自然科学基金(BK2009393)

关键词带约束最长公共子序列快速算法对偶算法 constrained longest common subsequence, fast algorithm, primal-dual

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献14

1Wagner R A, Fischer M J. The string-to-string correction problem. Journal of the ACM, 1974, 21(1) :168-173.
2Hirschberg D S. A linear space algorithm for computing maximal common subsequences. Communications of the ACM, 1975, 18:341-343.
3Hunt J W, Szymanski T G. A fast algorithm for computing longest common subsequences. Communications of the ACM, 1977, 20:350-353.
4Hirschberg D S. Algorithms for the longest common subsequence problem. Journal of the ACM,1977, 24: 664-675.
5Pevzner P A, Waterman M S. Generalized sequence alignment and duality. Advance Applied Mathematics, 1993,14 (2) :139-171.
6Nakatsu N, Kambayashi Y, Yajima S. A longest common subsequence algorithm suitable for similar texts. Aeta Informatica, 1982,18 : 171 -179.
7Ukkonen E. Algorithms for approximate string matching. Information and Control, 1985, 64: 100-118.
8Myers E W. An O(ND) difference algorithm and its variations. Algorithmica, 1986, 1 : 251-266.
9Rick C. Simple and fast linear space computation of longest common subsequences. Information Processing letters, 2000, 75:275-281.
10刘振栋,李恒武,朱大铭.计算最大堆迭的RNA二级结构预测算法[J].南京大学学报（自然科学版）,2005,41(5):532-537. 被引量：4

二级参考文献9

1Nussinov R, Pieczenik G,Griggs J R, et al. Aigorithms for loop matchings SIAMJ. Applied Mathematics, 1978,35(1): 68- 82.
2Zuker M, Stiegler P. Optimal computer folding of large RNA sequences using thermodynamics and auxiliary information. Nucleic Acids Research,1981,9: 133- 148.
3Rivas E, Eddy S R. A dynamic programming algorithm for RNA structure prediction including pseudoknots. Journal of Molecular Biology, 1999,285 :2 053-2 068.
4Lyngso R B, Pedersen C N. RNA pseudoknot prediction in energy based models. Journal of Computational Biology, 2001,7 : 409 - 428.
5李恒武朱大铭马绍汉.包含伪结点的RNA二级结构预测的改进算法[J].计算机科学,2003,(9):109-111.
6Jens R, Robert G. Design, implementation and evaluation of a practical pseudoknot folding algorithm based on thermodynamics. BMC Bioinformatics, 2004(5) : 104.
7Turner D H, Sugimoto N, Freier S M. RNA structure prediction. Annual Review of Biophysics Biophysical Chemistry, 1988(17): 167 - 192.
8PseudoBase: Theoretical Biology. http://wwwbio.leidenuniv. nl/-Batenburg/PKBGet. html, 1998.
9周毅,徐柏龄.神经网络中的正交设计法研究[J].南京大学学报（自然科学版）,2001,37(1):72-78. 被引量：35

共引文献3

1徐聪,刘元宁,朱晓冬,董浩,高娜.包括假结的RNA二级结构茎区组合预测新算法[J].吉林大学学报（工学版）,2009,39(S1):260-264.
2史军伟,徐阳,徐玲玲,廖亮.RNA二级结构分析方法及在植物系统学研究上的应用[J].九江学院学报,2008,27(3):78-83. 被引量：4
3邹权,郭茂祖,刘扬.质心法:受类别驱动的RNA二级结构预测方法[J].南京大学学报（自然科学版）,2009,45(5):677-688. 被引量：2

同被引文献75

1何干俊.汉语音译词的多维考察[J].江西社会科学,2012,32(4):194-197. 被引量：4
2陈计喜,姜丽红.自动化功能测试的方法与实现[J].计算机工程,2004,30(B12):168-169. 被引量：9
3刘宏申,秦锋.确定轮廓形状匹配中形状描述函数的方法[J].华中科技大学学报（自然科学版）,2005,33(4):13-16. 被引量：21
4李谦.基于小波变换和纹理特征的水印算法的研究[J].计算机工程与设计,2006,27(14):2616-2619. 被引量：6
5贾海燕,朱良家,周宗潭,胡德文.一种碎纸自动拼接中的形状匹配方法[J].计算机仿真,2006,23(11):180-183. 被引量：35
6章毓晋.图像工程--图像分析[M].2版.北京:清华大学出版社,2005.
7Richard O Duda,Peter E Hart,David G Stork.模式分类(英文版)[M].2版.北京:机械工业出版社,2004.
8Abraham Sitberschatz,Henry F Korth,Sudarshan S.数据库系统概念(英文版)[M].5版.北京:高等教育出版社,2006.
9沈娟.基于曲线轮廓描述的甲骨文字体生成和变形系统研究[D].苏州:苏州大学,2008.
10范伟李晓明.物联网数据特性对建模和挖掘的挑战[J].计算机学会通讯,2010,55(9):42-47.

引证文献7

1王爱民,葛文英,赵哲,葛彦强,刘国英,栗青生.龟甲类甲骨文碎片计算机辅助缀合研究[J].计算机工程与设计,2011,32(10):3570-3572. 被引量：7
2周溜溜,业宁.基于对gSpan改进的有向频繁子图挖掘算法[J].南京大学学报（自然科学版）,2011,47(5):532-543. 被引量：2
3曾波,潘少彬,陆璐.改进的LCS方法在测试脚本序列比对中的应用[J].计算机工程与应用,2011,47(35):71-76. 被引量：6
4王防修,周康.基于最长公共子序列的随机路径选择算法设计[J].计算机工程与设计,2014,35(6):2170-2173. 被引量：2
5陈伟鹤,刘云.基于词或词组长度和频数的短中文文本关键词提取算法[J].计算机科学,2016,43(12):50-57. 被引量：14
6王前东.一种带匹配路径约束的最长公共子序列长度算法[J].电子与信息学报,2017,39(11):2615-2619. 被引量：9
7魏慧玲,相伟.降低车位占用告警误报率的策略与方法研究[J].仪器仪表用户,2023,30(7):106-109.

二级引证文献39

1莫伯峰,张展.计算机辅助甲骨缀合研讨一则——谈“日有即”[J].民俗典籍文字研究,2021(2):169-174. 被引量：1
2张宗福.一种基于LCS的微博相似页面检测方法[J].集成技术,2013,2(3):5-9.
3熊晶,高峰,吴琴霞.甲骨文计算机辅助翻译技术研究[J].科学技术与工程,2014,22(2):179-182. 被引量：8
4王永新,王秋芬,梁道雷.一种高效LCS算法[J].南阳理工学院学报,2013,5(6):61-64. 被引量：5
5熊晶,高峰,吴琴霞.甲骨文大规模基础数据的语义挖掘研究[J].现代图书情报技术,2015(2):7-14. 被引量：10
6王少鹏,闻英友,赵宏.基于LCSS的数据流相似性查询处理算法研究[J].计算机研究与发展,2015,52(9):1976-1991. 被引量：3
7张仲妹,王桂玲,张赛,韩燕波.基于频繁子图挖掘的数据服务Mashup推荐[J].电子科技大学学报,2016,45(2):263-269. 被引量：1
8徐睿,陈宏君,张磊,周磊,文继锋.基于分层匹配和最长公共子序列的SCD文件比较算法[J].计算机系统应用,2016,25(12):176-181.
9陈洁.基于结构和语义相似度的SQL程序评分模型[J].计算机系统应用,2017,26(5):175-179.
10党彦杰.计算机技术在甲骨文领域的应用[J].数码世界,2017,0(9):34-34.

1文俊浩,朱灿,张杨.基于全对偶算法的自动化测试方法[J].重庆大学学报（自然科学版）,2005,28(10):59-61. 被引量：2
2杜欣,刘坤起,陈玉军,贾丽媛.改进的基因表达式程序设计实现复杂函数的自动建模[J].微计算机信息,2006(06S):295-297. 被引量：5
3Ning WEI,Zhongpei ZHANG.Competitive access in multi-RAT systems with regulated interference constraints[J].Science China(Information Sciences),2017,60(2):92-102. 被引量：1
4张茜,孙力娟,郭剑,肖甫,王汝传.基于网格划分的节点调度覆盖算法[J].计算机研究与发展,2011,48(S2):111-115. 被引量：2
5周康,殷燕芳,解智,魏传佳.城市交通优化中基于对偶算法的元胞自动机[J].华中科技大学学报（自然科学版）,2010,38(1):50-54. 被引量：1
6刘婷,崔杜武.一种基于冲突消解的资源分配算法[J].西安理工大学学报,2006,22(3):294-296. 被引量：1
7杨洪勇,田玉平.具有通信时延的网络拥塞控制对偶算法的稳定性[J].东南大学学报（自然科学版）,2003,33(6):707-711. 被引量：2
8金静花,田玉平.无线环境下拥塞控制算法的改进及其稳定性分析[J].控制与决策,2008,23(2):140-144.
9闫友彪.新的基于非线性控制理论的显式拥塞控制算法[J].计算机工程与应用,2007,43(23):141-146.
10唐功友,李娟,张勇.时滞系统基于对偶原理的故障诊断[J].控制理论与应用,2008,25(5):966-969. 被引量：4

南京大学学报（自然科学版）

2009年第5期

浏览历史

内容加载中请稍等...

带约束最长公共子序列快速算法被引量：7

参考文献14

二级参考文献9

共引文献3

同被引文献75

引证文献7

二级引证文献39

相关作者

相关机构

相关主题

浏览历史

带约束最长公共子序列快速算法 被引量：7

参考文献14

二级参考文献9

共引文献3

同被引文献75

引证文献7

二级引证文献39

相关作者

相关机构

相关主题

浏览历史

带约束最长公共子序列快速算法被引量：7