基于动态规划的Needleman-Wunsch双序列比对算法的分析与研究被引量：4

Analysis and research on the pairwise alignment Needleman-Wunsch algorithm based on dynamic programming

下载PDF

导出

摘要生物序列比对是生物信息学中最基础的研究课题之一。基于动态规划的Needleman-Wunsch双序列比对算法主要采用迭代算法及空位罚分规则对基因序列进行逐一比对,计算二者相似性得分,最后通过回溯分析得出序列之间的最佳比对。虽然该算法可以得到最佳比对结果,但是时间复杂度和空间复杂度较高。首先对原算法进行分析,对计算得分和回溯进行改进。接着设计2次实验,以金黄色葡萄球菌和银葡萄球菌分别作为目标序列和待比对序列,分别生成序列长度范围相同和不同的5组数据进行实验测试。最后通过对新型冠状病毒和SARS病毒全序列进行比对,进一步验证了改进算法的有效性。实验结果表明,改进后的算法可以缩短序列比对时间,提高序列比对效率。 Sequence alignment is one of the most fundamental research problems in bioinformatics.The pairwise alignment Needleman-Wunsch based on dynamic programming mainly uses the iterative algorithm and the vacancy penalty rule to compare gene sequences one by one,calculates their similarity score,and finally obtains the best alignment between sequences through backtracking analysis.Although the algorithm can get the best result,it has high time and space complexity.Firstly,the original algorithm is analyzed and improved from the aspects of calculation score and backtracking.Secondly,two experiments are designed.In the experiments,Staphylococcus aureus is used as the target sequence,and Staphylococcus aureus is used as the counterpart sequence.Five groups of experiments with the same and different sequence length range are conducted.Finally,the novel coronavirus and SARS virus sequences are compared to verify the effectiveness of the algorithm.The experimental results show that the improved algorithm can reduce the sequence alignment time and improve the efficiency of sequence alignment.

作者甘秋云 GAN Qiu-yun(School of Computing and Information Science,Fuzhou Institute of Technology,Fuzhou 350014,China)

机构地区福州理工学院计算与信息科学学院

出处《计算机工程与科学》 CSCD 北大核心 2021年第2期340-346,共7页 Computer Engineering & Science

基金福建省教育厅中青年教师教育科研项目(JAT191019)。

关键词序列比对动态规划相似性 sequence alignment dynamic programming identity

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献6

1黄佳琪.生物信息学序列比对算法分析[J].生物技术世界,2015,12(11):279-279. 被引量：3
2罗志兵.基于动态规划的基因双序列比对研究[J].现代计算机（中旬刊）,2017(11):28-33. 被引量：2
3唐玉荣,汪懋华.基于动态规划的快速序列比对算法[J].生物数学学报,2005,20(2):207-212. 被引量：8
4李丹.双序列比对算法的研究与改进[J].电子技术与软件工程,2017(18):148-148. 被引量：2
5熊坦.DNA序列匹配算法研究与优化[J].信息与电脑,2019,31(10):30-31. 被引量：1
6焦雅,高静,张文广.两序列比对算法与软件研究进展[J].计算机应用与软件,2015,32(6):5-8. 被引量：7

二级参考文献55

1Davic W Mount. Bioinformatics: Sequence and Genome Analysis[M]. USA: Cold Spring Harbor Laboratory Press, 2002, 53-54.
2Needleman S, Wunsch C. A general method applicable to the search for similarities in the amino acid sequences of two proteins[J]. Journal of Molecular Biology, 1970, 48(3):443-453.
3Hirschberg D. A linear space algorithm for conputing maximal common subsequences[J]. Comm ACM, 1975,18 (6) :341-343.
4Hirschberg D. Serial Computations of Levenshtein Distances[M]. in: A. Apostolicl, Z. Galil (Eds.), Pattern Matching Algorithms, Oxford University Press, 1997, 123-141.
5Ukkonen E. On approximate string matching[J]. Found Comput Theory, 1983, 158(6):487-495.
6David R, Powell, Lloyd Allison, et al. A versatile divide and conquer technique for optimal string alignment[J]. Information Processing Letters, 1999, 70(3):127-139.
7Mount D W.Bioinformatics:Sequence and Genome Analysis[M/OL].2nd ed.US:Cold Spring Harbor Laboratory Press,2004:2-12[2013-10-28].http://hydra.icgeb.trieste.it/~pongor/biophyshomepage/Mount_book/COVERS.pdf.
8Sequence alignment[EB/OL].(2013-10-24)[2013-11-02]http://en.wikipedia.org/wiki/Sequence_alignment#cite_note-mount-1.
9Dayhoff M O,Schwartz R M,Oreutt B C.In Atlas of Protein Sequence and structure[J].Bol,1978,5(3):345.
10Miyamoto M M,Fitch W M.Testing the covarion hypothesis of molecular evolution[J].Mol Biol Evol,1995,12(3):503-512.

共引文献15

1程志华.通过计算公交线路轨迹相似度检测线路是否调整的方法[J].公路交通科技（应用技术版）,2020(1):371-373. 被引量：2
2谢少荣,王东红,罗均,龚振邦.基于生物信息学中双DNA序列比对算法的图像立体匹配及其实现[J].光学精密工程,2007,15(1):106-111. 被引量：5
3唐四薪,周勇,易胤.随机文法模型在RNA二级结构预测中的应用[J].生物数学学报,2008,23(4):735-742. 被引量：2
4李辉,宋安平,张律文,赵志康,张武.单基因扰动实验的自适应灰关联聚类算法[J].计算机工程与设计,2009,30(21):4914-4916.
5施万利,王宏勇.基于双序列比对算法的立体图像匹配方法[J].计算机应用研究,2010,27(8):3176-3178. 被引量：2
6黄佳琪.生物信息学序列比对算法分析[J].生物技术世界,2015,12(11):279-279. 被引量：3
7白居,李永奎,卢昱杰,乐云.基于改进CBR的重大基础设施工程高层管理团队构建方法及验证[J].系统管理学报,2016,25(2):272-281. 被引量：12
8王璐.数学模型在生物序列结构比较中的研究及其应用[J].安阳师范学院学报,2017(2):28-33.
9邓妍,王艺霏,李金山,王君.SNP检测算法的分析与应用[J].分子植物育种,2018,16(11):3698-3703. 被引量：1
10张晓玲,杨健.动态规划法进行基因双序列比对的探索和实现[J].大理大学学报,2019,4(12):6-11.

同被引文献29

1王静,张禹,李杰.足球运动员在虚拟现实多目标追踪任务中的优势[J].北京体育大学学报,2023,46(4):128-144. 被引量：1
2张学民,廖彦罡,葛春林.运动员与普通大学生在多目标追踪任务中的表现[J].北京体育大学学报,2008,31(4):504-506. 被引量：16
3李军.目标数量对篮球运动员视觉追踪表现的影响[J].天津体育学院学报,2012,27(2):133-137. 被引量：18
4王一斌,程咏梅,卫泽刚,张绍武.基于熵聚类和双重筛选策略挖掘动脉粥样硬化风险疾病基因(英文)[J].生物物理学报,2014,30(1):63-71. 被引量：1
5张振男.视觉搜索对篮球罚球时命中率的影响研究[J].文体用品与科技,2015,0(16):158-159. 被引量：1
6龚然,陈听,岳小祺,肖义然,张禹.不同运动强度对篮球运动员多目标追踪影响及眼动分析[J].天津体育学院学报,2016,31(4):358-363. 被引量：18
7徐兆方,柳忠起,王兴伟,张欣.多目标搜索过程中的眼动研究[J].生物医学工程学杂志,2017,34(2):214-219. 被引量：4
8胡路明,苏晶,魏柳青,张学民.多目标追踪中基于运动信息的分组效应[J].心理学报,2018,50(11):1235-1248. 被引量：4
9张玉虎,周正.Needleman-Wunsch算法的改进[J].火力与指挥控制,2019,44(5):107-111. 被引量：3
10冯晓龙,高静.基于Spark的基因短序列比对模型[J].计算机仿真,2020,37(2):231-236. 被引量：2

引证文献4

1张小丹,李喆,卫泽刚,刘策,余凯哲,魏月华.基于k-mer词频向量的九种DNA序列相似性计算方法比较分析[J].科学技术创新,2023(21):106-111. 被引量：2
2张小丹,肖春杨,卫泽刚,杨严硕,刘飞.DNA双序列全局比对Needleman-Wunsch算法教学设计[J].电脑知识与技术,2024,20(8):178-180. 被引量：1
3杨波,王宏杰,徐胜超,毛明扬,蒋金陵,蒋大锐.一种面向生物基因多序列比对算法的任务调度方法[J].计算机与现代化,2024(7):7-12.
4王佳楠,王秋林.不同运动水平篮球运动员视觉搜索特征的研究[J].福建体育科技,2024,43(5):55-59.

二级引证文献3

1张小丹,肖春杨,卫泽刚,杨严硕,刘飞.DNA双序列全局比对Needleman-Wunsch算法教学设计[J].电脑知识与技术,2024,20(8):178-180. 被引量：1
2张小丹,杨严硕,胡婉靖,王亚峰,肖春杨.SIMD指令及其在C++编程语言中的应用[J].科技视界,2024,14(8):15-17. 被引量：1
3卫泽刚,陈旭,张小丹,胡婉靖,刘飞.基于Edlib的启发式生物序列聚类算法[J].宝鸡文理学院学报（自然科学版）,2024,44(3):50-55.

1郭海锋,杨宪赞,金峻臣.基于改进ACGAN算法的车道排队车辆估计及其分类[J].高技术通讯,2020,30(11):1169-1177.
2李晓岑,朱香颖,袁程.气候因素对病毒流行的影响[J].科技导报,2020,38(23):138-143. 被引量：2
3刘召辉.畜牧兽医工作中动物检疫现状与措施[J].兽医导刊,2020(24):22-22.
4刘志军.留守儿童行为发展影响因素研究——基于137个案例的回溯分析[J].浙江大学学报（人文社会科学版）,2020,50(6):216-234. 被引量：15
5魏建强,周虎利.城市轨道交通超长线路统计分析及思考[J].都市快轨交通,2021,34(1):22-28. 被引量：2
6李楠,陈重华,陈国忠,黄欣,陆启省.基于改进灰色模型的遥测变量预测方法[J].上海航天（中英文）,2020,37(6):92-97. 被引量：2
7李春蕾.先张法预应力抗拔桩截桩时桩顶处理分析[J].建筑结构,2020,50(S02):685-689. 被引量：1
8单景松,刘建,王敏,李峰.聚丙烯纤维透水水泥混凝土受力性能研究[J].中外公路,2020,40(6):276-280. 被引量：11
9林晓璇,陈林静,容晨毓,陈凯琪,高桂娟.铺地黍染色体制片优化及核型分析[J].草业科学,2021,38(1):89-98. 被引量：2

计算机工程与科学

2021年第2期

浏览历史

内容加载中请稍等...

基于动态规划的Needleman-Wunsch双序列比对算法的分析与研究被引量：4

参考文献6

二级参考文献55

共引文献15

同被引文献29

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于动态规划的Needleman-Wunsch双序列比对算法的分析与研究 被引量：4

参考文献6

二级参考文献55

共引文献15

同被引文献29

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于动态规划的Needleman-Wunsch双序列比对算法的分析与研究被引量：4