-
题名基于贝叶斯网络的克隆代码有害性预测
被引量:8
- 1
-
-
作者
张丽萍
张瑞霞
王欢
闫盛
-
机构
内蒙古师范大学计算机与信息工程学院
-
出处
《计算机应用》
CSCD
北大核心
2016年第1期260-265,共6页
-
基金
国家自然科学基金资助项目(61363017
61462071)
内蒙古自然科学基金资助项目(2014MS0613)~~
-
文摘
在软件开发过程中,程序员的复制、粘贴活动会产生大量的克隆代码,而那些发生不一致变化的克隆代码往往对程序是有害的。为了解决该问题,有效地发现程序中的有害克隆代码,提出一种基于贝叶斯网络的克隆有害性预测方法。首先,结合软件缺陷研究领域与克隆演化领域的相关研究成果,提出了两大类表征克隆代码信息的特征,分别是静态特征和演化特征;其次,通过贝叶斯网络核心算法来构建克隆有害性预测模型;最后,预测有害克隆代码发生的可能性。在5款C语言开源软件共99个版本上对克隆有害性预测模型的性能进行评估,实验结果表明该方法能够有效地实现对克隆代码有害性的预测,降低有害克隆代码对软件的威胁,提高软件质量。
-
关键词
克隆代码
有害性预测
贝叶斯网络
克隆演化
机器学习
-
Keywords
clone code
harmfulness prediction
Bayesian network
clone evolution
machine learning
-
分类号
TP311.5
[自动化与计算机技术—计算机软件与理论]
-
-
题名克隆代码有害性预测中的特征选择模型
被引量:2
- 2
-
-
作者
王欢
张丽萍
闫盛
刘东升
-
机构
内蒙古师范大学计算机与信息工程学院
-
出处
《计算机应用》
CSCD
北大核心
2017年第4期1135-1142,1163,共9页
-
基金
国家自然科学基金资助项目(61363017
61462071)
+1 种基金
内蒙古自治区自然科学基金资助项目(2014MS0613
2015MS0606)~~
-
文摘
为解决克隆代码有害性预测过程中特征无关与特征冗余的问题,提出一种基于相关程度和影响程度的克隆代码有害性特征选择组合模型。首先,利用信息增益率对特征数据进行相关性的初步排序;然后,保留相关性排名较高的特征并去除其他无关特征,减小特征的搜索空间;接着,采用基于朴素贝叶斯等六种分类器分别与封装型序列浮动前向选择算法结合来确定最优特征子集。最后对不同的特征选择方法进行对比分析,将各种方法在不同选择准则上的优势加以利用,对特征数据进行分析、筛选和优化。实验结果表明,与未进行特征选择之前对比发现有害性预测准确率提高15.2~34个百分点以上;与其他特征选择方法比较,该方法在F1测度上提高1.1~10.1个百分点,在AUC指标上提升达到0.7~22.1个百分点,能极大地提高有害性预测模型的准确度。
-
关键词
克隆代码
有害性预测
特征子集
信息增益率
特征选择
-
Keywords
clone code
harmfulness prediction
feature subset
information gain ratio
feature selection
-
分类号
TP311.5
[自动化与计算机技术—计算机软件与理论]
-