软件标识符的自然语言规范性研究

A Natural Language Perspective to the Readability of Software Identifiers

下载PDF

导出

摘要软件源代码的理解是软件协同开发与维护的核心,而源代码中占半数以上的标识符的理解则在软件理解中起到重要作用,传统软件工程主要研究通过命名规范限制标识符的命名过程以构造更易理解和交流的标识符。该文在梳理分析常见编程语言命名规范的基础上,该文提出一种全新的标识符可理解性评价标准。具体而言,首先总结梳理了常见主流编程语言中的命名规范并类比自然语言语素概念,提出基于软件语素的标识符构成过程,即标识符的构成可被视为软件语素的生成、排列和连接过程;在此基础上,该文提出一种结合自然语料库的软件标识符规范性评价方法,用来衡量软件标识符是否易于理解;最后,通过源代码理解数据集和Github平台中开源项目对规范性指标进行了验证性实验,结果表明,该文所提出的规范性分数能够很好衡量软件项目的可理解性。 The software identifiers plays an important role in software understanding.In this paper,we propose a new criterion for evaluating the readability of software identifiers.Firstly,we compare the naming conventions in popular programming languages and propose a Software Morpheme-based identifier construction process,in which the identifiers are considered as an arrangement and concatenation of different software morphemes.Then,this paper proposes a new evaluation metric for software identifier readability.Experiments on the source code comprehension tasks and open source projects on the Github platform show that the proposed method can measure the readability of software projects.

作者汶东震张帆张晓堃杨亮林原徐博林鸿飞 WEN Dongzhen;ZHANG Fan;ZHANG Xiaokun;YANG Liang;LIN Yuan;XU Bo;LIN Hongfei(School of Computer Science and Technology,Dalian University of Technology,Dalian,Liaoning 116024,China)

机构地区大连理工大学计算机科学与技术学院

出处《中文信息学报》 CSCD 北大核心 2024年第10期144-154,共11页 Journal of Chinese Information Processing

基金国家自然科学基金(62076051,62076046)。

关键词软件标识符源代码理解软件维护自然语言模型 software identifiers source code understanding software maintenance natural language models

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

1夏均强.大数据技术在计算机软件工程中的应用[J].中文科技期刊数据库（文摘版）工程技术,2024(10):0009-0012.
2黄洁.大数据背景下软件工程课程教学改革探究[J].中文科技期刊数据库（全文版）教育科学,2022(7):102-104.
3张云嘉.软件工程系统结构模型的应用研究[J].软件,2023,44(11):169-171.
4曹元.基于大语言模型的智能产线的设计[J].智慧中国,2024(10):79-80.
5李林林,孙良旭.以学生为中心的软件工程课程实践案例教学改革[J].中文科技期刊数据库（全文版）教育科学,2023(10):29-31.
6陈丽娟.基于HTML5技术的移动WebApp研究与开发[J].电脑迷,2023(12):1-3.
7陈坤.法理之学理分析与体系建构[J].法制与社会发展,2024,30(5):93-108.
8金光辉,姚弥,朱海蓉,周婧雅,刘瑞红,江孙芳,方力争,杜雪平,路孝琴,迟春花.“医学难以解释的症状”相关概念的发展及其对医学术语命名规范的启示[J].中华全科医师杂志,2024,23(11):1121-1128.
9薛建军.关于促进初中物理实验教学改革的探索[J].中华传奇（上旬）,2022(7):0019-0021.
10高崚峰,张倩,徐杭,马跃,侯阳.基于人工智能的冠状动脉钙化积分算法在胸部CT中的应用价值及影响因素分析[J].中国临床医学影像杂志,2024,35(10):741-745.

中文信息学报

2024年第10期

浏览历史

内容加载中请稍等...

软件标识符的自然语言规范性研究

相关作者

相关机构

相关主题

浏览历史