-
题名软件标识符的自然语言规范性研究
- 1
-
-
作者
汶东震
张帆
张晓堃
杨亮
林原
徐博
林鸿飞
-
机构
大连理工大学计算机科学与技术学院
-
出处
《中文信息学报》
CSCD
北大核心
2024年第10期144-154,共11页
-
基金
国家自然科学基金(62076051,62076046)。
-
文摘
软件源代码的理解是软件协同开发与维护的核心,而源代码中占半数以上的标识符的理解则在软件理解中起到重要作用,传统软件工程主要研究通过命名规范限制标识符的命名过程以构造更易理解和交流的标识符。该文在梳理分析常见编程语言命名规范的基础上,该文提出一种全新的标识符可理解性评价标准。具体而言,首先总结梳理了常见主流编程语言中的命名规范并类比自然语言语素概念,提出基于软件语素的标识符构成过程,即标识符的构成可被视为软件语素的生成、排列和连接过程;在此基础上,该文提出一种结合自然语料库的软件标识符规范性评价方法,用来衡量软件标识符是否易于理解;最后,通过源代码理解数据集和Github平台中开源项目对规范性指标进行了验证性实验,结果表明,该文所提出的规范性分数能够很好衡量软件项目的可理解性。
-
关键词
软件标识符
源代码理解
软件维护
自然语言模型
-
Keywords
software identifiers
source code understanding
software maintenance
natural language models
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名深度程序理解视角下代码搜索研究综述
- 2
-
-
作者
汶东震
张帆
刘海峰
杨亮
徐博
林原
林鸿飞
-
机构
大连理工大学
-
出处
《计算机工程与应用》
CSCD
北大核心
2022年第20期63-72,共10页
-
基金
国家重点研发计划(2016YFB1001103)
国家自然科学基金(61976036)。
-
文摘
代码搜索任务旨在通过分析用户需求,结合用户意图来找到满足其需求的软件构件。在加强软件复用性的同时,提高软件开发维护效率,降低成本。与传统的文档检索不同,程序特性往往隐含在标识符和代码结构中,理解程序功能是实现高效代码搜索的关键。从深度程序理解视角切入对代码搜索任务进行定义,并总结梳理近期代码搜索研究进展。针对当前代码搜索研究评估方法和数据集进行了整理。针对研究中存在的问题,对未来代码搜索研究进行展望,为后来研究者提供参考。
-
关键词
程序理解
深度程序理解
代码搜索
自然语言查询
代码表示
信息检索
-
Keywords
program comprehension
deep program comprehension
code search
natural language query
code representation
information retrieval
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-