基于注意力机制的Java API序列推荐方法被引量：2

Java API Sequence Recommendation Method Based on Attention Mechanism

下载PDF

导出

摘要软件开发者在软件代码中如何正确使用API和API序列(APIs),是一个需要学习的困难过程.于是面对不熟悉函数库或像Github那样包含大量APIs的代码仓库,需要一些推荐工具或系统辅助开发者的APIs使用.目前我们所知最好的方法DeepApi能较好理解用户的查询语义,但基于RNN的模型存在问题:(1)没有考虑每个单词的权重;(2)将输入序列压缩为一个固定长度的向量,损失了较多有用信息;(3)句子过长会使关键信息丢失.为此,本文使用了一种基于注意力机制的模型,可以区分每个单词的重要程度并解决长查询输入所产生的长距离依赖问题.我们从Github上面爬取了649个Java开源项目,经过处理得到有114 364对注释-API序列的训练集.实验结果表明我们的方法比DeepApi方法对于BLUE指标在Top1、Top5、Top10上均能提升约20%以上. It is a difficult process for developers to use API and API sequences(APIs)correctly in software development.When developers are faced with unfamiliar function libraries or code repositories like Github that contains a large number of APIs,they need assistance of some recommendation tools or system.To the best of our knowledge,DeepApi can better understand the semantics of user’s query,but the RNN-based model has some problems:(1)it does not consider the weight of each word,(2)the input sequence is compressed into a fixed length vector,which loses much useful information,(3)long sentences lead to loss of key information.Therefore,this study uses a model based on attention mechanism to distinguish the importance of each word and solve the problem of long-distance dependence caused by long query input.We crawled 649 Java open source projects from Github and processed them to get a training set of 114 364 pairs of annotation-API sequences.The experimental results show that the proposed method can increase BLUE index by more than about 20%compared with DeepApi method on Top1,Top5,and Top10.

作者张睿峰王鹏程吴鸣徐云 ZHANG Rui-Feng;WANG Peng-Cheng;WU Ming;XU Yun(School of Computer Science and Technology,University of Science and Technology of China,Hefei 230026,China;Key Laboratory of High Performance Computing of Anhui Province,Hefei 230026,China)

机构地区中国科学技术大学计算机科学与技术学院安徽省高性能计算重点实验室

出处《计算机系统应用》 2019年第9期209-214,共6页 Computer Systems & Applications

基金国家自然科学基金面上项目(61672480)~~

关键词 API序列推荐注意力机制深度学习 API sequences recommendation attention mechanisms deep learning

分类号 TP3 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献1

1聂黎明,江贺,高国军,王涵,徐秀娟.代码搜索与API推荐文献分析[J].计算机科学,2017,44(S1):475-482. 被引量：3

共引文献2

1李呓瑾,宁浩宇,刘秀.基于代码仓库分析的代码推荐研究[J].科学与信息化,2021(2):33-34.
2汶东震,张帆,刘海峰,杨亮,徐博,林原,林鸿飞.深度程序理解视角下代码搜索研究综述[J].计算机工程与应用,2022,58(20):63-72.

同被引文献14

1余力,刘鲁,李雪峰.用户多兴趣下的个性化推荐算法研究[J].计算机集成制造系统,2004,10(12):1610-1615. 被引量：45
2夏艳敏,唐兵,唐明董,曹步清,乔帅.利用关联规则挖掘的Web API组合模式发现[J].小型微型计算机系统,2019,40(10):2195-2201. 被引量：3
3韩院彬,赵辉,檀蓉,房海峰.改进型协同过滤的API服务推荐方法研究[J].现代电子技术,2019,42(21):86-89. 被引量：3
4张云帆,周宇,黄志球.基于语义相似度的API使用模式推荐[J].计算机科学,2020,47(3):34-40. 被引量：5
5高顺峰,张再跃.面向句法块向量的句子相似度计算方法[J].软件导刊,2020,19(10):106-110. 被引量：1
6李浩,钟声,康雁,李涛,张亚钏,卜荣景.融合领域知识的API推荐模型[J].计算机科学,2020,47(S02):544-548. 被引量：2
7郭帆,范威威.面向Java EE程序的SQLIA漏洞分析和验证方法[J].计算机科学与探索,2021,15(2):270-283. 被引量：11
8陈虹宇,吴贤国,张浩蔚,吴霁锋,翁顺.基于物联网的运营地铁隧道结构健康监测系统软件平台开发[J].城市轨道交通研究,2021,24(1):93-96. 被引量：14
9李鑫.一种面向Mashup应用的API推荐方法[J].计算机技术与发展,2021,31(2):38-43. 被引量：1
10韩华春,吴盛军,汪成根.基于多能流联合解算与分析的综合能源在线仿真系统开发[J].电力需求侧管理,2021,23(4):33-38. 被引量：4

引证文献2

1张廷秀.基于众包知识的API推荐方法研究[J].电脑知识与技术,2021,17(17):76-78.
2李华.Java软件开发问题分析[J].电子技术与软件工程,2023(2):43-46.

1邓文萍.基于Python的新浪微博用户信息爬取与分析[J].数字技术与应用,2019,37(7):96-98.
2何东山.引力关联与黑洞信息丢失之谜[J].咸阳师范学院学报,2019,34(4):18-22.
3Yang ZHANG,Yiwen WU,Tao WANG,Huaimin WANG.A novel approach for recommending semantically linkable issues in GitHub projects[J].Science China(Information Sciences),2019,62(9):202-204.
4李思特.基于自然语言处理的人工智能歌词创作[J].中国科技纵横,2019,0(14):41-42.
5陈杰,李昂,符峥,李思倩,王结臣.公交模式对公共服务设施可达性的影响[J].地球信息科学学报,2019,21(7):983-993. 被引量：8
6郑晓娟.电力系统计算机信息网络安全技术[J].信息通信,2019,0(7):120-122. 被引量：2
7崔颖,张迎辉.自动写作评改系统辅助高中英语写作教学的常见问题与对策——以山西省“十三五”规划课题第四次全省同题写作为例[J].基础教育外语教学研究,2019,0(7):47-54. 被引量：1
8董芷艺,谢章伟,崔展齐.基于开发者模型的问题修复者推荐方法[J].北京信息科技大学学报（自然科学版）,2019,34(3):64-67.
9李洋东成.基于神经网络的文本情感分析[J].科学咨询,2019,0(33):136-137.
10尹冰.IBM鲸吞红帽押宝“混合云”[J].上海信息化,2019,0(8):42-44.

计算机系统应用

2019年第9期

浏览历史

内容加载中请稍等...

基于注意力机制的Java API序列推荐方法被引量：2

参考文献1

共引文献2

同被引文献14

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于注意力机制的Java API序列推荐方法 被引量：2

参考文献1

共引文献2

同被引文献14

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于注意力机制的Java API序列推荐方法被引量：2