基于图片问答的静态重启随机梯度下降算法被引量：5

Static Restart Stochastic Gradient Descent Algorithm Based on Image Question Answering

下载PDF

导出

摘要图片问答是计算机视觉与自然语言处理交叉的多模态学习任务.为了解决该任务,研究人员提出堆叠注意力网络(stacked attention networks, SANs).研究发现该模型易陷入不好的局部最优解,引发较高的问答错误率.为了解决该问题,提出基于图片问答的静态重启随机梯度下降算法.实验结果和分析表明:它的准确率比基准算法提高0.29%,但其收敛速度慢于基准算法.为了验证改善性能的显著性,对实验结果进行统计假设检验.T检验结果证明它的改善性能是极其显著的.为了验证它在同类算法中的有效性,将该算法和当前最好的一阶优化算法进行有效性实验,实验结果和分析证明它更有效.为了验证它的泛化性能和推广价值,在经典的Cifar-10数据集上进行图像识别实验.实验结果和T检验结果证明:它具有良好的泛化性能和较好的推广价值. Image question answering is a multimodal learning task intersecting computer vision and natural language processing. With the breakthroughs in the deep neural networks, it has been the hotspot and focus of many researchers attention. To solve the task, researchers put forward numerous excellent models. Stacked attention networks (SANs) is one of the most typical models, and gets the state-of-the-art results in the test of four public visual question answering datasets. Although it has the excellent performance, because of the diversity of question and the sparsity of answer, it cannot fully learn the universal law of the corpus, and easily fall into the poor local optimal solution, which leads to the higher question answering error rate. By analyzing the causes of the error and observing the details of the model processing image question answering, we find that stochastic gradient descent based on momentum (baseline) has some defects in the optimization of SANs. To solve it, we propose static restart stochastic gradient descent based on image question answering. The experimental results show that its accuracy is 0.29% higher than baseline, but its convergence rate is slower than baseline. To verify the significance of the improved performance, we conduct statistical hypothesis test on the experimental results. The results of T test prove that its improved performance is extremely significant in the process of converging to the global optimal solution. To verify its effectiveness in the same kind of algorithm, we conduct effectiveness experiments with it and the state-of-the-art first-order optimization algorithms. The experimental results and analysis prove that it is more effective in solving image question answering. To verify its generalization performance and promotion value, we conduct the image recognition experiment on the classic Cifar-10 for the image recognition task. The experimental results and the results of T test prove that it has good generalization performance and promotion value in the process of converging to the global optimal solution.

作者李胜东吕学强 Li Shengdong;Lü Xueqiang(School of Information, Renmin University of China, Beijing 100872;Department of Computer Engineering, Langfang Yanjing Vocational Technical College, Langfang, Hebei 065200;Beijing Key Laboratory of Internet Culture and Digital Dissemination Research(Beijing Information Science and Technology University), Beijing 100101)

机构地区中国人民大学信息学院廊坊燕京职业技术学院计算机工程系网络文化与数字传播北京市重点实验室(北京信息科技大学)

出处《计算机研究与发展》 EI CSCD 北大核心 2019年第5期1092-1100,共9页 Journal of Computer Research and Development

基金国家自然科学基金项目(61671070) 国家语委十三五科研规划2017年度重点项目(ZDI135-53) 网络文化与数字传播北京市重点实验室开放课题(ICDD201505)This work was~~

关键词图片问答堆叠的注意力网络动量静态重启随机梯度下降 image question answering stacked attention networks (SANs) momentum static restart stochastic gradient descent (SGD)

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1姜纪远,夏良,章显,陶卿.一种具有O(1/T)收敛速率的稀疏随机算法[J].计算机研究与发展,2014,51(9):1901-1910. 被引量：3
2杨双涛,马志强,窦保媛,张力.一种Yarn框架下的异步双随机梯度下降算法[J].小型微型计算机系统,2017,38(5):1070-1075. 被引量：2
3陈振宏,兰艳艳,郭嘉丰,程学旗.基于差异合并的分布式随机梯度下降算法[J].计算机学报,2015,38(10):2054-2063. 被引量：20
4李平,戴月明,王艳.基于混合卡方统计量与逻辑回归的文本情感分析[J].计算机工程,2017,43(12):192-196. 被引量：19
5王功鹏,段萌,牛常勇.基于卷积神经网络的随机梯度下降算法[J].计算机工程与设计,2018,39(2):441-445. 被引量：73
6俞俊,汪亮,余宙.视觉问答技术研究[J].计算机研究与发展,2018,55(9):1946-1958. 被引量：22

二级参考文献64

1Vapnik V N. Statistical Learning Theory [M]. New York: Wiley-Interseience, 1998.
2Zhang T. Statistical behavior and consistency of classification methods based on convex risk minimization [J]. Annals of Statistics, 2004, 32(1): 56-85.
3Shalev Shwartz S, Singer Y, Srebro N, et al. Pegasos: Primal estimated sub-gradient solver for svm [J]. Mathematical Programming, 2011, 127(1) : 3-30.
4Bach F, Moulines E. Non-asymptotic analysis of stochastic approximation algorithms for machine learning [G] // Advances in Neural Information Processing Systems. New York: ACM, 2011:451-459.
5Nemirovski A, Juditsky A, Lan G, et al. Robust stochastic approximation approach to stochastic programming [J]. SIAM Journal on Optimization, 2009, 19(4): 1574-1609.
6Nesterov Y. A method of solving a convex programming problem with convergence rate 0 ( 1/k2 ) [J]. Soviet Mathematics Doklady, 1983, 27(2): 372-376.
7Nemirovski A, Yudin D. Problem Complexity and Method Efficiency in Optimization [M]. New York: Wiley Interscience, 1983.
8Beck A, Teboulle M. Mirror descent and nonlinear projected subgradient methods for convex optimization [J]. Operations Research Letters, 2003, 31(3): 167-175.
9Gabay D, Mercier B. A dual algorithm for the solution of nonlinear variational problems via finite element approximation [J]. Computers and Mathematics with Applications, 1976, 2(1): 17-40.
10Wang H, Banerjee A. Online alternating direction method [C] //Proc of the 29th Int Conf on Machine Learning. New York: ACM, 2012:1119-1126.

共引文献133

1王义,戴月明.基于混合互信息算法的文本情感分析[J].计算机应用研究,2020,37(2):337-341.
2钱石川,王志,鲁志艳,李志华,杏若婷,盛鑫,苏强,金韶华,李丽洁,陈锟.具有渐进学习能力的硝酸铵-硝酸溶液中硝酸铵浓度快速定量分析方法[J].分析化学,2023,51(12):1983-1992.
3张宝录,罗丹婷,胡鹏,樊举,景超.一种基于深度神经网络模型的测井曲线生成方法[J].电子测量技术,2020,43(11):107-111. 被引量：2
4熊月容,康志伟.基于快照集成卷积神经网络的陨石坑图像分类识别[J].中国科技论文在线精品论文,2022(1):104-111.
5石国庆,刘守仁,杨永林,倪健宏,皮文辉,王志杰.毛质优秀的美利奴“U”系羊新类群[J].中国草食动物,2000,2(1):24-25.
6唐世月.贪污罪犯罪对象新解[J].中国刑事法杂志,2000(1):54-59. 被引量：3
7慈波.试策与黄溍的政治关怀[J].四川大学学报（哲学社会科学版）,2012(3):52-58. 被引量：1
8殷帅,胡越黎,刘思齐,燕明.基于YOLO网络的数据采集与标注[J].仪表技术,2018(12):22-25. 被引量：9
9徐金东,牟春晓,范宝德,张艳洁,童向荣,倪梦莹.图像的多尺度稀疏分解及其在遥感图像融合上的应用[J].烟台大学学报（自然科学与工程版）,2017,30(1):48-54. 被引量：5
10曹司磊,曾维贵,刘明刚.基于区域判别的抗质心式箔条干扰方法[J].兵工自动化,2017,36(6):70-74. 被引量：3

同被引文献88

1蔡莉,王淑婷,刘俊晖,朱扬勇.数据标注研究综述[J].软件学报,2020,31(2):302-320. 被引量：62
2颜宏文,陈金鑫.基于改进YOLOv3的绝缘子串定位与状态识别方法[J].高电压技术,2020,46(2):423-432. 被引量：77
3雷鸣,尹申明,杨叔子.神经网络自适应学习研究[J].系统工程与电子技术,1994,16(3):19-27. 被引量：30
4何锡嘉,凌巍高,张雅欣,梁志胜.数字化医学影像技术下多模态图像配准仿真[J].计算机仿真,2018,35(12):166-170. 被引量：5
5刘永波,雷波,曹艳,唐江云,胡亮.基于深度卷积神经网络的玉米病害识别[J].中国农学通报,2018,34(36):159-164. 被引量：16
6房志学,苏建徽,王华锋,施永,徐华电.微网逆变器低电压穿越控制策略[J].电力系统自动化,2019,43(2):143-149. 被引量：18
7田生昌.最小二乘法的统计学原理及在农业试验分析中的应用[J].数学的实践与认识,2015,45(4):124-133. 被引量：29
8禹建丽,成久洋之,Valeri.Kroumov.线性再励的自适应变步长机器人神经网络路径规划算法[J].燕山大学学报,2002,26(3):258-260.. 被引量：8
9王翔宇,温皓杰,李鑫星,傅泽田,吕雄杰,张领先.农业主要病害检测与预警技术研究进展分析[J].农业机械学报,2016,47(9):266-277. 被引量：63
10赵新苗,冯向萍,赵涛.农业信息分类中K-means与SVM的混合算法研究[J].计算机技术与发展,2017,27(6):178-182. 被引量：5

引证文献5

1郑俊浩.基于深度学习的乳腺癌MRI影像预处理[J].智能计算机与应用,2020,10(1):231-232. 被引量：1
2宋美佳,贾鹤鸣,林志兴,卢仁盛,刘庆鑫.自适应学习率梯度下降的优化算法[J].三明学院学报,2021,38(6):36-44. 被引量：5
3吕晓洁.基于深度学习的分布式光伏发电系统电压稳定性评估[J].电子设计工程,2022,30(17):114-118. 被引量：4
4王明,张倩.我国基于深度学习的图像识别技术在农作物病虫害识别中的研究进展[J].中国蔬菜,2023(3):22-28. 被引量：7
5覃伟荣,劳燕玲.基于3D关联规则深度学习的异构遥感数据检测[J].计算机仿真,2023,40(9):482-486.

二级引证文献17

1李珂欣.DCE-MRI在乳腺良恶性肿瘤鉴别诊断中的应用及与MVD、VEGF水平的关系[J].齐齐哈尔医学院学报,2021,42(17):1491-1496.
2李迎正,金立左.基于目标检测的智能行人预警系统的研究[J].工业控制计算机,2022,35(11):84-86. 被引量：1
3崔畅.基于异步联邦学习和区块链的数据安全共享[J].计算机应用文摘,2022,38(24):86-89.
4蔡晓东,曾志杨.AFGSRec:一种自适应融合全局协同特征的社交推荐模型[J].华南理工大学学报（自然科学版）,2022,50(12):71-79.
5唐明.油气田分布式光伏发电系统储能安全问题研究[J].电气时代,2023(3):55-56. 被引量：2
6岳有军,李勇飞,赵辉,王红君.双目视觉手眼标定的精度优化[J].组合机床与自动化加工技术,2023(7):162-165.
7张昕莹,王力彬,李磊.基于深度学习的中药材病虫害图像识别系统设计[J].自动化与仪器仪表,2023(6):143-147.
8蒋清健,褚家锋.基于深度学习的农作物病虫害图像识别方法[J].信息与电脑,2023,35(18):120-123.
9胡雅祺,孔静,李宇恒,陈天星.基于深度学习的图像识别技术在选矿中的应用进展[J].矿冶,2024,33(1):131-140.
10吕卓,马永财.机器视觉表型识别技术的研究现状[J].现代化农业,2024(3):11-14.

1云涛.变步长LMS算法及在数字预失真中的应用[J].通信技术,2018,51(11):2753-2757. 被引量：5
2田晟,张裕天,张剑锋,许凯.基于深度神经网络的交通出行方式选择模型[J].北华大学学报（自然科学版）,2019,20(1):109-113. 被引量：3
3李俊杰,宗成庆.融合用户信息和评价对象信息的文本情感分类[J].厦门大学学报（自然科学版）,2018,57(6):876-883. 被引量：1
4张行文,董元和.基于多层感知机网络的手写数字识别算法[J].电脑知识与技术,2018,14(11Z):217-219. 被引量：3
5刘金玉,张金.护理干预在老年精神患者治疗康复中的临床价值[J].医学信息,2017,30(2):218-219.
6罗昌银,但唐朋,李艳红,陈昌昊,王泰.基于虚假评论识别的微博评论情感分析的研究与应用[J].计算机应用与软件,2019,36(4):55-62. 被引量：4
7秦超,高晓光,陈大庆.基于Bagging-Down SGD算法的分布式深度网络[J].系统工程与电子技术,2019,41(5):1021-1027. 被引量：1
8曹渝昆,何健伟.基于RA-DNN的电力变压器故障分类方法[J].电气自动化,2019,41(2):98-101. 被引量：3
9刘湘林.支持性心理治疗慢性精神分裂症的临床观察[J].世界临床医学,2017,11(8):57-58. 被引量：3
10张巍,麦志深.核模糊谱聚类LOF降噪方法研究[J].广东工业大学学报,2018,35(6):77-82. 被引量：1

计算机研究与发展

2019年第5期

浏览历史

内容加载中请稍等...

基于图片问答的静态重启随机梯度下降算法被引量：5

参考文献6

二级参考文献64

共引文献133

同被引文献88

引证文献5

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于图片问答的静态重启随机梯度下降算法 被引量：5

参考文献6

二级参考文献64

共引文献133

同被引文献88

引证文献5

二级引证文献17

相关作者

相关机构

相关主题

浏览历史

基于图片问答的静态重启随机梯度下降算法被引量：5