基于混合maxout单元的卷积神经网络性能优化被引量：6

Improving deep convolutional neural networks with mixed maxout units

下载PDF

导出

摘要针对深度卷积神经网络中maxout单元非最大特征无法传递、特征图像子空间池化表达能力不足的局限性,提出混合maxout(mixout,mixed maxout)单元。首先,计算相同输入在不同卷积变换下所形成的特征图像子空间的指数概率分布;其次,根据概率分布计算特征图像子空间的期望;最后,利用伯努利分布对子空间的最大值与期望值加权,均衡单元模型。分别构建基于mixout单元的简单模型和网中网模型进行实验,结果表明mixout单元模型性能较好。 The maxout units have the problem of not delivering non-max features,resulting in the insufficient of pooling operation over a subspace that is composed of several linear feature mappings,when they are applied in deep convolutional neural networks.The mixed maxout(mixout)units were proposed to deal with this constrain.Firstly,the exponential probability of the feature mappings getting from different linear transformations was computed.Then,the averaging of a subspace of different feature mappings by the exponential probability was computed.Finally,the output was randomly sampled from the max feature and the mean value by the Bernoulli distribution,leading to the better utilizing of model averaging ability of dropout.The simple models and network in network models was built to evaluate the performance of mixout units.The results show that mixout units based models have better performance.

作者赵慧珍刘付显李龙跃罗畅 ZHAO Hui-zhen;LIU Fu-xian;LI Long-yue;LUO Chang(School of Air and Missile Defense, Air Force Engineering University, Xi’an 710051, China)

机构地区空军工程大学防空反导学院

出处《通信学报》 EI CSCD 北大核心 2017年第7期105-114,共10页 Journal on Communications

基金国家自然科学基金资助项目(No.61601499)~~

关键词深度学习卷积神经网络 maxout单元激活函数 deep learning convolutional neural network maxout units activation function

分类号 TP391.3 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1周昌令,栾兴龙,肖建国.基于深度学习的域名查询行为向量空间嵌入[J].通信学报,2016,37(3):165-174. 被引量：9
2杨钊,陶大鹏,张树业,金连文.大数据下的基于深度神经网的相似汉字识别[J].通信学报,2014,35(9):184-189. 被引量：29

二级参考文献26

1LIU C L,YIN F,WANG Q F,et al.ICDAR 2011Chinese handwriting recognition competition[A].Proceedings of IEEE International Conference on Document Analysis and Recognition[C].Beijing,China,2011.1464-1469.
2LEUNG K C,LEUNG C H.Recognifon of handwritten Chinese characters by critical region analysis[J].Pattern Recognition,2010,43(3):949-961.
3GAO T F,LIU C L.High accuracy handwritten Chinese character recognition using LDA-based compound distances[J].Pattern Recognition,2008,41(11):3442-3451.
4TAO D P,LIANG L Y,JIN L W,et al.Similar handwritten Chinese character recognition by kernel discriminative locality alignment[J].Pattern Recognition Letters,2014,35(1):186-194.
5BENGIO Y.Leamnig deep architectures for AI[J].Foundations and trends in Machine Learning,2009,2(1):1-127.
6BENGIO Y,COURVILLE A.Deep Learning of Representations[M].Handbook on Neural Information Processing.Springer Berlin Heidelberg,2013.
7DENG L,HINTON G,KINGSBURY B.New types of deep neural network learning for speech recognition and related applications:an overview[A].Proceedings of IEEE International Conference on Acoustics,Speech,and Signal Processing[C].Vancouver,Canada,2013.
8HINTON G E,SALAKHUTDINOV R R.Reducing the dimensionality of data with neural networks[J].Science,2006,313(5786):504-507.
9LECUN Y,BOSERB,DENKER J S,et al.Handwritten digit recognition with a back-propagation network[A].Advances in neural information processing systems[C].Denver,United States,1990.396-404.
10LECUN Y,KAVUKCUOGLU K,FARABET C.Convolutional networks and applications in vision[A].Proceedings of IEEE International Symposium onCircuits and Systems[C].Paris,France,2010.253-256.

共引文献36

1王立刚,张志佳,李晋,范莹莹,刘立强.基于卷积神经网络的LED灯类字体数字识别[J].电子测量与仪器学报,2020(11):148-154. 被引量：8
2顾桓,田红,高妍.一种基于云平台的包装印刷设备增值服务系统[J].包装工程,2015,36(15):149-152. 被引量：3
3冯通.基于深度学习的航空飞行器故障自助检测研究[J].计算机仿真,2015,32(11):119-122. 被引量：7
4吉星,黄韬,鄂新华,孙礼.基于日志信息的DNS查询异常检测算法[J].北京邮电大学学报,2018,41(6):83-89. 被引量：7
5杨颐,张桂刚,王健,黄卫星,苏海霞.基于云计算的汉字文化数字化平台的架构研究[J].计算机科学,2016,43(7):28-34. 被引量：4
6金连文,钟卓耀,杨钊,杨维信,谢泽澄,孙俊.深度学习在手写汉字识别中的应用综述[J].自动化学报,2016,42(8):1125-1141. 被引量：110
7田喜平,赵红丹.一种用于汉字识别的字形编码系统设计与实现[J].现代电子技术,2017,40(2):60-63. 被引量：3
8覃科,刘晓刚,丁立新.基于卷积神经网络的CO_2焊接熔池图像状态识别方法[J].焊接,2017(6):21-26. 被引量：8
9杨杰,杨振南.基于改进的CNN多级分类的行人检测算法研究[J].计算机应用与软件,2017,34(8):220-224. 被引量：3
10刘露,孙巍巍,丁博.DBN融合模型对脱机手写汉字识别[J].哈尔滨理工大学学报,2017,22(6):82-86. 被引量：1

同被引文献32

1胡春玲.贝叶斯网络研究综述[J].合肥学院学报（自然科学版）,2013,23(1):33-40. 被引量：23
2李宏伟,吴庆祥.智能传感器中神经网络激活函数的实现方案[J].传感器与微系统,2014,33(1):46-48. 被引量：8
3黄凯奇,任伟强,谭铁牛.图像物体分类与检测算法综述[J].计算机学报,2014,37(6):1225-1240. 被引量：195
4张涛,杨剑,宋文爱,宋超峰.关于改进的激活函数TReLU的研究[J].小型微型计算机系统,2019,40(1):58-63. 被引量：9
5卢宏涛,张秦川.深度卷积神经网络在计算机视觉中的应用研究综述[J].数据采集与处理,2016,31(1):1-17. 被引量：557
6刘凯,张立民,范晓磊.改进卷积玻尔兹曼机的图像特征深度提取[J].哈尔滨工业大学学报,2016,48(5):155-159. 被引量：11
7孙晓,潘汀,任福继.基于ROI-KNN卷积神经网络的面部表情识别[J].自动化学报,2016,42(6):883-891. 被引量：52
8郝志峰,陈薇,蔡瑞初,黄瑞慧,温雯,王丽娟.基于典型因果推断算法的无线网络性能优化[J].计算机应用,2016,36(8):2114-2120. 被引量：2
9宋蒲斌,孙贺,王兆俊,程子敬,王梦源.基于DTN的高分卫星传感器网络性能优化研究[J].计算机工程,2016,42(8):46-51. 被引量：4
10常亮,邓小明,周明全,武仲科,袁野,杨硕,王宏安.图像理解中的卷积神经网络[J].自动化学报,2016,42(9):1300-1312. 被引量：426

引证文献6

1裴颂文,杨保国,顾春华.网中网残差网络模型的表情图像识别研究[J].小型微型计算机系统,2018,39(12):2681-2686. 被引量：11
2程俊华,曾国辉,鲁敦科,黄勃.基于Dropout的改进卷积神经网络模型平均方法[J].计算机应用,2019,39(6):1601-1606. 被引量：27
3蒋再新,程海艳,池小兵,张海利,崔海婷.基于储层网络算法的带噪图像识别技术研究与应用[J].东北电力技术,2019,40(5):34-38.
4王小伟.基于重叠分片法的网络顽健性动态增强仿真[J].计算机仿真,2020,37(3):288-291.
5马传香,汪炀杰,王旭.基于卷积神经网络的煤炭运载车辆识别[J].计算机科学,2020,47(S02):219-223. 被引量：5
6张焕,张庆,于纪言.激活函数的发展综述及其性质分析[J].西华大学学报（自然科学版）,2021,40(4):1-10. 被引量：50

二级引证文献93

1柳东威,王旭,廖佳妹.基于卷积神经网络的汽车产品检测优化研究[J].商用汽车,2024(2):82-87.
2李波燕,张勇,袁德荣,熊堂堂,何浪.基于注意力机制的手写体数字识别[J].计算机科学,2022,49(S02):626-630. 被引量：6
3高如新,常嘉浩,杜亚博,刘群坡.基于改进YOLOv5s的煤矸石目标检测算法[J].电子测量技术,2023,46(13):95-101. 被引量：1
4王奇.网络表情中的艺术设计研究[J].大观（东京文学）,2019,0(9):14-15.
5张云,李岚,王浩东.一种机器学习中防止过拟合的Dropout优化算法[J].兰州文理学院学报（自然科学版）,2019,33(6):84-87. 被引量：11
6李思瑶,刘宇红,张荣芬.基于迁移学习与模型融合的犬种识别方法[J].智能计算机与应用,2019,9(6):101-106. 被引量：1
7吴咏昆,李进,曾泽荣,和贺敏.楼宇新能源控制系统算法研究[J].建筑电气,2020,39(1):58-64.
8李硕,卞青山,刘传文,刘鸣涛,张林涛.基于DCNN的证件照人脸验证及应用研究[J].计算机与现代化,2020,0(2):104-109.
9郭玥秀,杨伟,刘琦,王玉.残差网络研究综述[J].计算机应用研究,2020,37(5):1292-1297. 被引量：71
10孔英会,郄天丛,张帅桐.基于深度学习的移动端表情识别系统设计[J].科学技术与工程,2020,20(25):10319-10326. 被引量：6

1杨杰.云计算在企业部署模式的研究[J].西南师范大学学报（自然科学版）,2017,42(6):32-39. 被引量：3
2史庆瑞,马泽亮,周智,贺宪权,王志强,马云霞.基于电子舌和模式识别的中成药品辨识方法研究[J].电子测量与仪器学报,2017,31(7):1081-1089. 被引量：6
3朱叶,申铉京,陈海鹏.基于混合灰度序模式的图像复制-粘贴篡改盲鉴别算法[J].吉林大学学报（工学版）,2017,47(4):1280-1285. 被引量：6
4任睿,马久跃,隋秀峰,包云岗.一种减少长尾延迟的分布式实时约束传播方法[J].计算机研究与发展,2017,54(7):1617-1628. 被引量：1
5周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1751
6Ryan W. WEBB.Using ground penetrating radar to assess the variability of snow water equivalent and melt in a mixed canopy forest, Northern Colorado[J].Frontiers of Earth Science,2017,11(3):482-495. 被引量：1

通信学报

2017年第7期

浏览历史

内容加载中请稍等...

基于混合maxout单元的卷积神经网络性能优化被引量：6

参考文献2

二级参考文献26

共引文献36

同被引文献32

引证文献6

二级引证文献93

相关作者

相关机构

相关主题

浏览历史

基于混合maxout单元的卷积神经网络性能优化 被引量：6

参考文献2

二级参考文献26

共引文献36

同被引文献32

引证文献6

二级引证文献93

相关作者

相关机构

相关主题

浏览历史

基于混合maxout单元的卷积神经网络性能优化被引量：6