基于底层特征建模的行为识别算法优化

Optimization of Behavior Recognition Algorithm Based on Low-level Feature Modeling

下载PDF

导出

摘要近年来基于时空兴趣点的视觉词袋(bag of video words,BOVW)模型被广泛用于行为识别算法研究;但是该模型忽略了每一种视觉单词的权重,另外没有考虑兴趣点时空分布信息,因而制约了其识别精度。提出了两种算法解决上述问题;其一,采用词频-逆向文件频率(term frequency-inverse document frequency,TF-IDF)方法对传统BOVW直方图进行优化处理,根据视觉单词在词袋与BOVW直方图的比例权衡其重要程度;其二,提出了基于三维共生矩阵的时空兴趣点互信息(spatialtemporal interest points mutual information,STIPsMI)算法,刻画不同视觉单词的时空兴趣点之间的时空关系。然后将STIPsMI描述符与优化后的BOVW直方图级联,作为视频序列最终的描述符。最后在两个主流的数据集KTH与UCF sports对该算法进行评估。实验结果表明,提出的时空特征描述符在行为识别准确率上优于BOVW模型与其他主流方法。 In recent years,the bag of visual words （ BOVW） model based on spatial-temporal interest points （STIPs） has been widely used in the research of behavior recognition. However,the model ignores the weight of each visual word,and secondly it does not consider the spatial and temporal distribution of STIPs,which defrades the recognition accuracy. Two new algoritlims were proposed to solve the above problems. Firstly,term frequency-inverse document frequency （TF-IDF） metiiod was used to optimize the traditional BOVW histogram,and the importance of visual word is weighed according to the its proportion in the words bag and the BOVW histogram .Secondly,the STPs mutual information（ STPsIVI） algorithm based on three dimensional Co-occurrence matrix is proposed ;the new descriptor is proposed to describe the spatial-temporal relationship of interest points between different visual words. Then the STIPsMI descriptor is concatenated with the optimized BOVW histogram as the final descriptor of the video sequence. The proposed method is evaluated on two challenging human action datasets：the KTH dataset and the UCF sports dataset. Experiment results confirm the validity of our approach and better than BOVW model and other mainstream methods.

作者刘云杨建滨王传旭 LIU Yun;YANG Jian-bin;WANG Chuan-xu(Institute of Informatics,Qingdao University of Science and Technology,Qingdao 266061,China)

机构地区青岛科技大学信息学院

出处《科学技术与工程》北大核心 2018年第21期69-75,共7页 Science Technology and Engineering

基金国家自然科学基金(61472196 61672305) 山东省自然科学基金(ZR2015FM012)资助

关键词行为识别视觉词袋词频-逆向文件频率共生矩阵互信息 action recognition bag of visual words TF-IDF co-occurrence matrix mutual infor-mation

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1陈亦新,徐婷,孙小端.信号交叉口个体行人与群体行人过街闯红灯行为分析[J].科学技术与工程,2017,17(8):288-292. 被引量：5
2单言虎,张彰,黄凯奇.人的视觉行为识别研究回顾、现状及展望[J].计算机研究与发展,2016,53(1):93-112. 被引量：47
3董广宇.基于多特征融合的复杂路况步态识别方法[J].科学技术与工程,2017,17(8):202-207. 被引量：1
4赵欣,周海英.一种结合深度信息的人体行为识别方法[J].科学技术与工程,2017,17(1):244-249. 被引量：4
5罗燕,赵书良,李晓超,韩玉辉,丁亚飞.基于词频统计的文本关键词提取方法[J].计算机应用,2016,36(3):718-725. 被引量：77
6沈新宁,王小龙,杜建洪.基于颜色自相关图和互信息的图像检索算法[J].计算机工程,2014,40(2):259-262. 被引量：11

二级参考文献158

1孙智勇,荣建,何民,苏永强.信号交叉口人行横道处的行人可接受间隙研究[J].公路交通科技,2004,21(11):102-104. 被引量：27
2钱宇彬,刘浩学.二次过街路口行人违反交通法规规律的研究[J].安全与环境学报,2006,6(6):119-122. 被引量：12
3张今瑜,王岚,张立勋.基于多传感器的实时步态检测研究[J].哈尔滨工程大学学报,2007,28(2):218-221. 被引量：16
4Huang J, Kumar S R, Mitra M, et al. Spatial Color Indexing and Applications[C]//Proc. of the 6th International Conference on Computer Vision. Bombay, India: IEEE Press, 1998.
5Yi T, William G I. Content-based Image Retrieval Using Joint Correlograms[J]. Multimedia Tools and Application, 2007, 34(2): 239-248.
6Tungkasthan A, lntarasema S, Premchaiswadi W. Spatial Color Indexing Using ACC Algorithm[C]//Proc. of the 7th International Conference on ICT and Knowledge Engineering. Bangkok, Thailand: IEEE Press, 2009.
7CoverTM,ThomasJA.信息论基础[M].阮吉寿,张华,译.北京:机械工业出版社,2008.
8Rousseeuw P J, Leroy A M. Robust Regression and Outlier Detection[M]. [S. 1.]: John Wiley & Sons, 1987.
9Ortega M, Rui Y, Chakrabarti K. Supporting Similarity Queries in MARS[C]//Proc. of the 5th ACM International Conference on Multimedia. New York, USA: ACM Press, 1997.
10Yates R B, Neto B R. Modern Information Retrieval[M]. New York: USA: ACM Press, 1999.

共引文献139

1巴哈古丽·图尼亚孜,玉素甫·艾拜都拉.维吾尔语词频统计系统研究[J].电子世界,2020(3):63-64.
2甘勇华,罗芷晴,熊文华,鲍瀚涛.城市交叉口慢行交通设施安全评价研究[J].中国公共安全,2023(2):61-68. 被引量：1
3李庆利,王永强,张帆,陈宝.快速颜色特征提取改进算法研究[J].福建电脑,2014,30(6):93-95. 被引量：1
4叶继华,陈亚慧,胡蕾.融合加权颜色相关图和改进LBP的彩色人脸图像识别[J].小型微型计算机系统,2015,36(12):2778-2783. 被引量：7
5谭光兴,刘臻晖.基于改进的排序学习的图片检索算法研究[J].计算机科学,2015,42(12):275-277. 被引量：1
6王恬,李庆武,刘艳,周亚琴.利用姿势估计实现人体异常行为识别[J].仪器仪表学报,2016,37(10):2366-2372. 被引量：31
7李冰.颜色纹理形状特征分层融合图像检索方法研究[J].西南师范大学学报（自然科学版）,2017,42(1):54-59. 被引量：9
8夏火松,潘筱听.基于Python挖掘的大数据学术研究与人才需求的关系研究[J].信息资源管理学报,2017,7(1):4-12. 被引量：15
9Huafeng Chen,Jun Chen,Ruimin Hu,Chen Chen,Zhongyuan Wang.Action Recognition with Temporal Scale-Invariant Deep Learning Framework[J].China Communications,2017,14(2):163-172. 被引量：1
10方振宇.基于抑郁词典的社交网络心理障碍检测方法[J].电脑知识与技术,2017,13(3):244-247. 被引量：6

1李少波,吴正,杨观赐,胡杰,于丽娅.基于类比设计的专利知识挖掘算法[J].计算机集成制造系统,2017,23(11):2344-2352. 被引量：3
2YANG Zhen,YAO Fei,FAN Kefeng,HUANG Jian.Text Dimensionality Reduction with Mutual Information Preserving Mapping[J].Chinese Journal of Electronics,2017,26(5):919-925. 被引量：2
3孔薇,底奔腾.基于通路串扰分析的阿尔茨海默症致病机理探寻[J].基因组学与应用生物学,2018,37(7):3192-3199. 被引量：2
4段佳豪,苏旭冉,付阳子,陈思露,郭鑫.基于遥感的天津市填海造地特征分析[J].现代商贸工业,2017,38(36):189-190. 被引量：1
5杨宏宇,王玥.云存储环境下的多关键字密文搜索方法[J].计算机应用,2018,38(2):343-347. 被引量：6
6贺明,宋文爱,康珺.基于萤火虫算法的三维Renyi熵眼底图像血管分割[J].科学技术与工程,2018,18(9):260-265. 被引量：1
7焦萍,姜威,贲晛烨,刘湜,张健钊.基于灰度共生矩阵的自动聚焦算法[J].光学技术,2018,44(3):273-277. 被引量：7
8章邦武,黄希庭.时空联系的反应编码形式:视觉性空间编码而非言语性空间编码[J].心理学进展,2015,5(10):561-570.
9马小娥,白永平,纪学朋,乔富伟,张宁.干旱区内陆河流域农村居民点时空格局演变及影响因素[J].中国农业资源与区划,2018,39(1):106-116. 被引量：18
10李正强,李东辉,张莹,吕阳,谢一凇,李凯涛,李莉,许华,伽丽丽,张元勋.基于超级站多仪器联合观测的大气气溶胶遥感研究[J].中国环境监测,2017,33(5):64-74. 被引量：2

科学技术与工程

2018年第21期

浏览历史

内容加载中请稍等...

基于底层特征建模的行为识别算法优化

参考文献6

二级参考文献158

共引文献139

相关作者

相关机构

相关主题

浏览历史