最大熵模型在音乐自动语义标注中的应用研究被引量：2

Research on maximum entropy model for music auto-tagging

下载PDF

导出

摘要随着Web 2.0的发展,音乐自动语义标注成为音乐检索系统的关键技术。但是,目前主流的语义模型都是对音频的内容特征进行处理,并且对每个标签独立建模,忽略了标签间的关联产生的音乐上下文特征。将最大熵模型应用于音乐自动语义标注中,对音乐上下文特征进行建模处理,可以通过约束条件的多少调节模型对已知数据的拟合程度和对未知数据的适应度,并自然地解决统计模型中参数平滑的问题。实验表明,最大熵模型具有较高的预测准确率,同时,在建模过程中引入音乐相似度对特征信息函数进行选择,可以提高系统性能。 With the development of Web 2. 0, music auto-tagging has become a key technology of music retrieval system. However, in typical music auto-tagging and retrieval systems, all tag level models are trained based on music content of audio features independently, ignoring the music context features between tags. This article applies the maximum entropy model to music auto-tagging system, in order to process the music context features, adjust the fitness of both known data and unknown data, and naturally smooth the parameters in the statistical model by changing the number of constraint conditions. Experimental results show that the maximum entropy model has relatively high prediction accuracy. In addition, the applying of tag similarity in feature information function selection can improve the prediction performance.

作者夏阁印晶晶陶秋雨

机构地区河海大学计算机与信息学院

出处《电子测量技术》 2014年第12期32-35,40,共5页 Electronic Measurement Technology

关键词音乐自动语义标注最大熵模型特征信息函数选择 music auto-tagging maximum entropy model feature information function selection

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献10

1SCHEDI M, GOMEZ E, GOTO M. Multimedia information retrieval: music and audio [ C ]. Proceedings of the 21st ACM international conference on Multimedia. ACM, 2013: 1117-1118.
2金聪,金枢炜.面向图像语义分类的视觉单词集成学习方法[J].电子测量技术,2012,35(8):53-56. 被引量：5
3LEVY M, SANDLER M. Music information retrieval using social tags and audio [J]. Multimedia, IEEE Transactions on, 2009, 11(3): 383 395.
4高天虹,马恩云.效率与成本是数据采集迎接挑战的关键[J].国外电子测量技术,2014,33(3):6-8. 被引量：4
5NESS S R, THEOCHARIS A, TZANETAKIS G, et al. Improving automatic music tag annotation using stacked generalization of probabilistic svm outputs [C]. Proceedings of the 17th ACM international conference on Multimedia. ACM, 2009: 705-708.
6MIOTTO R, LANCKRIET G. A generative context model for semantic music annotation and retrieval[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2012, 20(4): 1096-1108.
7HOFFMAN M D, BLEI D M, COOK P R. Easy As CBA: A Simple Probabilistic Model for TaggingMusic [C]. ISMIR. 2009, 9: 369-374.
8曾金芳,滕召胜.信息熵在曲线拟合辨识中的应用[J].电子测量与仪器学报,2012,26(2):171-176. 被引量：10
9文莹,肖明清,王邑,赵亮亮.基于信息熵属性约简的航空发动机故障诊断[J].仪器仪表学报,2012,33(8):1773-1778. 被引量：15
10SERGIO D, YASM N, GONZALO G. A maximum : entropy model for opinions in social groups[J]. The European Physical Journal B, 2014.4.

二级参考文献45

1程嗣怡,索中英,吴华,张官荣,钟秋.基于协调近似表示空间的航空发动机故障诊断[J].航空动力学报,2009,24(7):1644-1648. 被引量：9
2郭亚中,左洪福,王华伟.基于粗糙集的民航飞机故障诊断规则获取方法[J].系统工程理论与实践,2006,26(11):139-144. 被引量：10
3谢煜,杨三序,李晓伟.基于反拟合法的电容称重传感器非线性校正[J].仪器仪表学报,2007,28(5):923-927. 被引量：23
4王成儒,罗晓燕.尺度及旋转不变纹理图像检索[J].电子测量技术,2007,30(5):29-31. 被引量：2
5WANG G B,HUANG H ZH,et al.Uncertainty estima-tion of reliability redundancy in complex systems basedon the Cross Entropy method[J].Journal of MechanicalScience and Technology,2009,23:2612-2623.
6BATINA L,GIERLICHSM B,et al.Mutual InformationAnalysis:a Comprehensive Study[J].Journal of Cryp-tology,2011,24(2):269-292.
7VEYRAT-CHARVILLON N,FRANCOIS-XAIER S.Mutual Information Analysis:How,When and Why?[J].International Association for Cryptology Research,2009:429-443.
8DEWAR R C.Maximum entropy production and plantoptimization theories[J].Philosophical Transactions ofthe Royal Society,2010,365(1545):1429-1435.
9张文修,仇国芳.基于粗糙集的不确定决策[M].北京:清华大学出版社,2006.32-35.
10胡金海.航空发动机智能监控诊断的方法研究与体系构建[D].西安:空军工程大学,2007.

共引文献30

1金聪,刘金安,金枢炜.基于视觉语言模型的图像语义挖掘研究[J].图书情报工作,2013,57(5):120-123. 被引量：3
2任玉凤,陈克安,张冰瑞.声源辨识个体差异研究[J].国外电子测量技术,2013,32(3):71-74. 被引量：1
3刘海港,董芷岑.航空发电机综合故障诊断技术研究[J].电子测量技术,2014,37(3):125-127. 被引量：21
4张静,罗传仙,杨丰源,黄光磊,陈泽昊,李喆,盛戈皞.直流XLPE电缆绝缘泄漏电流与局部放电试验特征研究[J].高压电器,2019,55(2):140-148. 被引量：16
5毛清华,马宏伟,张旭辉.改进邻域粗糙集的输送带缺陷特征约简算法[J].仪器仪表学报,2014,35(7):1676-1680. 被引量：9
6宫元九,夏斐,孙嘉兴.激光标刻系统几何失真的校正方法[J].电子测量技术,2014,37(10):62-65. 被引量：2
7张立国,李盼,李梅梅,张淑清,张志福.基于ITD模糊熵和GG聚类的滚动轴承故障诊断[J].仪器仪表学报,2014,35(11):2624-2632. 被引量：42
8卓宁,张海江.靶场多雷达组网数据处理中时间校准方法研究[J].电子测量技术,2014,37(12):99-101. 被引量：7
9肖明清,杨召,薛辉辉,唐希浪,邓俊.云计算及其在测试领域的应用探索[J].空军工程大学学报（自然科学版）,2015,16(1):50-55. 被引量：11
10李勇,丁亚军,钱盛友,段先知,邹孝.基于灰度概率分布-交叉熵法的无损测温方法[J].电子测量与仪器学报,2015,29(2):247-251. 被引量：8

同被引文献20

1AHSAN H, KUMAR V, JAWAHAR C V. Multi- label annotation of music [ C ]. 2015 Eighth International Conference on Advances in Pattern Recognition (ICAPR), IEEE, 2015: 1-5.
2NAM J, HERRERA J, SLANEY M, et al. Learning sparse feature representations for music annotation and retrieval[C]. ISMIR, 2012 : 565-570.
3MIOTTO R, LANCKRIET G. A generative context model for semantic music annotation and retrieval[J]. IEEE Transactions on Audio, Speech and Language Processing, 2012, 20(4): 1096-1108.
4. DHANALAKSHMI P, PALANIVEL S, RAMALINGAM V. Pattern classification models for classifying and indexing audio signals[J]. Engineering Applications of Artificial Intelligence, 2011, 24 (2) : 350-357.
5HOFFMAN M, BLEI D, COOK P. Easy as CBA: a simple probabilistic model for tagging music [J]. International Symposium/Conference on Music Information Retrieval, 2009.
6WANG Y. The constrained Fisher scoring method for maximum likelihood computation of a nonparametrie mixing distribution [ J ]. Computational Statistics, 2009, 24(1): 67-81.
7ZHANG M L, ZHANG K. Multi-label learning by exploiting label dependency[C]. Proceedings of the 16th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, ACM, 2010 : 999-1008.
8LI C X. Exploiting label correlations for multi-label classification[J]. 2011.
9DEI.AYE A, LIU C L. Contextual tezct/non-text stroke classification in online handwritten notes with conditional random fields[J].Pattern Recognition, 2014, 47(3): 959-968.
10YIN J, YAN Q, LV Y, et al. Music auto-tagging with variable feature sets and probabilistic annotation[C]. 2014 9th International Symposium on Communication Systems, Networks & Digital Signal Processing (CSNDSP), IEEE, 2014: 156-160.

引证文献2

1何晓梅.基于条件随机场的音乐共同语义标注[J].电子测量技术,2016,39(8):70-74. 被引量：3
2王建平,刘雪景,陈克琼,李帷韬.具有变精度反馈机制的脱机手写体汉字智能认知[J].计算机应用与软件,2018,35(7):231-236. 被引量：1

二级引证文献4

1王玉娇,耿思,李宁.东巴古籍资源的数字化及数据管理[J].电子测量与仪器学报,2017,31(4):636-643. 被引量：6
2王逸凡,李国平.基于语义相似度及命名实体识别的主观题自动评分方法[J].电子测量技术,2019,42(2):84-87. 被引量：6
3张荣华,刘智,罗琴.一种基于QBC不一致性的恶意加密流量识别方法[J].电子测量技术,2022,45(1):28-34. 被引量：1
4甘恒,黎曙,张松华,郭婷.基于优化二叉树SVM脱机手写体汉字粗分类研究[J].电子技术与软件工程,2022(8):179-183.

1方幼林,杨冬青,唐世渭,张卫华,余利波,付强.数据转换过程的串行化方法[J].计算机工程与应用,2003,39(17):4-6. 被引量：6
2徐久成,沈钧毅.信息系统中对象之间相似性度量的研究[J].微电子学与计算机,2003,20(5):59-61. 被引量：1
3张柳,梅雪,林锦国,饶斐.小波多尺度C-V模型的红外图像分割[J].机床与液压,2008,36(7):137-139.
4俞鹏飞,张新峰,王敏捷.基于乐纹特征和倒排索引的音乐检索系统[J].计算机应用与软件,2014,31(10):45-48. 被引量：2
5傅鹂,孙坚,付春雷.基于语义的音乐检索系统[J].重庆理工大学学报（自然科学）,2011,25(1):40-43. 被引量：2
6刘金红,陆余良.基于Ontology改进的N-Gram文本分类模型研究[J].计算机工程与设计,2007,28(13):3213-3215. 被引量：3
7韦凌翔,陈红,王永岗,张敏,王龙飞.基于相关向量机的短时交通流量平滑处理方法[J].西北大学学报（自然科学版）,2017,47(1):38-42. 被引量：1
8赵亮,姚青.基于SOA的可变业务流程管理系统[J].计算机工程与设计,2010,31(24):5244-5247. 被引量：11
9李美莲.基于模型参数辨识的网络化系统控制策略[J].中国科学技术大学学报,2014,44(7):618-622.
10李佳,陈亚军.基于时间和共同评分项目数的协同过滤算法研究[J].软件导刊,2015,14(7):61-63. 被引量：2

电子测量技术

2014年第12期

浏览历史

内容加载中请稍等...

最大熵模型在音乐自动语义标注中的应用研究被引量：2

参考文献10

二级参考文献45

共引文献30

同被引文献20

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

最大熵模型在音乐自动语义标注中的应用研究 被引量：2

参考文献10

二级参考文献45

共引文献30

同被引文献20

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

最大熵模型在音乐自动语义标注中的应用研究被引量：2