摘要
随着互联网上音乐数目的增长,如何对音乐进行分析、识别成为焦点问题.在音乐的识别过程中,需要对歌曲的帧数据进行聚类,数据的海量性与音乐数据本身的复杂性使得分析计算需要借助MapReduce平台多机并行完成.提出一种MapReduce平台上的音频数据聚类系统———HDCH,能够有效地对海量音频数据进行聚类.实验证明,HDCH具有很好的性能和可扩展性.除了音频数据外,HDCH还适用于所有海量高维数据的聚类分析.
随着互联网上音乐数目的增长,如何对音乐进行分析、识别成为焦点问题.在音乐的识别过程中,需要对歌曲的帧数据进行聚类,数据的海量性与音乐数据本身的复杂性使得分析计算需要借助MapReduce平台多机并行完成.提出一种MapReduce平台上的音频数据聚类系统———HDCH,能够有效地对海量音频数据进行聚类.实验证明,HDCH具有很好的性能和可扩展性.除了音频数据外,HDCH还适用于所有海量高维数据的聚类分析.
出处
《计算机研究与发展》
EI
CSCD
北大核心
2011年第S3期472-475,共4页
Journal of Computer Research and Development
基金
科技重大专项基金项目(2010ZX01042-003-004)
国家自然科学基金重点基金项目(61033010)
国家"八六三"高技术研究发展计划基金项目(2009AA062803)
上海市科委现代服务业专项基金项目(10dz1511000)
关键词
高维数据
聚类
MAPREDUCE
music frames
high dimensional data
clustering
MapReduce