摘要
聚类结果的有效性由结构有效性、算法有效性和先验知识有效性3个方面的因素决定.忽略先验知识和假设结构的有效性孤立地提升聚类算法的有效性很可能产生无效的聚类结果.现有聚类方法通常只是简单地导出假设结构下最优的聚类结果,并交付用户,缺乏对聚类结果的自省能力.实际上,聚类方法是一个不断迭代优化的过程,包括对训练数据拟合度和假设结构的迭代优化.基于上述的考虑,提出以聚类结构的鲁棒性作为聚类结果有效性的衡量指标,并将鲁棒性评估有机地整合到聚类算法的迭代优化过程中,提出一种面向结构鲁棒性的迭代聚类方法框架.此外,依托该框架下设计并实现了SROC聚类算法,通过对模拟数据和真实文档数据的聚类实验,例证了方法有效性.
出处
《计算机研究与发展》
EI
CSCD
北大核心
2007年第z3期263-267,共5页
Journal of Computer Research and Development
基金
国家"八六三"高技术研究发展计划基金项目(2006AA12Z217)