摘要
在亲合度的基础上定义出实体之间的距离公式,并进一步定义出单个实体与实体集之间的平均距离公式,作为实体划分的标准,并结合k-means算法对主题数据库进行划分。此方法改进了亲合度利用单个实体参与的活动数作为划分依据的缺点,更好地体现实体之间的联系,有助于信息资源的规划。
出处
《情报杂志》
CSSCI
北大核心
2009年第1期17-18,16,共3页
Journal of Intelligence
基金
国家科技部高新技术计划项目"基于ASP的中小企业信息化服务系统"(编号:2005EJ000017)
国家电子信息发展基金
河北省信息产业发展计划项目"供电企业计算机集成信息系统(CIIS)"(编号:2005035025)