期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于数据分组匹配的相似重复记录检测 被引量:6
1
作者 周丽娟 肖满生 《计算机工程》 CAS CSCD 北大核心 2010年第12期104-106,共3页
针对数据集成中相似重复记录的识别问题,提出一种数据特征属性优选分组的算法。通过计算特征属性的方差来确定某维属性的权值,基于数据分组思想选择权值大的属性,将数据集分割成不相交的小数据集,并在各小数据集中用模糊匹配算法进行相... 针对数据集成中相似重复记录的识别问题,提出一种数据特征属性优选分组的算法。通过计算特征属性的方差来确定某维属性的权值,基于数据分组思想选择权值大的属性,将数据集分割成不相交的小数据集,并在各小数据集中用模糊匹配算法进行相似重复记录的识别。理论分析和实验结果表明,该方法识别效率和检测精度较高。 展开更多
关键词 多源数据 属性优选 数据分组匹配 相似重复记录
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部