期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于版式电子文档的全文检索技术在自然资源部机关政务办公系统中的应用初探 被引量:1
1
作者 李正 咸容禹 +2 位作者 余前佳 陈卉 吴玉龙 《国土资源信息化》 2019年第2期22-26,共5页
通过构建版式电子文档库及配套的文档自动转换功能,为实现公文全文检索提供了结构化数据源,同时基于成熟的自然语言处理技术结合政务办公的业务需求特点实现了全文检索、相似文件查询等功能。成功的探索出了一套传统办公系统升级全文检... 通过构建版式电子文档库及配套的文档自动转换功能,为实现公文全文检索提供了结构化数据源,同时基于成熟的自然语言处理技术结合政务办公的业务需求特点实现了全文检索、相似文件查询等功能。成功的探索出了一套传统办公系统升级全文检索功能的解决方案。 展开更多
关键词 政务办公系统 版式文档 全文检索 相似文件检索
下载PDF
Near-duplicate document detection with improved similarity measurement 被引量:2
2
作者 袁鑫攀 龙军 +1 位作者 张祖平 桂卫华 《Journal of Central South University》 SCIE EI CAS 2012年第8期2231-2237,共7页
To quickly find documents with high similarity in existing documentation sets, fingerprint group merging retrieval algorithm is proposed to address both sides of the problem:a given similarity threshold could not be t... To quickly find documents with high similarity in existing documentation sets, fingerprint group merging retrieval algorithm is proposed to address both sides of the problem:a given similarity threshold could not be too low and fewer fingerprints could lead to low accuracy. It can be proved that the efficiency of similarity retrieval is improved by fingerprint group merging retrieval algorithm with lower similarity threshold. Experiments with the lower similarity threshold r=0.7 and high fingerprint bits k=400 demonstrate that the CPU time-consuming cost decreases from 1 921 s to 273 s. Theoretical analysis and experimental results verify the effectiveness of this method. 展开更多
关键词 similarity estimation near-duplicate document detection fingerprint group Hamming distance minwise hashing
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部