-
题名基于Hough变换的企业财务重复数据批量剔除方法
- 1
-
-
作者
唐磊
陈璇
王庆宇
-
机构
安徽工业经济职业技术学院
天津天狮学院
-
出处
《河北北方学院学报(自然科学版)》
2023年第3期22-26,共5页
-
文摘
企业财务数据在空间分布上具有一定的不规则性,导致对重复数据剔除的完整性较低,为此,提出基于Hough变换的企业财务重复数据批量剔除方法。首先,采用Hough变换对企业财务数据进行预处理,将累加器单元所有直线形成的峰值作为数据理想的期望值,根据期望变换结果区分在Hough变换下数据的位置变化幅值,沿原始数据空间分布实现对数据的划分。考虑到企业财务数据对应空间直线的边缘即为直线形成的累加器单元形状,因此对沿着正弦曲线法线方向的累加值进行增强处理,得到放大后的峰值信息。之后,采用ASCA实现对重复数据的筛选,用二分极值法将距离Hough变换后峰值最远的位置作为聚类中心,将DBI指数完全一致的数据聚类,保留聚类中的唯一数据,其余进行批量删除,完成操作后计算新的聚类中心,重复计算直至峰值累加器单元的财务数据处于均匀分布状态。测试结果表明,设计方法空间缩减率可达到91.0%,删除数据的准确性可达到96.12%,实现了对重复数据的较完整剔除。
-
关键词
HOUGH变换
重复数据
批量剔除
累加器单元
数据空间分布
增强处理
ASCA
DBI指数
-
Keywords
Hough transform
duplicate data
batch rejection
accumulator unit
spatial distribution of data
enhanced processing
ASCA
DBI index
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名物联网感知信息采集过程重复数据批量剔除方法
被引量:2
- 2
-
-
作者
朱荣军
-
机构
安徽工业经济职业技术学院电气工程学院
-
出处
《齐齐哈尔大学学报(自然科学版)》
2022年第1期21-25,共5页
-
基金
2020年度安徽省质量工程项目——安徽工业经济职业技术学院海尔实践教育基地(2020sjjd020)
2020年度安徽省质量工程项目——1+X证书制度下高职电子类专业“课证融通”的教学模式改革(2020jyxm0245)。
-
文摘
针对目前重复数据批量剔除方法中提升压缩比和降低数据开销之间的矛盾,提出一种物联网感知信息采集过程重复数据批量剔除方法。首先将物联网感知信息采集数据文件组织作为数据位图的排列形式,结合滑动分块算法对系列形式进行更新,以列的形式读取数据信息,组成新的数据块。然后计算不同数据之间的相似度,通过量子粒子群优化算法优化BP神经网络,组建重复数据批量剔除模型,通过模型完成重复数据剔除。最后进行性能测试,实验结果表明,所提方法能够有效提升平均压缩比,降低平均时间开销和重复数据批量剔除错误率。
-
关键词
物联网感知信息
采集过程
重复数据
批量剔除
-
Keywords
Internet of Things perception information
collection process
duplicate data
batch elimination
-
分类号
TP309.3
[自动化与计算机技术—计算机系统结构]
-