期刊文献+
共找到104篇文章
< 1 2 6 >
每页显示 20 50 100
复合家庭类型细分方案——以河北省为例 被引量:1
1
作者 田伟 王铮 +3 位作者 闫丽珍 李绍康 张敏 刘劲松 《西南师范大学学报(自然科学版)》 CAS 北大核心 2016年第12期60-67,共8页
基于河北省全员人口数据库,综合考虑了家庭所含代数,第一代家庭成员中的夫妻对数,是否存在隔代现象,夫妻是否残缺、是否流出等因素,提出了复合家庭类型的4类细分方案,将复合家庭分为40种Ⅳ级类型.基于关系数据模型,构建了复合家庭识别模... 基于河北省全员人口数据库,综合考虑了家庭所含代数,第一代家庭成员中的夫妻对数,是否存在隔代现象,夫妻是否残缺、是否流出等因素,提出了复合家庭类型的4类细分方案,将复合家庭分为40种Ⅳ级类型.基于关系数据模型,构建了复合家庭识别模型.研究表明:河北省复合家庭占全部家庭的比重为2.44%,复合家庭平均户规模为7.38人/户.滹滏平原是河北省复合家庭占比高值区.复合家庭类型细分方案为开展复合家庭分类的理论研究和管理实践提供了统一的分类方案,复合家庭识别模型为揭示复合家庭分布规律和行为特征提供了基于人口大数据的分析模型. 展开更多
关键词 复合家庭 家庭内部结构 识别模型 全员人口数据库
下载PDF
中文文本同频词统计规律及在关键词提取中的应用 被引量:4
2
作者 李晓超 赵书良 +2 位作者 罗燕 陈敏 柳萌萌 《计算机应用研究》 CSCD 北大核心 2016年第4期1007-1012,共6页
通过大量实验对中文文本中同频词的统计规律进行了研究,利用齐普夫定律推导出了适合中文文本的同频词数的数学表达式,能更准确地表示出不同长度的文本中各频次的同频词数;借助同频词数的数学表达式,重新确立了中文文本中高频词和低频词... 通过大量实验对中文文本中同频词的统计规律进行了研究,利用齐普夫定律推导出了适合中文文本的同频词数的数学表达式,能更准确地表示出不同长度的文本中各频次的同频词数;借助同频词数的数学表达式,重新确立了中文文本中高频词和低频词的界分公式,并通过实验验证了该公式能够更好地界分高频词和低频词。将提出的统计规律应用于中文文本关键词提取,有效提高了关键词提取效率,在文本长度不小于3 010词的前提下,频次为1和频次为2的词不必参与TF-IDF值的计算,可将计算效率提高2~7倍,且没有造成关键词丢失。解决了学术界关心的如何处理中文低频词的问题,对关键词提取中如何处理低频词提供了可操作标准。 展开更多
关键词 同频词 齐普夫定律 布茨定律 关键词提取 TF-IDF算法
下载PDF
斯特林曲线的离散卷积生成及其求值算法
3
作者 王瑜 刘婉柔 +1 位作者 解滨 韩力文 《浙江大学学报(理学版)》 北大核心 2025年第1期122-132,共11页
斯特林基函数是由离散概率模型生成的一类有理基函数。通过分析基函数的逐层递推关系,构造了斯特林基函数的离散卷积结构。结合离散卷积满足的交换性,得到n次斯特林曲线的n!种de Casteljau算法,并将其用于曲线的递归求值,进而得到n次斯... 斯特林基函数是由离散概率模型生成的一类有理基函数。通过分析基函数的逐层递推关系,构造了斯特林基函数的离散卷积结构。结合离散卷积满足的交换性,得到n次斯特林曲线的n!种de Casteljau算法,并将其用于曲线的递归求值,进而得到n次斯特林曲线的2种线性求值算法、速端曲线离散卷积表示以及首末两个n次斯特林基函数的导函数显式表达式。研究可推广至一类嵌套空间中的有理基函数及其曲线曲面。 展开更多
关键词 斯特林曲线 离散卷积 de Casteljau算法 线性复杂度 速端曲线
下载PDF
基于粒计算的多尺度聚类尺度上推算法 被引量:8
4
作者 赵骏鹏 赵书良 +2 位作者 李超 高琳 池云仙 《计算机应用研究》 CSCD 北大核心 2018年第2期362-366,共5页
多尺度科学在数据挖掘领域的研究多见于图像和空间数据挖掘,对一般数据的多尺度特性研究较少。传统聚类算法只在单一尺度上进行,无法充分挖掘蕴藏在数据中的知识。引入粒计算思想,进行普适的多尺度聚类方法研究,对数据进行多层次、多角... 多尺度科学在数据挖掘领域的研究多见于图像和空间数据挖掘,对一般数据的多尺度特性研究较少。传统聚类算法只在单一尺度上进行,无法充分挖掘蕴藏在数据中的知识。引入粒计算思想,进行普适的多尺度聚类方法研究,对数据进行多层次、多角度分析,实现一次挖掘,多次应用。首先,介绍粒计算相关知识;然后,提出多尺度聚类尺度上推算法UAMC(upscaling algorithm of multi-scale clustering),以簇为粒子,簇心为粒子特征进行尺度转换,利用斑块模型得到大尺度知识,避免二次挖掘带来的资源浪费。最后,利用UCI公用数据集和H省全员人口真实数据集对算法性能进行实验验证,结果表明算法在准确性上优于K-means等基准算法,是有效可行的。 展开更多
关键词 多尺度 粒计算 信息粒度 斑块模型 多尺度聚类
下载PDF
粒子群算法在分布式ETL任务调度中的应用 被引量:3
5
作者 王春阳 赵书良 王长宾 《计算机工程与应用》 CSCD 2013年第9期150-155,共6页
随着分布式数据环境越来越复杂,ETL工具要面临数据源多、分布地域广和海量数据等因素带来的挑战。原有的集中式ETL工作流优化理论不能满足现在复杂数据环境的要求。介绍了如何将基于置换的离散型粒子群算法应用到分布式ETL任务优化调度... 随着分布式数据环境越来越复杂,ETL工具要面临数据源多、分布地域广和海量数据等因素带来的挑战。原有的集中式ETL工作流优化理论不能满足现在复杂数据环境的要求。介绍了如何将基于置换的离散型粒子群算法应用到分布式ETL任务优化调度问题上,主要工作围绕ETL工作调度模型、算法编码设计、目标函数选择等内容来展开,给出了分布式ETL工作调度策略的实现过程和伪代码。理论分析和实验证明了实际应用的有效可行性。 展开更多
关键词 分布式抽取-转换-加载(ETL) 任务调度 基于置换的离散型粒子群算法
下载PDF
灰色模型在PM2.5预测中的应用 被引量:5
6
作者 冯科展 解建军 +1 位作者 张玫 刘金生 《绵阳师范学院学报》 2015年第5期75-79,共5页
PM2.5对空气质量和能见度等有重要的影响,了解其变化趋势,对制定合理的治理机制具有现实意义.在传统的GM(1,1)模型的基础上,提高数据的光滑度,建立了改进的GM(1,1)模型,并利用MATLAB实现GM(1,1)模型算法.以石家庄市PM2.5浓度作为研究对... PM2.5对空气质量和能见度等有重要的影响,了解其变化趋势,对制定合理的治理机制具有现实意义.在传统的GM(1,1)模型的基础上,提高数据的光滑度,建立了改进的GM(1,1)模型,并利用MATLAB实现GM(1,1)模型算法.以石家庄市PM2.5浓度作为研究对象,以历史数据预测未来数据,并检验其精度.结果显示,石家庄市PM2.5浓度,在短期内仍将保持较高值,采取措施控制PM2.5浓度不容忽视. 展开更多
关键词 PM2.5 环境污染 GM(1 1)模型 MATLAB 预测
下载PDF
Lupaş q-Bézier曲线的几何求值算法及其应用 被引量:1
7
作者 柳丽宏 左华 韩力文 《图学学报》 CSCD 北大核心 2021年第4期651-658,共8页
Lupaşq-Bézier曲线是一种以q-整数作为形状参数的广义Bézier曲线。本文构造了Lupaş q-Bézier曲线的一种新型几何求值算法,该算法倒数第二层2个节点的仿射组合与曲线相切。利用算法的相切性质得到Lupaş q-Bézier曲... Lupaşq-Bézier曲线是一种以q-整数作为形状参数的广义Bézier曲线。本文构造了Lupaş q-Bézier曲线的一种新型几何求值算法,该算法倒数第二层2个节点的仿射组合与曲线相切。利用算法的相切性质得到Lupaş q-Bézier曲线导矢的一种新表示,并实现了Lupaş q-Bézier曲线的细分。特别地,二次Lupaş q-Bézier曲线分割得到的2条子曲线的形状参数的乘积等于原曲线的形状参数。进一步,得到了加权Lupaş q-Bézier曲线的一种新型几何求值算法,该算法具有显式矩阵表示。 展开更多
关键词 Lupaşq-Bézier曲线 de Casteljau算法 显式矩阵表示 细分 计算复杂度
下载PDF
改进型插值IELAD算法在图像去噪中的应用
8
作者 范胜娟 张有会 +2 位作者 王志巍 董蕊 曹萌 《计算机科学》 CSCD 北大核心 2014年第S1期203-206,共4页
基于视频信号处理中用于场内插值的边缘自适应平均算法(ELA)思想,提出一种针对椒盐噪声图像滤波的改进型边缘自适应平均去噪算法(IELAD)。算法在扩展横向5+5阶ELA窗口的基础上增加了纵向5+5阶ELA窗口。根据噪声点所处边缘方向,自适应地... 基于视频信号处理中用于场内插值的边缘自适应平均算法(ELA)思想,提出一种针对椒盐噪声图像滤波的改进型边缘自适应平均去噪算法(IELAD)。算法在扩展横向5+5阶ELA窗口的基础上增加了纵向5+5阶ELA窗口。根据噪声点所处边缘方向,自适应地确定窗口及滤波方向进行滤波处理。实验表明IELAD算法充分利用了ELA窗口的保边特性,能够在去除椒盐噪声的同时有效地保持图像的边缘及细节信息。 展开更多
关键词 IELAD窗口 保持边缘 椒盐噪声 视频信号 ELA插值
下载PDF
q-Baskakov曲线
9
作者 董美娟 刘国芬 +1 位作者 解滨 韩力文 《高校应用数学学报(A辑)》 北大核心 2024年第4期379-390,共12页
近年来,一类基于q-微积分的广义Baskakov算子得到广泛研究,为构造新的曲线提供了理论依据.在Aral与Gupta(2011)定义的q-Baskakov算子中提取出qBaskakov基函数,研究得到它的性质,如非负性、单位分解性、单峰性等.由于固定次数的q-Baskako... 近年来,一类基于q-微积分的广义Baskakov算子得到广泛研究,为构造新的曲线提供了理论依据.在Aral与Gupta(2011)定义的q-Baskakov算子中提取出qBaskakov基函数,研究得到它的性质,如非负性、单位分解性、单峰性等.由于固定次数的q-Baskakov基函数有无限多个,为避免所构造的曲线无法插值它的控制多边形末端点,给出q-Baskakov曲线的截断定义,并证明截断的q-Baskakov曲线具有几何不变性、仿射不变性、凸包性等优良性质.在形状控制方面,文中给出的实例显示了q-Baskakov曲线在造型中的实际应用,很好地模拟控制多边形的形状,并且形状参数可从整体对曲线形状进行控制,从而进一步补充和完善了曲线造型理论. 展开更多
关键词 q-微积分 q-Baskakov基函数 q-Baskakov曲线 曲线造型
下载PDF
h-Said-Ball基与h-Said-Ball曲线
10
作者 刘婉柔 解滨 韩力文 《高校应用数学学报(A辑)》 北大核心 2024年第3期273-290,共18页
h-Bezier曲线是Bezier曲线基于h-微积分意义下的推广模型.为增强Said-Ball曲线的造型能力,提高h-Bezier曲线递归求值速度,该文提出任意次的h-Said-Ball基函数,构造了h-Said-Ball曲线.通过分析Said-Ball曲线递归求值算法与Bezier曲线的... h-Bezier曲线是Bezier曲线基于h-微积分意义下的推广模型.为增强Said-Ball曲线的造型能力,提高h-Bezier曲线递归求值速度,该文提出任意次的h-Said-Ball基函数,构造了h-Said-Ball曲线.通过分析Said-Ball曲线递归求值算法与Bezier曲线的转化关系,结合h-Bezier曲线的递归求值算法和h-Bernstein基函数的构造方式,得到任意次h-Said-Ball基函数的表达式.h-Said-Ball基具有非负,单位分解,端点插值等优良性质,和h-Bernstein基之间存在显式转换矩阵.进一步,定义h-Said-Ball曲线并分析其基本性质,推导递归求值算法和包络表示,h-Said-Ball曲线的求值计算量是h-Bezier曲线的一半.借助从h-Said-Ball曲线到h-Bezier曲线的割角算法,证明了h-Said-Ball基是全正基,从而h-Said-Ball曲线具有变差缩减性和保凸性.数值实例显示了h-Said-Ball曲线相比Said-Ball曲线的造型优势和灵活性. 展开更多
关键词 h-Bezier曲线 SAID-BALL曲线 h-Said-Ball基函数 h-Said-Ball曲线 全正基 递归求值算法
下载PDF
保持函数 e −μx ( μ>0 )的Baskakov型算子的逼近性质
11
作者 董惠 齐秋兰 《理论数学》 2024年第12期47-55,共9页
本文利用复合的思想,构造了保持函数e−μx(μ>0)的Baskakov型算子,给出了该类含参算子基函数图像,同时研究了该类算子的保单调性、保凸性、保星形性以及保半可加性。最后,选取适当的函数,利用数学软件绘制出该类算子的逼近效果图像,... 本文利用复合的思想,构造了保持函数e−μx(μ>0)的Baskakov型算子,给出了该类含参算子基函数图像,同时研究了该类算子的保单调性、保凸性、保星形性以及保半可加性。最后,选取适当的函数,利用数学软件绘制出该类算子的逼近效果图像,并给出逼近的均方根误差。In this paper, using the idea of combination, Baskakov operators maintaining the function e−μx(μ>0)are constructed. The graphics of their basis functions are given. At the same time, the shape preserving properties of these operators are obtained in terms of monotonicity, convexity, starshapeness and semi-additivity. Finally, choosing the approximation function, the approximation effect image of these kind of operators are drawn by software, and the root mean square error of approximation is obtained. 展开更多
关键词 BASKAKOV型算子 保形性质 数值模拟
下载PDF
基于词频统计的文本关键词提取方法 被引量:78
12
作者 罗燕 赵书良 +2 位作者 李晓超 韩玉辉 丁亚飞 《计算机应用》 CSCD 北大核心 2016年第3期718-725,共8页
针对传统TF-IDF算法关键词提取效率低下及准确率欠佳的问题,提出一种基于词频统计的文本关键词提取方法。首先,通过齐普夫定律推导出文本中同频词数的计算公式;其次,根据同频词数计算公式确定文本中各频次词语所占比重,发现文本中绝大... 针对传统TF-IDF算法关键词提取效率低下及准确率欠佳的问题,提出一种基于词频统计的文本关键词提取方法。首先,通过齐普夫定律推导出文本中同频词数的计算公式;其次,根据同频词数计算公式确定文本中各频次词语所占比重,发现文本中绝大多数是低频词;最后,将词频统计规律应用于关键词提取,提出基于词频统计的TFIDF算法。采用中、英文文本实验数据集进行仿真实验,其中推导出的同频词数计算公式平均相对误差未超过0.05;确立的各频次词语所占比重的最大误差绝对值为0.04;提出的基于词频统计的TF-IDF算法与传统TF-IDF算法相比,平均查准率、平均查全率和平均F1度量均有提高,而平均运行时间则均有降低。实验结果表明,在文本关键词提取中,基于词频统计的TF-IDF算法在查准率、查全率及F1指标上均优于传统TF-IDF算法,并能够有效减少关键词提取运行时间。 展开更多
关键词 词频统计 齐普夫定律 同频词 关键词提取 TF-IDF算法
下载PDF
多尺度数据挖掘方法 被引量:28
13
作者 柳萌萌 赵书良 +3 位作者 韩玉辉 苏东海 李晓超 陈敏 《软件学报》 EI CSCD 北大核心 2016年第12期3030-3050,共21页
多尺度理论已被引入到数据挖掘领域,但人们对其研究仍不够深入和完善,缺乏普适性理论与方法.随着大数据处理应用的不断深入,其研究变得更加迫切.针对上述问题,进行了普适的多尺度数据挖掘理论和方法的研究.首先,基于概念分层理论给出了... 多尺度理论已被引入到数据挖掘领域,但人们对其研究仍不够深入和完善,缺乏普适性理论与方法.随着大数据处理应用的不断深入,其研究变得更加迫切.针对上述问题,进行了普适的多尺度数据挖掘理论和方法的研究.首先,基于概念分层理论给出了数据尺度划分和数据尺度的定义以及多尺度数据集之间的上下层尺度数据集关系;其次,阐明了多尺度数据挖掘的定义、研究实质和方法分类;最后,提出了多尺度数据挖掘算法框架,给出其理论基础,并将此框架应用于关联规则挖掘,提出了多尺度关联规则挖掘算法MSARMA(multi-scale association rules mining algorithm),实现了多尺度数据集之间知识的跨尺度推导.利用IBM T10I4D100K数据集和H省全员人口真实数据集对MSARMA算法进行了实验和分析,实验结果表明:算法具有较高的覆盖率、精确度和较低的支持度估计误差,是可行且有效的. 展开更多
关键词 多尺度 频繁项集 关联规则 尺度转换 多尺度关联规则挖掘
下载PDF
基于八方向Sobel算子的边缘检测算法 被引量:51
14
作者 郑英娟 张有会 +2 位作者 王志巍 张静 范胜娟 《计算机科学》 CSCD 北大核心 2013年第11A期354-356,共3页
针对传统图像边缘检测方法检测效果不理想的问题,提出一种基于八方向Sobel算子的边缘检测算法。采用0°、22.5°、45°、67.5°、90°、112.5°、135°、157.5°8个方向的模板进行检测,能较好地检测出... 针对传统图像边缘检测方法检测效果不理想的问题,提出一种基于八方向Sobel算子的边缘检测算法。采用0°、22.5°、45°、67.5°、90°、112.5°、135°、157.5°8个方向的模板进行检测,能较好地检测出不同方向的边缘。在检测过程中,考虑到邻域内像素到中心像素距离不同,对中心像素的贡献不同,算法根据该像素到中心像素欧氏距离对邻域内像素进行加权,使得距中心像素越近,其权值越大。实验表明,算法检测出的图像边缘较为完整,轮廓线清晰且连续性较好。 展开更多
关键词 边缘检测 SOBEL算子 八方向 权值
下载PDF
多尺度聚类挖掘算法 被引量:7
15
作者 韩玉辉 赵书良 +2 位作者 柳萌萌 罗燕 丁亚飞 《计算机科学》 CSCD 北大核心 2016年第8期244-248,共5页
数据挖掘领域在多尺度研究上已取得了一些进展。然而,当前研究主要集中于空间、图像数据的多尺度挖掘,并且传统的聚类挖掘并未对数据集的多尺度特性进行单独的研究。针对存在的问题,进行了普适性的多尺度聚类挖掘理论和方法的研究。首先... 数据挖掘领域在多尺度研究上已取得了一些进展。然而,当前研究主要集中于空间、图像数据的多尺度挖掘,并且传统的聚类挖掘并未对数据集的多尺度特性进行单独的研究。针对存在的问题,进行了普适性的多尺度聚类挖掘理论和方法的研究。首先,根据概念分层理论扩展尺度定义并构建多尺度数据集;其次,阐述尺度转换原因、分类,归纳多尺度聚类的定义;然后,以克里格法为理论基础,给出多尺度聚类尺度上推算法MSCSUA和多尺度聚类尺度下推算法MSCSDA;最后,利用公用UCI聚类数据集和H省全员人口真实数据集对算法进行实验验证,结果表明MSCSUA和MSCSDA是有效、可行的。 展开更多
关键词 多尺度 聚类 尺度转换 多尺度聚类挖掘 克里格法
下载PDF
一种新的面向普通用户的多值属性关联规则可视化挖掘方法 被引量:9
16
作者 郭晓波 赵书良 +1 位作者 王长宾 陈敏 《电子学报》 EI CAS CSCD 北大核心 2015年第2期344-352,共9页
针对传统关联规则可视化挖掘方法不利于处理多值属性数据、缺乏展现数据间的频繁模式和关联模式以及效率低下等问题,提出了基于KAF因子和CHF因子的Apriori改进算法进行多值属性关联规则挖掘,实现了一种新的基于概念格的多值属性关联规... 针对传统关联规则可视化挖掘方法不利于处理多值属性数据、缺乏展现数据间的频繁模式和关联模式以及效率低下等问题,提出了基于KAF因子和CHF因子的Apriori改进算法进行多值属性关联规则挖掘,实现了一种新的基于概念格的多值属性关联规则可视化方法.运用概念格理论对多值属性数据进行了重新定义和分类,建立了较为完整的挖掘过程参数调整策略,方便用户选择关键属性值进行规则挖掘分析,提高了算法运行速度和挖掘效率.以概念格结构将多值数据组织起来,实现了对频繁项集的可视化展示,以及关联规则的多模式可视化展示.实验结果表明,改进后的挖掘算法具有更好的性能,所提出的可视化形式和已有成果相比具有良好的展现效果. 展开更多
关键词 多值属性 概念格 关联规则 可视化挖掘
下载PDF
基于局部均值和标准差的图像去雾算法 被引量:6
17
作者 李娟 张有会 +2 位作者 王志巍 董蕊 王建新 《计算机工程与应用》 CSCD 北大核心 2016年第5期215-219,共5页
针对雾天图像对比度低和颜色退化严重现象,提出一种单幅图像快速去雾算法。对雾天图像局部区域均值和标准差的特点进行分析,根据图像局部均值和标准差的差值得到关于大气散射光的估计,结合大气散射模型对雾天图像进行修复。实验结果表明... 针对雾天图像对比度低和颜色退化严重现象,提出一种单幅图像快速去雾算法。对雾天图像局部区域均值和标准差的特点进行分析,根据图像局部均值和标准差的差值得到关于大气散射光的估计,结合大气散射模型对雾天图像进行修复。实验结果表明,算法能够有效地去除图像中的雾气,且处理速度较快,便于实时应用。 展开更多
关键词 去雾 局部均值 标准差 大气散射光 景深
下载PDF
三支决策视角下概念格的分析和比较 被引量:8
18
作者 李磊军 李美争 +1 位作者 解滨 米据生 《模式识别与人工智能》 EI CSCD 北大核心 2016年第10期951-960,共10页
基于概念的构造和形式背景的构成,文中从三支决策的视角探究不同概念格之间的内在联系,分别对比不完备形式背景和经典形式背景中的概念格及直觉模糊形式背景和模糊形式背景中的概念格,展现三支决策在概念格理论中的重要价值.通过对比可... 基于概念的构造和形式背景的构成,文中从三支决策的视角探究不同概念格之间的内在联系,分别对比不完备形式背景和经典形式背景中的概念格及直觉模糊形式背景和模糊形式背景中的概念格,展现三支决策在概念格理论中的重要价值.通过对比可以看出,相比经典形式背景和模糊形式背景中的概念格,不完备形式背景和直觉模糊形式背景中的概念格体现三支决策思想,具有数据存储所占空间更小,属性约简更简洁等优势. 展开更多
关键词 概念格 三支决策 不完备形式背景 模糊形式背景 直觉模糊形式背景
下载PDF
基于概念图的关联规则知识表示 被引量:6
19
作者 郭晓波 赵书良 +2 位作者 刘军丹 赵娇娇 王长宾 《计算机科学》 CSCD 北大核心 2013年第8期261-265,共5页
针对传统关联规则表示方式无法展现领域知识、数据项间的关系及规则中所隐含的信息等问题,提出了一种基于概念图的关联规则知识表示方法,该方法包括模式定义和模式解析,其结合概念图理论可将关联规则转换成概念图的知识表示形式。给出... 针对传统关联规则表示方式无法展现领域知识、数据项间的关系及规则中所隐含的信息等问题,提出了一种基于概念图的关联规则知识表示方法,该方法包括模式定义和模式解析,其结合概念图理论可将关联规则转换成概念图的知识表示形式。给出了关联规则的概念图知识表示算法,并以某省全员人口数据为数据源对算法进行了具体实现和分析。实验结果表明,该方法在人口信息表现方面具有良好的效果。 展开更多
关键词 知识表示 概念图 关联规则 人口数据
下载PDF
多尺度关联规则挖掘的尺度上推算法 被引量:6
20
作者 柳萌萌 赵书良 +1 位作者 陈敏 李晓超 《计算机应用研究》 CSCD 北大核心 2015年第10期2924-2929,共6页
多尺度理论已被引入到数据挖掘领域中,但目前多尺度数据挖掘的研究并不深入,缺乏普适性理论与方法。针对上述问题,研究了普适的多尺度数据挖掘理论,提出了尺度上推关联规则挖掘算法。首先基于概念分层理论给出了数据尺度划分和数据尺度... 多尺度理论已被引入到数据挖掘领域中,但目前多尺度数据挖掘的研究并不深入,缺乏普适性理论与方法。针对上述问题,研究了普适的多尺度数据挖掘理论,提出了尺度上推关联规则挖掘算法。首先基于概念分层理论给出了数据尺度划分和数据尺度的定义;然后根据多尺度理论的研究重点阐明了多尺度数据挖掘的实质及研究核心;最后在多尺度数据理论研究的基础上提出了尺度上推关联规则挖掘算法SU-ARMA(scaling-up association rules mining algorithm)。该算法利用采样理论和Jaccard相似性系数对数据集挖掘结果中的频繁项集进行处理,实现了多尺度数据间知识的向上推导。利用人造数据集和H省全员人口真实数据集对算法进行了实验和分析,实验结果表明算法具有较高的覆盖率、精确度和较低的支持度估计误差,是可行且有效的。 展开更多
关键词 多尺度 概念分层 频繁项集 尺度上推 多尺度关联规则挖掘
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部