摘要
首先从开发优势与应用原理两个角度阐述数据挖掘技术,进一步分析如今可用的数据挖掘算法;同时,提出一种优化改进的Apriori算法。该算法在完成常规数据源选择、数据采集与存储、数据预处理等操作后、构建了一种近邻和决策树两种数据挖掘分类模型,进而在发现频繁项集过程中,将数据建模和模型评估,并对其每个子元素进行计数操作,对子元素的计算数值小于当前的项集阶数时的则进行特征描述标记;最后,对两种模型的混淆矩阵数据进行计算,比较模型的预测准确率,最终得出准确率较高的数据模型,从而提高了算法的整体效率。
出处
《信息技术与信息化》
2022年第7期91-94,共4页
Information Technology and Informatization
基金
山东华宇工学院模式识别应用工程技术研发中心研究基金(No.201905)。