期刊文献+
共找到356,311篇文章
< 1 2 250 >
每页显示 20 50 100
基于在线梯度下降的Mini Batch K-Prototypes算法
1
作者 贾子琪 万世昌 +2 位作者 张腾飞 吉康毅 常雪瑞 《南阳理工学院学报》 2023年第4期45-49,共5页
K-Prototypes算法每次迭代都需要花费大量时间来计算所有样本与每个簇中心的相异度以将其划分到各个聚类簇中,这导致K-Prototypes算法在处理大型数据集时运行时间急剧增加。根据在线梯度下降算法对K-Prototypes算法的迭代过程进行优化,... K-Prototypes算法每次迭代都需要花费大量时间来计算所有样本与每个簇中心的相异度以将其划分到各个聚类簇中,这导致K-Prototypes算法在处理大型数据集时运行时间急剧增加。根据在线梯度下降算法对K-Prototypes算法的迭代过程进行优化,减少算法每次迭代所需的计算量从而降低算法的时间复杂度,提升算法运行效率。实验结果表明,提出的基于在线梯度下降的K-Prototypes聚类算法,可以在不影响算法收敛性和有效性的前提下降低算法的时间复杂度,提升算法运行效率。 展开更多
关键词 k-prototypes Mini Batch k-prototypes 在线梯度下降
下载PDF
改进的k-prototypes算法及应用 被引量:1
2
作者 罗冬梅 《武夷学院学报》 2009年第2期74-77,共4页
文中提出了一种改进的k-prototypes算法,该算法可以解决具有数值和分类混合类型数据的聚类问题,将它应用于对某高校网站的Web服务器日志进行数据分析,发现有意义的信息,建立规则库,并验证了算法的有效性。
关键词 数据挖掘 k-prototypes算法 K-MEANS算法 k-modes算法 WEB日志分析
下载PDF
改进的K-prototypes算法在农民工养老参保中的应用研究
3
作者 陆可 李鸣 +1 位作者 邹启鸣 徐浩 《管理观察》 2015年第28期189-192,共4页
农民工养老问题一直备受社会关注。许多学者对该问题展开了调研,并采用Logistic回归模型来分析调研结果。但是,Logistic回归模型要避免变量间的多元共线性。农民工养老保险参保调研数据各变量之间往往存在关联性,而且数据维度高。针对Lo... 农民工养老问题一直备受社会关注。许多学者对该问题展开了调研,并采用Logistic回归模型来分析调研结果。但是,Logistic回归模型要避免变量间的多元共线性。农民工养老保险参保调研数据各变量之间往往存在关联性,而且数据维度高。针对Logistic回归模型的局限性和调研数据维度高的问题,本文改进了K-prototypes聚类算法,并用于分析农民工未购买养老保险的原因。基于该方法得到的分析结果可以为相关部门制定针对性政策提供参考。 展开更多
关键词 聚类 改进的k-prototypes算法 农民工养老保险
下载PDF
基于改进k-prototypes算法的Web日志分析系统的设计与实现
4
作者 罗冬梅 《吉林工程技术师范学院学报》 2015年第5期93-96,共4页
设计了一个基于改进k-prototypes算法的Web日志分析系统,结合学校网站采集的数据针对相关技术算法进行了应用及分析。
关键词 数据挖掘 WEB日志 k-prototypes算法
下载PDF
模糊K-Prototypes算法中的加权指数研究 被引量:4
5
作者 汪加才 朱艺华 《计算机应用》 CSCD 北大核心 2005年第2期348-351,共4页
模糊K Prototypes(FKP)算法融合了K Means和K Modes对数值型和符号型数据的处理方法,适合于混合类型数据的聚类分析。同时,模糊技术使得FKP适合于处理含有噪声和缺少数据的数据库。但是,在使用FCM(FuzzyC Meansalgorithm)或FKP算法时,... 模糊K Prototypes(FKP)算法融合了K Means和K Modes对数值型和符号型数据的处理方法,适合于混合类型数据的聚类分析。同时,模糊技术使得FKP适合于处理含有噪声和缺少数据的数据库。但是,在使用FCM(FuzzyC Meansalgorithm)或FKP算法时,如何选取加权指数α仍是悬而未决的问题。许多研究者基于他们的实验结果给出FCM中的最佳加权指数可能位于区间 [1. 5,2. 5],本文则提出了一个FKP中加权指数的探寻算法。在多个实际数据集上的实验结果表明,为进行有效的聚类,FKP中加权指数应该小于 1. 5。 展开更多
关键词 加权指数 FKP算法 聚类有效性
下载PDF
基于分布式的K-prototypes算法设计
6
作者 李兴 《信息通信》 2014年第4期68-69,共2页
聚类算法已经在很多领域有着广泛的应用,对于大多数的数据集,其中的属性不完全是数值型的,这就给聚类带来了困难。K-Prototypes算法的出现,解决了混合型属性聚类的困难,但其计算重复繁琐,给编程人员带来了大量的困难。Hadoop分布式系统... 聚类算法已经在很多领域有着广泛的应用,对于大多数的数据集,其中的属性不完全是数值型的,这就给聚类带来了困难。K-Prototypes算法的出现,解决了混合型属性聚类的困难,但其计算重复繁琐,给编程人员带来了大量的困难。Hadoop分布式系统的出现,给编写并行化的K-Prototypes算法提供了可能,这就能提高程序的并行化从而大幅度提高程序的效率。文章正是在此技术前提下,设计的并行化程序。 展开更多
关键词 HADOOP 数据挖掘算法 并行化
下载PDF
基于K-prototypes的混合属性数据聚类算法改进
7
作者 倪丹 李泽文 《科技创新与应用》 2024年第28期31-34,38,共5页
属性数据分为数值型数据和分类型数据,一般情况下对于数值型数据运算前要进行标准化处理,但是对于数值型数据差异大的数据,由于大数掩盖小数的影响,按照K-prototypes聚类算法,数值型数据标准化后而且不对相应的分类数据有任何预处理或... 属性数据分为数值型数据和分类型数据,一般情况下对于数值型数据运算前要进行标准化处理,但是对于数值型数据差异大的数据,由于大数掩盖小数的影响,按照K-prototypes聚类算法,数值型数据标准化后而且不对相应的分类数据有任何预处理或者在计算时没有进行任何改变,很可能提高分类数据在聚类中的影响,并且分类型数据并未进一步地细分,不能满足不同要求的混合属性聚类。该文在将数值型数据标准化的基础上,将分类数据细分为二元数据和类型数据,并用相异度系数距离计算分类数据之间的距离,并且赋予二元和类型数据相应的权重,来改进K-prototypes聚类算法,使该算法满足不同要求的混合属性数据聚类,最后通过C#语言,在ArcEngine2010版本上实现。 展开更多
关键词 k-prototypes算法 混合属性 类型数据 相异度系数 加权属性
下载PDF
基于K-prototypes的混合属性数据聚类算法 被引量:16
8
作者 陈韡 王雷 蒋子云 《计算机应用》 CSCD 北大核心 2010年第8期2003-2005,2110,共4页
通过对基于K-prototypes算法对混合属性数据处理的聚类问题进行研究,改进了K-prototypes算法中分类属性相异度计算公式,使之能更加精确反映样本间的差异;在此基础上提出了一种用于处理混合属性数据的聚类算法,并将改进后的算法应用于英... 通过对基于K-prototypes算法对混合属性数据处理的聚类问题进行研究,改进了K-prototypes算法中分类属性相异度计算公式,使之能更加精确反映样本间的差异;在此基础上提出了一种用于处理混合属性数据的聚类算法,并将改进后的算法应用于英语借词数据的聚类分析中。实验结果表明,与K-prototypes算法相比,改进后的算法具有更好的稳定性和更高的精度。 展开更多
关键词 聚类 k-prototypes算法 混合属性数据 相异度
下载PDF
基于平均差异度的改进k-prototypes聚类算法 被引量:4
9
作者 石鸿雁 徐明明 《沈阳工业大学学报》 EI CAS 北大核心 2019年第5期555-559,共5页
针对k-prototypes聚类算法随机选取初始聚类中心导致聚类结果不稳定,以及现有的大多数混合属性数据聚类算法聚类质量不高等问题,提出了基于平均差异度的改进k-prototypes聚类算法.通过利用平均差异度选取初始聚类中心,避免了初始聚类中... 针对k-prototypes聚类算法随机选取初始聚类中心导致聚类结果不稳定,以及现有的大多数混合属性数据聚类算法聚类质量不高等问题,提出了基于平均差异度的改进k-prototypes聚类算法.通过利用平均差异度选取初始聚类中心,避免了初始聚类中心点选取的随机性,同时利用信息熵确定数值数据的属性权重,并对分类属性度量公式进行改进,给出了一种混合属性数据度量公式.结果表明,改进后的算法具有较高的准确率,能够有效处理混合属性数据. 展开更多
关键词 k-prototypes算法 聚类 初始聚类中心 混合属性数据 平均差异度 信息熵 属性权重 度量公式
下载PDF
量子遗传算法的模糊K-prototypes聚类 被引量:1
10
作者 叶奇明 梁根 《计算机工程与应用》 CSCD 北大核心 2010年第1期112-115,共4页
聚类分析是数据挖掘中应用最多的一种技术,它在许多领域都有重要应用。模糊h-prototypes算法是当前聚类分析中最有效算法之一,但是存在对初始值敏感、容易陷入局部极小值的问题。为了克服该缺点,提出了一种基于量子遗传算法和FKP算法的... 聚类分析是数据挖掘中应用最多的一种技术,它在许多领域都有重要应用。模糊h-prototypes算法是当前聚类分析中最有效算法之一,但是存在对初始值敏感、容易陷入局部极小值的问题。为了克服该缺点,提出了一种基于量子遗传算法和FKP算法的混合聚类算法,首先利用量子遗传算法确定FKP的初始聚类中心,再将量子遗传算法聚类结果作为后续FKP算法的初始值。实验结果显示,算法具有良好的收敛性和稳定性,聚类效果优于单一使用FKP算法和相关改进的算法。 展开更多
关键词 聚类算法 量子遗传算法 模糊k-prototypes算法 数值型属性 数据挖掘
下载PDF
基于信息增益的模糊K-prototypes聚类算法
11
作者 欧阳浩 王智文 +1 位作者 戴喜生 刘智琦 《计算机工程与科学》 CSCD 北大核心 2015年第5期1009-1014,共6页
K-prototypes聚类算法结合了K-means算法和K-modes算法,可用于分析混合属性的数据对象。传统的K-prototypes聚类算法在计算数据对象的相异度时,未考虑各个属性对于最终聚类结果的影响程度,而现实世界中,各属性的重要程度是不同的。使用... K-prototypes聚类算法结合了K-means算法和K-modes算法,可用于分析混合属性的数据对象。传统的K-prototypes聚类算法在计算数据对象的相异度时,未考虑各个属性对于最终聚类结果的影响程度,而现实世界中,各属性的重要程度是不同的。使用了信息论中信息增益的计算方法,来获得各个属性的权值。在计算各属性的差异度时,乘以这些权值,从而可以获得更为准确的聚类结果。为了增加算法处理模糊问题的能力,本算法引用了模糊理论,从而使其具有较好的抗干扰能力和处理不确定性问题的能力。通过对四个UCI数据集的聚类分析实验,表明了本算法的有效性。 展开更多
关键词 聚类 信息增益 模糊k-prototypes算法 混合型数据
下载PDF
一种与k-prototypes混合的蚁群聚类算法的浅探
12
作者 于妍 《数字技术与应用》 2010年第11期77-77,79,共2页
本文介于k-prototypes和蚁群聚类算法的优、缺点,将两种算法进行改进后,交替使用,相互弥补、扬长避短,形成一种全新的算法,既缩短了聚类时间也能形成高效的聚类结果。
关键词 蚁群聚类算法 k-prototypes算法
下载PDF
数值型和分类型混合数据的模糊K-Prototypes聚类算法(英文) 被引量:47
13
作者 陈宁 陈安 周龙骧 《软件学报》 EI CSCD 北大核心 2001年第8期1107-1119,共13页
由于数据库经常同时包含数值型和分类型的属性 ,因此研究能够处理混合型数据的聚类算法无疑是很重要的 .讨论了混合型数据的聚类问题 ,提出了一种模糊 K- prototypes算法 .该算法融合了 K- means和 K- modes对数值型和分类型数据的处理... 由于数据库经常同时包含数值型和分类型的属性 ,因此研究能够处理混合型数据的聚类算法无疑是很重要的 .讨论了混合型数据的聚类问题 ,提出了一种模糊 K- prototypes算法 .该算法融合了 K- means和 K- modes对数值型和分类型数据的处理方法 ,能够处理混合类型的数据 .模糊技术体现聚类的边界特征 ,更适合处理含有噪声和缺失数据的数据库 .实验结果显示 。 展开更多
关键词 数据库 数值型混合数据 分类型混合数据 模糊k-prototypes聚类算法
下载PDF
模糊k-prototypes聚类算法的一种改进算法 被引量:11
14
作者 王宇 杨莉 《大连理工大学学报》 EI CAS CSCD 北大核心 2003年第6期849-852,共4页
模糊k-prototypes算法是当前聚类分析中最有效算法之一.简述了模糊k-prototypes算法的发展进程和主要性质;并在此基础上,指出它在处理数值型和分类型混合数据时的不足,进而提出一种改进算法;最后,将算法应用到英语借词之中,给出计算结果... 模糊k-prototypes算法是当前聚类分析中最有效算法之一.简述了模糊k-prototypes算法的发展进程和主要性质;并在此基础上,指出它在处理数值型和分类型混合数据时的不足,进而提出一种改进算法;最后,将算法应用到英语借词之中,给出计算结果.结果表明,改进算法具有较好的稳定性和较高的精确度. 展开更多
关键词 模糊k-prototypes聚类算法 数值型属性 分类型属性 英语借词 数据挖掘
下载PDF
算法解释制度的体系化构建 被引量:11
15
作者 苏宇 《东方法学》 CSSCI 北大核心 2024年第1期81-95,共15页
算法解释在算法治理中举足轻重。算法解释承载着权益保障、社会交往和风险治理三重意义,其在技术层面上的障碍正在逐渐被突破,可以通过多种技术机制实现。在算法治理活动中,应根据常规场景、关键场景和争议场景分别限定选择解释的路径... 算法解释在算法治理中举足轻重。算法解释承载着权益保障、社会交往和风险治理三重意义,其在技术层面上的障碍正在逐渐被突破,可以通过多种技术机制实现。在算法治理活动中,应根据常规场景、关键场景和争议场景分别限定选择解释的路径选择和技术方案,通过冻结机制、抽样机制和镜像机制固定算法解释,并使之接受外部的验证与审查,确保算法解释真实、有效。算法解释的系列机制应被进一步构建为体系化的算法解释制度,在这一制度框架内,对解释路径与精度、解释时限、解释瑕疵责任等要素的合理配置,可以实现社会效益与规制负担的精细平衡。 展开更多
关键词 算法解释 算法验证 算法黑箱 算法透明度 机器学习 算法治理
下载PDF
改进A^(*)算法和人工势场法的路径规划 被引量:10
16
作者 余翔 姜陈 +1 位作者 段思睿 邓千锐 《系统仿真学报》 CAS CSCD 北大核心 2024年第3期782-794,共13页
A^(*)算法存在折线路径多和搜索节点多的问题,人工势场(artificial potential field,APF)法存在局部最优和不可到达的问题,针对两种算法存在的问题进行了研究。利用欧氏距离与投影距离提出一种新的混合式启发函数,依据该函数对A^(*)算... A^(*)算法存在折线路径多和搜索节点多的问题,人工势场(artificial potential field,APF)法存在局部最优和不可到达的问题,针对两种算法存在的问题进行了研究。利用欧氏距离与投影距离提出一种新的混合式启发函数,依据该函数对A^(*)算法的流程进行改进,减少A^(*)算法的搜索节点,提高搜索效率。利用新A^(*)算法生成的最优节点作为APF算法的局部目标点,辅助机器人摆脱局部最优点;通过加入机器人和目标点的位置关系改进势场函数,修改斥力的增益,优化斥力的生成方向。在改进的基础上将两种算法融合提出一种新的算法,利用APF法的势场函数引导A^(*)算法的搜索。从路径长度、避障效果、迭代次数对改进算法进行对比分析,仿真结果表明,提出的改进算法搜索效率高,实现避障的同时保证计算的路径最优。 展开更多
关键词 APF算法 A^(*)算法 路径规划 引力势场 斥力势场
原文传递
算法嵌入政府治理:逻辑、风险与规制 被引量:4
17
作者 周晓丽 姬晓暄 《西安交通大学学报(社会科学版)》 CSSCI 北大核心 2024年第1期52-61,共10页
伴随着现代信息技术的迅猛发展,智能算法在推动经济社会不断发展的同时也成为推动国家治理现代化的重要驱动力。现阶段如何推进算法技术更有效地嵌入政府治理,在充分发挥技术效益的同时反制技术滥用,实现公共价值最大化目标是亟须关注... 伴随着现代信息技术的迅猛发展,智能算法在推动经济社会不断发展的同时也成为推动国家治理现代化的重要驱动力。现阶段如何推进算法技术更有效地嵌入政府治理,在充分发挥技术效益的同时反制技术滥用,实现公共价值最大化目标是亟须关注的时代命题。从“技术—权力—规则”三个维度搭建研究算法嵌入政府治理的分析框架,探索算法技术赋能政府治理的价值意蕴与运作逻辑。聚焦算法技术黑箱阻滞公共责任认定、算法权力削弱政府与民众自主性、算法规则偏好导致治理正义性减损等风险与挑战,提出在实践中要推进技术适度透明化以明晰责任关系链条、规范算法权力运作并坚持人本主义治理理念、明确算法规则决策限度以强化治理正义性等实践进路。 展开更多
关键词 算法 政府治理 算法技术 算法规则 算法权力
下载PDF
一种增强的K-prototypes混合数据聚类算法 被引量:4
18
作者 李顺勇 顾嘉成 《陕西科技大学学报》 北大核心 2021年第2期183-188,共6页
针对K-prototypes算法处理混合数据时精度不高等问题,提出了一种增强的K-prototypes混合数据聚类算法(An Enhanced K-prototypes Mixed Data Clustering Algorithm,EKPCA).首先定义了一种新的距离计算公式,扩大了数据之间的差异性,有利... 针对K-prototypes算法处理混合数据时精度不高等问题,提出了一种增强的K-prototypes混合数据聚类算法(An Enhanced K-prototypes Mixed Data Clustering Algorithm,EKPCA).首先定义了一种新的距离计算公式,扩大了数据之间的差异性,有利于对簇边缘数据进行合理划分;其次选取较多初始原型来覆盖数据的整体信息;最后迭代消去多余原型,得到数据集的真实分类.在8个UCI数据集上对算法进行评测,实验结果表明EKPCA算法有较高聚类精度. 展开更多
关键词 k-prototypes 混合数据 距离计算 初始原型 迭代消去
下载PDF
算法审计需求论 被引量:4
19
作者 郑石桥 《财会月刊》 北大核心 2024年第16期77-82,共6页
算法审计是算法治理体系的重要成员,本文以经典审计理论为基础,提出算法审计需求的一个理论框架。算法的合约类委托代理关系中存在完备合约,监管类委托代理关系中算法相关法律法规发挥了类似完备合约的作用,这两类关系中都不存在算法审... 算法审计是算法治理体系的重要成员,本文以经典审计理论为基础,提出算法审计需求的一个理论框架。算法的合约类委托代理关系中存在完备合约,监管类委托代理关系中算法相关法律法规发挥了类似完备合约的作用,这两类关系中都不存在算法审计需求。算法的资源类委托代理关系中,由于激励不相容、信息不对称、合约不完备和环境不确定同时存在,必须建构算法治理体系来应对算法代理问题和次优问题,算法审计基于审计固有功能对算法责任履行情况实施鉴证,发现其中存在的代理问题和次优问题,报告给委托人及其他利益相关者并推动整改,从而为算法责任的良好履行提供一定的保障。 展开更多
关键词 算法委托代理关系 算法代理问题 算法次优问题 算法治理体系 算法审计需求
下载PDF
如何实现“黑箱”下的算法治理?——平台推荐算法监管的测量实验与策略探索 被引量:4
20
作者 张楠 闫涛 张腾 《公共行政评论》 CSSCI 北大核心 2024年第1期25-44,M0003,共21页
近年来,平台推荐算法的快速发展和广泛应用深刻改变了互联网信息内容的供给方式,同时也引发了一系列算法风险与现实问题。平台推荐算法治理与监管成为政府规范算法应用的重点内容之一,无论是算法备案制度的探索,还是实现算法透明化的设... 近年来,平台推荐算法的快速发展和广泛应用深刻改变了互联网信息内容的供给方式,同时也引发了一系列算法风险与现实问题。平台推荐算法治理与监管成为政府规范算法应用的重点内容之一,无论是算法备案制度的探索,还是实现算法透明化的设想,均面临着一定的困难和挑战。在不打开算法“黑箱”的前提下,平台推荐算法规制与监管是否有可行之道?论文基于机器行为学思想,采用实验方法,以用户视角对推荐结果进行跟踪记录,通过实验数据的对比分析,验证了平台推荐算法结果差异的可测性。基于实验结果,论文提出了通过对不同平台推荐结果进行大规模数据测试和检验,测量平台推荐算法运行逻辑与推荐效果,从而实现“黑箱”下有效的逆向监管,以期丰富未来算法治理的选择。 展开更多
关键词 推荐算法 算法治理 算法监管 机器行为学
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部