期刊文献+
共找到26,247篇文章
< 1 2 250 >
每页显示 20 50 100
二值决策Bayesian粗糙集模型属性约简研究 被引量:2
1
作者 周杰 苗夺谦 《计算机科学》 CSCD 北大核心 2011年第8期214-216,231,共4页
Bayesian粗糙集模型作为经典粗糙集理论与Bayesian推理发展的综合模型,其近似区域划分以事件发生的先验概率为基准,可有效处理众多实际问题,如医疗诊断、故障检测、经济预测等。针对二值决策Bayesian粗糙集理论,证明了Slezak和Ziarko属... Bayesian粗糙集模型作为经典粗糙集理论与Bayesian推理发展的综合模型,其近似区域划分以事件发生的先验概率为基准,可有效处理众多实际问题,如医疗诊断、故障检测、经济预测等。针对二值决策Bayesian粗糙集理论,证明了Slezak和Ziarko属性约简模型等价,并进一步给出了相应分辨矩阵描述,从而经典粗糙集模型中基于分辨矩阵的知识约简思想均可平移应用于Bayesian粗糙集模型,丰富了Bayesian粗糙集理论体系。 展开更多
关键词 bayesian粗糙集模型 置信增益 分辨矩阵 二值决策
下载PDF
对Bayesian粗糙集模型的讨论 被引量:2
2
作者 闫德勤 《计算机科学》 CSCD 北大核心 2006年第11期162-163,共2页
变精度粗糙集模型是对传统的(Pawlak)粗糙集模型的一个重要拓展,但变精度模型中需要设定人为参数不利于信息的客观体现。Bayesian粗糙集模型是基于变精度和概率论的思想最新提出的无参数模型。对Bayesian粗糙集模型进行了分析,指出了其... 变精度粗糙集模型是对传统的(Pawlak)粗糙集模型的一个重要拓展,但变精度模型中需要设定人为参数不利于信息的客观体现。Bayesian粗糙集模型是基于变精度和概率论的思想最新提出的无参数模型。对Bayesian粗糙集模型进行了分析,指出了其中的不足,提出了一种改进形式。 展开更多
关键词 粗糙集 变精度模型 bayesian粗糙集模型
下载PDF
基于粗糙集理论与PCA-APSO-SVM的沥青路面使用性能预测 被引量:1
3
作者 李海莲 杨斯媛 +2 位作者 祁增涛 刘忠磊 李清华 《重庆交通大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第8期10-17,共8页
针对传统沥青路面使用性能预测精度较低的问题,建立了基于粗糙集理论(rough set,RS)与主成分分析法(principal compoent analysis,PCA)-自适应粒子群算法(adaptive particle swarm optimization,APSO)-支持向量机(support vector machin... 针对传统沥青路面使用性能预测精度较低的问题,建立了基于粗糙集理论(rough set,RS)与主成分分析法(principal compoent analysis,PCA)-自适应粒子群算法(adaptive particle swarm optimization,APSO)-支持向量机(support vector machine,SVM)的沥青路面使用性能预测模型。基于沥青路面的时序指标与影响因素指标,建立了11个初始预测指标(包括前3年的路面使用性能、当量轴次、路龄、养护性质、坑槽率、修补率、年降水量、平均气温、日照时数);通过RS属性约减筛选出9个核心指标;利用PCA提取4个主成分,得到了基于4个主成分的数据集;将APSO引入到SVM中,对数据集进行训练,并优化了SVM模型参数;建立了路面使用性能的PCA-APSO-SVM预测模型,并以G6京藏高速甘肃境内某段道路为例,对路面使用性能进行预测。研究结果表明:PCA-APSO-SVM模型预测精度较PCA-PSO-SVM、APSO-SVM、PSO-SVM有较大提高,预测结果与实际情况更加符合,能为路面养护决策提供相关参考。 展开更多
关键词 道路工程 路面使用性能预测 粗糙集理论 主成分分析 粒子群算法 支持向量机
下载PDF
基于不一致近邻的模糊粗糙集特征选择
4
作者 赵洁 叶文浩 +2 位作者 梁周扬 陈建新 董振宁 《计算机工程》 CSCD 北大核心 2024年第1期110-119,共10页
模糊粗糙集可突破经典粗糙集仅能处理离散数据的局限,有效对连续型数值进行特征选择。然而,模糊粗糙集以对象为中心计算,时间复杂度高,难以处理高维和大规模数据。为此,基于水平截集提出一种不一致近邻加速策略。该策略跟踪论域中每个... 模糊粗糙集可突破经典粗糙集仅能处理离散数据的局限,有效对连续型数值进行特征选择。然而,模糊粗糙集以对象为中心计算,时间复杂度高,难以处理高维和大规模数据。为此,基于水平截集提出一种不一致近邻加速策略。该策略跟踪论域中每个对象的模糊近邻集,持续删减其中不影响计算的近邻,若对象的不一致近邻删减至空,则删减该对象,从而提高算法效率。同时,设计一种基于不一致近邻递减的属性重要度,可有效抑制冗余特征入选,提升效率及分类精度。通过理论证明,所提的加速策略及属性重要度不影响属性入选的次序。在此基础上,提出新的模糊粗糙集特征选择算法。在9个UCI和scikit数据集上进行验证,实验结果表明,该算法不仅有效缩短运行时间,并可取得较高的分类精度,相比FA-FSCE、AVDP和IV-FS-FRS-2算法,运行时间至少可缩短9.44%,尤其在高维和大规模数据上可缩短61.01%~99.54%,在支持向量机和K-近邻算法的分类精度上最高可分别提高11.20%和19.95%。 展开更多
关键词 模糊粗糙集 特征选择 水平截集 不一致近邻 属性重要度
下载PDF
F-粗糙集的拓展与应用
5
作者 邓大勇 沈文新 《浙江师范大学学报(自然科学版)》 CAS 2024年第4期381-390,共10页
F-粗糙集是第1个动态粗糙集模型,具有良好的兼容性、表达能力以及动态性,但绝大多数粗糙集模型动态性不足.为了明晰粗糙集模型的动态性,拓展F-粗糙集的应用,综述了F-粗糙集研究的现状和发展,证明了多粒度粗糙集、多粒度邻域粗糙集和多... F-粗糙集是第1个动态粗糙集模型,具有良好的兼容性、表达能力以及动态性,但绝大多数粗糙集模型动态性不足.为了明晰粗糙集模型的动态性,拓展F-粗糙集的应用,综述了F-粗糙集研究的现状和发展,证明了多粒度粗糙集、多粒度邻域粗糙集和多尺度信息系统中的粗糙集可以用F-粗糙集表示.此外,还研究了F-粗糙集的可拓性,并建议将其他粗糙集模型与F-粗糙集相结合,使它们在处理动态数据、增量数据和海量数据时具有更强的能力.研究结果将提高其他粗糙集模型的动态性,有利于粗糙集进一步应用到大数据领域. 展开更多
关键词 粗糙集 F-粗糙集 多粒度粗糙集 多粒度邻域粗糙集 多尺度信息系统
下载PDF
基于平均型聚合函数的多粒度模糊粗糙集
6
作者 于鹏 王圣智 《郑州大学学报(理学版)》 CAS 北大核心 2024年第4期65-71,共7页
多粒度模糊粗糙集(multi-granulation fuzzy rough set,MGFRS)是一种重要的粗糙集模型。乐观多粒度模糊粗糙集和悲观多粒度模糊粗糙集分别给出了被描述对象的两种极端描述。从数据聚合角度看,将不同粒度值合并为单一粒度值时,乐观MGFRS... 多粒度模糊粗糙集(multi-granulation fuzzy rough set,MGFRS)是一种重要的粗糙集模型。乐观多粒度模糊粗糙集和悲观多粒度模糊粗糙集分别给出了被描述对象的两种极端描述。从数据聚合角度看,将不同粒度值合并为单一粒度值时,乐观MGFRS采用的是取小算子,悲观MGFRS采用的是取大算子。将取小与取大算子拓展为一般的平均型聚合算子,提出了一种新的多粒度模糊粗糙集模型:基于平均型聚合函数的多粒度模糊粗糙集(multi-granulation fuzzy rough set model on the base of average aggregate function,MFA)模型。研究了MFA模型的基本性质,给出了MFA模型与乐观和悲观多粒度模糊粗糙集的关系。同时,基于MFA模型,提出了基于平均型聚合算子的粗糙近似集模型。 展开更多
关键词 聚合函数 粗糙集 多粒度模糊粗糙集 近似集
下载PDF
基于粗糙集理论的均匀设计阿魏酸合成工艺因素规律的方法研究
7
作者 崔红新 王子翰 +3 位作者 张泞杰 杨帅朋 赵迪 黄琼 《中南药学》 CAS 2024年第9期2405-2409,共5页
目的利用粗糙集理论研究药物合成生产过程中生产因素之间的内在规律,探求最优合成工艺方案的方法。方法采用粗糙集理论方法,以阿魏酸合成工艺为案例,利用均匀设计试验预处理,形成基于粗糙集的决策表,建立粗糙集规则模型。通过决策规则... 目的利用粗糙集理论研究药物合成生产过程中生产因素之间的内在规律,探求最优合成工艺方案的方法。方法采用粗糙集理论方法,以阿魏酸合成工艺为案例,利用均匀设计试验预处理,形成基于粗糙集的决策表,建立粗糙集规则模型。通过决策规则分析工艺因素对试验指标的影响,优选最佳合成工艺。结果阿魏酸合成工艺的反应时间水平与阿魏酸收率水平呈线性增加的趋势(P<0.01),原料配比、吡啶量因素水平与阿魏酸收率水平并没有线性增加的趋势(P>0.05)。当试验三因素都取7水平时,试验结果最好,为最佳组合。结论粗糙集理论方法能够全面地分析药物合成工艺因素与试验结果之间的内在动态规律,为提高药物合成工艺质量,提出了一种独特的优选方法和思路以供参考。 展开更多
关键词 粗糙集 均匀设计 因素 决策规则模型 阿魏酸
原文传递
基于粗糙集理论和正交设计的冠心苏合滴丸制药生产工艺参数优选的方法研究
8
作者 崔红新 郭颖 +4 位作者 陈晓莹 朱芳静 韩景仁 赵迪 黄琼 《中南药学》 CAS 2024年第9期2410-2414,共5页
目的利用粗糙集理论和正交设计研究制药生产工艺参数之间的规律,探求优选生产工艺参数优选的数学方法。方法采用粗糙集理论方法,以冠心苏合滴丸生产工艺参数优选为案例,利用正交设计试验预处理数据,建立决策表,通过粗糙集规则模型动态... 目的利用粗糙集理论和正交设计研究制药生产工艺参数之间的规律,探求优选生产工艺参数优选的数学方法。方法采用粗糙集理论方法,以冠心苏合滴丸生产工艺参数优选为案例,利用正交设计试验预处理数据,建立决策表,通过粗糙集规则模型动态分析工艺参数对结果的影响,优选最佳工艺参数。结果当冠心苏合滴丸生产工艺的参数药物与基质的配比分别与药液温度和冷却剂温度的水平逐渐增高时,溶散时限的平均水平呈现低-高-低的动态变化趋势;但当药液温度和冷却剂温度水平逐渐增高时,溶散时限的平均水平呈现动态的递减变化趋势。药物与基质的配比为1∶2,药液温度为70℃,冷却剂温度为12~14℃时,为冠心苏合滴丸生产工艺的参数的最佳组合。结论粗糙集理论能够动态、全面地分析制药生产工艺参数与试验指标之间的内在关系,提供了一种研究提高制药生产工艺质量的数学方法。 展开更多
关键词 粗糙集理论 正交设计 决策规则模型 冠心苏合滴丸
原文传递
基于邻域优势粗糙集的区分度动态属性约简算法
9
作者 张海玉 贾润亮 《计算机工程与设计》 北大核心 2024年第8期2320-2328,共9页
为解决动态环境下数值型偏序关系数据的属性约简问题,利用优势粗糙集的区分度提出一种增量式属性约简算法。在数值型信息系统环境下,定义邻域优势区分度度量,通过邻域优势区分度设出一种非增量式属性约简算法;研究和分析对象变化场景下... 为解决动态环境下数值型偏序关系数据的属性约简问题,利用优势粗糙集的区分度提出一种增量式属性约简算法。在数值型信息系统环境下,定义邻域优势区分度度量,通过邻域优势区分度设出一种非增量式属性约简算法;研究和分析对象变化场景下邻域优势区分度进行增量式更新的原理;分别提出数据对象增加和减少情形下数据集属性约简的增量式更新算法。在多个UCI数据集上进行实验验证,实验结果表明,该增量式算法能够有效完成动态数据的属性约简任务。 展开更多
关键词 数值型 偏序关系数据 属性约简 优势粗糙集 邻域关系 区分度 增量式学习
下载PDF
一种属性变化局部变精度邻域粗糙集动态算法
10
作者 王美丽 赵佳怡 冯卫兵 《河南科技大学学报(自然科学版)》 CAS 北大核心 2024年第4期79-87,M0007,M0008,共11页
传统的邻域粗糙集模型对混合型数据的抗噪能力和计算效率低下,基于矩阵理论建立了一种属性动态变化的局部变精度邻域粗糙集模型。在局部对角矩阵和中间矩阵的更新规律的基础上,构建了混合信息系统局部变精度邻域粗糙集下近似的动态更新... 传统的邻域粗糙集模型对混合型数据的抗噪能力和计算效率低下,基于矩阵理论建立了一种属性动态变化的局部变精度邻域粗糙集模型。在局部对角矩阵和中间矩阵的更新规律的基础上,构建了混合信息系统局部变精度邻域粗糙集下近似的动态更新机制,提出了一种新的属性变化的局部变精度邻域粗糙集动态算法。通过实验分析可知:所提出的动态算法具有较高的计算效率和良好的稳健性。 展开更多
关键词 局部变精度邻域粗糙集 混合信息系统 属性集变化 动态更新机制
下载PDF
随机多属性子空间的ReliefF加权邻域粗糙集与属性约简
11
作者 王莉 《计算机工程与应用》 CSCD 北大核心 2024年第8期69-77,共9页
属性约简是一种重要的数据降维预处理方法,然而现有的属性约简方法大多没有考虑信息系统中属性权重的信息。ReliefF算法是一种实现简单且运算效率高的属性权重评估方法,提出一种随机多属性子空间的ReliefF加权邻域粗糙集和属性约简算法... 属性约简是一种重要的数据降维预处理方法,然而现有的属性约简方法大多没有考虑信息系统中属性权重的信息。ReliefF算法是一种实现简单且运算效率高的属性权重评估方法,提出一种随机多属性子空间的ReliefF加权邻域粗糙集和属性约简算法。该方法生成了多组具有相同大小随机子空间的属性集划分,并对每组划分的随机子空间利用ReliefF算法计算得到属性的局部权重,将所有组得到的属性局部权重求取平均值,得到了信息系统每个属性最终的全局权重;基于属性权重的结果,提出一种新的加权邻域粗糙集模型,并证明了相关理论和性质;在该模型的基础上通过加权邻域依赖度提出一种信息系统的属性约简算法。在公开数据集上的属性约简实验结果表明,所提出的属性约简算法比已有的同类型算法整体上具有更优的约简性能。 展开更多
关键词 属性约简 RELIEFF算法 随机子空间 加权邻域 邻域粗糙集模型
下载PDF
广义多粒度双量化邻域粗糙集
12
作者 孙文鑫 《兰州文理学院学报(自然科学版)》 2024年第3期15-23,共9页
针对实数型数据的信息量化问题,引入相对概念和绝对基数构建了广义多粒度双量化邻域粗糙集模型.首先,通过I型和II型广义多粒度上、下邻域特征支撑函数构建两类广义多粒度上、下邻域近似算子并讨论其性质;其次,讨论了两种广义多粒度邻域... 针对实数型数据的信息量化问题,引入相对概念和绝对基数构建了广义多粒度双量化邻域粗糙集模型.首先,通过I型和II型广义多粒度上、下邻域特征支撑函数构建两类广义多粒度上、下邻域近似算子并讨论其性质;其次,讨论了两种广义多粒度邻域粗糙集的关系;最后,通过传染病案例实证分析了模型的实用性和有效性. 展开更多
关键词 广义多粒度粗糙集 双量化 邻域粗糙集 传染病
下载PDF
基于灰色动态聚类-粗糙集的装配式建筑施工安全评价指标体系优化
13
作者 李平 周颖 蒋春迪 《工程管理学报》 2024年第3期135-140,共6页
建立合理的装配式建筑施工安全评价指标体系是规范装配式建筑安全施工的关键,引入灰色动态聚类和粗糙集属性约简相结合的方法对指标进行约简分析。利用灰色关联分析法建立样本间的灰色关联矩阵,并利用F-统计量确定最优阈值,以确定样本... 建立合理的装配式建筑施工安全评价指标体系是规范装配式建筑安全施工的关键,引入灰色动态聚类和粗糙集属性约简相结合的方法对指标进行约简分析。利用灰色关联分析法建立样本间的灰色关联矩阵,并利用F-统计量确定最优阈值,以确定样本的最佳分类;逐一删除每个指标,采用灰色动态聚类方法对剩余指标进行聚类分析,得出其最佳聚类结果;运用粗糙集约简理论,对比删减某一指标和全部指标下的最佳聚类结果,保留与原始最佳聚类结果不同即对样本分类有影响的指标。这一举措实现了安全评价指标的有效筛选,减少了后续施工安全评价的工作量,确保了安全评价的准确性,同时也为装配式建筑现场施工管理工作提供了指导。 展开更多
关键词 装配式建筑 灰色动态聚类 粗糙集 指标约简 F-统计量
下载PDF
基于粗糙集-云模型的城市常规公交运力配置水平评价
14
作者 刘新 谭桂菲 《交通运输研究》 2024年第3期37-45,共9页
为优化完善城市常规公交运力配置的多层次综合评估指标体系及其等级标准,以便科学评估常规公交运力配置水平,提出了一种基于粗糙集-云模型的城市常规公交运力配置水平评估模型。首先,利用粗糙集理论对指标体系进行筛选,并匹配了相应的... 为优化完善城市常规公交运力配置的多层次综合评估指标体系及其等级标准,以便科学评估常规公交运力配置水平,提出了一种基于粗糙集-云模型的城市常规公交运力配置水平评估模型。首先,利用粗糙集理论对指标体系进行筛选,并匹配了相应的等级标准;然后,采用CRITIC方法对指标进行赋权,进而利用云模型算法生成评价标准云和结果云,通过数字特征和云图直观展现评价结果。最后,以青岛市主城区144条常规公交线路为例,对模型进行了验证。结果显示:青岛市主城区144条常规公交运力配置水平目标层综合评价等级为“中等”,在子目标层(公交客流水平、公交线路水平、公交线路发车水平、公交车辆运营水平、公交车辆技术水平)中,评价等级为“中等”及以上的占60%,总体上与目前青岛市主城区常规公交运力配置水平特点相符。研究表明,该模型能实现对城市常规公交运力配置的综合评价,可为城市常规公交运力配置评价体系和评价模型构建提供参考。 展开更多
关键词 城市常规公交 运力配置水平 评价指标体系 粗糙集 CRITIC 云模型
下载PDF
FT-粗糙集模型的一些性质
15
作者 张纪平 周缪娟 李进金 《泉州师范学院学报》 2024年第2期1-9,共9页
T-粗糙集是Pawlak粗糙集理论发展过程中的一个重要模型,已成功应用于数据挖掘等诸多领域.FT-粗糙集模型能够在保持数据的完整性下处理连续型数据,是对仅能处理离散型数据的T-粗糙集模型上的发展.文章引入模糊近似空间(X,Y,T)一对模糊集... T-粗糙集是Pawlak粗糙集理论发展过程中的一个重要模型,已成功应用于数据挖掘等诸多领域.FT-粗糙集模型能够在保持数据的完整性下处理连续型数据,是对仅能处理离散型数据的T-粗糙集模型上的发展.文章引入模糊近似空间(X,Y,T)一对模糊集的弱逆和强逆定义,用量化方法研究FT-粗糙集的一些性质,得到模糊技能映射在析取模型、合取模型下分别生成的知识结构;用量化方法与矩阵表示探究FT-粗糙集模糊集值映射在并、交运算下的性质. 展开更多
关键词 FT-粗糙集 模糊近似空间 下逆和上逆 弱逆和强逆
下载PDF
基于粗糙集理论的高职毕业生就业指标体系构建研究
16
作者 杨波 高沁楠 《陶行知学刊》 2024年第3期77-80,共4页
随着高职教育的迅速发展,对毕业生就业质量的评估变得越来越重要。文章分析高职毕业生就业质量评估的现状,探索利用粗糙集理论优化高职毕业生就业指标体系,以提高评估的准确性和效率,提升高职毕业生的就业质量和满意度。
关键词 粗糙集理论 高职毕业生 就业指标 就业质量 数据挖掘
下载PDF
基于改进粗糙集的低照度遥感图像对比度增强方法
17
作者 石琳 《无线互联科技》 2024年第13期28-30,共3页
为解决图像增强后存在的噪声问题,文章提出基于改进粗糙集的低照度遥感图像对比度增强方法。该方法先基于改进粗糙集进行低照度遥感图像预处理,后自适应调整低照度遥感图像,采用提高饱和度、恢复色彩等操作,完成对图像的对比度增强处理... 为解决图像增强后存在的噪声问题,文章提出基于改进粗糙集的低照度遥感图像对比度增强方法。该方法先基于改进粗糙集进行低照度遥感图像预处理,后自适应调整低照度遥感图像,采用提高饱和度、恢复色彩等操作,完成对图像的对比度增强处理。实验结果表明,文章所提方法的应用使图像的对比度指标得到了显著提升,应用效果更优。 展开更多
关键词 图像对比度增强 遥感技术 低照度遥感图像 改进粗糙集
下载PDF
区间值直觉模糊β覆盖粗糙集模型 被引量:1
18
作者 任浩伟 王青海 张巧珍 《陕西科技大学学报》 北大核心 2024年第5期214-224,共11页
在新的β覆盖邻域系统上提出四种区间值直觉模糊β覆盖粗糙集模型,用于有效处理区间值直觉模糊信息的多属性决策问题.首先,从论域的区间值直觉模糊β覆盖出发,引入两类新的邻域系统并构造了四种不同类型的区间值直觉模糊β覆盖粗糙集,... 在新的β覆盖邻域系统上提出四种区间值直觉模糊β覆盖粗糙集模型,用于有效处理区间值直觉模糊信息的多属性决策问题.首先,从论域的区间值直觉模糊β覆盖出发,引入两类新的邻域系统并构造了四种不同类型的区间值直觉模糊β覆盖粗糙集,扩展了现有模型的适用范围.其次,深入研究了每种模型的数学性质,构建了所提出的四种模型之间的关联关系,为模糊β覆盖粗糙集领域的研究提供了理论基础.最后,为解决区间值直觉模糊信息的多属性决策问题,设计了决策算法并进行应用实例分析,并通过与其他决策方法的对比分析,表明了区间值直觉模糊β覆盖粗糙集在多属性决策问题中具有可行性和有效性.研究成果对于复杂模糊信息决策具有一定的参考和指导意义,并为解决多属性决策问题提供了新的思路和方法. 展开更多
关键词 区间值直觉模糊集 邻域系统 β覆盖粗糙集 多属性决策
下载PDF
多粒度粒球粗糙集模型 被引量:1
19
作者 蒋珊珊 林国平 +1 位作者 林艺东 寇毅 《西北大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第2期197-208,共12页
基于粒球计算的粗糙集理论作为知识发现和数据挖掘的重要工具之一,已成功地应用于标记预测、属性约简等。而现有的粒球粗糙集模型仅仅是从单粒度出发,无法从多粒度角度对数据进行分析和处理,实际生活中仍有很多应用场景需从多粒度角度... 基于粒球计算的粗糙集理论作为知识发现和数据挖掘的重要工具之一,已成功地应用于标记预测、属性约简等。而现有的粒球粗糙集模型仅仅是从单粒度出发,无法从多粒度角度对数据进行分析和处理,实际生活中仍有很多应用场景需从多粒度角度进行思考。将粒球计算思想结合到多粒度粗糙集模型,提出了多粒度粒球粗糙集模型,并讨论了该模型的相关性质。该模型通过纯度的设定对数据进行粒球划分,能够有效地刻画数据之间的内在联系,以此设计多粒度粒球粗糙集的正域生成算法。实验分析表明该模型的可行性和有效性。 展开更多
关键词 粒球计算 粒球粗糙集 多粒度粗糙集 纯度
下载PDF
基于粗糙集的不完备谣言信息系统的知识获取与决策
20
作者 王标 卫红权 +2 位作者 王凯 刘树新 江昊聪 《信息安全学报》 CSCD 2024年第2期19-35,共17页
网络谣言可能扰乱人们的思想、心理和行为,引发社会震荡、危害公共安全,而微博等社交平台的广泛应用使得谣言造成的影响与危害变得更大,因此,谣言检测对于网络空间的有序健康发展具有重要的意义。当前谣言的自动检测技术更多关注检测模... 网络谣言可能扰乱人们的思想、心理和行为,引发社会震荡、危害公共安全,而微博等社交平台的广泛应用使得谣言造成的影响与危害变得更大,因此,谣言检测对于网络空间的有序健康发展具有重要的意义。当前谣言的自动检测技术更多关注检测模型的构建和输入数据的表现形式,而在改善数据质量以提高谣言识别效果方面的研究很少。基于此,本文将粗糙集理论应用于不完备谣言信息系统进行知识获取与决策,实质上是通过粗糙集理论解决不完备谣言信息系统的不确定性度量,冗余性以及不完备性等问题,以获得高质量的数据,改善谣言检测效果。首先系统总结了粗糙集理论中不确定性度量的方法,包括香农熵、粗糙熵、Liang熵以及信息粒度等四种不确定度量方法,并整理和推导了这四种不确定度量方法从完备信息系统到不完备信息系统的一致性拓展。基于上述总结的四种不确定度量方法,提出了基于最大相关最小冗余(MCMR,Maximum Correlation Minimum Redundancy)的知识约简算法。该方法基于熵度量方式,能够综合考量决策信息与冗余噪音,在UCI及Weibo等8个数据集上实验验证,结果表明本文算法优于几种基线算法,能够有效解决信息系统的冗余性。另外,提出了一种基于极大相容块的不完备决策树算法,在不同缺失程度数据上实验验证,结果表明本文算法能够有效解决信息系统的不完备性。 展开更多
关键词 谣言检测 粗糙集 不完备信息系统 最大相关最小冗余 极大相容块
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部