大数据环境下多决策表的区间值全局近似约简被引量：22

Approaches to Approximate Reduction with Interval-Valued Multi-Decision Tables in Big Data

下载PDF

导出

摘要在电力大数据中,很多具体的应用如负荷预测、故障诊断都需要依据一段时间内的数据变化来判断所属类别,对某一条数据进行类别判定是毫无意义的.基于此,将区间值粗糙集引入到大数据分类问题中,分别从代数观和信息观提出了基于属性依赖度和基于互信息的区间值启发式约简相关定义和性质证明,并给出相应算法,丰富和发展了区间值粗糙集理论,同时为大数据的分析研究提供了思路.针对大数据的分布式存储架构,又提出了多决策表的区间值全局约简概念和性质证明,进一步给出多决策表的区间值全局约简算法.为了使得算法在实际应用中取得更好的效果,将近似约简概念引入所提的3种算法中,通过对2012上半年某电厂一台600MW的机组运行数据进行稳态判定,验证所提算法的有效性.实验结果表明,所提的3种算法均能在保持较高分类准确率的条件下从对象和属性个数两方面对数据集进行大幅度缩减,从而为大数据的进一步分析处理提供支撑. For the big data on electric power, many specific applications, such as load forecasting and fault diagnosis, need to consider data changes during a period of time to determine their decision classes, as deriving a class label of only one data record is meaningless. Based on the above discussion, interval-valued rough set is introduced into big data classification. Employing algebra and information theory, this paper defines the related concepts and proves the properties for interval-valued reductions based on dependency and mutual information, and presents the corresponding heuristic reduction algorithms. The proposed methods can not only enrich and develop the interval-valued rough set theory, but also provide a new way for the analysis of big data. Pertaining to the distributed data storage architecture of big data, this paper further proposes the interval-valued global reduction in multi-decision tables with proofs of its properties. The corresponding algorithm is also given. In order for the algorithms to achieve better results in practical applications, approximate reduction is introduced. To evaluate three proposed algorithms, it uses six months’ operating data of one 600MW unit in some power plant. Experimental results show that the three algorithms proposed in this article can maintain high classification accuracy with the proper parameters, and the numbers of objects and attributes can both be greatly reduced.

作者徐菲菲雷景生毕忠勤苗夺谦杜海舟

机构地区上海电力学院计算机科学与技术学院同济大学电子与信息工程学院

出处《软件学报》 EI CSCD 北大核心 2014年第9期2119-2135,共17页 Journal of Software

基金国家自然科学基金(61272437 60305094) 上海市教育委员会科研创新项目(12YZ140 14YZ131) 上海市自然科学基金(13ZR1417500)

关键词大数据区间值近似约简多决策表全局约简 big data interval-value approximate reduction multi-decision tables global reduction

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献18

1李国杰,程学旗.大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考[J].中国科学院院刊,2012,27(6):647-657. 被引量：1606
2张楠,苗夺谦,岳晓冬.区间值信息系统的知识约简[J].计算机研究与发展,2010,47(8):1362-1371. 被引量：51
3王珊,王会举,覃雄派,周烜.架构大数据:挑战、现状与展望[J].计算机学报,2011,34(10):1741-1752. 被引量：616
4郭庆,刘文军,焦贤发,吴磊.一种基于模糊聚类的区间值属性约简算法[J].模糊系统与数学,2013,27(1):149-153. 被引量：7
5王元卓,靳小龙,程学旗.网络大数据:现状与展望[J].计算机学报,2013,36(6):1125-1138. 被引量：714
6龚伟林,李德玉,王素格,程利涛.基于模糊区分矩阵的区间值信息系统属性约简[J].山西大学学报（自然科学版）,2011,34(3):381-387. 被引量：3
7杨明,杨萍.垂直分布多决策表下基于条件信息熵的近似约简[J].控制与决策,2008,23(10):1103-1108. 被引量：10
8陈子春,秦克云.区间值信息系统基于极大相容类的属性约简[J].模糊系统与数学,2009,23(6):126-132. 被引量：4
9孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,50(1):146-169. 被引量：2393
10申德荣,于戈,王习特,聂铁铮,寇月.支持大数据管理的NoSQL系统研究综述[J].软件学报,2013,24(8):1786-1803. 被引量：194

二级参考文献577

1庞发虎,庞振凌,杜瑞卿.粗糙集理论对湖泊生态系统健康评定指数法的评价[J].生物数学学报,2008,23(2):337-344. 被引量：4
2王明慧.粗糙集理论在铁路行车调度指挥系统中应用的研究[J].中国铁道科学,2004,25(4):103-107. 被引量：13
3陈真诚,张锋,蒋大宗,倪利莉,王红艳.利用多分辨率分析的胸部X线数字图像粗糙集滤波增强[J].中国生物医学工程学报,2004,23(6):486-489. 被引量：7
4张文修,魏玲,祁建军.概念格的属性约简理论与方法[J].中国科学（E辑）,2005,35(6):628-639. 被引量：194
5黄兵,周献中.不一致决策表的分配序约简[J].南京理工大学学报,2005,29(3):360-362. 被引量：7
6胡峰,黄海,王国胤,吴渝.不完备信息系统的粒计算方法[J].小型微型计算机系统,2005,26(8):1335-1339. 被引量：18
7徐章艳,刘作鹏,杨炳儒,宋威.一个复杂度为max（O（｜C｜｜U｜），O（｜C^2｜U／C｜））的快速属性约简算法[J].计算机学报,2006,29(3):391-399. 被引量：234
8杨明.一种基于改进差别矩阵的核增量式更新算法[J].计算机学报,2006,29(3):407-413. 被引量：76
9胡圣武,郭增长,王新洲,陶本藻.论遥感数据的模糊不确定性及基于Rough集的处理方法[J].中国铁道科学,2006,27(2):132-136. 被引量：5
10王珏,苗夺谦,周育健.关于Rough Set理论与应用的综述[J].模式识别与人工智能,1996,9(4):337-344. 被引量：264

共引文献5749

1万瑞霖,杨言鑫(指导).大数据环境下的市场营销方式改革发展新方向[J].中外企业家,2020,0(16):83-83. 被引量：8
2韩莹莹,钟专,褚月娇,康春阳,李东霓,王志佳,刘晓阳,张白羽.基于大数据智能化背景下神经病学实践教学体系构建的探索[J].中国实验诊断学,2023,27(8):1006-1009.
3李坪.大数据赋权正当性证成[J].中山大学法律评论,2020(1):3-21. 被引量：1
4孙昊鹏.大数据在新冠肺炎疫情中的应用和缺失[J].郑州师范教育,2020,9(3):91-96. 被引量：1
5张刘玲.会展行业发展现状及未来发展趋势[J].质量与市场,2023(12):31-33. 被引量：2
6闫妍.刍议大数据时代背景下全面预算管理对提升项目储备精益化管理水平的价值[J].质量与市场,2020,0(1):19-21. 被引量：6
7李明建.试论大数据技术的图书馆特色馆藏文化建设[J].作家天地,2020(21):189-190.
8叶青.违法立案的检察监督机制研究[J].国家检察官学院学报,2024,32(1):53-68. 被引量：1
9张人戈,于平.运用信息技术改造传统产业正当时——大数据与实体经济融合的必要性分析[J].时代金融,2019,0(32):13-14.
10卢艺.数据治理在热轧边缘中的应用研究[J].冶金自动化,2023,47(S01):383-386. 被引量：1

同被引文献169

1于洪,杨显.微博中节点影响力度量与传播路径模式研究[J].通信学报,2012,33(S1):96-102. 被引量：27
2贾凡,薛佩军,许嘉.决策区间值信息系统的交互相容关系及属性约简[J].计算机科学,2012,39(S3):245-248. 被引量：2
3牟雁超,苏汉宸,程序,李红燕,王腾蛟.ASIC:一种适用于云数据管理的自适应辅助索引机制[J].计算机研究与发展,2013,50(S1):352-360. 被引量：1
4韩益亮,卢万谊,武光明,杨晓元.适用于网络大数据的属性基广义签密方案[J].计算机研究与发展,2013,50(S2):23-29. 被引量：2
5李凡,徐章艳,饶勇.Vague集[J].计算机科学,2000,27(9):12-14. 被引量：34
6仇国芳,陈劲.模糊信息系统属性重要性度量[J].模糊系统与数学,2006,20(1):123-127. 被引量：6
7徐伟华,张文修.基于优势关系下不协调目标信息系统的知识约简[J].计算机科学,2006,33(2):182-184. 被引量：43
8张文修,徐宗本,梁怡,梁广锡.包含度理论[J].模糊系统与数学,1996,10(4):1-9. 被引量：49
9王加阳,陈松乔,罗安.粗集动态约简研究[J].小型微型计算机系统,2006,27(11):2056-2060. 被引量：13
10邓大勇,黄厚宽,李向军.不一致决策系统中约简之间的比较[J].电子学报,2007,35(2):252-255. 被引量：28

引证文献22

1刘承良.网络大数据的现状与展望[J].中国管理信息化,2015,18(12):186-188. 被引量：7
2孙彬.计算机物流服务的约简与优势发现[J].物流技术,2015,34(13):262-265.
3丁卫平,陈森博,王杰华,管致锦.基于云计算的多层量子精英属性协同约简算法[J].四川大学学报（工程科学版）,2015,47(6):97-103. 被引量：1
4宋雨,焦谱,李刚.大数据预处理中属性约简的特性保持分析[J].计算机测量与控制,2015,23(12):4191-4194. 被引量：7
5李刚,焦谱,文福拴,宋雨,尚金成,何洋.基于偏序约简的智能电网大数据预处理方法[J].电力系统自动化,2016,40(7):98-106. 被引量：34
6任艳.微信息大数据粗糙集的近似约简[J].沈阳工业大学学报,2016,38(3):309-313. 被引量：4
7张倩倩,孟慧丽,徐久成.Vague决策系统属性约简算法研究[J].小型微型计算机系统,2016,37(7):1542-1545.
8李刚,杨立业,刘福炎,俞敏,宋雨,文福拴.能源互联网关联数据融合的互信息方法[J].电力建设,2016,37(9):22-29. 被引量：9
9武友新,李文晶,钟子岳.基于属性值集合链的粗糙集快速属性约简算法[J].计算机工程与设计,2016,37(11):2967-2970.
10丁卫平,王建东,张晓峰,管致锦.Co-evolutionary cloud-based attribute ensemble multi-agent reduction algorithm[J].Journal of Southeast University(English Edition),2016,32(4):432-438.

二级引证文献96

1钟庆,陈伟坤,许中,崔晓飞,刘峰,王钢,汪隆君.设备故障统计数据与电能质量监测数据的关联分析[J].电力电容器与无功补偿,2016,37(6):29-34. 被引量：12
2邓松,岳东,朱力鹏,胡斌,周爱华.电力大数据智能化高效分析挖掘技术框架[J].电子测量与仪器学报,2016,30(11):1679-1686. 被引量：46
3王钦,蒋怀光,文福拴,梅天华.智能电网中大数据的概念、技术与挑战[J].电力建设,2016,37(12):1-10. 被引量：40
4李刚,焦亚菲,刘福炎,俞敏,宋雨,文福拴.联合采用熵权和灰色系统理论的电力大数据质量综合评估[J].电力建设,2016,37(12):24-31. 被引量：28
5李杨,刘伟佳,文福拴,董朝阳,郑宇,张睿.电转气设备与燃气机组的联合竞价策略[J].电力系统自动化,2017,41(1):9-17. 被引量：12
6刘敦楠,唐天琦,赵佳伟,叶彬,马静,王宝,杨敏.能源大数据信息服务定价及其在电力市场中的应用[J].电力建设,2017,38(2):52-59. 被引量：23
7王芃,刘伟佳,林振智,文福拴,董朝阳,郑宇,张睿.基于场景分析的风电场与电转气厂站协同选址规划[J].电力系统自动化,2017,41(6):20-29. 被引量：35
8陈衡.大数据约简技术应用研究[J].信息技术与信息化,2017(3):99-101.
9左剑,向萌,张可人,胡迪军,邓小亮,蔡如昕,张瑞.基于云计算平台Hadoop的线路参数并行辨识算法研究[J].湖南电力,2017,37(3):7-10.
10李刚,张建付,文福拴,宋雨.计及信息不确定性的风电机组健康状态实时评估方法[J].电力系统自动化,2017,41(18):111-117. 被引量：11

1郭亚军,王春震,张发明,邹家兴.一种基于部分样本类别判定的聚类分析方法[J].东北大学学报（自然科学版）,2009,30(7):1051-1054. 被引量：2
2许强,马登武.基于物体特征轮廓的单类判别方法[J].计算机辅助设计与图形学学报,2014,26(6):932-938.
3张林,张建立.基于类别属性数学期望的分类算法[J].安庆师范学院学报（自然科学版）,2013,19(1):31-34. 被引量：1
4刘晨,袁和金,游朗.一种智能家居系统中的室温曲线自动判定方法[J].电脑编程技巧与维护,2016(16):85-87.
5李德毅,刘常昱,淦文燕.正态云模型的重尾性质证明[J].中国工程科学,2011,13(4):20-23. 被引量：25
6袁晓月,黎爽.归纳证明在类型理论中的应用研究[J].江西科学,2015,33(2):248-253.
7张剑飞,杜晓昕,王波.基于量子萤火虫和增益Beta的医学DR图像自适应增强[J].微电子学与计算机,2014,31(5):135-139. 被引量：7
8刘海峰,姚泽清,刘守生,苏展.基于聚类降维的改进KNN文本分类[J].微计算机信息,2010,26(3):18-20. 被引量：2
9刘海峰,王元元,姚泽清,陈琦.文本分类中一种基于选择的二次特征降维方法[J].情报学报,2009,28(1):23-27. 被引量：8
10高文利.基于本体的军备情报抽取系统的设计与实现[J].现代图书情报技术,2010(1):83-87. 被引量：2

软件学报

2014年第9期

浏览历史

内容加载中请稍等...

大数据环境下多决策表的区间值全局近似约简被引量：22

参考文献18

二级参考文献577

共引文献5749

同被引文献169

引证文献22

二级引证文献96

相关作者

相关机构

相关主题

浏览历史

大数据环境下多决策表的区间值全局近似约简 被引量：22

参考文献18

二级参考文献577

共引文献5749

同被引文献169

引证文献22

二级引证文献96

相关作者

相关机构

相关主题

浏览历史

大数据环境下多决策表的区间值全局近似约简被引量：22