期刊文献+
共找到2,276篇文章
< 1 2 114 >
每页显示 20 50 100
HiSC:A Hybrid XML Index Composing Structure-Encoded with Cluster
1
作者 YANG Jincai ZHANG Lin 《Wuhan University Journal of Natural Sciences》 CAS 2007年第5期840-844,共5页
A new way of indexing and processing twig patterns in an XML documents is proposed in this paper. Every path in XML document can be transformed into a sequence of labels by Structure-Encoded that constructs a one-to-o... A new way of indexing and processing twig patterns in an XML documents is proposed in this paper. Every path in XML document can be transformed into a sequence of labels by Structure-Encoded that constructs a one-to-one correspondence between XML tree and sequence. Base on identifying characteristics of nodes in XML tree, the elements are classified and clustered. During query proceeding, the twig pattern is also transformed into its Structure-Encoded. By performing subsequence matching on the set of sequences in XML documents, all the occurrences of path in the XML documents are refined. Using the index, the numbers of elements retrieved are minimized. The search results with pertinent format provide more structure information without any false dismissals or false alarms. The index also supports keyword search Experiment results indicate the index has significantly efficiency with high precision. 展开更多
关键词 XML index structure cluster index region coding structure-encoded keyword search
下载PDF
An improved clustering analyzing algorithm for image index 被引量:2
2
作者 ZHANG Lin LI Xiao-ping ZHONG Ying 《通讯和计算机(中英文版)》 2009年第6期26-30,51,共6页
关键词 图像索引 计算机技术 聚类算法 遗传算法
下载PDF
AN ANALYSIS OF THE APPLICABILITY OF FUZZY CLUSTERING IN ESTABLISHING AN INDEX FOR THE EVALUATION OF METEOROLOGICAL SERVICE SATISFACTION 被引量:1
3
作者 YAN Min-hui YAO Xiu-ping +2 位作者 WANG Lei JIANG Li-xia ZHANG Jin-feng 《Journal of Tropical Meteorology》 SCIE 2020年第1期103-110,共8页
An evaluation index is a prerequisite for the scientific evaluation of a public meteorological service.This paper aims to explore a technical method for determining and screening evaluation indicators.Based on public ... An evaluation index is a prerequisite for the scientific evaluation of a public meteorological service.This paper aims to explore a technical method for determining and screening evaluation indicators.Based on public satisfaction survey data obtained in Wafangdian,China in 2010,this study investigates the suitability of fuzzy clustering analysis method in establishing an evaluation index.Through quantitative analysis of multilayer fuzzy clustering of various evaluation indicators,correlation analysis indicates that if the results of clustering were identical for two evaluation indicators in the same sub-evaluation layer,then one indicator could be removed,or the two indicators merged.For evaluation indicators in different sub-evaluation layers,although clustering reveals attribute correlations,these indicators may not be substituted for one another.Analysis of the applicability of the fuzzy clustering method shows that it plays a certain role in the establishment and correction of an evaluation index. 展开更多
关键词 evaluation index multilayer fuzzy clustering analysis range transformation transitional closure method
下载PDF
CDV Index: A Validity Index for Better Clustering Quality Measurement
4
作者 Jian-Hua Yeh Fei-Jie Joung Jia-Chi Lin 《Journal of Computer and Communications》 2014年第4期163-171,共9页
In this paper, a cluster validity index called CDV index is presented. The CDV index is capable of providing a quality measurement for the goodness of a clustering result for a data set. The CDV index is composed of t... In this paper, a cluster validity index called CDV index is presented. The CDV index is capable of providing a quality measurement for the goodness of a clustering result for a data set. The CDV index is composed of three major factors, including a statistically calculated external diameter factor, a restorer factor to reduce the effect of data dimension, and a number of clusters related punishment factor. With the calculation of the product of the three factors under various number of clusters settings, the best clustering result for some number of clusters setting is able to be found by searching for the minimum value of CDV curve. In the empirical experiments presented in this research, K-Means clustering method is chosen for its simplicity and execution speed. For the presentation of the effectiveness and superiority of the CDV index in the experiments, several traditional cluster validity indexes were implemented as the control group of experiments, including DI, DBI, ADI, and the most effective PBM index in recent years. The data sets of the experiments are also carefully selected to justify the generalization of CDV index, including three real world data sets and three artificial data sets which are the simulation of real world data distribution. These data sets are all tested to present the superior features of CDV index. 展开更多
关键词 cluster Validity index UNSUPERVISED Learning K-Means clustering INTRA cluster COMPACTNESS Inter cluster Dispersedness
下载PDF
Detection and Mapping of Water Quality Variation in the Godavari River Using Water Quality Index, Clustering and GIS Techniques
5
作者 Indrani Gupta Awkash Kumar +1 位作者 Chandrakant Singh Rakesh Kumar 《Journal of Geographic Information System》 2015年第2期71-84,共14页
The objective of this research is to develop a tool for planning and managing the water quality of River Godavari. This is achieved by classifying the pollution levels of Godavari River into several categories using w... The objective of this research is to develop a tool for planning and managing the water quality of River Godavari. This is achieved by classifying the pollution levels of Godavari River into several categories using water quality index and a clustering approach that ensure simple but accurate information about the pollution levels and water characteristics at any point in Godavari River in Maharashtra. The derived water quality indices and clusters were then visualized by using a Geographical Information System to draw thematic maps of Godavari River, thus making GIS as a decision support system. The obtained maps may assist the decision makers in managing and controlling pollution in the Godavari River. This also provides an effective overview of those spots in the Godavari River where intensified monitoring activities are required. Consequently, the obtained results make a major contribution to the assessment of the State’s water quality monitoring network. Three significant groups (less polluted, moderately and highly polluted sites) were detected by Cluster Analysis method. The results of Discriminant Analysis revealed that five parameters?i.e.?pH, Dissolved Oxygen (DO), Faecal Coliform (FC), Total Coliform (TC) and Ammonical Nitrogen (NH3-N) were necessary for analysis in spatial variation. Using discriminant function developed in the analysis, 100% of the original sites were correctly classified. 展开更多
关键词 GIS Water Quality index cluster ANALYSIS DISCRIMINANT ANALYSIS
下载PDF
Presentation of a multi-index clustering technique for the mathematical programming of block-cave scheduling
6
作者 Farshad Nezhadshahmohammad Yashar Pourrahimian Hamid Aghababaei 《International Journal of Mining Science and Technology》 SCIE EI CSCD 2018年第6期941-950,共10页
Long-term planning is one of the most important stages that determines the distribution of cash flows over the mine life and the feasibility of the project. However, it is not feasible in block caving to generate a pr... Long-term planning is one of the most important stages that determines the distribution of cash flows over the mine life and the feasibility of the project. However, it is not feasible in block caving to generate a production schedule that will provide optimal operating strategies without considering geotechnical constraints. This paper develops a mixed-integer linear programming(MILP) model to optimize the extraction sequence of drawpoints over multiple time horizons of block-cave mines with respect to the draw control systems. A multi-similarity index clustering technique to solve the MILP model in a reasonable time is also presented. Application and comparison of production scheduling based on the draw control system and clustering technique are illustrated using 325 drawpoints over 15 periods. The results show a significant reduction in the size of the MILP model, and in the time required to solve it. 展开更多
关键词 PRODUCTION SCHEDULING Block-cave mining Multi-similarity index clustering DRAW control system PRODUCTION rate curve
下载PDF
Application of Principal Component Analysis, Cluster Analysis, Pollution Index and Geoaccumulation Index in Pollution Assessment with Heavy Metals from Gold Mining Operations, Tanzania
7
作者 Caren Anatory Kahangwa 《Journal of Geoscience and Environment Protection》 2022年第4期303-317,共15页
Gold mining is now widely acknowledged as one of the significant sources of soil pollution in developed countries. In developing countries, the sources and levels of soil contamination have not been thoroughly address... Gold mining is now widely acknowledged as one of the significant sources of soil pollution in developed countries. In developing countries, the sources and levels of soil contamination have not been thoroughly addressed. Thus, this study was intended to determine the source of soil pollution and the level of contamination in the active and closed gold mining areas. The research paper presents the pollution load of heavy metals (lead-Pb, chromium-Cr, cadmium-Cd, copper-Cu, arsenic-As, manganese-Mn, and nickel-Ni) in 90 soil samples collected from the studied sites. Multivariate statistical analysis, including Principal Component Analysis (PCA) and Cluster Analysis (CA), coupled with correlation coefficient analysis, was performed to determine the possible sources of pollution in the study areas. The results indicated that Pb, Cr, Cu and Mn come from different sources than Cd, As and Ni. The results obtained from the metal pollution assessment using the Pollution Index (PI) and the Geoaccumulation Index (Igeo) confirmed that soils in the mining areas were contaminated in the range from moderately through strongly to highly contaminated soils. This study verified that soil contamination in the gold mining areas results from natural and anthropogenic processes. The current study findings would enhance our knowledge regarding the soil contamination level in the mining areas and the source of contamination. It is recommended to use PCA, CA, PI and Igeo to assess and monitor the heavy metal contaminated soil in gold mining areas. 展开更多
关键词 Heavy Metals Contamination Principal Component Analysis cluster Analysis Pollution index Geoaccumulation index
下载PDF
基于大数据聚类的通信网络安全态势预测技术 被引量:6
8
作者 陈功平 王红 《淮阴师范学院学报(自然科学版)》 CAS 2024年第1期20-26,共7页
传统通信网络安全态势预测技术缺乏大数据支撑,难以对发生的攻击进行详细分类和追踪,导致在进行长时间的态势预测中收敛过慢,准确度降低.提出一种基于大数据聚类的通信网络安全态势预测技术.分析通信网络的属性以及特点,选择安全态势描... 传统通信网络安全态势预测技术缺乏大数据支撑,难以对发生的攻击进行详细分类和追踪,导致在进行长时间的态势预测中收敛过慢,准确度降低.提出一种基于大数据聚类的通信网络安全态势预测技术.分析通信网络的属性以及特点,选择安全态势描述一级指标,将数据标准化处理之后,细分出二级指标;优化大数据聚类算法,计算最优聚类数量、确定聚类中心,建立关联规则库并优化预测流程,完成基于大数据聚类的通信网络安全态势预测技术的设计.通过实验结果表明,与两种传统的安全态势预测技术相比,设计的技术收敛速度更快,全体数据点没有出现残差扩散的现象,并且数据完整度较高. 展开更多
关键词 大数据聚类 通信网络 安全态势 描述指标 聚类优化 收敛速度
下载PDF
贝塞尔涡旋光束经水下气泡幕传输衰减特性研究
9
作者 董康军 程明建 +1 位作者 张修兴 雷前召 《渭南师范学院学报》 2024年第11期88-94,共7页
利用涡旋光束与水下气泡的相互作用,可以实现对水下航行体的快速、准确探测和跟踪,基于贝塞尔涡旋光束经过球形粒子散射Mie理论,并通过等效折射率的方法,研究了贝塞尔涡旋光束与微小气泡的相互作用规律。在考虑洁净水的吸收、散射作用... 利用涡旋光束与水下气泡的相互作用,可以实现对水下航行体的快速、准确探测和跟踪,基于贝塞尔涡旋光束经过球形粒子散射Mie理论,并通过等效折射率的方法,研究了贝塞尔涡旋光束与微小气泡的相互作用规律。在考虑洁净水的吸收、散射作用以及水下气泡散射作用的基础上,分析了不同光源参数下贝塞尔涡旋光束在水下气泡环境中的传输功率衰减。 展开更多
关键词 贝塞尔涡旋光束 气泡幕 折射率 散射 传输衰减
下载PDF
血清中的免疫炎症生物标志物与慢性湿疹病人的疾病严重程度相关性研究 被引量:1
10
作者 秦宗碧 李伶华 +4 位作者 蔡翔 邱百怡 王首帆 徐爱琴 朱立宏 《安徽医药》 CAS 2024年第6期1182-1186,共5页
目的探讨慢性湿疹病人血清免疫炎症生物标志物与疾病严重程度的相关性。方法将2021年9月至2022年8月于武汉市中医医院接受治疗的100例慢性湿疹病人纳入研究,包括局限性湿疹69例、泛发性湿疹31例;根据疾病严重程度分为轻度组37例、中度... 目的探讨慢性湿疹病人血清免疫炎症生物标志物与疾病严重程度的相关性。方法将2021年9月至2022年8月于武汉市中医医院接受治疗的100例慢性湿疹病人纳入研究,包括局限性湿疹69例、泛发性湿疹31例;根据疾病严重程度分为轻度组37例、中度组34例和重度组29例;将同期该院40例健康体检者纳入对照组。采用酶联免疫吸附测定检测血清免疫炎症生物标志物白细胞介素(IL)-2、IL-4、IL-5、IL-6、γ干扰素(IFN-γ)、IL-10、IL-17、IL-18、IL-23、IL-33、肿瘤坏死因子α(TNF-α)水平;采用流式细胞仪检测外周血分化抗原(CD)4+、CD8+水平;采用Pearson相关分析慢性湿疹病人血清免疫炎症生物标志物与湿疹面积及严重度指数(EASI)评分的相关性。结果对照组、轻度组、中度组、重度组慢性湿疹病人血清IL-2[(10.51±2.10)μg/L比(12.94±2.26)μg/L比(15.03±2.34)μg/L比(17.94±2.56)μg/L]、IL-4、IL-5、IL-6、IL-10、IL-17、IL-18、IL-23、IL-33、TNF-α、IFN-γ、CD8+依次升高,CD4+[(43.24±6.79)%比(37.04±4.25)%比(29.12±2.78)%比(25.62±2.35)%]依次降低(P<0.05)。局限性与泛发性慢性湿疹病人血清IL-2、IL-4、IL-5、IL-6、IL-10、IL-17、IL-18、IL-23、IL-33、TNF-α、IFN-γ、CD4+、CD8+差异无统计学意义(P>0.05)。慢性湿疹病人EASI评分与血清IL-2、IL-4、IL-5、IL-6、IL-10、IL-17、IL-18、IL-23、IL-33、TNF-α、IFN-γ、CD8+呈正相关,与CD4+呈负相关(P<0.05)。结论血清免疫炎症生物标志物与慢性湿疹病人病情严重程度存在显著相关性,可考虑将各指标作为病情评估的相关辅助指标,在临床中推广应用。 展开更多
关键词 湿疹 免疫 炎症 分化抗原 严重度指数
下载PDF
产业集群对中国服装出口韧性的影响及空间溢出效应研究 被引量:2
11
作者 刘璐 肖伟斌 +1 位作者 李宇 许磊 《中国商论》 2024年第10期7-11,共5页
在服装产业领域,产业集群现象尤为突出,已成为我国服装制造业发展的主要模式。随着全球化进程的不断深入,出口结构及其对产业韧性的影响成为研究的焦点。本文运用中国服装产品出口数据,从需求侧出发,深入探讨了服装产业集聚对出口韧性... 在服装产业领域,产业集群现象尤为突出,已成为我国服装制造业发展的主要模式。随着全球化进程的不断深入,出口结构及其对产业韧性的影响成为研究的焦点。本文运用中国服装产品出口数据,从需求侧出发,深入探讨了服装产业集聚对出口韧性的影响机制。实证结果发现:产业集群与短期服装出口韧性负相关,且这一结果能够通过多种稳健性检验;进一步拓展空间杜宾模型发现,产业集群在区域经济发展中具有复杂的影响机制,产业集群虽然抑制了本土的短期服装出口韧性,但促进了周边地区的短期服装出口韧性。基于此,本文提出政府应实时调控,抵御外生冲击;通过建立区域内的风险共享机制,实现由竞争向协作和互惠的转变,以期持续推进区域经济一体化进程,构建区域风险共担机制,防范新时期外部冲击风险。 展开更多
关键词 服装出口韧性 产业集群 需求侧 区位熵指数 外部冲击风险
下载PDF
“油-稻-稻”三熟制早熟冬油菜氮高效基因型及鉴定指标筛选
12
作者 钱银飞 邱才飞 +5 位作者 彭春瑞 邹小云 姚易根 裴润根 刘根如 杨文孙 《江西农业大学学报》 CAS CSCD 北大核心 2024年第4期830-840,共11页
【目的】旨在筛选适宜“油-稻-稻”三熟制的氮高效早熟冬油菜基因型及其简易筛选指标。【方法】利用田间小区试验,选用了生育期185 d以下的的适宜“油-稻-稻”三熟制种植的14种早熟冬油菜基因型,进行正常施氮(N_(1))和不施氮(N_(0))处... 【目的】旨在筛选适宜“油-稻-稻”三熟制的氮高效早熟冬油菜基因型及其简易筛选指标。【方法】利用田间小区试验,选用了生育期185 d以下的的适宜“油-稻-稻”三熟制种植的14种早熟冬油菜基因型,进行正常施氮(N_(1))和不施氮(N_(0))处理。根据不同冬油菜基因型氮肥利用率(NUE)的差异,利用树状聚类分析进行分类,形成高、中、低3种氮效率基因型。同时通过逆向溯源的方法,观察分析3种氮效率基因型在不同氮水平条件下的产量构成、主要农艺性状、干物质积累及氮素吸收等方面的表现特征。总结分析出氮高效冬油菜基因型的一些简易判断的指标。【结果】不同氮效率基因型冬油菜在产量形成、主要农艺性状等方面存在显著差异。N1处理下成熟期早熟冬油菜的主要农艺性状的表型值和变异系数基本表现大于N0处理。因此,以N1处理下不同基因型的农艺性状表现作为不同氮效率基因型的鉴别标准。N1处理下,氮高效基因型比氮中效和氮低效基因型产量高、单株角果数多、每角粒数多、株高高、主花序长、一级分枝数多、角果密度高、各部位干物质积累量高、籽粒中氮含量高、氮肥偏生产力、氮肥农学效率、氮肥生理利用率和氮收获指数均较高。【结论】沣油737是适合南方“油-稻-稻”三熟制的氮高效早熟冬油菜;正常施氮条件下,成熟期较多的单株角果数与每角粒数,以及较高株高是判断早熟冬油菜氮高效基因型的简易指标。 展开更多
关键词 油-稻-稻 三熟制 冬油菜 氮高效 树状聚类 筛选指标
下载PDF
中国典型城市交通出行特征及未来道路交通演变研究
13
作者 刘宗巍 张望 +1 位作者 陈铭 赵福全 《现代城市研究》 北大核心 2024年第1期107-113,共7页
为建立适合不同城市特点的交通体系,并明确定位汽车在其中承担的作用,文章首先从外部环境和交通工具两大维度出发,建立了表征城市整体交通出行情况的多层级评价体系;并基于一级指标的得分,对选取的9座中国典型城市的交通出行特征进行了... 为建立适合不同城市特点的交通体系,并明确定位汽车在其中承担的作用,文章首先从外部环境和交通工具两大维度出发,建立了表征城市整体交通出行情况的多层级评价体系;并基于一级指标的得分,对选取的9座中国典型城市的交通出行特征进行了聚类分析,确定了城市的不同类型;然后通过多元回归分析,识别了影响城市道路交通的主要因素;最后通过相关因素变化的情景假设,预测了各城市道路交通效率可能的演变情况,并提出了相关政策建议。 展开更多
关键词 城市交通出行 道路拥堵 评价指标体系 聚类分析 情景演变
下载PDF
中国乡村创新创业发展:指数构建与测度分析 被引量:1
14
作者 阮建青 杨奇明 +1 位作者 叶武威 张雨薇 《经济与管理》 CSSCI 北大核心 2024年第5期9-18,共10页
鼓励乡村创新创业是推进乡村振兴战略的重要抓手,但尚未有科学严谨的研究全面揭示中国乡村创新创业的发展程度和时空特征。通过构建包括2个一级指标、7个二级指标和21个三级指标的乡村创新创业指标体系,计算2014—2021年中国县、市、省... 鼓励乡村创新创业是推进乡村振兴战略的重要抓手,但尚未有科学严谨的研究全面揭示中国乡村创新创业的发展程度和时空特征。通过构建包括2个一级指标、7个二级指标和21个三级指标的乡村创新创业指标体系,计算2014—2021年中国县、市、省级三个层面的乡村创新创业指数,并对其发展趋势、空间特征等展开分析。研究发现:中国乡村创新创业总体上蓬勃发展,但区域间存在差异;乡村振兴示范县的创新创业程度要显著高于其他县,国家重点帮扶县的创新创业增长速度要显著高于非重点帮扶县;乡村创新创业活动存在明显的空间集聚现象,同时也表现出区域收敛的趋势。乡村创新创业指数已向社会开放,将为各界研究中国乡村创新创业提供基础性数据。 展开更多
关键词 乡村创新创业 指标体系 空间集聚 区域收敛 重点帮扶县
下载PDF
配电网监测数据索引集群的分布缓存方法
15
作者 屈志坚 吴广龙 +1 位作者 帅诚鹏 梁家敏 《电力系统及其自动化学报》 CSCD 北大核心 2024年第1期53-60,共8页
针对配电网监测数据急剧增加导致配电网监控系统响应时间过长的问题,本文提出一种热点数据部分链表分布缓存方法。首先,引入缓存技术并分析原有热点数据链表缓存方法的局限性,提出一种新的缓存方法以提高缓存管理效率;然后,设计预热查... 针对配电网监测数据急剧增加导致配电网监控系统响应时间过长的问题,本文提出一种热点数据部分链表分布缓存方法。首先,引入缓存技术并分析原有热点数据链表缓存方法的局限性,提出一种新的缓存方法以提高缓存管理效率;然后,设计预热查询实现索引系统的热启动从而提高索引系统的缓存命中率;最后,以配电网监测数据为算例,验证所提方法的效果。测试结果表明,所提出的缓存方法及设计的预热查询能在不同查询条件下大幅减少索引集群的查询时间,有效提高配电网监测数据索引集群的查询效率。 展开更多
关键词 大数据 配电网监测数据 分布式缓存 索引集群
下载PDF
中国创新型产业集群创新效率评价与空间格局分析 被引量:1
16
作者 张伟 肖钧馨 《沧州师范学院学报》 2024年第1期27-35,117,共10页
基于DEA-BCC模型和Malmquist指数模型,从静态和动态两方面对我国创新型产业集群创新效率进行综合评价,研究结果表明:我国创新型产业集群创新效率水平有所下降,仍有较大进步空间,且存在两极分化的现象.较多省(区、市)处于纯技术有效规模... 基于DEA-BCC模型和Malmquist指数模型,从静态和动态两方面对我国创新型产业集群创新效率进行综合评价,研究结果表明:我国创新型产业集群创新效率水平有所下降,仍有较大进步空间,且存在两极分化的现象.较多省(区、市)处于纯技术有效规模无效的DEA弱有效状态,存在投入产出不匹配问题.考察期内全要素生产率变化指数整体呈“N”型上升趋势,主要得益于技术进步的拉动作用,纯技术效率与规模效率共同起了阻碍作用.区域间及区域内创新型产业集群发展存在不平衡性,东部地区增长最快;其次为西部地区,中部、东北相对落后.从空间分布看,全国创新型产业集群创新效率表现出由南北向内陆逐步递减的分布格局,创新效率较高的省(区、市)成片分布在东南、西南、西北地区,空间非均衡性呈现出先缩小后扩大的趋势. 展开更多
关键词 创新型产业集群 BCC模型 MALMQUIST指数 空间格局
下载PDF
基于BIRCH聚类的航空器自主运行风险状态评价
17
作者 张洪海 沈雪 +3 位作者 瞿昕宜 张世佳 张纵驰 唐思嘉 《中国安全生产科学技术》 CAS CSCD 北大核心 2024年第9期188-196,共9页
为解决自主运行模式下航空器风险评价指标缺失和风险状态实时评估困难等问题,提出1种自主运行模式下航空器风险状态评价方法。从航空器冲突、气象规避区侵入、操纵裕度3个方面建立风险状态评价指标体系,运用BIRCH算法建立聚类特征树对... 为解决自主运行模式下航空器风险评价指标缺失和风险状态实时评估困难等问题,提出1种自主运行模式下航空器风险状态评价方法。从航空器冲突、气象规避区侵入、操纵裕度3个方面建立风险状态评价指标体系,运用BIRCH算法建立聚类特征树对多维航空器特征样本进行风险模型训练,引入增量式聚类的概念,更新特征树,实时评估动态目标航空器的风险状态。然后,以广州05扇区为运行场景展开仿真实验。研究结果表明:所提方法准确度达99.5%,平均计算时间约为0.0249 s。研究结果可有效支撑自主运行理念实施,提高风险预警能力,保障航空器自主运行安全。 展开更多
关键词 航空运输 自主运行 风险状态指标 BIRCH聚类
下载PDF
一种融合乌鸦搜索算法的K-means聚类算法
18
作者 高海宾 《新乡学院学报》 2024年第3期19-25,共7页
传统的K-均值聚类算法(K-means)对初始聚类中心的选择敏感,容易陷入局部最优解,并且需要预先设定聚类数量K,这在实际操作中往往难以实现。为了解决这些问题,提出了一种融合乌鸦搜索算法的K-means聚类算法。该算法利用乌鸦搜索算法的全... 传统的K-均值聚类算法(K-means)对初始聚类中心的选择敏感,容易陷入局部最优解,并且需要预先设定聚类数量K,这在实际操作中往往难以实现。为了解决这些问题,提出了一种融合乌鸦搜索算法的K-means聚类算法。该算法利用乌鸦搜索算法的全局搜索能力,自动确定最佳的聚类数目K,从而提高聚类的质量和效率。通过在Seeds数据集进行实验计算卡林斯基-哈拉巴斯(Calinski-Harabasz)指数等评价指标,发现该算法聚类效果明显优于传统的K-means算法。 展开更多
关键词 K-MEANS算法 乌鸦搜索算法 聚类 Calinski-Harabasz指数
下载PDF
编制价格指数的爬虫数据抽样方法研究
19
作者 雷兵 梁凯凯 刘维 《统计与决策》 CSSCI 北大核心 2024年第12期24-28,共5页
文章针对全量爬虫数据编制价格指数成本高的问题,提出了一种抽样方法。该方法采用“大数据—小数据”思想,在基期通过网络爬虫技术全量抓取电商平台的商品交易数据,形成抽样框;在连续性调查中采用抽样技术,根据分层抽样思想,运用聚类算... 文章针对全量爬虫数据编制价格指数成本高的问题,提出了一种抽样方法。该方法采用“大数据—小数据”思想,在基期通过网络爬虫技术全量抓取电商平台的商品交易数据,形成抽样框;在连续性调查中采用抽样技术,根据分层抽样思想,运用聚类算法及其轮廓系数实现总体数据分层,并通过不等概率随机抽样获取各层代表性样本;考虑到连续性调查中入选样本存在无回答现象,提出正式和备选样本思路,针对每个正式样本,采用最近邻匹配法挑选若干个备选样本,当正式样本无回答时,以备选样本作为替补来完成价格指数编制。以天猫商城粮油品类为例进行验证,结果表明:在抓取的数据中,基期全量爬虫数据有18351条,第2—8期连续性调查的平均抽样比为10.18%,抽样的平均相对误差为0.59%,说明该方法是可行的。 展开更多
关键词 价格指数 爬虫数据 分层抽样 聚类算法 样本匹配
下载PDF
基于改进FCM聚类的光伏电站出力场景特性研究 被引量:1
20
作者 苗璐 樊玮 +3 位作者 肖红燕 刘宇 陈德扬 张勇军 《广东电力》 北大核心 2024年第3期1-11,共11页
为提高新型电力系统的运行安全可靠性,需要对光伏电站的出力特性进行量化评估,并从高不确定性的众多发电场景中掌握光伏电站的运行规律。为此,基于场景聚类和缩减原理对光伏出力进行分析。首先提出光伏出力特性的评价指标,包括波动性和... 为提高新型电力系统的运行安全可靠性,需要对光伏电站的出力特性进行量化评估,并从高不确定性的众多发电场景中掌握光伏电站的运行规律。为此,基于场景聚类和缩减原理对光伏出力进行分析。首先提出光伏出力特性的评价指标,包括波动性和出力效率2个一级指标和相应的二级指标;然后采用模糊C均值(fuzzy C-means,FCM)聚类算法,基于密度思想和距离最大、最小原则确定初始聚类中心,通过不断迭代得到不同场景下光伏出力的聚类结果。考虑到传统聚类算法存在局部收敛性,难以确定最优聚类数目,提出结合聚类有效性指标来确定聚类最优数目,进而采用基于概率距离的前推回代法对得到的聚类结果进行场景削减,最终得到光伏电站季节典型出力场景。最后基于广东省某光伏电站实际出力数据进行分析,验证所提指标和算法的有效性。 展开更多
关键词 光伏出力场景 聚类算法 场景缩减 FCM算法 聚类指标
下载PDF
上一页 1 2 114 下一页 到第
使用帮助 返回顶部