期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
基于MPI的并行大数据集生成器
1
作者 葛旭冉 刘洋 +1 位作者 陈志广 肖侬 《计算机工程与科学》 CSCD 北大核心 2022年第7期1152-1161,共10页
大数据处理分析算法在优化研究过程中,速度常常受限于数据集的规模。在数据集体量不足时,算法的通信时间往往要高于真正的计算时间,无法验证真实的效果。故设计实现了一个大数据集生成器,为运行在超级计算机上的并行大数据处理分析算法... 大数据处理分析算法在优化研究过程中,速度常常受限于数据集的规模。在数据集体量不足时,算法的通信时间往往要高于真正的计算时间,无法验证真实的效果。故设计实现了一个大数据集生成器,为运行在超级计算机上的并行大数据处理分析算法提供基准测试数据集。首先,使用MPI并行编程技术构造了一个并行随机数生成器,在此基础上设计实现了可控制规模及复杂性的人工数据集,主要包括:分类和聚类数据集、回归数据集、流形学习数据集和因子分解数据集等。其次,设计了大数据集生成器的I/O系统,提供MPI-I/O并行读、写数据集的接口,并设置了数据集在不同进程间的分发、映射规则,通过点对点通信实现不同节点之间的数据交互。实验结果表明,并行大数据集生成器有效提高了数据生成效率和生成规模,为并行大数据处理分析算法提供了高质量、大体量的测试数据集。 展开更多
关键词 MPI 数据集生成 I/O系统 并行大数据处理算法 算法测试
下载PDF
基于蜕变关系的贝叶斯分类器测试数据集生成器的设计与实现
2
作者 贾明华 徐月 王晓东 《数字技术与应用》 2019年第5期166-167,共2页
蜕变测试方法是一种科学有效的软件测试方法,数据集的生成是人们一直以来的研究重点,本文提出了一种基于蜕变关系的贝叶斯分类器测试数据集生成器。该工具首先将数据集作为输入;其次,依次按照不同的蜕变关系对数据集进行蜕变;最后,输出... 蜕变测试方法是一种科学有效的软件测试方法,数据集的生成是人们一直以来的研究重点,本文提出了一种基于蜕变关系的贝叶斯分类器测试数据集生成器。该工具首先将数据集作为输入;其次,依次按照不同的蜕变关系对数据集进行蜕变;最后,输出各个衍生的数据集。该工具实现了针对贝叶斯分类器的测试数据集生成器,提高了贝叶斯分类器测试数据的生成效率,并解决了数据集数量少且质量不高问题。 展开更多
关键词 蜕变关系 贝叶斯分类器 数据集生成
下载PDF
积极心理学更智能:机器学习与自发生成数据集的新途径 被引量:1
3
作者 彭凯平 童松 吴晟 《西北师大学报(社会科学版)》 CSSCI 北大核心 2024年第2期91-99,共9页
本文探讨了积极心理学在计算智能快速发展时所面临的具体挑战,分析了机器学习和自发生成数据集在应对这些挑战时的巨大潜力。机器学习可从高维数据中提取与人类认知相关的非线性关系,成为研究人类认知和情感的新途径。自发生成数据集能... 本文探讨了积极心理学在计算智能快速发展时所面临的具体挑战,分析了机器学习和自发生成数据集在应对这些挑战时的巨大潜力。机器学习可从高维数据中提取与人类认知相关的非线性关系,成为研究人类认知和情感的新途径。自发生成数据集能更真实地反映人类行为和心理过程,为研究者提供高效的研究素材。这些新兴技术为积极心理学提供了全新视角,能更全面地认识人类行为和心理并推动文化差异性研究、理论更新和干预策略评估。未来研究需探索机器学习、自发生成数据集与积极心理学理论的结合,以深入理解人类行为和情感的多样性和复杂性。 展开更多
关键词 积极心理学 机器学习 自发生成数据(NODS) 计算智能
原文传递
基于改进遗传算法的接口测试数据集的生成方法 被引量:2
4
作者 韩霄汉 叶方彬 +2 位作者 窦健 祝恩国 王朝亮 《济南大学学报(自然科学版)》 CAS 北大核心 2019年第1期56-60,共5页
针对用电信息采集统一接口平台需要大量包含足够测试用例占比的测试数据这一难题,提出基于改进遗传算法的用电信息采集系统统一接口平台测试数据集的生成方法;在对原始数据预处理的基础上,采用基于相似度的交叉算子对原始群体扩充,使用... 针对用电信息采集统一接口平台需要大量包含足够测试用例占比的测试数据这一难题,提出基于改进遗传算法的用电信息采集系统统一接口平台测试数据集的生成方法;在对原始数据预处理的基础上,采用基于相似度的交叉算子对原始群体扩充,使用提出基于群体趋势不变的染色体变异算法,在保持群体数据集特性的情况下增大测试用例占比,从而形成测试数据的自动生成方法;应用该测试数据集生成方法,基于某省级电力公司2016年7—9月300万个典型用电客户用电数据进行数据集生成实验,利用熵原理比较无变异因子、插值法变异和改进遗传算法分别生成的测试数据与原始数据的重合度。结果表明,改进遗传算法生成的测试数据集,具有同用电信息采集系统采集数据相同的属性和属性值分布以及类似的属性关联关系,能够满足测试用例需求。 展开更多
关键词 用电信息采 统一接口平台 遗传算法 变异算法 测试数据集生成
下载PDF
一种用于数据挖掘算法的数据生成方法 被引量:7
5
作者 魏伟杰 张斌 +1 位作者 王波 张明卫 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第3期328-331,共4页
由于受到保密性、时间和数据多样性等一些原因的限制,测试数据集的获取一直困扰着数据挖掘算法的研究.因此,提出一种基于遗传算法和熵的测试数据集的模拟生成方法,生成方法利用遗传算法具有继承性的特性对采集到的少量的真实数据进行扩... 由于受到保密性、时间和数据多样性等一些原因的限制,测试数据集的获取一直困扰着数据挖掘算法的研究.因此,提出一种基于遗传算法和熵的测试数据集的模拟生成方法,生成方法利用遗传算法具有继承性的特性对采集到的少量的真实数据进行扩充和模拟,用熵衡量生成数据与真实数据的相似程度,最终生成规模大的测试数据集,并给出了描述型数据的生成算法.使用此方法,可以生成同真实数据集具有相同的属性,相同的属性取值区间和属性值分布,类似属性关联关系的测试数据集,加速数据挖掘算法的研究进程. 展开更多
关键词 数据挖掘 算法测试 模拟数据集生成 遗传算法
下载PDF
基于ER-YOLO算法的跨环境输电线路缺陷识别方法 被引量:5
6
作者 裴少通 张行远 +2 位作者 胡晨龙 杨文杰 刘云鹏 《电工技术学报》 EI CSCD 北大核心 2024年第9期2825-2840,共16页
为提高输电线路缺陷智能检测算法在不同环境条件下的鲁棒性,克服现有智能检测算法在不同环境下识别性能下降的问题,该文提出了跨环境鲁棒YOLO(ER-YOLO)算法。首先,基于广义注意力理论在YOLOv8的骨干网络中引入Transformer注意力机制;其... 为提高输电线路缺陷智能检测算法在不同环境条件下的鲁棒性,克服现有智能检测算法在不同环境下识别性能下降的问题,该文提出了跨环境鲁棒YOLO(ER-YOLO)算法。首先,基于广义注意力理论在YOLOv8的骨干网络中引入Transformer注意力机制;其次,使用大卷积核和通道注意力模块优化特征提取;最后,应用多重注意力机制检测头网络强化算法多尺度、空间位置和多任务感知能力。为获得测试数据,该文探索生成了模拟暗光、雾霾、模糊环境的虚拟数据集。经消融实验和对比分析,跨环境鲁棒YOLO算法在跨环境测试中展现了更高的缺陷识别精度和鲁棒性,各测试数据集下mAP平均值为0.726,相对改进前提升0.069,同时在实际环境下进行了验证,证明了该算法的有效性。该文提出的跨拍摄环境的输电线路缺陷识别方法,在跨环境识别中表现出卓越的性能。跨环境图像生成方法可为后续虚拟数据集生成技术提供借鉴。 展开更多
关键词 输电线路 缺陷检测 深度学习 数据集生成
下载PDF
数据仓库技术及其在电信行业的应用探讨 被引量:1
7
作者 王杰 《通信世界》 2002年第18期37-38,共2页
随着我国加入WTO,电信市场将逐步对外开放,一些世界级的电信巨头将通过多种手段逐步渗透到中国电信市场。国内电信运营商正面对一个全新的、更加激烈的市场竞争环境。电信运营商意识到,客户才是企业生存和发展的根基,而保有客户、... 随着我国加入WTO,电信市场将逐步对外开放,一些世界级的电信巨头将通过多种手段逐步渗透到中国电信市场。国内电信运营商正面对一个全新的、更加激烈的市场竞争环境。电信运营商意识到,客户才是企业生存和发展的根基,而保有客户、吸引客户和充分发掘客户的盈收潜力是企业提高核心竞争力的关键,因此中国移动、中国联通等纷纷推出建设相关系统的规范,来指导其属下的各级公司的建设。 展开更多
关键词 数据仓库技术 中国 电信行业 电信运营商 市场竞争 生成数据 数据存储管理
下载PDF
Headedness in Yorǘhbá: An Examination of the Deviant Value of Determiner Phrase
8
作者 Issa O. Sanusi 《Sino-US English Teaching》 2014年第1期59-65,共7页
The issue of "headedness" is a product of Chomsky's (1988) notion of UG (Universal Grammar) that led to the development of a framework known as P&P (Principles and Parameters) theory. It is this theory we ha... The issue of "headedness" is a product of Chomsky's (1988) notion of UG (Universal Grammar) that led to the development of a framework known as P&P (Principles and Parameters) theory. It is this theory we have adopted for our analysis in this paper. The purpose of this paper is to examine the inconsistency in the value of Head Parameter with reference to the value of DP (determiner phrase) in Yorfib^i. As a native speaker of Yorfib~, the author has adopted an introspective method of data collection and used the intuitive knowledge of other native speakers of the language for necessary clarifications. Despite the fact that English and Yorfib~ are both head-initial, the structure of the NPs (noun phrases) in English shows that the head noun is always pre-modified, making the NP "head-final"--a violation of the value of Head Parameter in the language. This necessitated the need for Abney's (1987) DP hypothesis; in which the determiner heads its own phrase, thereby making a NP in English head-initial. This solves the problem of Head Parameter in English. However, since nouns in Yor/lb^i are post-modified, adopting "DP-analysis" will automatically produce head-final--a violation of the value of Head Parameter in the language. Given the inconsistency in the specification of head-complement order among the noun phrases in English and Yorfib~, this paper proposes to set a parameter for SVO (Subject-Verb-Object) languages with pre-modification (like English) to adopt "DP-analysis", and those with post-modification (like Yorfib^t) to adopt "NP-analysis". This will ensure "head-initial" value for the two categories of SVO languages 展开更多
关键词 headedness pre-modification post-modification DP-analysis NP-analysis English Yoruba
下载PDF
一种基于极限学习机的推力分配方法 被引量:6
9
作者 徐海祥 马晨龙 冯辉 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第12期34-39,70,共7页
针对传统迭代推力分配方法实时性较差的问题,提出了一种基于极限学习机(ELM)的推力分配方法.该方法考虑了推进器的布局条件与推进器推力约束,利用序列二次规划(SQP)算法在短时间内生成了大量用于极限学习机神经网络训练的推力分配样本数... 针对传统迭代推力分配方法实时性较差的问题,提出了一种基于极限学习机(ELM)的推力分配方法.该方法考虑了推进器的布局条件与推进器推力约束,利用序列二次规划(SQP)算法在短时间内生成了大量用于极限学习机神经网络训练的推力分配样本数据.利用生成的数据集进行了离线训练,并进行了在线测试.仿真结果表明:该方法可以较高的精度和更快的计算速度完成推力分配,体现了其相较于传统迭代优化算法的优越性,更能满足工程应用的实时性需求. 展开更多
关键词 极限学习机 推力分配 神经网络 数据集生成 序列二次规划
原文传递
面向纹理平滑的方向性滤波尺度预测模型 被引量:1
10
作者 林俊彦 刘春晓 +1 位作者 章金凯 李泓易 《中国图象图形学报》 CSCD 北大核心 2022年第8期2506-2515,共10页
目的 传统图像处理的纹理滤波方法难以区分梯度较强的纹理与物体的结构,而深度学习方法使用的训练集生成方式不够合理,且模型表示方式比较粗糙,为此本文设计了一种面向纹理平滑的方向性滤波尺度预测模型,并生成了含有标签的新的纹理滤... 目的 传统图像处理的纹理滤波方法难以区分梯度较强的纹理与物体的结构,而深度学习方法使用的训练集生成方式不够合理,且模型表示方式比较粗糙,为此本文设计了一种面向纹理平滑的方向性滤波尺度预测模型,并生成了含有标签的新的纹理滤波数据集。方法 在现有结构图像中逐连通区域填充多种纹理图,生成有利于模型训练的纹理滤波数据集。设计了方向性滤波尺度预测模型,该模型包含尺度感知子网络和图像平滑子网络。前者预测得到的滤波尺度图不但体现了该像素与周围像素是否为同一纹理,而且还隐含了该像素是否为结构像素的信息。后者以滤波尺度图和原图的堆叠作为输入,凭借少量的卷积层快速得出纹理滤波的结果。结果 在本文的纹理滤波数据集上与7个算法进行比较,峰值信噪比(peak signal to noise ratio, PSNR)与结构相似度(structural similarity, SSIM)分别高于第2名2.79 dB、0.0133,均方误差(mean squared error, MSE)低于第2名6.863 8,运算速度快于第2名0.002 s。在其他数据集上的实验对比也显示出本文算法更好地保持结构与平滑纹理。通过比较不同数据集上训练的同一网络模型,证实了本文的纹理滤波数据集有助于增强模型对于强梯度纹理与物体结构的区分能力。结论 本文制作的纹理滤波数据集使模型更好地区分强梯度纹理与物体结构并增强模型的泛化能力。本文设计的方向性滤波尺度预测模型在性能上超越了已有的大多数纹理平滑方法,尤其在强梯度纹理的抑制和弱梯度结构的保持两个方面表现优异。 展开更多
关键词 深度学习 图像平滑 纹理滤波 数据集生成 U型网络(U-Net)
原文传递
Inferring microbial interaction networks based on consensus similarity network fusion 被引量:3
11
作者 JIANG XingPeng HU XiaoHua 《Science China(Life Sciences)》 SCIE CAS 2014年第11期1115-1120,共6页
With the rapid accumulation of high-throughput metagenomic sequencing data,it is possible to infer microbial species relations in a microbial community systematically.In recent years,some approaches have been proposed... With the rapid accumulation of high-throughput metagenomic sequencing data,it is possible to infer microbial species relations in a microbial community systematically.In recent years,some approaches have been proposed for identifying microbial interaction network.These methods often focus on one dataset without considering the advantage of data integration.In this study,we propose to use a similarity network fusion(SNF)method to infer microbial relations.The SNF efficiently integrates the similarities of species derived from different datasets by a cross-network diffusion process.We also introduce consensus k-nearest neighborhood(Ck-NN)method instead of k-NN in the original SNF(we call the approach CSNF).The final network represents the augmented species relationships with aggregated evidence from various datasets,taking advantage of complementarity in the data.We apply the method on genus profiles derived from three microbiome datasets and we find that CSNF can discover the modular structure of microbial interaction network which cannot be identified by analyzing a single dataset. 展开更多
关键词 species interaction METAGENOME diffusion process biological network MODULARITY
原文传递
Understanding human diseases with high-throughput quantitative measurement and analysis of molecular signatures 被引量:2
12
作者 YANG Li WEI Gang +2 位作者 TANG Kun NARDINI Christine HAN Jing-Dong J. 《Science China(Life Sciences)》 SCIE CAS 2013年第3期213-219,共7页
Microarray and deep sequencing technologies have provided unprecedented opportunities for mapping genome mutations,RNA transcripts,transcription factor binding,and histone modifications at high resolution at the genom... Microarray and deep sequencing technologies have provided unprecedented opportunities for mapping genome mutations,RNA transcripts,transcription factor binding,and histone modifications at high resolution at the genome-wide level.This has revolutionized the way in which transcriptomes,regulatory networks and epigenetic regulations have been studied and large amounts of heterogeneous data have been generated.Although efforts are being made to integrate these datasets unbiasedly and efficiently,how best to do this still remains a challenge.Here we review major impacts of high-throughput genome-wide data generation,their relevance to human diseases,and various bioinformatics approaches for data integration.Finally,we provide a case study on inflammatory diseases. 展开更多
关键词 GENOMICS EPIGENOMICS PHENOMICS integration data analysis
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部