期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
基于数据挖掘和RandomForest算法的助学金分类研究 被引量:1
1
作者 王雨萌 武小军 罗雅晨 《中国市场》 2019年第3期50-52,共3页
在普及高等教育的过程中,发放助学金作为帮助贫困学生完成学业的重要手段之一。目前国内高校的助学金发放准则存在一定的问题,因此如何在高校缺乏学生的真实家庭情况以及助学金的金额有限的背景下,将助学金发放到最需要帮助的学生手上... 在普及高等教育的过程中,发放助学金作为帮助贫困学生完成学业的重要手段之一。目前国内高校的助学金发放准则存在一定的问题,因此如何在高校缺乏学生的真实家庭情况以及助学金的金额有限的背景下,将助学金发放到最需要帮助的学生手上成为亟待解决的问题。文章以某高校大学生一卡通脱敏数据为原始数据,采用大数据挖掘技术和机器学习算法等AI技术进行拟合训练,以期有效预测需要帮助的学生,发挥助学金的作用。 展开更多
关键词 数据挖掘 randomforest 机器学习 助学金
下载PDF
基于RandomForest分类方法的购买预测研究 被引量:1
2
作者 姜潇蔚 杨达霏 《江苏通信》 2021年第6期72-74,共3页
本文针对银行客户,提出一种基于RandomForest的银行客户分类模型,通过基于RandomForest的分类方法对银行客户已存在数据进行处理,并应用labelencoder对数据进行预处理从而提高分类精确度,得到客户对产品是否具有购买倾向。结合了RandomF... 本文针对银行客户,提出一种基于RandomForest的银行客户分类模型,通过基于RandomForest的分类方法对银行客户已存在数据进行处理,并应用labelencoder对数据进行预处理从而提高分类精确度,得到客户对产品是否具有购买倾向。结合了RandomForest的分类能力和labelencoder量化数据能力,使用葡萄牙银行机构数据进行验证,实验结果表明本文提出的客户购买预测模型精度更高。 展开更多
关键词 randomforest 机器学习 客户分类
下载PDF
基于RandomForest的取消酒店预订应用研究
3
作者 顾凤云 曹睿 《赤峰学院学报(自然科学版)》 2021年第6期15-22,共8页
酒店行业迅速发展的同时,存在专业人才短缺、缺乏成熟的管理模式和临时取消率高等问题。本文以Kaggle酒店取消预订数据集为研究对象,对原始数据进行预处理,再利用Lasso方法进行特征重要性排序,将特征提取后的数据作为RandomForest训练... 酒店行业迅速发展的同时,存在专业人才短缺、缺乏成熟的管理模式和临时取消率高等问题。本文以Kaggle酒店取消预订数据集为研究对象,对原始数据进行预处理,再利用Lasso方法进行特征重要性排序,将特征提取后的数据作为RandomForest训练模型的输入进行预测,并且通过与XGBoost、LightGBM、DecisionTree等7种主流算法进行对比实验,结果表明本文方案在accuracy、recall、f1_score、AUC四种性能指标上优于对比模型。采用SHAP模型对已建立的价格模型进行解释,同时通过XGBoost,RandomForest的特征重要性排序,识别影响取消预订的关键因素是押金类型、预订时长以及预定渠道。 展开更多
关键词 机器学习 取消预订模型 酒店行业 randomforest模型 SHAP值
下载PDF
基于RF-LSTM模型对A股历史数据的分析
4
作者 丁睦坤 柴啸龙 《商展经济》 2024年第1期111-115,共5页
本文在分析A股个股历史数据及自定义的指标基础上,建立RandomForest模型,并利用RF模型对指标进行筛选,再将RF模型选取的指标传入建立RF-LSTM模型,实现预测功能。为了展现RF-LSTM模型的适用性,本文引入了自定义的AR-RF集成模型作为对比,... 本文在分析A股个股历史数据及自定义的指标基础上,建立RandomForest模型,并利用RF模型对指标进行筛选,再将RF模型选取的指标传入建立RF-LSTM模型,实现预测功能。为了展现RF-LSTM模型的适用性,本文引入了自定义的AR-RF集成模型作为对比,在最终测试集的预测结果中发现RF-LSTM模型有更好的效果。本文的主要创新点是,自定义并二次量化处理个股支撑压力指标,在得到RF-LSTM模型的预测结果后,结合自定义公式,对未来的走势进行量化处理。 展开更多
关键词 randomforest模型 AR-RF集成模型 自定义支撑压力指标 RF-LSTM模型 走势量化处理
下载PDF
Genotyping Characteristics of Human Fecal Escherichia coli and Their Association with Multidrug Resistance in Miyun District, Beijing
5
作者 ZHANG Wei Wei ZHU Xiao Lin +11 位作者 DENG Le Le HAN Ya Jun LI Zhuo Wei WANG Jin Long CHEN Yong Liang WANG Ao Lin TIAN Er Li CHENG Bin XU Lin Hua CHEN Yi Cong TIAN Li Li HE Guang Xue 《Biomedical and Environmental Sciences》 SCIE CAS CSCD 2023年第5期406-417,共12页
Objective To explore the genotyping characteristics of human fecal Escherichia coli(E. coli) and the relationships between antibiotic resistance genes(ARGs) and multidrug resistance(MDR) of E. coli in Miyun District, ... Objective To explore the genotyping characteristics of human fecal Escherichia coli(E. coli) and the relationships between antibiotic resistance genes(ARGs) and multidrug resistance(MDR) of E. coli in Miyun District, Beijing, an area with high incidence of infectious diarrheal cases but no related data.Methods Over a period of 3 years, 94 E. coli strains were isolated from fecal samples collected from Miyun District Hospital, a surveillance hospital of the National Pathogen Identification Network. The antibiotic susceptibility of the isolates was determined by the broth microdilution method. ARGs,multilocus sequence typing(MLST), and polymorphism trees were analyzed using whole-genome sequencing data(WGS).Results This study revealed that 68.09% of the isolates had MDR, prevalent and distributed in different clades, with a relatively high rate and low pathogenicity. There was no difference in MDR between the diarrheal(49/70) and healthy groups(15/24).Conclusion We developed a random forest(RF) prediction model of TEM.1 + baeR + mphA + mphB +QnrS1 + AAC.3-IId to identify MDR status, highlighting its potential for early resistance identification. The causes of MDR are likely mobile units transmitting the ARGs. In the future, we will continue to strengthen the monitoring of ARGs and MDR, and increase the number of strains to further verify the accuracy of the MDR markers. 展开更多
关键词 E.COLI Multidrug resistance Whole-genome sequencing Antibiotic resistance genes randomforest
下载PDF
A Two-Step Algorithm to Estimate Variable Importance for Multi-State Data:An Application to COVID-19
6
作者 Behnaz Alafchi Leili Tapak +2 位作者 Hassan Doosti Christophe Chesneau Ghodratollah Roshanaei 《Computer Modeling in Engineering & Sciences》 SCIE EI 2023年第6期2047-2064,共18页
Survival data with amulti-state structure are frequently observed in follow-up studies.An analytic approach based on a multi-state model(MSM)should be used in longitudinal health studies in which a patient experiences... Survival data with amulti-state structure are frequently observed in follow-up studies.An analytic approach based on a multi-state model(MSM)should be used in longitudinal health studies in which a patient experiences a sequence of clinical progression events.One main objective in the MSM framework is variable selection,where attempts are made to identify the risk factors associated with the transition hazard rates or probabilities of disease progression.The usual variable selection methods,including stepwise and penalized methods,do not provide information about the importance of variables.In this context,we present a two-step algorithm to evaluate the importance of variables formulti-state data.Three differentmachine learning approaches(randomforest,gradient boosting,and neural network)as themost widely usedmethods are considered to estimate the variable importance in order to identify the factors affecting disease progression and rank these factors according to their importance.The performance of our proposed methods is validated by simulation and applied to the COVID-19 data set.The results revealed that the proposed two-stage method has promising performance for estimating variable importance. 展开更多
关键词 Multi-state data deviance residual martingale residual gradient boosting randomforest neural network variable importance variable selection
下载PDF
Multi Class Brain Cancer Prediction System Empowered with BRISK Descriptor
7
作者 Madona B.Sahaai G.R.Jothilakshmi +1 位作者 E.Praveen V.Hemath Kumar 《Intelligent Automation & Soft Computing》 SCIE 2023年第5期1507-1521,共15页
Magnetic Resonance Imaging(MRI)is one of the important resources for identifying abnormalities in the human brain.This work proposes an effective Multi-Class Classification(MCC)system using Binary Robust Invariant Scal... Magnetic Resonance Imaging(MRI)is one of the important resources for identifying abnormalities in the human brain.This work proposes an effective Multi-Class Classification(MCC)system using Binary Robust Invariant Scalable Keypoints(BRISK)as texture descriptors for effective classification.Atfirst,the potential Region Of Interests(ROIs)are detected using features from the acceler-ated segment test algorithm.Then,non-maxima suppression is employed in scale space based on the information in the ROIs.The discriminating power of BRISK is examined using three machine learning classifiers such as k-Nearest Neighbour(kNN),Support Vector Machine(SVM)and Random Forest(RF).An MCC sys-tem is developed which classifies the MRI images into normal,glioma,meningio-ma and pituitary.A total of 3264 MRI brain images are employed in this study to evaluate the proposed MCC system.Results show that the average accuracy of the proposed MCC-RF based system is 99.62%with a sensitivity of 99.16%and spe-cificity of 99.75%.The average accuracy of the MCC-kNN system is 93.65%and 97.59%by the MCC-SVM based system. 展开更多
关键词 Braincancer BRISKdescriptor randomforest multi-classclassification brain image analysis
下载PDF
Employee Attrition Classification Model Based on Stacking Algorithm
8
作者 CHEN Yanming LIN Xinyu ZHAN Kunye 《Psychology Research》 2023年第6期279-285,共7页
This paper aims to build an employee attrition classification model based on the Stacking algorithm.Oversampling algorithm is applied to address the issue of data imbalance and the Randomforest feature importance rank... This paper aims to build an employee attrition classification model based on the Stacking algorithm.Oversampling algorithm is applied to address the issue of data imbalance and the Randomforest feature importance ranking method is used to resolve the overfitting problem after data cleaning and preprocessing.Then,different algorithms are used to establish classification models as control experiments,and R-squared indicators are used to compare.Finally,the Stacking algorithm is used to establish the final classification model.This model has practical and significant implications for both human resource management and employee attrition analysis. 展开更多
关键词 employee attrition classification model machine learning ensemble learning oversampling algorithm randomforest stacking algorithm
下载PDF
基于K-means和Random Forest的WiFi室内定位方法 被引量:10
9
作者 李军 何星 +1 位作者 蔡云泽 徐琴 《控制工程》 CSCD 北大核心 2017年第4期787-792,共6页
为了减小室内环境因素对室内WiFi定位的影响,降低定位成本,提高定位精度以及扩大定位区域,通过对室内定位系统和机器学习算法的讨论,提出了一种基于K-means和Random Forest融合的WiFi室内定位算法。针对室内WiFi信号强度分布的特点,该... 为了减小室内环境因素对室内WiFi定位的影响,降低定位成本,提高定位精度以及扩大定位区域,通过对室内定位系统和机器学习算法的讨论,提出了一种基于K-means和Random Forest融合的WiFi室内定位算法。针对室内WiFi信号强度分布的特点,该算法通过K-means聚类改进算法对数据进行初始分类,然后使用Random Forest对初始分类结果进行二次分类。实验结果表明,该定位算法的定位精度在2米以内的概率为89.1%,达到预期的定位效果,同时对缺失值数据具有较好的适应能力。 展开更多
关键词 室内定位 WIFI randomforest K-MEANS 多模融合
原文传递
数据挖掘分类算法优化非平衡采样样本的研究与应用 被引量:3
10
作者 吴琼 周维民 李运田 《工业控制计算机》 2014年第2期63-64,78,共3页
主要是针对采样过程中的非平衡数据进行处理、分类,改变传统算法在其处理过程中的分类倾向性。结合数据挖掘中多种分类算法构建的混合模型进行分类处理非平衡采样数据,并将优化的结果进行比较。
关键词 分类算法 非平衡性 ADABOOST randomforests SVM ROC
下载PDF
决策树算法在物流企业人才流失中的应用研究
11
作者 杨军 李宇航 《物流工程与管理》 2017年第8期154-156,共3页
随着我国物流行业的快速发展,物流企业需要大量的人才,然而物流的快速发展也导致公司员工流动性增加,这给企业在经济和人才管理方面造成了损失和困扰,因此,如何解决人才流失的问题,是物流企业在竞争激烈的市场中面临的挑战之一。文中基... 随着我国物流行业的快速发展,物流企业需要大量的人才,然而物流的快速发展也导致公司员工流动性增加,这给企业在经济和人才管理方面造成了损失和困扰,因此,如何解决人才流失的问题,是物流企业在竞争激烈的市场中面临的挑战之一。文中基于大数据挖掘与分析软件平台,利用数据挖掘中的J48和RandomForest两种分类算法对搜集某物流企业的员工离职相关数据进行分析,找出影响员工离职的因素,为今后该公司人力资源管理及人才挽留提供理论依据。 展开更多
关键词 人才流失 J48算法 randomforest算法
下载PDF
基于多特征融合和随机森林的视网膜血管分割 被引量:25
12
作者 朱承璋 崔锦恺 +2 位作者 邹北骥 陈瑶 王俊 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2017年第4期584-592,共9页
为了进行眼底疾病辅助诊断,提出一种基于多特征融合和随机森林的视网膜血管分割方法.首先为彩色眼底图中的每个像素点提取一个23维特征向量(包括图像不变矩、灰度共生矩阵、LoG结合高斯二阶导、梯度法、相位一致性和Hessian矩阵特征);... 为了进行眼底疾病辅助诊断,提出一种基于多特征融合和随机森林的视网膜血管分割方法.首先为彩色眼底图中的每个像素点提取一个23维特征向量(包括图像不变矩、灰度共生矩阵、LoG结合高斯二阶导、梯度法、相位一致性和Hessian矩阵特征);然后选取一定数量的像素点,提取其特征共同构造一个特征矩阵作为输入数据,并采用随机森林算法训练分类器;再用训练好的分类器对待分割图像中的像素点进行分类,判断其是否为血管点;最后在初步分割基础上进行基于连通区域补足血管的后处理,得到优化后的血管分割结果.在DRIVE公共数据库上进行实验的结果表明,该方法平均精确度达0.9606,平均灵敏度达0.7447,平均特异性达0.9838,比已有方法性能更优. 展开更多
关键词 多特征融合 随机森林 眼底图像 视网膜血管分割
下载PDF
基于多时相Sentinel-2A的县域农作物分类 被引量:37
13
作者 吴静 吕玉娜 +1 位作者 李纯斌 李全红 《农业机械学报》 EI CAS CSCD 北大核心 2019年第9期194-200,共7页
利用遥感技术精准地获取区域农作物种植结构数据,对指导农业生产、制定农业政策具有重要意义。以景泰县为研究区,以多时相Sentinel2A遥感影像为数据源,计算时序归一化植被指数(Normalized difference vegetation index,NDVI)和红边归一... 利用遥感技术精准地获取区域农作物种植结构数据,对指导农业生产、制定农业政策具有重要意义。以景泰县为研究区,以多时相Sentinel2A遥感影像为数据源,计算时序归一化植被指数(Normalized difference vegetation index,NDVI)和红边归一化植被指数(Red edge normalized vegetation index,RENDVI)及其组合特征(NDVI+RENDVI、NDVI RENDVI和NDVI&RENDVI),分析作物特征曲线,并采用随机森林法分别以5种特征参数作为分类特征对研究区农作物进行精细分类。结果表明:根据形态特征,研究区农作物特征值曲线可划分为3种类型:高值型(玉米、水稻、胡麻和马铃薯)、低值型(洋葱、大棚作物和砂田瓜果)和开口型(春小麦、春小麦秋油葵)。高值型和低值型可在7、8月影像中区分,开口型和前两种类型在5月和9月影像上的特征值有明显差异。3种类型内的作物可以通过不同时相影像区分,高值型的4种作物在9月影像上通过成熟期差异可以区分;低值型的3种作物的特征值差异在全年影像上都可以明显体现;开口型的两种作物利用9月影像可以明显区分。利用NDVI、RENDVI、NDVI+RENDVI、NDVI RENDVI和NDVI&RENDVI 5种特征分类的总体精度分别为82.14%、78.16%、81.17%、75.64%和86.20%,Kappa系数分别为0.78、0.74、0.77、0.71和0.83,总体精度和Kappa系数由大到小依次为NDVI&RENDVI、NDVI、NDVI+RENDVI、RENDVI、NDVI RENDVI,说明RENDVI辅助NDVI可以有效提高分类精度(精度较仅用NDVI提高4.06个百分点)。选择合适的时期和分类特征,利用Sentinel2A特有的红边波段数据及其较高的空间分辨率在县域农作物精细分类上具有较好的精度。 展开更多
关键词 农作物分类 Sentinel2A 随机森林法 景泰县
下载PDF
基于RF-GABPSO混合选择算法的黑土有机质含量估测研究 被引量:6
14
作者 马玥 姜琦刚 +1 位作者 孟治国 刘骅欣 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2018年第1期181-187,共7页
针对土壤有机质含量高光谱估测研究中变量维数过高与特征谱段筛选问题,提出了一种结合随机森林和自适应搜索算法的混合特征选择方法。首先依据随机森林变量重要性原理获取初始优化集,然后利用遗传二进制粒子群封装算法对初始优化集进一... 针对土壤有机质含量高光谱估测研究中变量维数过高与特征谱段筛选问题,提出了一种结合随机森林和自适应搜索算法的混合特征选择方法。首先依据随机森林变量重要性原理获取初始优化集,然后利用遗传二进制粒子群封装算法对初始优化集进一步自适应筛选。对于土壤有机质含量估测建模问题,选择稳健性强且能有效处理高维变量的随机森林算法。以典型黑土区采集的土壤样品为研究对象,将ASD光谱仪获取的可见光-近红外区间光谱数据和经化学分析得到的土壤有机质含量为数据源,对原始光谱进行光谱变换和重采样处理后,采用随机森林-遗传二进制粒子群混合选择方法提取特征光谱区间,构建有机质含量随机森林估测模型。与利用全光谱、随机森林方法筛选的光谱和自适应搜索算法筛选的光谱构建随机森林模型得到的预测精度进行比较。结果表明,利用随机森林-遗传二进制粒子群混合特征选择算法筛选的波谱变量参与随机森林建模,预测决定系数,均方根误差和相对分析误差分别为0.838,0.54%,2.534。该方案应用最少的变量个数获得最高的预测精度,能够较高效地估测黑土有机质含量,也能为其他类型土壤在有机质含量估测研究的变量筛选与建模问题上提供参考。 展开更多
关键词 高光谱 黑土有机质含量 遗传算法 二进制粒子群算法 随机森林
下载PDF
爆破振动诱发民房结构损伤识别的随机森林模型 被引量:3
15
作者 方前程 商丽 +1 位作者 商拥辉 宋译 《爆炸与冲击》 EI CAS CSCD 北大核心 2017年第6期939-945,共7页
为快速、准确地评价爆破振动诱发民房结构损伤效应,借鉴随机森林理论并结合工程实际,建立露采爆破振动诱发民房结构损伤识别的随机森林模型;综合考虑爆破参数、爆破振动特征参量及房屋结构动力特性等因素,选取质点峰值振动速度、主频率... 为快速、准确地评价爆破振动诱发民房结构损伤效应,借鉴随机森林理论并结合工程实际,建立露采爆破振动诱发民房结构损伤识别的随机森林模型;综合考虑爆破参数、爆破振动特征参量及房屋结构动力特性等因素,选取质点峰值振动速度、主频率、主频率持续时间、段药量、爆心距、施工质量参数、场地条件参数、屋盖形式参数、砖墙面积率、民房高度、灰缝强度和圈梁构造柱参数等12个影响因素作为模型输入,将砖混结构建筑物的损害等级作为模型输出;基于多分类器集成的思想,以108组爆破振动实测数据作为学习样本进行训练,建模过程中由多个决策树集成随机森林、用投票的方式实现对民房结构损伤有效识别;用12组现场数据验证模型的有效性;在对样本分类的同时,计算预测变量的重要性值,发现质点峰值振动速度为最重要的评价指标,其后依次为爆心距,主频率持续时间,主频率,圈梁构造柱参数,灰缝强度,屋盖形式参数,民房高度,段药量,施工质量参数,砖墙面积率和场地条件参数。研究结果表明:随机森林模型预测结果学习样本准确度是87.97%,而测试集准确度是91.67%,与实际情况吻合较好,预测精度较高。 展开更多
关键词 爆破振动 民房结构损伤 随机森林 质点峰值振动速度 预测
下载PDF
基于机动动作元的敌机战术机动在线识别方法 被引量:13
16
作者 贾镇泽 樊晓光 +1 位作者 薛明浩 张嵩 《北京理工大学学报》 EI CAS CSCD 北大核心 2018年第8期820-827,共8页
敌机战术机动动作的在线识别可为空战态势感知、任务规划和辅助决策提供重要参考信息.针对雷达数据不能提供敌机姿态信息,导致战术机动动作难以直接描述的问题,提出了一种基于空战机动动作元的两级识别方法.首先分析了雷达传感器提供的... 敌机战术机动动作的在线识别可为空战态势感知、任务规划和辅助决策提供重要参考信息.针对雷达数据不能提供敌机姿态信息,导致战术机动动作难以直接描述的问题,提出了一种基于空战机动动作元的两级识别方法.首先分析了雷达传感器提供的特征信息;其次根据战术动作的航迹曲线,将空战战术动作分解为11种基本的机动动作元,降低了动作描述的复杂度;然后采用随机森林和支持向量机设计了两级识别方法,层级1利用航迹参数识别机动动作元,层级2根据动作元序列和运动参数识别战术动作.通过对仿真飞行数据进行验证,表明机动动作元能有效描述典型机动动作,提出的方法能够实现敌机战术机动的准确在线识别. 展开更多
关键词 空战机动 空战机动动作元 在线识别 随机森林 支持向量机
下载PDF
排水管道堵塞故障的声诊断方法研究 被引量:4
17
作者 闫菁 冯早 +1 位作者 吴建德 马军 《云南大学学报(自然科学版)》 CAS CSCD 北大核心 2018年第3期431-439,共9页
针对现有城市排水管道堵塞程度难以辨识的问题,提出一种基于多特征融合与随机森林的排水管道堵塞程度辨识方法.首先对排水管道中采集到的声响应信号进行分帧处理建立信号帧集合.其次,提取各个信号帧的A计权总声压级、能量熵、分形盒维... 针对现有城市排水管道堵塞程度难以辨识的问题,提出一种基于多特征融合与随机森林的排水管道堵塞程度辨识方法.首先对排水管道中采集到的声响应信号进行分帧处理建立信号帧集合.其次,提取各个信号帧的A计权总声压级、能量熵、分形盒维数指标构建特征向量集合;引入距离可分性判据,以达到对特征向量集合去冗余并提高特征区分度的目的;并利用类内类间散布矩阵的迹作为权重实现特征的加权融合.最后,对加权融合的特征向量集合使用随机森林进行故障辨识.实验结果表明,基于距离可分性判据的多特征融合特征向量集合可取得更高的管道堵塞故障识别率;同时,随机森林的堵塞辨识模型与SVM辨识模型比较,随机森林辨识模型有较高的准确率和较快的辨识速度.经验证,本方法不仅能有效地识别不同程度的管道堵塞故障和重复堵塞情况,而且能够排除管道配件比如三通件对故障识别的影响. 展开更多
关键词 故障声诊断 特征融合 距离可分性判据 加权融合 随机森林
下载PDF
结合时-频纹理特征的随机森林分类器应用于鸟声识别 被引量:14
18
作者 陈莎莎 李应 《计算机应用与软件》 CSCD 北大核心 2014年第1期154-157,161,共5页
研究一个基于时频纹理特征和随机森林分类器的抗噪鸟声识别系统。首先,针对实际环境中,各种不可预料的噪音会使得系统识别性能严重下降的问题,使用一种基于噪声估计的音频增强算法对带噪鸟声信号进行前端处理。然后将增强后的信号功率... 研究一个基于时频纹理特征和随机森林分类器的抗噪鸟声识别系统。首先,针对实际环境中,各种不可预料的噪音会使得系统识别性能严重下降的问题,使用一种基于噪声估计的音频增强算法对带噪鸟声信号进行前端处理。然后将增强后的信号功率谱以时频图形式输出,并根据时频图中所包含的纹理信息,利用基于灰度共生矩阵的纹理分析法进行纹理特征提取。最后使用基于决策树的组合分类器—随机森林进行分类和识别。实验结果表明,该方法不仅能对鸟类声音进行快速准确地识别而且具有良好的抗噪性。 展开更多
关键词 生态声音 音频增强 时频纹理 灰度共生矩阵 随机森林分类器
下载PDF
基于抽象API调用序列的Android恶意软件检测方法 被引量:5
19
作者 崔艳鹏 颜波 胡建伟 《计算机应用与软件》 北大核心 2019年第9期321-326,共6页
随着Android版本的不断更替,以及恶意软件的代码混淆技术的发展,主流的静态检测方法开始面临检测效率逐年下降的问题。针对上述问题,提出一种基于抽象API调用序列的Android恶意软件检测方法。该方法采用API包名、混淆名和自定义名来抽象... 随着Android版本的不断更替,以及恶意软件的代码混淆技术的发展,主流的静态检测方法开始面临检测效率逐年下降的问题。针对上述问题,提出一种基于抽象API调用序列的Android恶意软件检测方法。该方法采用API包名、混淆名和自定义名来抽象API调用序列,使得抽象出来的序列不依赖API版本,同时又包含混淆代码特征,具有更好的容错性。在此基础上,计算抽象API调用序列之间的转移概率矩阵作为分类特征,采用RandomForest分类算法进行恶意软件检测。实验结果表明,该方法对API版本依赖性小,且判别准确率高于一般使用API调用序列作为特征的判别方法,从而能更有效地检测未知应用软件的恶意性。 展开更多
关键词 ANDROID 恶意软件检测 抽象API调用序列 代码混淆 randomforest
下载PDF
基于激光诱导击穿光谱的微生物种类鉴别研究 被引量:7
20
作者 饶刚福 黄林 +9 位作者 刘木华 陈添兵 陈金印 罗子奕 许方豪 杨晖 何秀文 周华茂 林金龙 姚明印 《分析化学》 SCIE EI CAS CSCD 北大核心 2018年第7期1122-1128,共7页
建立了激光诱导击穿光谱(Laser induced breakdown spectroscopy,LIBS)全光学诊断方法,对微生物种类进行快速鉴别。制取10种微生物样品,优选滤纸为富集载体,采集等离子体羽时间演变形貌图及LIBS光谱指纹图分析了鉴别微生物种类的可行性... 建立了激光诱导击穿光谱(Laser induced breakdown spectroscopy,LIBS)全光学诊断方法,对微生物种类进行快速鉴别。制取10种微生物样品,优选滤纸为富集载体,采集等离子体羽时间演变形貌图及LIBS光谱指纹图分析了鉴别微生物种类的可行性;运用九点平滑(Nine smooth,9SM)、多元散射校正(Multiple scatter correction,MSC)对波长范围200~420 nm和560~680 nm微生物LIBS全谱数据进行了预处理;分析比较了主成分分析(Principal component analysis,PCA)、随机森林结合主成分分析(Random forest combined with principal component analysis,PCA-RF)两种方法对微生物种类的鉴别结果。结果表明,运用一定的数据预处理方法,采用PCA-RF算法对10类微生物种类鉴别,训练集总准确率为99.6%,预测集总准确率为96.7%,说明选择合适的LIBS光谱预处理及模型构建方法,对微生物种类的快速准确鉴别具有可行性。 展开更多
关键词 微生物 快速鉴别 等离子羽 激光诱导击穿光谱 随机森林 主成分分析
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部