为提高浮动车数据中异常数据检测能力及不同载客状态下的模型检测分析能力,提出基于S-DTA-IIForest(Summation&Difference Third Order Average&Improvement-Isolation Forest)的浮动车数据异常检测算法。构建由相邻两项求和(S...为提高浮动车数据中异常数据检测能力及不同载客状态下的模型检测分析能力,提出基于S-DTA-IIForest(Summation&Difference Third Order Average&Improvement-Isolation Forest)的浮动车数据异常检测算法。构建由相邻两项求和(S)、三阶求和平均差分(DTA)的二维度空间SDTA特征向量;提出差额累计更新和动态区分辨识的改进孤立森林IIForest算法,通过设置停止阈值参数,避免当出现新样本异常值分数大于停止阈值时,仅更新样本不更新孤立森林模型的问题,设计每个二叉树区分辨识度参数,区分辨识度位于停止区间时停止二叉树生长,提高算法收敛性能,以ROC(Receiver Operating Characteristic)曲线下面积AUC(Area Under ROC Cure)、F1-score为指标对模型精度进行对比分析,并以重庆市中心城区学府大道开展实例验证。结果表明:本文S-DTA-IIForest组合算法AUC、F1-score分别为86.63%、0.89,AUC较传统孤立森林IForest(Isolation Forest)提高32.4%,运行效率提高1.29%,具有收敛速度更快、精度更高的优势,载客条件下模型AUC、F1-score较未载客分别提高7.7%、10.8%,组合算法对载客数据有更高的检测精度,且未载客状态数据异常率较载客状态增加71.4%,未载客数据异常率更高。展开更多
由于绿色装配式建筑受环境变化、设备故障等因素影响,使得能耗数据存在较多噪声,无法准确定位异常数据,导致对其修正难度较大。为了有效解决能耗数据存在异常和缺失等问题,提出一种绿色装配式建筑能耗异常数据快速修正方法。结合小波阈...由于绿色装配式建筑受环境变化、设备故障等因素影响,使得能耗数据存在较多噪声,无法准确定位异常数据,导致对其修正难度较大。为了有效解决能耗数据存在异常和缺失等问题,提出一种绿色装配式建筑能耗异常数据快速修正方法。结合小波阈值去噪方法和卡尔曼滤波方法,去噪处理绿色装配式建筑能耗数据。利用基于密度的空间聚类算法(Spatial-Augmented Density-Based Spatial Clustering of Applications with Noise,SA-DBSCAN)算法,检测绿色装配式建筑能耗异常数据,引入反向传播(Backpropagation,BP)神经网络对其修正。经过大量仿真分析表明,所提方法可以准确检测绿色装配式建筑能耗异常数据,且修正精度较高,误报率仅为0.15%、检测率高达98.09%,修正仅耗时12.8ms,可以为绿色装配式建筑能耗数据的可靠性和完整性提供有效支持。展开更多
文摘为提高浮动车数据中异常数据检测能力及不同载客状态下的模型检测分析能力,提出基于S-DTA-IIForest(Summation&Difference Third Order Average&Improvement-Isolation Forest)的浮动车数据异常检测算法。构建由相邻两项求和(S)、三阶求和平均差分(DTA)的二维度空间SDTA特征向量;提出差额累计更新和动态区分辨识的改进孤立森林IIForest算法,通过设置停止阈值参数,避免当出现新样本异常值分数大于停止阈值时,仅更新样本不更新孤立森林模型的问题,设计每个二叉树区分辨识度参数,区分辨识度位于停止区间时停止二叉树生长,提高算法收敛性能,以ROC(Receiver Operating Characteristic)曲线下面积AUC(Area Under ROC Cure)、F1-score为指标对模型精度进行对比分析,并以重庆市中心城区学府大道开展实例验证。结果表明:本文S-DTA-IIForest组合算法AUC、F1-score分别为86.63%、0.89,AUC较传统孤立森林IForest(Isolation Forest)提高32.4%,运行效率提高1.29%,具有收敛速度更快、精度更高的优势,载客条件下模型AUC、F1-score较未载客分别提高7.7%、10.8%,组合算法对载客数据有更高的检测精度,且未载客状态数据异常率较载客状态增加71.4%,未载客数据异常率更高。
文摘由于绿色装配式建筑受环境变化、设备故障等因素影响,使得能耗数据存在较多噪声,无法准确定位异常数据,导致对其修正难度较大。为了有效解决能耗数据存在异常和缺失等问题,提出一种绿色装配式建筑能耗异常数据快速修正方法。结合小波阈值去噪方法和卡尔曼滤波方法,去噪处理绿色装配式建筑能耗数据。利用基于密度的空间聚类算法(Spatial-Augmented Density-Based Spatial Clustering of Applications with Noise,SA-DBSCAN)算法,检测绿色装配式建筑能耗异常数据,引入反向传播(Backpropagation,BP)神经网络对其修正。经过大量仿真分析表明,所提方法可以准确检测绿色装配式建筑能耗异常数据,且修正精度较高,误报率仅为0.15%、检测率高达98.09%,修正仅耗时12.8ms,可以为绿色装配式建筑能耗数据的可靠性和完整性提供有效支持。