基于随机子采样的隔离森林算法没有考虑到子采样中来自不同区域样本点之间的相对密度,为此提出基于核函数的隔离森林算法K-iForest,根据概率密度函数重新采样来提高隔离森林算法的性能。在离群点检测数据库(ODDS)的Annthyroid、ForestCo...基于随机子采样的隔离森林算法没有考虑到子采样中来自不同区域样本点之间的相对密度,为此提出基于核函数的隔离森林算法K-iForest,根据概率密度函数重新采样来提高隔离森林算法的性能。在离群点检测数据库(ODDS)的Annthyroid、ForestCover、Mulcross、Shuttle和Http(KDD Cup 1999)、Smtp(KDD Cup 1999)、KDD CUP 99数据集上验证K-iForest算法的有效性和效率,并与iForest算法、EIF算法、RRCF算法、GIF算法以及HIF算法进行比较。实验结果表明,K-iForest算法的AUC值高出其他算法0.1%~100.2%。展开更多
针对城市区域的复杂性和多变性,提出了一个级联城市区域分析框架(cascaded urban area analysis framework,CUAAF),用来对城市区域进行时空聚类分析.首先,将城市区域划分为多个地理栅格.其次,采用新的区域时空行为指标(areabehaviorinde...针对城市区域的复杂性和多变性,提出了一个级联城市区域分析框架(cascaded urban area analysis framework,CUAAF),用来对城市区域进行时空聚类分析.首先,将城市区域划分为多个地理栅格.其次,采用新的区域时空行为指标(areabehaviorindex,ABI)评估任意2个栅格之间的相关性.接着,用Louvain算法对相应的栅格网络进行分析,得到聚类区域.在得到聚类区域后,可再次将该区域输入CUAAF框架,进行级联分析,得到更多分层信息.级联实验可以采用多种指标分析城市区域,从不同层次了解城市区域,获得更详细的城市区域信息.最后,分别用周中周末的数据做了对比实验,结果显示本文方法具有稳健性和数据敏感性.展开更多
文摘基于随机子采样的隔离森林算法没有考虑到子采样中来自不同区域样本点之间的相对密度,为此提出基于核函数的隔离森林算法K-iForest,根据概率密度函数重新采样来提高隔离森林算法的性能。在离群点检测数据库(ODDS)的Annthyroid、ForestCover、Mulcross、Shuttle和Http(KDD Cup 1999)、Smtp(KDD Cup 1999)、KDD CUP 99数据集上验证K-iForest算法的有效性和效率,并与iForest算法、EIF算法、RRCF算法、GIF算法以及HIF算法进行比较。实验结果表明,K-iForest算法的AUC值高出其他算法0.1%~100.2%。
文摘针对城市区域的复杂性和多变性,提出了一个级联城市区域分析框架(cascaded urban area analysis framework,CUAAF),用来对城市区域进行时空聚类分析.首先,将城市区域划分为多个地理栅格.其次,采用新的区域时空行为指标(areabehaviorindex,ABI)评估任意2个栅格之间的相关性.接着,用Louvain算法对相应的栅格网络进行分析,得到聚类区域.在得到聚类区域后,可再次将该区域输入CUAAF框架,进行级联分析,得到更多分层信息.级联实验可以采用多种指标分析城市区域,从不同层次了解城市区域,获得更详细的城市区域信息.最后,分别用周中周末的数据做了对比实验,结果显示本文方法具有稳健性和数据敏感性.