针对轨迹聚类方法难以准确识别高相似热点路径的问题,提出能区分起讫点或局部路段的热点路径识别方法,将出行轨迹映射并压缩为移动网格序列,分别从边界与内部区分序列间的空间相似性度量,整合转化为距离并进行基于方格序列密度的空间聚...针对轨迹聚类方法难以准确识别高相似热点路径的问题,提出能区分起讫点或局部路段的热点路径识别方法,将出行轨迹映射并压缩为移动网格序列,分别从边界与内部区分序列间的空间相似性度量,整合转化为距离并进行基于方格序列密度的空间聚类(grid sequencedensity-based spatial clustering of applications with noise,GS-DBSCAN)。以青岛市市南区部分出租车的轨迹数据为例,与只考虑内部相似性且分别以对比序列中较短序列和较长序列为基准的聚类方法进行对比验证。结果表明:同时考虑边界与内部相似性且以较长序列为基准的GS-DBSCAN算法能正确区分多出行起讫点分布下长度差异较大的分离、汇合与交叉耦合热点路径,受路径长度、网格尺寸等变量差异的影响小于2%,且聚类运算效率较高。展开更多
文摘针对轨迹聚类方法难以准确识别高相似热点路径的问题,提出能区分起讫点或局部路段的热点路径识别方法,将出行轨迹映射并压缩为移动网格序列,分别从边界与内部区分序列间的空间相似性度量,整合转化为距离并进行基于方格序列密度的空间聚类(grid sequencedensity-based spatial clustering of applications with noise,GS-DBSCAN)。以青岛市市南区部分出租车的轨迹数据为例,与只考虑内部相似性且分别以对比序列中较短序列和较长序列为基准的聚类方法进行对比验证。结果表明:同时考虑边界与内部相似性且以较长序列为基准的GS-DBSCAN算法能正确区分多出行起讫点分布下长度差异较大的分离、汇合与交叉耦合热点路径,受路径长度、网格尺寸等变量差异的影响小于2%,且聚类运算效率较高。