摘要
从大型地理数据库中自动发现知识的方法是迫切需要的。本文从探测奇异值的一般方法入手,探讨了四种典型方法的基本思想以及优缺点。根据地理数据的特点,基于距离的奇异值探测方法具有较好的适用性,其关键问题在于定义距离函数。以地理数据库中的道路数据为例,本文说明了如何利用基于距离的奇异值探测方法,从大型、高维的地理数据库中探测奇异值。实验结果表明本文的方法是可行的、有效的。
It is vital to discover knowledge automatically from large geographic databases.This paper discusses four basic approaches of detecting outliers,summarizes their main ideas and evaluates their strengths and weaknesses.The distance-based approach is suitable for geographic data.Its key is to define an appropriate distance function.By applying the distance-based outliers datectron method from road datasets of a geographic databases,we show how effective outliers can be found in a large and high-dimensional geographic database.
出处
《测绘科学》
CSCD
2004年第5期12-15,共4页
Science of Surveying and Mapping
关键词
地理数据库
数据挖掘
知识
奇异值
分布
geographic databases
data mining
knowledge
outline
distribution