提出了两种基于相邻关系的地理标识语言空间线对象离群检测算法:DOL-AR1和DOL-AR2,定义了基于相邻关系的空间线对象之间的相异度,DOL-AR1将基于相邻关系的相异度作为空间线对象之间的距离度量准则,利用Density-based Spatial Clustering of Applications with Noise算法检测出离群的空间线对象.算法DOL-AR2以基于相邻关系的相异度为准则对空间线对象进行聚类,根据每个簇的离群因子,检测该簇是否离群.实验结果表明,算法DOL-AR1和算法DOL-AR2都能有效地检测出离群的线对象,本文对提出的两种离群检测算法的性能进行了比较,发现算法DOL-AR2的效率要高于算法DOL-AR1的效率.
针对传统聚类算法在对复杂密集型数据集聚类时不能取得较好聚类结果的问题,利用进化聚类算法对复杂密集型数据集进行聚类,提出一种基于蚁群系统的聚类算法(clustering algorithm based on ant colony system,CAACS),利用蚂蚁在行进路径中释放信息素且追求浓信息素的原理来实现蚂蚁的随机搜索,并引入近邻函数值的概念来确定样本数据之间的相似性,通过蚂蚁在行走过程中不断建立样本数据之间的最相似连接来形成各个子连通图,各个子连通图中的样本数据构成一个类。实验采用随机产生的不规则数据集以及一系列合成的数据集将CAACS算法与DBSCAN算法(density-based spatial clustering of application with noise)及面向非规则非致密空间分布数据的蚁群聚类方法进行比较。实验结果表明CAACS算法对复杂密集型数据集能达到较好的聚类结果。