王艳飞
- 作品数:3 被引量:11H指数:2
- 供职机构:青岛大学更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于聚类和密度裁剪的改进KNN算法被引量:6
- 2017年
- 经典KNN算法在处理高维数据或样本数繁多的样本集时需要巨大的计算量,这使其在实际应用的过程中存在着一定的局限性;提出一种基于聚类和密度裁剪的改进KNN算法。在训练阶段,首先根据样本密度对整个训练集进行裁剪,然后将裁剪好的训练集进行聚类处理,得到若干个密度比较均匀的类簇并将其转化为超球。在测试阶段,采用两种方法,第一种是找出距离待测样本最近的k个超球,然后将这个k个超球内的训练样本作为新的训练样本集,在这个新的训练样本集上使用经典KNN算法得到待测样本的类别;第二种则是找出距离待测样本最近的1个超球,然后根据该超球的类别得出待测样本的类别。实验采用8个UCI样本集进行测试,实验结果表明,该算法同经典KNN相比具有良好的性能,是一种有效的分类方法。
- 王艳飞郝卫杰范支菊张三顺张公敬
- 关键词:聚类KNN算法
- 基于超球区域划分的改进KNN算法被引量:5
- 2017年
- 针对KNN算法样本相似度计算量大,计算冗余度高而效率低下的问题,提出了基于超球区域划分的改进KNN算法。该算法是在经典KNN算法上的改进。通过构造等半径超球集合,将所有训练样本分配到相应的超球中,因此一个待测样本的类别可以通过其最近邻的k个超球内的训练样本集来确定。为保证运算效率,设计算法去寻找最优的超球半径r。实验结果表明,基于超球区域划分的改进KNN算法与经典的传统KNN算法在效率和性能方面有较大的提高。
- 郝卫杰王艳飞胡敬伟张公敬
- 关键词:KNN算法超球
- 基于聚类和密度裁剪的改进KNN算法
- 形形色色的信息汇聚成浩瀚的数据海洋,如何快速对数据进行准确的分类并从中提取出有用的信息已经成为人们面临的一大现实问题,因此,如何解决这一难题的工作已经逐渐变成了一类热门的研究课题,即数据挖掘。数据分类作为数据挖掘的重要一...
- 王艳飞
- 关键词:数据挖掘聚类分析