孙可
- 作品数:5 被引量:9H指数:2
- 供职机构:广西师范大学更多>>
- 发文基金:国家自然科学基金国家重点基础研究发展计划广西壮族自治区自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于自表征和群组效应的子空间聚类算法
- 2017年
- 为解决目前聚类算法对噪声敏感和缺乏考虑样本间相关性等问题,提出一种充分考虑样本间相关性,使构造的关联矩阵保持子空间结构的子空间聚类算法。利用2,1-norm对每个样本进行自表征;群组效应确保相近样本的自表征系数亦相近,生成块对角化的样本自表征系数矩阵;根据自表征矩阵得到关联矩阵,在谱聚类模型下实现数据聚类。在Hopkins155等数据集上的实验结果表明,在聚类错误率评判标准下,该算法优于现有经典子空间聚类算法SRC、SSC等。
- 苏毅娟李永钢杨利锋孙可罗?
- 关键词:子空间聚类谱聚类关联矩阵
- 基于LPP和Lasso的kNN回归算法
- 2015年
- 针对k NN回归算法中k值固定且未考虑样本相关性的影响,提出一种基于LPP和Lasso的最近邻算法.该算法通过局部保持投影与稀疏编码相结合,使训练样本对每一个测试样本都进行重构,重构过程中,LPP用于保持原始数据的局部结构,l1-范式确保每个测试样本被k个不同数目的最近邻样本预测,以此解决k NN算法中k值固定问题.在UCI数据集上得到的实验结果表明,改进算法在线性回归中的预测能力优于传统k NN算法.
- 龚永红邓振云孙可刘越
- 关键词:KNN局部保持投影
- 基于LPP和l_(2,1)的KNN填充算法
- 2015年
- 传统的KNN缺失值填充算法存在没有利用样本间属性的相关性,也没有考虑到保持样本数据本身的结构和去除噪声样本的问题。本文提出利用训练样本重构测试样本从而进行最近邻缺失值填充的方法,该方法重构过程充分利用样本间的相关性,也用到LPP(保局投影)保持数据结构在重构过程中不变,同时引入l2,1范式用于去除噪声样本。在UCI数据集上的仿真实验结果表明,该方法比传统的KNN填充算法以及基于属性信息熵的Entropy-KNN算法有更高的预测准确度。
- 苏毅娟孙可邓振云尹科军
- 关键词:缺失值填充保局投影
- 基于局部相关性的kNN分类算法被引量:4
- 2016年
- kNN算法作为一种简单、有效的分类算法,在文本分类中得到广泛的应用。但是在k值(通常是固定的)的选取问题上通常是人为设定。为此,本文引入了重构和局部保持投影(locality preserving projections,LPP)技术用于最近邻分类,使得k值的选取是由样本间的相关性和拓扑结构决定。该算法利用l1-范数稀疏编码方法使每个测试样本都由它的k(不固定)个最近邻样本来重构,同时通过LPP保持重构前后样本间的局部结构不变,不仅解决了k值的选取问题,并且避免了固定k值对分类的影响。实验结果表明,该方法的分类性能优于经典kNN算法。
- 邓振云龚永红孙可张继连
- 关键词:KNN保局投影
- 一种高效的K值自适应的SA-KNN算法被引量:6
- 2015年
- 传统的K近邻(KNN)分类算法在实际应用过程中存在一些缺陷:没有考虑去除噪声样本,也没有考虑到在样本数据空间变换过程中保持样本数据本身的流形学结构,并且没有使用样本间属性的相关性。为此,提出引入稀疏学习理论,利用训练样本重构测试样本的方法,重构过程使用了样本间的相关性,也用到局部保持投影LPP保持数据结构不变,同时引入l2,1范数用于去除噪声样本的方法来寻找投影变换矩阵W,进而利用W确定KNN算法中K值的SA-KNN算法。在UCI数据集上的仿真实验结果表明,该方法比传统的KNN分类算法和Entropy-KNN算法有更高的分类准确度。
- 孙可龚永红邓振云
- 关键词:K近邻分类局部保持投影