国家自然科学基金(61105085) 作品数:15 被引量:15 H指数:2 相关作者: 闫德勤 刘德山 吕志超 王晓伟 刘胜蓝 更多>> 相关机构: 辽宁师范大学 江西理工大学 大连理工大学 更多>> 发文基金: 国家自然科学基金 辽宁省教育厅高等学校科学研究项目 辽宁省教育厅基金资助项目 更多>> 相关领域: 自动化与计算机技术 电子电信 交通运输工程 更多>>
基于密度信息的改进降维方法 2013年 扩散映射(diffusion maps)是一种基于流形学习的非线性降维方法。为了提高降维的效果,根据近邻点的选取对diffusion maps的降维效果影响,利用数据近邻点分布的不同,挖掘该数据点局部的密度信息,能够更好地保持数据的流形结构。利用样本点聚类后的类别信息构造密度信息指数,提出了一种改进的diffusion maps算法,有效地保持了高维数据中的流形结构,所提的新算法在多种实验中得到了证实。 贾洪哲 闫德勤 张岩关键词:流形学习 降维 聚类 基于随机矩阵变换的快速PCA算法 被引量:2 2013年 主成分分析PCA(Principle Component Analysis)是一种重要的分析方法,广泛应用于图像检索、机器学习、模式识别等领域。随着近年来数据维数越来越大,算法的稳定性、时间复杂度和内存使用成了PCA进一步应用所必须要解决的问题。为此提出一种快速算法,该算法利用随机矩阵构造卷数据降维矩阵,在保持点与点之间"核距离"不变的情况下,将待分解矩阵变换成一个低维矩阵。在没有偏差的情况下,将对原始大矩阵的分解变成对这个低维矩阵的分解,大幅降低了时间复杂度,减少了对内存的使用,同时增加了算法的稳定性,从而在根本上解决了上述3个问题。 王晓伟 闫德勤 刘益含关键词:主成分分析 随机矩阵 时间复杂度 一种基于压缩感知的邻域优化算法 2014年 非线性降维方法是目前对降维研究有着重要影响的方法,但在降维过程中经常会遇到局部邻域信息量不足、短路和噪声干扰等问题,严重影响降维效果,很难广泛应用于真实数据的处理中。对以上问题分析发现,其主要原因在于经典降维算法都是采用全局固定的邻域大小。提出了一种基于压缩感知的邻域优化算法,运用压缩感知技术对高维空间目标点近邻进行压缩采样,构建"收—放"模型,自适应得到最优子空间,同时优化邻域组成元素,使得数据的整体降维效果更加稳定。通过手工流形和真实数据集的实验,验证了算法的有效性和稳定性。 吕志超 闫德勤 刘胜蓝 刘德山关键词:非线性 压缩感知 降维 一种邻域竞争线性嵌入的降维方法 2015年 针对局部线性嵌入算法处理稀疏数据失效的问题,提出一种基于邻域竞争线性嵌入的降维方法。利用数据的统计信息动态确定局部线性化范围,并采用cam分布寻找数据点的近邻,避免了近邻选取方向的缺失。在数据集稀疏的情况下,通过对数据点近邻做局部结构的提取,该算法能够很好地把握数据的局部信息和整体信息。为了验证算法的有效性,将该算法应用于手工流形降维和对Corel数据库进行图像检索等,结果表明该算法不仅有较好的降维效果,而且具有很好的实用价值。 李燕燕 闫德勤关键词:线性化 流形学习 局部线性嵌入 降维 基于FLPP的极端学习机人脸识别方法 2018年 极端学习机(ELM)训练速度快、分类率高,已被广泛应用于人脸识别领域,但是在实际问题中由于数据具有较高维数,导致ELM在有限样本下存在学习不充分的问题。传统对数据进行有效维数约简的方法,没有考虑到数据之间判别信息和小样本问题。为此,提出一种强制性保留算法(FLPP),以保持全部样本与局部样本之间的几何结构,同时类间离散度矩阵加入判别信息,因此避免了样本点重叠和小样本问题。实验结果表明,该算法有效提高了极端学习机的泛化性能和分类准确率。 刘佳奇 闫德勤 何阳关键词:维数约简 极端学习机 人脸识别 一种改进的邻域保持嵌入算法 被引量:2 2018年 邻域保持嵌入(NPE)是一种新颖的子空间学习算法,在降维的同时保持了样本集原有的局部邻域流形结构。为了进一步增强NPE在人脸识别和语音识别中的识别功能,提出了一种改进的邻域保持嵌入算法(RNPE)。在NPE的基础上通过引入类间权值矩阵,使得类间离散度最大,类内离散度最小,增加了样本类间散布约束。最后利用极端学习机(ELM)分类器进行分类,在Yale人脸库、Umist人脸库、Isolet语音库上的实验结果表明,RNPE算法的识别率明显高于NPE算法、LMMDE算法以及RAF-GE算法。 娄雪 闫德勤 王博林 王族关键词:人脸识别 一种邻域线性竞争的排列降维方法 被引量:1 2014年 局部线性嵌入算法以及局部切空间排列算法是目前对降维研究有着重要影响的算法,但对于稀疏数据及噪声数据,在使用这些经典算法降维时效果欠佳。一个重要问题就是这些算法在处理局部邻域时存在信息涵盖量不足。对经典算法中全局信息和局部信息的提取机制进行分析后,提出一种邻域线性竞争的排列方法(neighborhood linear rival alignment algorithm,NLRA)。通过对数据点的近邻作局部结构提取,有效挖掘稀疏数据内部信息,使得数据整体降维效果更加稳定。通过手工流形和真实数据集的实验,验证了算法的有效性和稳定性。 闫德勤 吕志超 刘胜蓝关键词:线性化 局部线性嵌入 降维 稀疏数据 一种基于贪心算法的快速PCA算法 被引量:3 2013年 提出一种快速算法,该算法利用贪心算法构造卷数据降维矩阵,在保持点与点之间"核距离"不变的情况下,把待分解矩阵变换成一个低维矩阵。在没有偏差的情况下,将对原始大矩阵的分解变成对这个低维矩阵的分解,大幅降低了时间复杂度,减少了对内存的使用率的同时增加了算法的稳定性。 王晓伟 闫德勤 唐祚关键词:主成分分析 贪心算法 时间复杂度 一种优化的近邻保持嵌入降维算法研究 2023年 近邻保持嵌入算法NPE是流形学习领域中一种重要的降维算法,现已成功应用于很多领域,例如人脸识别、语音识别等,但在处理局部邻域信息量不足、存在短路以及流形曲率大等稀疏数据时,原始数据的几何拓扑结构损坏严重。其主要原因是在邻域选择中没有对数据类间信息进行很好的区分。基于此,提出了一种优化的近邻保持算法(ONPE),在NPE算法中对数据类间信息进行优化,构造类间权值矩阵;并在低维局部重建时引入类内密度信息,从数据类内和类间两个维度出发,更好地避免数据在近邻选取方向上的缺失。将ONPE算法应用于图像检索等实验,结果表明在图像检索的实验中该算法有较高的查准率和查全率。ONPE相对于NPE降维的时间复杂度并没有增加,验证了算法的实用性和有效性。 李燕燕 闫德勤关键词:流形学习 降维 类别信息 一种新的去无关基因肿瘤样本分类方法 被引量:1 2015年 基因数据分类方法的研究是当前生物信息学的一个热点,利用基因微阵列技术所提供大量的基因数据为诊断不同种类的基因疾病提供了可能.依据基因表达谱建立有效的模型对肿瘤类型的识别、诊断和治疗具有重要应用价值.通过对肿瘤基因表达谱进行分析,提出一种新的去无关基因的分析方法.新方法首先通过引入参数数量与改进的信噪比结合,对已有的基因信噪比(REFSC)公式进行改进,然后用主成分分析法提取主要的分类信息,达到特征提取的目的.最后用支持向量机(SVM)对样本集进行分类测试,分类模型的核函数分别采用线性linear、多项式polymoid、径向基RBF核函数,对肿瘤样本集进行实验测试,实验表明了新方法是可行的和有效的. 刘德山 范雅惠 闫德勤 贾洪哲关键词:特征提取 支持向量机 基因表达谱