教育部科学技术研究重点项目(206017)
- 作品数:11 被引量:86H指数:5
- 相关作者:梁吉业曹付元钱宇华高小方王俊红更多>>
- 相关机构:山西大学更多>>
- 发文基金:国家教育部博士点基金教育部科学技术研究重点项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术动力工程及工程热物理电子电信理学更多>>
- 基于采样密度和流形弯曲度的动态邻域算法被引量:2
- 2010年
- 针对流形学习的邻域优化问题,提出一种动态邻域的算法。基于局部采样密度和流形弯曲度估计切空间,并为所有样本点动态地选择邻域,其参数可通过计算残差自动确定。实验结果表明,将这种算法应用于ISOMAP后,邻域得到进一步优化,嵌入结果也更加准确。
- 高小方梁吉业
- 关键词:流形学习动态邻域
- 基于优势关系的信息系统与形式概念分析被引量:1
- 2009年
- 对形式概念分析在基于优势关系的信息系统中的应用进行了讨论,证明了由基于优势关系的信息系统导出的形式背景中的对象粒与优势类是等价的,同时对象粒协调集与优势协调集是等价的。
- 王俊红梁吉业曲开社
- 关键词:形式概念分析概念格信息系统
- 流形学习方法中的若干问题分析被引量:17
- 2009年
- 流形学习是近年来机器学习与认知科学中的一个新的研究热点,其本质在于根据有限的离散样本学习和发现嵌入在高维空间中的低维光滑流形,从而揭示隐藏在高维数据中的内在低维结构,以实现非线性降维或者可视化。介绍了几种主要的流形学习算法,分析了它们的优势与不足,总结了流形学习方法中需要解决的若干问题及其研究现状,并展望了流形学习未来的研究前景。
- 高小方
- 关键词:流形学习维数约简局部线性嵌入算法
- 一种基于条件熵的增量核求解方法被引量:13
- 2008年
- 分析了增加新对象后,决策表的决策属性关于条件属性的条件熵变化原理.并在此基础上提出了一种新的增量核求解算法.该算法只需找到与新对象属性值相等的条件类和决策类就可以得到新的条件熵,进而求得决策表在信息观下的增量属性核.实例证明了该算法的有效性.
- 梁吉业魏巍钱宇华
- 关键词:决策表条件熵
- 基于邻域模型的K-means初始聚类中心选择算法被引量:9
- 2008年
- 传统的K-means算法由于其方法简单,在模式识别和机器学习中被广泛讨论和应用。但由于K-means算法随机选择初始聚类中心,而初始聚类中心的选择对最终的聚类结果有着直接的影响,因此算法不能保证得到一个唯一的聚类结果。利用邻域模型中对象邻域的上下近似,定义了对象邻域耦合度和分离度的概念,给出了对象在初始聚类中心选择中的重要性,提出了一种初始聚类中心的选择算法。另外,分析了邻域模型中三种范数对聚类精度的影响,并和随机选择初始聚类中心、CCIA选择初始聚类中心算法进行了比较,实验结果表明,该算法是有效的。
- 曹付元梁吉业姜广
- 关键词:邻域模型初始聚类中心K-MEANS聚类粗糙集
- 基于粗糙集的改进K-Modes聚类算法被引量:16
- 2009年
- 传统的K-Modes算法采用简单匹配的方法来计算对象之间的距离,并没有充分考虑同一属性下的两个不同值之间的相似性。基于粗糙集中的上、下近似,提出了一种新的距离度量,并重新定义了类中心,对传统K-Modes算法进行了改进。与其他改进K-Modes算法进行了比较,实验结果表明,基于粗糙集的改进K-Modes算法有效地提高了聚类精度。
- 白亮梁吉业曹付元
- 关键词:聚类算法粗糙集
- 基于加权连接度的改进K-Modes聚类算法被引量:3
- 2008年
- K-Modes算法是一种经典的字符型数据聚类算法,在处理对象属性值距离时,采用简单的0-1匹配,不能体现出属性值之间潜在的相似关系。通过图形聚类理论中的连接度来度量字符型属性值之间的相似性,改进了传统的K-Modes算法。实验结果表明该方法较传统的K-Modes算法有一定的改善。
- 张小宇梁吉业曹付元于慧娟
- 关键词:字符型数据聚类连接度
- 基于决策支持度的决策树生成算法被引量:5
- 2008年
- 从条件属性对决策支持程度不同的角度出发,引入了决策支持度的概念,提出了一种以其为启发式信息的决策树生成算法。实验分析表明,相对于传统的决策树生成算法,此算法改善了决策树的结构,有效提高了决策分类的精度。
- 关晓蔷梁吉业钱宇华刘煜伟
- 关键词:决策树信息系统
- 基于优势关系的概念格被引量:1
- 2009年
- 对基于优势关系的形式背景进行了讨论,在基于优势关系的形式背景上建立了对象偏序集、属性偏序集以及对象-属性偏序集,提出了基于优势关系的概念格的定义及构建方法。这些结论进一步丰富了概念格的理论,对研究基于优势关系的信息系统的规则提取提供了新的思路。
- 王俊红梁吉业曲开社
- 关键词:形式概念分析概念格偏序集
- 非平衡数据集分类问题研究进展被引量:20
- 2008年
- 非平衡数据集广泛存在于现实世界中,其分类问题已经成为目前数据挖掘领域中的一个研究热点。文章综述了非平衡数据集分类问题的评价方法及其常用分类算法,分析了目前存在的主要困难,并指出需进一步解决的几个问题。
- 高嘉伟梁吉业
- 关键词:非平衡数据集