您的位置: 专家智库 > >

江苏省基础研究计划(BK2009093)

作品数:17 被引量:1,162H指数:7
相关作者:丁世飞许新征朱红史忠植徐丽更多>>
相关机构:中国矿业大学中国科学院徐州医学院更多>>
发文基金:江苏省基础研究计划国家自然科学基金中国矿业大学科技基金更多>>
相关领域:自动化与计算机技术自然科学总论矿业工程更多>>

文献类型

  • 17篇中文期刊文章

领域

  • 16篇自动化与计算...
  • 1篇矿业工程
  • 1篇自然科学总论

主题

  • 7篇聚类
  • 4篇粗糙集
  • 3篇支持向量
  • 3篇支持向量机
  • 3篇属性约简
  • 3篇向量
  • 3篇向量机
  • 3篇聚类算法
  • 2篇神经网
  • 2篇神经网络
  • 2篇统计学习
  • 2篇统计学习理论
  • 2篇谱聚类
  • 2篇粒度
  • 1篇信息函数
  • 1篇信息粒
  • 1篇信息粒度
  • 1篇信息系统
  • 1篇信息熵
  • 1篇语义

机构

  • 17篇中国矿业大学
  • 12篇中国科学院
  • 1篇北京大学
  • 1篇徐州医学院

作者

  • 14篇丁世飞
  • 6篇许新征
  • 4篇朱红
  • 3篇史忠植
  • 3篇徐丽
  • 3篇戴斌
  • 2篇张力文
  • 2篇雷小锋
  • 2篇贾伟宽
  • 2篇宋丰泰
  • 2篇齐丙娟
  • 2篇庄伟
  • 1篇吴祥
  • 1篇张禹
  • 1篇王虎
  • 1篇谢昆青
  • 1篇谭红艳
  • 1篇杨胜强
  • 1篇赵作鹏
  • 1篇巨瑜芳

传媒

  • 3篇广西师范大学...
  • 3篇计算机科学
  • 1篇计算机研究与...
  • 1篇模式识别与人...
  • 1篇电子学报
  • 1篇计算机学报
  • 1篇计算机工程与...
  • 1篇微电子学与计...
  • 1篇电子科技大学...
  • 1篇计算机应用研...
  • 1篇计算机工程与...
  • 1篇计算机工程与...
  • 1篇软件导刊

年份

  • 4篇2012
  • 8篇2011
  • 5篇2010
17 条 记 录,以下是 1-10
排序方式:
基于FCM隶属度的支持向量机被引量:2
2011年
传统SVM在训练大规模数据集时,训练速度慢,时间消耗代价大.针对此问题,提出利用FCM算法对训练样本集进行预处理,依据样本隶属度提取出所有可能的支持向量进行SVM训练.利用原始数据集对算法进行验证,此算法在保证SVM分类精度的同时,大大提高了训练速度,算法具有可行性.
齐丙娟丁世飞
关键词:统计学习理论支持向量机模糊C均值聚类
基于谱聚类的文本相似性研究
2012年
为了克服自然语言表达形式的多样性和文本分类的粗略性,将潜在语义分析和谱聚类方法结合起来对语料库进行处理,构造一个语义空间,最终使用向量空间模型对文本进行相似性计算。实验证明,该方法可有效提高语义相似性计算的准确度。
戴斌
关键词:语义相似性语义结构潜在语义分析谱聚类语义空间
基于旋转投影统计特征的手写数字识别方法被引量:2
2011年
通过抽取数字的轮廓和骨架来提取几何特征,可以有效地反映手写数字的细节,但手写数字的不规范性导致其识别率并不高。运用统计分析理论可以克服这一缺点。首先提出了基于投影间隔比率和间隔变化的特征提取方法,通过数字投影计算间隔的像素数比率和变化趋势,并将其归一化作为特征向量。进一步通过旋转投影基准线,增加特征向量之间的正交性以减少信息冗余,基于这一思路提出旋转投影的识别方法。理论分析和实验证明了旋转投影可以在相同特征数量的情况下达到更高的识别率,并给出了推荐参数。此外,通过旋转投影,直接解决了倾斜数字的识别问题。
庄伟雷小锋宋丰泰戴斌谢昆青
关键词:统计分析朴素贝叶斯手写数字识别
基于启发式的粗糙集属性约简算法研究被引量:6
2011年
对目前常见的粗糙集属性约简算法进行了研究和总结,在此基础上,针对差别矩阵以及启发式约简算法提出了改进算法,减少算法在计算时所需的时间和空间复杂度,求取最小约简。将改进后的约简算法系统地应用到学生考试成绩分析中,对得到的规则进行科学地评价,找出影响学生成绩的潜在因素,并提出学习建议。通过实际应用表明了改进算法的有效性和可行性。
胡立花丁世飞丁浩
关键词:粗糙集属性约简计算机算法
基于Shannon熵的因子特征提取算法被引量:10
2011年
现存的数据提取算法,大都以方差贡献率作为评价准则,来衡量特征提取的效果.然而方差贡献率注重的是样本相关矩阵特征值的性质,并不能顾及到信息的度量问题.文中将Shannon信息熵理论引入提取算法,定义类概率、类信息函数,通过计算累计信息贡献率来确定提取特征维数,提取效果可以从信息论的角度评价.将此理论与因子分析(FA)结合,建立基于信息熵的FA特征提取算法,利用信息贡献率确定主因子提取的个数.通过实例分析,验证理论的有效性.
贾伟宽丁世飞许新征苏春阳史忠植
关键词:信息函数特征提取方差贡献率
基于傅里叶变换和连通图的聚类分析方法被引量:2
2012年
聚类是假设数据在具有某种群聚结构的前提下根据观察到的无标记的样本发现数据的最优划分。针对已有的聚类算法存在的缺点,假设数据样本的结果簇是密集的,且簇与簇之间区别明显,基于该假设提出一种基于傅里叶变换和连通图的聚类分析方法 FGClus。首先针对每个样本点计算k阶距离矩阵并序列化作为离散傅里叶变换的输入信号;然后抽取频域内幅值最小的复数项并构造输入序列进行傅里叶逆变换,得到在时域空间中的最佳阈值;最后利用该阈值结合连通图指导最终的聚类过程。实验表明,FGClus算法克服了K-means算法聚类前需确定聚类个数、聚类结果对初始代表点的选取敏感、只能聚类球状数据等缺点,取得了良好的聚类效果。
巨瑜芳雷小锋戴斌庄伟宋丰泰
关键词:离散傅里叶变换连通图最佳阈值
基于改进属性约简的粗核聚类算法被引量:2
2011年
核聚类算法是一种能够处理样本间差异微弱的有效聚类算法。以粗糙集理论为基础,将基于属性重要度的属性约简算法应用到核聚类算法中,提出一种新的聚类改进算法,由此可以得到高准确率低复杂度的良好结果。该算法在使用核函数对样本优化前,首先用基于属性重要度的约简算法对样本属性进行处理,同时引入信息熵来改进约简算法,从而删除冗余属性得到较优的属性集;然后对样本进行K-means聚类,采用软划分把样本划分到相应聚类中心的上下近似子集中,根据近似子集中样本对聚类的影响程度不同,对上下近似中的样本设置不同的权重来共同决定新的聚类中心。此算法相当于对样本进行了双重优化,采用UCI数据集来测试算法性能。通过和传统聚类算法比较,得出本算法在提高聚类精度的同时降低了复杂度,收敛速度也得到了一定提高。
徐丽丁世飞郭锋锋
关键词:粗糙集属性约简属性重要度信息熵核聚类
粒度聚类算法研究被引量:11
2011年
信息粒度是对信息和知识细化的不同层次的度量。基于信息粒度的聚类分析方法,凭借能够灵活选择粒度结构,消除聚类结果和先验知识之间的不协调性,有效完成聚类任务等优点,成为国内外学者的研究热点之一。从粗糙集、模糊集、商空间3个理论角度与传统聚类算法相结合,阐述并分析了把粒度的思想引入到聚类中的有效算法及其优缺点,并对这样结合后处理高维复杂数据的可行性及有效性做了分析与展望。
徐丽丁世飞
关键词:信息粒度粗糙集模糊集商空间理论聚类算法
煤与瓦斯突出的PCA-BP神经网络预测模型研究被引量:10
2011年
通过主成分分析法对煤与瓦斯突出的主要影响因素进行主成分提取,选取贡献率大于85%的3个主成分来代替原来的7个影响因素,以此来确定BP神经网络的输入参数为3个。根据煤与瓦斯突出的类型,建立了煤与瓦斯突出预测的PCA-BP神经网络模型。选用典型突出矿井的煤与瓦斯突出实例作为学习样本,对PCA-BP网络进行训练。以云南某煤矿的煤与瓦斯突出实例作为预测样本,仿真结果表明PCA-BP神经网络模型性能优于传统BP神经网络,能够满足煤与瓦斯突出预测的要求。
许新征丁世飞杨胜强赵作鹏吴祥
关键词:主成分分析神经网络煤与瓦斯突出
基于改进属性约简的细粒度并行AP聚类算法被引量:7
2012年
Affinity Propagation(AP)聚类算法将所有数据点作为潜在的聚类中心,在相似度矩阵的基础上通过消息传递进行聚类.与传统聚类方法相比,对于规模很大的数据集,AP是一种快速、有效的聚类方法.正是这样,属性约简对于AP算法非常重要.另外,在大规模并行系统的设计中,细粒度并行是实现高性能的基本策略.提出了一种基于改进属性约简的细粒度并行AP聚类算法(IRPAP),将粒度思想引入到并行计算中.首先分析了并行计算中的粒度原理.然后用改进的属性约简算法对数据集预处理.此算法并行计算并选择差别矩阵元素,降低了时间空间复杂度,最后用AP算法聚类.整个IRPAP算法将任务划分到多个线程同时处理.实验证明,对于大规模数据集的聚类,IRPAP算法比AP算法效率更高.
朱红丁世飞许新征
关键词:属性约简细粒度并行计算聚类
共2页<12>
聚类工具0