公共文化服务平台

基于FCM隶属度的支持向量机被引量：2: 2011年; 传统SVM在训练大规模数据集时,训练速度慢,时间消耗代价大.针对此问题,提出利用FCM算法对训练样本集进行预处理,依据样本隶属度提取出所有可能的支持向量进行SVM训练.利用原始数据集对算法进行验证,此算法在保证SVM分类精度的同时,大大提高了训练速度,算法具有可行性.; 齐丙娟丁世飞; 关键词：统计学习理论支持向量机模糊C均值聚类

Parallel Web Mining System Based on Cloud Platform被引量：1: 2012年; Traditional machine-learning algorithms are struggling to handle the exceedingly large amount of data being generated by the internet. In real-world applications, there is an urgent need for machine-learning algorithms to be able to handle large-scale, high-dimensional text data. Cloud computing involves the delivery of computing and storage as a service to a heterogeneous community of recipients, Recently, it has aroused much interest in industry and academia. Most previous works on cloud platforms only focus on the parallel algorithms for structured data. In this paper, we focus on the parallel implementation of web-mining algorithms and develop a parallel web-mining system that includes parallel web crawler; parallel text extract, transform and load （ETL） and modeling; and parallel text mining and application subsystems. The complete system enables variable real-world web-mining applications for mass data.; Shengmei LuoQing HeLixia LiuXiang AoNing LiFuzhen Zhuang

Research and Development of Attribute Reduction Algorithm Based on Rough Set: ＜正＞Attribute reduction is a form of the data reduction,usually as a preprocessing step in data mining.Its job ...; Shifei Ding~(1,2),Hao Ding~1 1.School of Computer Science and Technology,China University of Mining and Technology,Xuzhou,221116 2.Key Laboratory of Intelligent Information Processing,Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100080; 文献传递

一种模糊加权的改进层次聚类算法研究: 2011年; 传统层次聚类算法中经常会遇到合并点和分裂点选择的问题,一旦一组对象被合并或者分裂,下一步的处理将在新生成类上进行,已做处理不能撤销,这样有可能导致低质量的聚类结果.针对这个问题,文中提出了一种模糊加权层次聚类改进算法,每次分层聚类时先计算对象属于这个类可靠度,然后和阀值进行比较,当可靠度小于阀值时重新确定对象的归属类,这样就解决了上述问题.最后通过实验验证,该算法确实可行有效.; 李剑英丁世飞徐丽钱钧; 关键词：层次聚类模糊加权可靠度阈值

煤与瓦斯突出的PCA-BP神经网络预测模型研究被引量：10: 2011年; 通过主成分分析法对煤与瓦斯突出的主要影响因素进行主成分提取,选取贡献率大于85%的3个主成分来代替原来的7个影响因素,以此来确定BP神经网络的输入参数为3个。根据煤与瓦斯突出的类型,建立了煤与瓦斯突出预测的PCA-BP神经网络模型。选用典型突出矿井的煤与瓦斯突出实例作为学习样本,对PCA-BP网络进行训练。以云南某煤矿的煤与瓦斯突出实例作为预测样本,仿真结果表明PCA-BP神经网络模型性能优于传统BP神经网络,能够满足煤与瓦斯突出预测的要求。; 许新征丁世飞杨胜强赵作鹏吴祥; 关键词：主成分分析神经网络煤与瓦斯突出

Research on Ranking Support Vector Machine and Prospects: Learning to rank is designed to determine a ranking for the target objects according to some rule.Specifically...; DING Shi-Fei 1,2,LIU Xiao-Liang 1,ZHANG Li-Wen 1 1.School of Computer Science and Technology,China University of Mining and Technology,Xuzhou 221008,P.R.China 2.Key Laboratory of Intelligent Information Processing,Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100080,P.R.China; 文献传递

基于改进属性约简的细粒度并行AP聚类算法被引量：7: 2012年; Affinity Propagation(AP)聚类算法将所有数据点作为潜在的聚类中心,在相似度矩阵的基础上通过消息传递进行聚类.与传统聚类方法相比,对于规模很大的数据集,AP是一种快速、有效的聚类方法.正是这样,属性约简对于AP算法非常重要.另外,在大规模并行系统的设计中,细粒度并行是实现高性能的基本策略.提出了一种基于改进属性约简的细粒度并行AP聚类算法(IRPAP),将粒度思想引入到并行计算中.首先分析了并行计算中的粒度原理.然后用改进的属性约简算法对数据集预处理.此算法并行计算并选择差别矩阵元素,降低了时间空间复杂度,最后用AP算法聚类.整个IRPAP算法将任务划分到多个线程同时处理.实验证明,对于大规模数据集的聚类,IRPAP算法比AP算法效率更高.; 朱红丁世飞许新征; 关键词：属性约简细粒度并行计算聚类

一种粗逻辑神经网络的构造和学习方法: 2011年; 传统的粗逻辑神经网络可以对信息系统及粗推理决策进行研究,能够深入地揭示粗糙集理论实质,但对于处理非单值输入问题不能取得良好的效果。粗糙神经元的上边界和下边界恰好能解决这一方面的问题,且随着粗集理论的不断发展,上下边界的概念得到了广泛的应用。综合两个方面的优点,提出了一种粗逻辑神经网络的构造与学习方法。它主要由传统粗逻辑神经网络和粗糙神经元的思想(模式中每一个特征变量都包含上界和下界两个边界)构成:边界粗逻辑神经网络。首先给出了粗糙神经元和粗逻辑及决策的基本知识,然后提出了边界粗逻辑神经网络的结构和学习方法及两种模型并比较了模型间的优缺点。与传统粗逻辑神经网络相比,这类神经网络能更有效地处理非单值和连续近似域函数问题。最后提出可以进一步优化的方向。; 陈锦荣丁世飞; 关键词：粗糙集神经网络

物联网与数据挖掘云服务被引量：31: 2012年; 物联网与云计算是目前信息技术的研究热点,探讨数据挖掘在其中扮演的角色,以及与这2项技术相结合的方式.分析了数据挖掘在物联网中的地位和作用,指出了云计算是物联网的基石,剖析了分布式数据挖掘与并行数据挖掘的异同,说明了物联网中数据挖掘服务的提供方式.; 何清; 关键词：物联网云计算数据挖掘云服务

基于对象间完备度的限制容差关系改进模型被引量：3: 2010年; 本文在分析不完备信息系统已经存在的容差关系、非对称相似关系、限制容差关系以及特征关系的基础上,提出了对象间完备度的概念,并建立了基于对象间完备度的限制容差关系模型,最后通过实例分析说明此模型可以更加真实客观地处理不完备信息系统。; 王虎丁世飞张禹; 关键词：不完备信息系统粗糙集限制容差关系

渝B2-20050021-1　渝公网安备 50019002500403号　违法和不良信息举报中心　互联网出版许可证　新出网证(渝)字10号

国家自然科学基金(60975039)