江西省科技支撑计划项目(20112BBG70087)
- 作品数:4 被引量:11H指数:2
- 相关作者:邱桃荣白小明周浩黄海泉彭永供更多>>
- 相关机构:南昌大学更多>>
- 发文基金:江西省科技支撑计划项目江西省教育厅科技计划项目国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于粒计算的决策树并行算法的应用被引量:5
- 2015年
- 针对传统的决策树分类算法不能有效解决海量数据挖掘的问题,结合并行处理模型MapReduce,研究基于粒计算的ID3决策树分类的并行化处理方法。基于信息粒的二进制表示来构建属性的二进制信息粒向量,给出数据集的二进制信息粒关联矩阵表示;基于二进制信息粒关联矩阵,提出属性的信息增益的计算方法,设计基于MapReduce的粒计算决策树并行分类算法。通过使用标准数据集和实际气象领域的雷电真实数据集进行测试,验证了该算法的有效性。
- 周浩刘萍邱桃荣白小明
- 关键词:粒计算决策树信息增益
- 基于JSF技术的招生与就业网站建设研究被引量:1
- 2012年
- 针对提高Web应用程序开发效率的问题,基于JSF框架的Web开发模式应用于招生就业信息网站后台管理子系统的开发中。通过基于友好的服务器端UI框架,以Hibernate来完成对象和关系数据之间的映射,并由Spring框架将各种技术集成进来,将JSF架构应用于对网站后台管理子系统中的招生信息查询系统进行开发,运行结果表明,此改进方法是高效的。
- 廖强刘韬沈华
- 关键词:JSFWEB应用查询系统
- 基于哈夫曼树的雷电数据采样算法被引量:5
- 2013年
- 对具有非平衡特征的海量雷电气象数据集,采用基于欧式距离的样本欠采样算法时效率较低。为解决该问题,提出一种基于哈夫曼树的雷电数据采样算法。使用哈夫曼树构建方法估算雷电样本的簇中心及簇内样本个数,利用得到的结果并结合欧式距离的样本欠采样算法进行非雷电样本采样。对27 552条真实数据做采样实验,结果表明,该算法的采样时间约为16 min,不仅能降低数据量,而且能提高算法的时间性能。
- 彭永供邱桃荣林于渊黄海泉
- 关键词:雷电预报非平衡数据哈夫曼树支持向量机
- 一种基于粗糙集属性重要度和密度聚集的匿名化方法被引量:1
- 2013年
- 基于微聚集技术的k-匿名化MDAV算法没有考虑数据属性的分布情况和数据属性重要性在聚类中的作用,易产生不合理的划分,从而对数据的保护程度与数据可用性之间关系带来影响。针对这个问题本文提出一种基于属性重要度和密度聚类的MDAV改进方法实现对数据集k-匿名化。首先采用基于密度聚类DENCLUE方法对数据表进行聚集成簇,然后对每个簇采用基于粗糙集属性重要度作为加权距离的权值来计算相似样本,实现对数据集的k-划分。与MDAV算法比较测试,所改进的方法改善了发布数据的可用性。
- 邱桃荣段文影段隆振白小明
- 关键词:粗糙集属性重要度