国家科技支撑计划(2006BAK01A33)
- 作品数:24 被引量:163H指数:6
- 相关作者:李雄飞李军李军李巍孙涛更多>>
- 相关机构:吉林大学长春理工大学东北师范大学更多>>
- 发文基金:国家科技支撑计划吉林省科技发展计划基金国家自然科学基金更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 一种新的不平衡数据学习算法PCBoost被引量:63
- 2012年
- 现实世界中广泛存在不平衡数据,其分类问题是机器学习研究中的一个热点.多数传统分类算法假定类分布平衡或误分类代价均衡,在处理不平衡数据时,效果不够理想.文中提出一种不平衡数据分类算法-PCBoost.算法以信息增益率为分裂准则构建决策树,作为弱分类器.在每次迭代初始,利用数据合成方法添加合成的少数类样例,平衡训练信息;在子分类器形成后,修正"扰动",删除未被正确分类的合成样例.文中讨论了数据合成方法,给出了训练误差界的理论分析,并分析了集成学习参数的选择.实验结果表明,PCBoost算法具有处理不平衡数据分类问题的优势.
- 李雄飞李军李军董元方
- 关键词:数据挖掘不平衡数据
- 数据分布不敏感的决策树算法被引量:1
- 2009年
- 传统的决策树算法是数据分布敏感的,面对数据分布偏斜的样本集时,常导致少数类别样本的分类精度很低。已有的可以处理偏斜样本集的决策树算法只针对两种类别样本的集合。由此提出了一种新的数据分布不敏感的决策树算法——DTID。该算法通过构造各种新的少数类别样本,调整样本集合的数据分布,提高少数类别样本的分类精度。DTID算法采用样本取模运算减少了算法的运行时间。实验结果表明,与C4.5等算法相比,DTID的分类精度明显提高,即使样本集中包含多种少数类别样本也能获得较好的分类效果。
- 孙涛李雄飞刘丽娟
- 关键词:人工智能决策树算法
- XML文档分类的IL-AdaBoost算法被引量:3
- 2011年
- 提出一种XML文档分类算法——IL-AdaBoost。算法以XML频繁变化子结构为特征构建决策树桩,作为boosting算法的弱分类器,并改进了AdaBoost算法;利用泊松过程模拟新增XML文档的生成,反映XML文档随时间增加的特性,更新样本分布,实现增量学习。利用采样改善基本分类器的差异性,提高集成学习效果。
- 董元方李雄飞李军李军
- 关键词:人工智能ADABOOST
- 改进的分布式系统负载平衡策略被引量:1
- 2011年
- 针对服务器计算能力及带宽等方面的异构性导致的系统负载不均衡问题,提出了一种改进的分布式系统负载平衡策略.将模糊综合评判理论运用到服务器性能评价中,选出性能最佳的服务器,使负载均衡,提高了分布式资源的利用率.实验结果表明,运用此策略可以准确地选出最佳服务器.
- 董立岩黄乐王利民毛锐殷涵
- 关键词:分布式系统负载平衡模糊综合评判
- 动态有序树存储模型与实现方法被引量:4
- 2013年
- XML作为半结构化数据模型的代表,其文档较大,存储动态有序树时需要较多空间成为其明显的缺点,对XML文档进行二进制的编码压缩可以有效地减少存储空间.提出了一种不仅可以对有序树进行空间高效存储,又可以实现有序树的动态化操作的封装包结构.此结构通过将有序树的二进制编码段分段处理的方法,减少了修改量.并通过三重定位的方法快速选定要修改的封装包.针对有序树动态化后出现的节点意义丢失的问题,提出了对树进行辅助描述的高效节点序号表,通过节点序号表可以记录每个节点的内容及意义,进而补充了二进制编码只能表示树结构的缺点.并通过建立有效的序号修改表对其进行快速高效的更新.通过设计对动态树的各种常用操作,并计算出各种操作的空间及时间复杂度,表明了通过此结构可以实现动态有序树的空间高效存储.
- 特日根李巍李雄飞
- 关键词:XML压缩查询处理二进制编码
- 基于Spread业务支撑系统的拓扑构造
- 2011年
- 基于Spread具有的高度灵活性和自动发现功能,构造一个基于Spread的业务支撑系统,并研究了该系统的拓扑构造,给出了系统拓扑常见的4种情况:服务节点加入、服务节点离开、动态拓扑增加和动态拓扑减少的算法.仿真实验表明,该系统具有良好的稳定性、扩展性和容灾抗毁能力.
- 董立岩殷涵王利民毛锐黄乐
- 关键词:拓扑构造业务支撑系统
- 基于移动agent的分布式入侵检测系统研究被引量:2
- 2009年
- 为了提高现有分布式入侵检测系统的效率和性能,提出了一种基于移动agent的分布式入侵检测系统模型。将移动agent技术应用于入侵检测中,并给出了其移动agent间的可靠通信方法,实现了agent的协同检测。实验结果表明,由于移动agent的应用,入侵检测系统的节点成为了可移动的部件,从而使该模型具有了更强的抗攻击性和入侵检测能力。
- 徐沛娟曹锦纲郑顾平张龙飞张林
- 关键词:移动AGENT分布式入侵检测网络安全
- 一种基于欠采样的不平衡数据分类算法被引量:21
- 2011年
- 针对不平衡数据学习问题,提出一种基于欠采样的分类算法。对多数类样例进行欠采样,保留位于分类边界附近的多数类样例。以AUC为优化目标,选择最恰当的邻域半径使数据达到平衡,利用欠采样后的样例训练贝叶斯分类器,并采用AUC评价分类器性能。仿真数据及UCI数据集上的实验结果表明,该算法有效。
- 程险峰李军李军
- 关键词:不平衡数据欠采样
- 启发式遗传算法求解应急资源调度被引量:6
- 2010年
- 提出了带有启发信息的初始种群生成以及染色体编码的过程,给出了对适应度函数进行动态调整的策略。在遗传算子部分给出了对交叉点的选择和对交叉算子、变异算子进行修正的方法。在种群进化过程中提出了回溯迭代控制的方法,通过模拟仿真将算法应用于求解应急资源调度问题,并将本文提出的算法和Dijkstra算法进行了比较。结果表明:用本文提出的算法能有效地求解应急资源调配问题,并且能为决策者提供有力的决策支持。
- 张海龙李雄飞王仁彪
- 关键词:人工智能最短路径遗传算法启发信息DIJKSTRA
- 用启发式算法求解最短路径问题被引量:9
- 2011年
- 提出了一种带有启发信息的邻接表结点存储结构模型,给出了结点间权值计算的具体评判函数,依据评判函数值优化邻接表中节点的相对位置。基于最短路径问题提出了带有启发信息的遗传算法思想,将启发信息加入到了初始种群生成过程中,提出了新的交叉方法。通过模拟仿真得到了算法的性能参数,并将本文算法和Dijkstra算法进行比较,结果表明,在求解数据规模比较大的最短路径问题时,本文算法具有更高的执行效率。
- 李雄飞张海龙刘兆军王仁彪
- 关键词:计算机应用最短路径启发信息DIJKSTRA算法