余光柱
- 作品数:9 被引量:11H指数:2
- 供职机构:东华大学信息科学与技术学院更多>>
- 发文基金:国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 高效用关联规则的挖掘
- 关联规则的挖掘就是要发现大量数据中项集之间的关联或相关联系,它是数据挖掘研究的重要内容之一,在科学研究、电信网络、市场与风险管理、客户关系管理(CRM)、存货控制、军事等方面得到了广泛应用。但是,传统的关联规则以支持度衡...
- 余光柱
- 关键词:数据挖掘关联规则频繁集
- 高维大数据集中频繁闭合模式的挖掘
- 2008年
- 高维大数据集对现有的数据挖掘算法提出了挑战。该文把挖掘任务分解为挖掘频繁长模式与短模式2个子问题,提出一种在高维大数据集中挖掘长项集的算法,即inter-transaction。该算法利用了高维数据中长事务相交迅速变短的特性,通过事务的交集运算直接得到长闭合模式,同时采用新的减枝策略,优化了事务交集运算的方法。实验表明,该方法对高维大数据集非常有效。
- 余光柱王亮易先军邵世煌
- 关键词:频繁闭合模式
- 不平衡类分布下多分类问题的提升算法被引量:1
- 2007年
- 模式识别在实际应用中常碰到类分布不平衡的多分类问题,该情形下的分类器性能采用传统的精度指标评价意义不大,需要采用代价指标和ROC曲线分析来评价。传统的分类器对不平衡问题分类性能很差,利用AdaBoost算法在机器学习中对样本权重的调整,将不平衡的错分代价加入到样本权重,使分类器更多关注重要的少数样本类,可以提高不平衡类分布下多分类性能。模拟试验也表明了该方案的有效性。
- 罗兵余光柱
- 关键词:模式识别不平衡数据
- 基于激励的关联规则的挖掘
- 2009年
- 基于支持度的关联规则挖掘算法无法找到那些非频繁但效用很高的项集,基于效用的关联规则会漏掉那些效用不高但发生比较频繁、支持度和效用值的积(激励)很大的项集。提出了基于激励的关联规则挖掘问题及一种自下而上的挖掘算法HM-miner。激励综合了支持度与效用的优点,能同时度量项集的统计重要性和语义重要性。HM-miner利用激励的上界特性进行减枝,能有效挖掘高激励项集。
- 刘旭辉邵世煌余光柱
- 关键词:关联规则兴趣度
- 基于DNA损伤的p53基因调控网络模型研究
- 肿瘤可看作与其密切相关的基因及其蛋白质分子组成的一种复杂的网络形态。生物医学研究揭示了p53基因控制着一系列下游基因的转录与翻译过程,并通过复杂的调控通路实现细胞周期捕获,病变细胞凋亡等功能。本文研究了持续离子辐射等环境...
- 齐金鹏邵世煌白慧余光柱
- 关键词:DNA损伤P53基因网络模型离子辐射
- 文献传递
- 高激励项集的挖掘研究
- 2009年
- 基于支持度的关联规则只能找出所有的频繁集,无法找到那些非频繁但效用很高的项集;基于效用的关联规则致力于发现所有高效用项集,无法找到效用不高但支持度与效用的积很大的项集。为克服支持度与效用的不足,提出了一种新的项集重要性的度量方法(即激励)及一种自下而上的挖掘高激励项集的算法HM-Two-Phase-Miner。激励集成了支持度与效用的优点,能同时表达项集的语义特性与统计特性。HM-Two-Phase-Miner利用事务权重激励向下封闭特性进行减枝,有效提高了算法的性能。
- 余光柱刘旭辉邵世煌
- 关键词:关联规则
- 高置信度关联规则的挖掘被引量:5
- 2010年
- 传统的关联规则和基于效用的关联规则,会忽略一些支持度或效用值不高、置信度(又称可信度)却非常高的规则,这些置信度很高的规则能帮助人们满足规避风险、提高成功率的期望。为挖掘这些低支持度(或效用值)、高置信度的规则,提出了HCARM算法。HCARM采用了划分的方法来处理大数据集,利用新的剪枝策略压缩搜索空间。同时,通过设定长度阈值minlen,使HCARM适合长模式挖掘。实验结果表明,该方法对高置信度长模式有效。
- 周贤善杜友福邵世煌余光柱
- 关键词:关联规则剪枝策略
- 基于遗传编程的SMT机器视觉检测特征提取被引量:1
- 2007年
- 在印刷电路板贴片安装的机器视觉检测中,贴片元件的型号识别和缺陷检测都是基于CCD采集的图像,数据量大、维数太多,该图像特征的提取是正确检测识别的关键技术之一。遗传编程通过遗传优化可以从原始数据或传统的高维特征中提取出更能反映类别本质的有效特征,降低特征维数、减少分类器的计算成本,同时提高分类识别精度。设计基于遗传编程的特征提取方案用于该机器视觉检测,并改进了特征评价指标。对比实验验证了本方案提取的特征分别用于ANN和SVM的良好分类识别效果。
- 罗兵章云余光柱
- 关键词:特征提取遗传编程机器视觉模式识别自动视觉检测
- 一种基于划分的高效用长项集挖掘算法被引量:4
- 2007年
- 效用(utility)可弥补支持度在表现语义重要性方面的不足。现有的几种基于效用的关联规则挖掘算法都采用了类似Apri-ori自底向上的搜索方法,不适合长模式的挖掘。提出了一种双向搜索高效用项集的模型及一种基于划分的inter-transaction算法。inter-transaction利用了长事务相交迅速变短的特性和新的减枝策略,能同时输出项集的效用与支持度。实验表明,该方法对蕴含长模式的高维数据库非常有效。
- 余光柱李克清易先军邵世煌