惠亮
- 作品数:3 被引量:20H指数:3
- 供职机构:江南大学物联网工程学院更多>>
- 发文基金:江苏省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 关联规则中FP-tree的最大频繁模式非检验挖掘算法被引量:5
- 2010年
- 基于FP-tree的最大频繁模式挖掘算法是目前较为高效的频繁模式挖掘算法,针对这些算法需要递归生成条件FP-tree、做超集检验等问题,在分析DMFIA-1算法的基础上,提出了最大频繁模式的非检验挖掘算法NCMFP。该算法改进了FP-tree的结构,使挖掘过程中不需要生成条件频繁模式树也不需要超集检验。算法采用的预测剪枝策略减少了挖掘的次数,采用的求取公共交集的方式保证了挖掘结果的完整性。实验结果表明在支持度相对较小情况下,NCMFP的效率是同类算法的2~5倍。
- 惠亮钱雪忠
- 关键词:关联规则数据挖掘频繁模式树最大频繁项集
- 关联规则中改进FP-tree的最大频繁模式挖掘算法被引量:3
- 2010年
- 关联规则挖掘是数据挖掘领域中重要的研究内容,最大频繁模式挖掘又是关联规则挖掘中的关键问题之一。针对已有的最大频繁模式挖掘算法存在的问题,通过对FP—Growth、FP—Max算法的分析,提出了基于改进FP—tree的最大频繁模式挖掘算法DFP—Max。该算法使用预测、剪枝的策略减少条件FP—tree个数,采用数字集匹配代替项集匹配的方式,减少超集检验的次数,并且避免了中间结果的组合连接,从而使算法达到较高的效率。实验结果表明,在支持度相对较小情况下,DFP—Max的效率是同类算法的2-5倍。
- 钱雪忠惠亮
- 关键词:关联规则最大频繁项集
- 关联规则中基于降维的最大频繁模式挖掘算法被引量:13
- 2011年
- 基于FP-tree的最大频繁模式挖掘算法是目前较为高效的频繁模式挖掘算法,针对这些算法需要递归生成条件FP-tree、产生大量候选最大频繁项集等问题,在分析FPM ax、DMFIA算法的基础上,提出基于降维的最大频繁模式挖掘算法(BDRFI)。该算法改传统的FP-tree为数字频繁模式树DFP-tree,提高了超集检验的效率;采用的预测剪枝策略减少了挖掘的次数;基于降低项集维度的挖掘方式,减少了候选项的数目,避免了递归地产生条件频繁模式树,提高了算法的效率。实验结果表明,BDRFI的效率是同类算法的2~8倍。
- 钱雪忠惠亮
- 关键词:关联规则数据挖掘最大频繁项集频繁模式树降维