陈强
- 作品数:1 被引量:4H指数:1
- 供职机构:西安电子科技大学软件学院更多>>
- 发文基金:中央高校基本科研业务费专项资金中国博士后科学基金陕西省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 利用MapReduce平台实现高效并行的频繁子图挖掘被引量:4
- 2014年
- 频繁子图挖掘是数据挖掘领域的一个重要问题,并且有着广泛的应用。在Hadoop平台上实现了一种基于MapReduce的高效频繁子图挖掘算法Cloud-GFSG(cloud-global frequent subgraph)。该算法基于Apriori思想,在扩展边生成新的子图时,使用已经挖掘出的k-1阶的频繁子图生成k阶的频繁子图。同时,检查是否存在待扩展生成的子图,设定生成的频繁子图表示规则,保证了频繁子图信息的唯一性。较同类算法相比,该算法在挖掘频繁子图时更具通用性,并且在扩展边时避免产生大量的复制图,从而使得算法的正确性得以保证,且运行效率显著提高。
- 孙鹤立陈强刘玮黄健斌邹建华
- 关键词:频繁子图挖掘MAPREDUCEHADOOP平台