江苏省高校自然科学研究项目(03KJD520117)
- 作品数:1 被引量:7H指数:1
- 相关作者:吉根林韦素云鲍培明更多>>
- 相关机构:南京师范大学更多>>
- 发文基金:江苏省高校自然科学研究项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 一种基于DOM树的XML数据频繁模式挖掘算法被引量:7
- 2006年
- 由于XM L数据具有半结构化特性,使得面向XM L数据的数据挖掘不同于面向关系数据库的数据挖掘,它具有更复杂的层次结构。研究基于DOM树的XM L数据频繁模式挖掘算法,提出面向XM L数据的频繁模式增量式挖掘算法F reqtT ree。该算法首先将XM L数据转化成DOM树,然后从DOM树挖掘所有频繁模式。F reqtT ree算法采用最右扩展技术,只在树的最右分支上增加新结点生成新树。同时充分利用已生成的频繁模式信息,使得产生的候选模式数量较少。F reqtT ree算法利用频繁k-1模式的支持数计算候选k模式的支持数,该算法只对DOM树遍历一次,具有较高的效率。采用多组数据对此算法的性能进行检验,并与其他算法作对比实验,实验结果表明该算法高效可行。
- 吉根林韦素云鲍培明
- 关键词:XMLDOM树增量式挖掘数据挖掘