安徽省高校省级自然科学研究项目(KJ2008B45ZC)
- 作品数:2 被引量:5H指数:1
- 相关作者:朱勇夏启寿胡学钢方元康更多>>
- 相关机构:合肥工业大学池州学院更多>>
- 发文基金:国家自然科学基金安徽省高校省级自然科学研究项目更多>>
- 相关领域:自动化与计算机技术更多>>
- 改进的Web日志数据预处理技术被引量:5
- 2009年
- 介绍Web日志挖掘预处理过程中一些特殊情况的处理方法,在会话识别阶段给出一种基于过滤框架网页与会话重组相结合的会话识别方法,在会话识别之前进行框架网页的过滤,根据传统的会话识别方法构造初始会话集,使用会话重组算法对初始会话集进行优化。实验结果显示,该方法提高了会话识别的质量。
- 方元康胡学钢夏启寿朱勇
- 关键词:WEB日志挖掘数据预处理会话识别
- 基于框架网页与页面阈值的会话识别算法
- 2009年
- 会话识别是Web日志预处理过程中的一个重要环节,针对传统会话识别的不足,提出一种改进的会话识别算法。在识别出具体的用户之后,过滤大量的框架网页;然后根据每个页面的内容及网站结构,构造出相对合理的页面访问时间阈值,并以此阈值来进行用户的会话识别。最后通过实验数据,与几种传统的会话识别方法进行了比较,表明该算法更为合理有效。
- 方元康胡学钢夏启寿朱勇
- 关键词:WEB挖掘数据预处理阈值会话识别