曾伟
- 作品数:4 被引量:16H指数:2
- 供职机构:武汉科技大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于衰减窗口与剪枝维度树的实时数据流聚类研究
- 实时数据流挖掘是目前数据挖掘与数据库领域的新兴研究热点,针对实时数据流的聚类分析技术也是该研究中最具有挑战性的难题之一。本文首先介绍了基于实时数据流的数据挖掘和知识发现的研究背景以及该领域现有的主要研究分支:聚类、分类、...
- 曾伟
- 关键词:数据流挖掘剪枝策略
- 实时数据流聚类的研究新进展被引量:9
- 2009年
- 实时数据流聚类是目前国际数据库和数据管理领域的新兴研究热点。综述了实时数据流聚类的最新研究进展,在介绍实时数据流聚类的相关理论和常用技术的基础上,对现有各种代表性算法的优势和不足进行了系统地分析,从处理速度、聚类形状、演化分析、高维性及噪声健壮性5个方面对算法的性能进行了比较。探讨了基于聚类的实时数据流演化分析方法及其局限性。最后展望了将来可能的研究方向。
- 张晓龙曾伟
- 关键词:实时数据流聚类数据流挖掘
- 基于衰减窗口与剪枝维度树的实时数据流聚类被引量:6
- 2009年
- 提出一种基于衰减窗口的实时数据流聚类算法PDStream。算法首先对数据空间进行网格划分,采用改进的维度树结构维护和更新数据流的摘要信息,设计了一种周期性剪枝策略,周期性地剪去维度树中的稀疏网格,最后采用深度优先搜索算法在线处理聚类请求。基于人工数据集和真实数据集的实验表明,PDStream算法可以有效地发现数据流中任意形状的聚类,内存消耗少,具有较好的计算精度。
- 张晓龙曾伟
- 关键词:数据流网格聚类剪枝策略
- 对含噪声点的实时数据流进行聚类和聚类边界界定的方法
- 本发明具体涉及一种对含噪声点的实时数据流进行聚类和聚类边界界定的方法。其方案是:更新数据点X能映射到的网格g的密度;将密度大于或等于密度阈值densityThreshold(t)的网格g标记为高密度网格g<Sub>h</...
- 张晓龙梁小波曾伟