国家自然科学基金(61070006)
- 作品数:3 被引量:8H指数:1
- 相关作者:宋擒豹杜磊杜星朱晓燕张本文更多>>
- 相关机构:西安交通大学更多>>
- 发文基金:国家自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 数据流变化检测研究综述
- 2012年
- 数据流是一种动态数据,它在某种因素的驱动下可能会随时间发生变化,而这种变化往往隐含着现实世界的某种事件。如何及时、准确地发现数据流中的变化已成为数据流挖掘的一个研究热点,并且在实际中有非常广泛的应用。描述了数据流变化及变化检测的核心任务,归纳了变化检测的通用框架,分析评价了目前已知的数据流变化检测方法及其技术特点,最后展望了数据流变化检测技术的发展方向。
- 宋擒豹杜磊
- 关键词:数据挖掘数据流变化检测
- 一种k-NN分类器k值自动选取方法被引量:8
- 2013年
- k-NN分类算法已广泛应用于文本挖掘和模式识别等领域,其近邻数直接影响着分类精度,值过小时k-NN会受到噪声的影响,值过大时同样会降低分类精度,为此提出一种快速选取值的方法.首先给出值的候选集,然后在候选集上快速地选取值.在100个公开数据集上的实验结果表明,所提出的算法能够选取一个有效的近邻数,是一种效果好、有潜力的方法.
- 杜磊杜星宋擒豹
- 软件更改可能性预测中的重要性度量研究
- 2013年
- 针对已有软件度量在对类进行衡量时没有考虑软件的整体结构的问题,考虑到类在整个软件项目中的重要性,提出了2个新的软件度量指标,并以此构造了一种预测效果更好的软件更改可能性预测模型。新的软件度量指标将软件项目用图进行表示,其中节点表示项目中的类,边表示类之间的依赖关系;在整个软件项目构建的图中对类的重要性进行研究,从而构造预测软件更改可能性的重要性度量。选用了6个开源软件项目进行实验验证,实验数据包括:①项目中每个类的软件度量,包括4个基于大小的软件度量指标,6个基于复杂度的软件度量指标和2个基于重要性的软件度量指标;②项目中每个类在选定的历史阶段的更改行数。实验结果表明,新的软件度量指标可使5个项目的精度得到提高,平均提高1.16%,并使6个项目的曲线下面积得到提高,平均提高3.65%。
- 朱晓燕宋擒豹张本文