陕西省教育厅科研计划项目(12JK0739)
- 作品数:4 被引量:9H指数:2
- 相关作者:周红芳周扬赵雪涵钱钢王啸更多>>
- 相关机构:西安理工大学西安高压电器研究院有限责任公司西安交通大学更多>>
- 发文基金:陕西省教育厅科研计划项目国家自然科学基金陕西省自然科学基金更多>>
- 相关领域:自动化与计算机技术更多>>
- 基于限定区域数据取样的密度聚类算法被引量:5
- 2012年
- 传统密度算法DBSCAN与DBRS的缺点在于时间性能和聚类精度均较低,为此,提出一种结合限定区域数据取样技术的密度聚类算法——DBLRS。该算法在不增加时间和空间复杂度的基础上利用参数Eps查找核心点的邻域点和扩展点,并在限定区域(Eps,2Eps)内进行数据抽样。实验结果表明,限定区域内选取代表点进行簇的扩充降低了大簇分裂的概率,提高了算法效率与聚类精度。
- 周红芳赵雪涵周扬
- 关键词:密度聚类代表点
- 基于频繁模式的选择性集成
- 2013年
- 针对集成学习方法在处理大规模数据集时具有计算复杂度高、基分类器数目多、分类精度不理想的问题,提出一种基于频繁模式的选择性集成算法.该算法利用频繁模式挖掘的原理,将未剪枝的集成分类器和样本空间映射为事务数据库,并利用布尔矩阵存储分类结果,然后从中挖掘频繁基分类器组成最终的集成分类器,达到选择性集成的目的.实验结果表明,与集成分类算法Bagging、AdaBoost、WAVE和RFW相比,该算法减小了集成分类器的规模,提高了集成分类器的分类精度和分类效率.
- 周红芳王啸赵雪涵饶元
- 关键词:大规模数据集事务数据库布尔矩阵
- 基于倒排索引的MR定位算法被引量:1
- 2013年
- 为了实现手机测量报告MR的实时、精确定位,提出一种基于倒排索引的定位算法。该算法以路测数据作为定位数据库,对于不含路测数据的区域用哈塔传播模型估算电平信息,之后用射线模型修正定位数据库。在执行定位算法时,通过为MR矢量化,将定位问题转化为求最大相似度问题。实验结果表明,该算法可以实现海量MR的实时定位,并且提高了定位精度。
- 周红芳周扬钱钢
- 关键词:倒排索引相似度
- 基于K-means的最佳聚类数确定方法研究被引量:3
- 2014年
- 确定数据集的最佳聚类数是聚类研究中的一个重要难题。为了更有效地确定数据集的最佳聚类数,该文提出了通过改进K-means算法并结合一个不依赖于具体算法的有效性指标Q(c)对数据集的最佳聚类数进行确定的方法。理论分析和实验结果证明了该方法具有良好的性能和有效性。
- 李红岩胡林林王江波周红芳
- 关键词:最佳聚类数聚类有效性指标聚类