国家自然科学基金(61363027) 作品数:24 被引量:75 H指数:5 相关作者: 苏一丹 覃华 蒙祖强 秦亮曦 蒋亮 更多>> 相关机构: 广西大学 中国矿业大学 北京理工大学 更多>> 发文基金: 国家自然科学基金 广西壮族自治区自然科学基金 教育部人文社会科学研究基金 更多>> 相关领域: 自动化与计算机技术 更多>>
一种基于向量夹角的快速计算等价类算法 被引量:3 2015年 等价类是Rough集理论的核心概念之一,如何高效地计算等价类是提高各相关算法性能的关键.引入高维空间向量夹角的概念,根据数据在机器中的存储特点,以字节内容的最大值加1作为基数对数据进行基数排序,在此基础上设计以计算向量夹角来求信息系统等价类的算法.该算法把原来计算等价类的逻辑比较转换为数值计算,非常显著地提高了等价类的计算效率,尤其对大规模高维数据.该算法的时间复杂度为O(|C‖U|log|U|),理论分析与实验结果表明了该算法的正确性和高效性. 蒋亮 蒙祖强 胡玉兰 常红岩关键词:ROUGH集 信息系统 等价类 空间向量 基于能量平衡与拥塞控制的蚁群优化路由协议 被引量:2 2018年 为降低移动自组网中数据包传输的能量消耗和拥塞现象,提出一种兼顾能量平衡与拥塞控制的蚁群优化路由协议.该路由协议以AODV路由协议为基础,包括路由发现和路由维护两个阶段.在路由发现阶段,采用蚁群优化算法选择具有最大剩余能量、最小路径花费和最小时延变化的最优节点构建路由.在路由维护阶段,监控节点的能量阈值级别和路径能量花费,限制能量不满足条件的节点或者路径传输数据,降低能量消耗,提高网络寿命;使用GPRS技术快速检测链路断开现象,维护路由稳定.仿真结果表明,该路由协议传输数据所需平均跳数少、报文送达率高、端到端延时少. 濮阳莉 周建明关键词:路由协议 蚁群优化 能量平衡 拥塞控制 移动自组网 基于代价敏感和近似分类质量的决策粗糙集属性约简研究 被引量:2 2019年 针对决策粗糙集属性约简在引入代价后分类精度不高的问题,对其中代价敏感与分类精度的平衡进行了研究。将分类总代价和近似分类质量作为属性约简过程中的约束条件,结合模拟退火方法,提出了一种基于代价敏感和近似分类质量的决策粗糙集属性约简(ARACOQ)算法。利用UCI数据集对算法进行了模拟实验,实验结果验证了ARACOQ算法的有效性,该算法能够在可承受代价范围内找到一个分类精度最高的属性约简集。 陈婉清 秦亮曦关键词:属性约简 近似分类质量 集粒度计算、蚁群算法与模糊思想的聚类算法 被引量:3 2015年 模糊C均值聚类算法在开始时采用随机的方式选取初始聚类中心,该方式使得FCM算法对初始聚类中心的选取极为敏感,且在局部范围内较易得到最优解,但是在全局范围内的效果较差;蚁群聚类算法根据先验知识随意设定蚂蚁拾起或放下数据对象的概率,缺乏严密的数学依据。针对FCM算法和蚁群算法的不足,文中将模糊粒度计算的思想推广应用到蚁群聚类算法中,并将改进后的蚁群聚类算法与模糊C均值聚类算法相结合,提出了一种将粒度计算、蚁群算法与模糊C均值算法思想相结合的聚类算法。经过实验验证,改进后的算法较原算法具有更好的聚类效果。 邵明来 秦亮曦关键词:聚类 模糊C均值算法 粒度计算 蚁群算法 基于概率无向图模型的近邻传播聚类算法 被引量:9 2017年 针对近邻传播聚类算法偏向参数难选定、生成的簇数目偏多等问题,提出一种概率无向图模型的近邻传播聚类算法.首先为样本数据构建概率无向图模型,利用极大团和势函数计算无向图中数据样本的概率密度,将此概率密度作为一种聚类先验知识注入近邻传播算法的偏向参数中,提高算法的聚类效率;并用高斯降噪和簇归并方法进一步提升算法的聚类精度.在UCI数据集上的实验结果表明,所提出算法的聚类效率和精度均优于相比较的同类算法. 覃华 詹娟娟 苏一丹关键词:高斯平滑 一种改进的模糊连接点聚类算法 被引量:1 2018年 传统的模糊连接点FJP聚类算法采用基于欧氏距离的最大-最小合成运算法生成传递闭包,该方法所生成的传递闭包存在失真问题,即包含有较多错误的数据关联信息,最终造成算法聚类精度低且计算时间长。针对以上问题,提出一种改进的模糊连接点聚类算法:先用组合核函数计算数据集的模糊相似度矩阵,提高算法对数据非线性特征的辨识能力,并用大顶堆存储之;然后遍历传递闭包矩阵中的空元素,用堆顶的桥元素填充传递闭包的空元素,直至生成传递闭包。在测试数据集上的实验结果表明,本文算法的平均聚类精度较传统FJP算法有20%以上的提升,显著改善了传递闭包的失真问题;另外,在大型数据集上的计算效率亦优于传统FJP算法的,说明本文改进FJP算法的思路是有效的、可行的。 孙明珊 覃华 苏一丹关键词:传递闭包 一种基于拓扑信息的物流频繁路径挖掘算法 被引量:7 2015年 为了高效地从海量物流数据中获取频繁路径,根据物流网络及物流的特征设计了一种物流数据模型以及一种充分考虑了物流网络拓扑信息的频繁路径序列挖掘算法PMWTI(Path Mining With Topology Information)。在PMWTI中设计了一种用于候选路径序列深度剪枝的代价容忍度剪枝方法,该方法在利用Apriori性质剪枝的基础上进一步去除了部分不可能是频繁路径序列的候选路径序列,这在一定程度上缩减了候选路径序列规模,从而减少了对数据集的扫描。实验表明,相比没有采用该剪枝方法的同等算法,PMWTI具有更高的频繁路径挖掘效率。 杨俊瑶 蒙祖强 蒋亮关键词:物流 数据挖掘 基于CUDA的并行谱聚类社区挖掘算法 2016年 社会网络和社交媒体数据具有大规模、高维度的特性,社区挖掘算法的计算效率是一个值得研究的问题。针对此问题,本文利用CUDA并行计算架构,提出一种并行的谱聚类社区挖掘算法,首先对高维的社会网络数据集进行降维,再用CUDA的并行计算能力提高谱聚类算法的计算效率。实验表明,本文所提算法能有效地提高社区挖掘算法的计算速度,并行计算效率较常规算法有5~8倍的提高,为社区挖掘计算提出一种新的思路。 蒋莉芳 苏一丹 覃华关键词:CUDA 并行计算 谱聚类 大规模网络 迭代吉洪诺夫正则化的FCM聚类算法 被引量:2 2017年 模糊C均值聚类算法(fuzzy C-means,FCM)存在不适定性问题,数据噪声会引起聚类失真。为此,提出一种迭代Tikhonov正则化模糊C均值聚类算法,对FCM的目标函数引入正则化罚项,推导最优正则化参数的迭代公式,用L曲线法在迭代过程中实现正则化参数的寻优,提高FCM的抗噪声能力,克服不适定问题。在UCI数据集和人工数据集上的实验结果表明,所提算法的聚类精度较传统FCM高,迭代次数少10倍以上,抗噪声能力更强,用迭代Tikhonov正则化克服传统FCM的不适定问题是可行的。 蒋莉芳 苏一丹 覃华关键词:模糊C均值聚类 不适定问题 TIKHONOV正则化 低偏差蒙特卡罗序列的量子遗传算法 被引量:3 2017年 针对量子遗传算法存在迭代次数多、计算时间长、容易陷入局部极值的问题,提出一种低偏差蒙特卡罗序列量子遗传算法,利用低偏差序列良好的均匀性,实现量子遗传算法探索与利用的平衡.首先,提出新的低偏差序列Hε量子门来更新量子态形式的种群,提高算法探索量子态的能力,减少算法的迭代次数;其次,提出Pareto集邻域搜索,在当前近优解上用低偏差序列在当前解上进行邻域搜索,以寻找更优的解.在5个复杂函数优化问题上验证本文算法,实验结果表明:所提算法的寻优能力较传统量子遗传算法更强,解的质量有两个数量级以上的提高;算法的计算时间和迭代次数亦优于传统量子遗传算法,引入低偏差序列实现量子遗传算法探索与利用的平衡是可行的. 黄山 苏一丹 覃华 蒙祖强关键词:量子遗传算法