搜索到369篇“ 分类型数据“的相关文章
一种针对分类数据的熵特征变换FCM聚类算法
2024年
针对分类数据导致聚类性能下降的问题,本文提出一种新的熵特征变换FCM聚类算法。首先根据熵的数学描述形式,定义分类数据参数的熵特征值,进而生成熵特征变换模及其增量模;接着定义模的矩阵“痕迹”,获取EFTM模数据的特征集合;然后融合FCM聚类分析,设计一种以熵为特征提取的主体描述形式的聚类算法;最后实验均表明,该算法具有较高的自适应性。
刘晋胜周靖
关键词:分类型数据特征提取FCM聚类算法
分类数据可解释性聚类算法研究
聚类分析是一种重要的无监督机器学习方法和数据挖掘技术。近年来,研究者针对不同应用领域,提出了一系列聚类分析算法,并已在图像分析、文本挖掘、社会网络分析等领域得到广泛应用。然而,已有的聚类分析算法研究主要集中于如何提高聚类...
王坤
关键词:分类型数据聚类分析信息熵
一种基于簇内簇间相异度的分类数据聚类方法
本发明公开一种基于簇内簇间相异度的分类数据聚类方法,基于簇内簇间相似性提出新的相异度计算方法,并基于该相异度完成了簇中心自动选择。本发明的相异度保留了数据的特征,做到了低簇内相异度高簇间相异性的标准,在聚类精度、纯度和...
宋玲贾子琪叶进陈燕王立颖石森煌
结合柯西核的分类数据密度峰值聚类算法被引量:4
2022年
密度峰值聚类算法在处理分类数据时难以产生较好的聚类效果。针对该现象,详细分析了其产生的原因:距离计算的重叠问题和密度计算的聚集问题。同时为了解决上述问题,提出了一种面向分类数据的密度峰值聚类算法(Cauchy kernel-based density peaks clustering for categorical data,CDPCD)。算法首先指出分类数据距离度量过程中有序特性(分类数据属性值之间的顺序关系)鲜有考虑的现状,进而提出一种基于概率分布的加权有序距离度量来缓解重叠问题。通过结合柯西核函数,在共享最近邻密度峰值聚类算法基础上重新评估数据密度值,改进了密度计算和二次分配方式,增强了密度多样性,降低了聚集问题带来的影响。多个真实数据集上的实验结果表明,相较于传统的基于划分和密度的聚类算法,CDPCD都取得了更好的聚类结果。
盛锦超杜明晶李宇蕊孙嘉睿
关键词:分类型数据数据挖掘
分类数据聚类算法的几种改进研究
聚类分析是数据挖掘中非常重要的一个步骤,该步骤将混乱的数据按一定规则聚集成一些具有现实意义的类别。这些聚集而成的类别为初始信息的挖掘以及后续更深层次的信息发现提供了强有力的支持,具有非常重要的研究意义。在现实世界中,不仅...
陈育丹
关键词:分类型数据聚类算法
分类数据可视化图表的自动配色研究
由相邻色块组成的分类数据图,例如饼图和堆栈条形图,已广泛用于日常生活和科学研究中。在此类图表中,颜色是重要的视觉通道。通常,颜色用于区分这些数据的类别。相似的颜色和较差的查看条件往往增加用户阅读图表的难度,降低用户区分色...
李继鹏
关键词:数据可视化图匹配
文献传递
一种处理现实生活中分类数据的有效方法
本发明公开了一种处理现实生活中分类数据的有效方法,包含以下步骤:步骤1,随机从含有n个样本的数据集X中选取k个初始点,k为数据集X的分类数目;步骤2,计算每个对象到k个初始点的距离,将对象分配到与其距离最小的初始点类中...
李顺勇张苗苗张钰嘉
文献传递
一种软件管理用分类数据备份装置
本发明公开了一种软件管理用分类数据备份装置,包括底座,底座的顶部设置有外壳,外壳的底部通过固定柱与底座固定连接,外壳的顶部设置有顶盖组件,底座的顶部设置有驱动机构,外壳底部的一侧设置有定位机构。本发明通过在实际使用时,...
郦俊岭
一种基于簇内簇间相异度的分类数据聚类方法
本发明公开一种基于簇内簇间相异度的分类数据聚类方法,基于簇内簇间相似性提出新的相异度计算方法,并基于该相异度完成了簇中心自动选择。本发明的相异度保留了数据的特征,做到了低簇内相异度高簇间相异性的标准,在聚类精度、纯度和...
宋玲贾子琪叶进陈燕王立颖石森煌
文献传递
分类数据异常检测算法研究
在进行数据分析的时候,常常会遇到与整个数据集行为不相符的数据,这些数据被称为异常数据、异常值或者离群值。异常值检测是最基本的数据分析任务之一,用于发现罕见事件、例外情况或与常规条目的某种偏离。异常检测在许多领域里面有着重...
孙志鹏
关键词:分类型数据异常检测计算方式

相关作者

孙浩军
作品数:28被引量:230H指数:5
供职机构:汕头大学工学院
研究主题:聚类 高维 聚类算法 信息熵 层次聚类
宋玲
作品数:141被引量:400H指数:11
供职机构:广西大学
研究主题:选播 选播路由 服务质量 QOS路由算法 无线传感器网络
叶进
作品数:138被引量:277H指数:9
供职机构:广西大学计算机与电子信息学院
研究主题:拥塞控制 光伏阵列 TCP 拥塞控制方法 跨层设计
杜育林
作品数:2被引量:3H指数:1
供职机构:汕头大学
研究主题:高维 分类型数据 信息熵 子空间聚类算法 子空间聚类
游俊斌
作品数:2被引量:0H指数:0
供职机构:汕头大学
研究主题:分类型数据 子空间聚类算法 粗糙集 高维数据 高维