成红红
- 作品数:13 被引量:35H指数:3
- 供职机构:山西大学计算机与信息技术学院更多>>
- 发文基金:国家自然科学基金教育部“新世纪优秀人才支持计划”国家教育部博士点基金更多>>
- 相关领域:自动化与计算机技术语言文字更多>>
- 一种对应约束的决策表属性约简算法
- 决策表属性约简是粗糙集理论中的重要问题,经典决策表属性约简方法从保持论域划分能力的角度出发选择最优条件属性约简集。本文从决策属性与条件属性的相关性角度出发,将决策表属性约简思想与传统统计学中对应分析方法结合,提出一种量化...
- 成红红张晓琴李飞江钱宇华
- 关键词:决策表属性约简
- CNN图像标题生成
- 图像标题生成是人工智能领域一个非常有挑战性的任务,该任务需要在给定一张图片的情况下能够生成与它内容相符的标题句子.它需要同时处理图像和文本两个模态的数据,并发现不同数据彼此间的关联.针对该任务通常采用一个编码器-解码器模...
- 李勇成红红梁新彦郭倩钱宇华
- 关键词:卷积神经网络特征提取
- 数据簸箕
- 2013年
- 大数据时代的到来给数据挖掘和知识发现带来了很大的挑战。簸箕是一种大家熟知的农用工具,能快速将不同的物体分开。基于簸箕的工作机制,提出了一个新颖的学习原理:随机并行序化原理(random parallel ranking principle,RPRP),称为数据簸箕,可高效地对数据进行排序和分类。为了验证这种学习原理的有效性与高效性,设计了一种新的聚类方法,即聚类簸箕。实验结果表明,聚类簸箕能够快速且有效地对数据进行聚类。此外,该学习原理也能够用于设计高效的分类器。该数据簸箕有望推动大数据背景下机器学习与知识发现理论与方法的发展。
- 钱宇华成红红张晓琴梁吉业
- 关键词:大数据集
- 一种对应约束的决策表属性约简算法被引量:1
- 2015年
- 决策表属性约简是粗糙集理论中的重要问题,经典决策表属性约简方法从保持论域划分能力的角度出发,选择最优条件属性约简集。从决策属性与条件属性的相关性角度出发,将决策表属性约简思想与传统统计学中的对应分析方法相结合,提出了一种量化决策属性与条件属性之间依赖关系的度量,称为投影区分度,并基于此发展了一种决策表属性约简算法。最后用简单实例说明了该方法的正确性。
- 成红红张晓琴李飞江钱宇华
- 关键词:决策表属性约简
- 面向多标记学习的局部粗糙集被引量:3
- 2016年
- 多标记学习研究的是一个对象同时具有多个标记的一类复杂问题.文本标注、视频内容标注、图像识别和蛋白质功能的发现等都属于这类任务.与单标记学习问题一样,多标记学习也遭遇到了数据维数大的挑战.针对多标记数据,目前已经设计出一些约简算法,但与单标记约简算法相比,方法数量有限且局限性大.随着大数据时代的到来,收集大量样本越来越容易,但标注收集到的全部样本不切实际.这给想要通过利用粗糙集模型来解决多标记学习问题的研究人员带来了三个挑战:数据维数更高、现有粗糙集的局限性和部分标记决策表的出现.为了解决这三个挑战,提出了面向多标记学习的局部粗糙集模型,并获得了一些有意思的性质.最后,通过利用局部粗糙集模型,设计了一个多标记的启发式约简算法,并在三个公开的多标记数据集上验证了算法的有效性.
- 梁新彦钱宇华郭倩成红红
- 关键词:多标记学习属性约简
- 数据簸箕
- 大数据时代的到来给数据挖掘和知识发现带来了很大的挑战。簸箕是一种大家熟知的农用工具,能快速的将不同的物体分开。基于簸箕的工作机制,提出一个新颖的学习原理:随机并行序化原理(RPRP),称为数据簸箕,可高效地对数据进行排序...
- 钱宇华成红红张晓琴梁吉业
- 关键词:大数据集
- 全粒度聚类算法被引量:2
- 2014年
- 聚类分析是数据挖掘与知识发现领域的一个重要研究方向.多数聚类算法中相似性是其核心概念之一,对象之间的相似性会被直接或者间接的计算出来.传统的相似性度量方法多是基于单一的粒度去观察两个被测对象.在人类认知过程中,通常采用多粒度来更合理有效地进行问题求解.本文借鉴人类的这种多粒度认知机理,提出一种新的相似性学习方法,称作全粒度相似性度量方法,基于此发展了一种全粒度聚类算法.而全粒度相似性度量从各个角度观察被测对象,进而会得到两个对象间更加真实的相似度.从UCI数据集中选取5组数据进行实验,最后通过与两种传统的聚类方法比较验证了全粒度聚类算法的合理性与有效性.
- 李飞江成红红钱宇华
- 关键词:聚类分析
- 关联学习:关联关系挖掘新视角被引量:5
- 2020年
- 关联关系挖掘与发现是大数据挖掘与分析的重要基础,现有的关联关系挖掘方法多是对数据进行统计分析,对未知数据缺少关联判别作用.尝试从学习的角度进行关联关系挖掘,给出了关联学习的形式化定义和相关概念,并根据关联学习定义构建学习数据集.具体地构建了2类关联图像数据集(two class associated image data sets,TAID),利用卷积神经网络提取关联特征,然后分别用softmax函数和K近邻算法判别关联关系,基于此提出3种关联关系判别器:关联图像卷积神经网络判别器(associated image convolutional neural network discriminator,AICNN)、关联图像LeNet判别器(associated image LeNet discriminator,AILeNet)和关联图像K近邻判别器(associated image K-nearest neighbor discriminator,AIKNN).3种关联判别器在TAID数据集上进行测试,AICNN在64×64像素90000个训练样本上的判别精度达0.8217,AILeNet在256×256像素22500个训练样本上的判别精度达0.8456,AIKNN在256×256像素22500个训练样本上的判别精度达到0.8664.这3种关联判别器有效地证明了学习角度挖掘关联关系的可行性.
- 钱宇华张明星成红红
- 数据簸箕
- 大数据时代的到来给数据挖掘和知识发现带来了很大的挑战。簸箕是一种大家熟知的农用工具,能快速的将不同的物体分开。基于簸箕的工作机制,提出一个新颖的学习原理:随机并行序化原理(RPRP),称为数据簸箕,可高效地对数据进行排序...
- 钱宇华成红红张晓琴梁吉业
- 关键词:大数据集
- 基于粒计算的关联关系挖掘研究
- 随着信息技术的飞速发展,科学和工业等各个领域积累了海量的数据。海量数据中存在着丰富的关联关系结构,识别和筛选有价值的关联关系是大数据复杂关联关系挖掘的重要任务之一。复杂关联关系挖掘广泛应用到机器学习和数据挖掘任务中,其发...
- 成红红
- 关键词:数据挖掘粒计算模糊聚类
- 文献传递