您的位置: 专家智库 > >

郑奇斌

作品数:5 被引量:14H指数:3
供职机构:解放军理工大学更多>>
发文基金:国家自然科学基金中国博士后科学基金更多>>
相关领域:自动化与计算机技术医药卫生经济管理更多>>

文献类型

  • 3篇期刊文章
  • 2篇会议论文

领域

  • 5篇自动化与计算...
  • 1篇经济管理
  • 1篇医药卫生

主题

  • 2篇数据完整
  • 2篇数据完整性
  • 2篇数据质量
  • 2篇完整性
  • 1篇信息缺失
  • 1篇数据库
  • 1篇同名
  • 1篇排歧
  • 1篇模糊聚类
  • 1篇聚类
  • 1篇机构信息
  • 1篇关联规则
  • 1篇关联规则挖掘
  • 1篇C-均值
  • 1篇C-均值算法
  • 1篇K-近邻
  • 1篇K近邻
  • 1篇K近邻算法
  • 1篇不完整数据

机构

  • 5篇解放军理工大...
  • 1篇总参第六十三...
  • 1篇国防科技大学

作者

  • 5篇郑奇斌
  • 3篇刁兴春
  • 3篇曹建军
  • 1篇许永平
  • 1篇李红梅
  • 1篇周星
  • 1篇周星

传媒

  • 2篇计算机科学
  • 1篇计算机应用

年份

  • 1篇2018
  • 1篇2017
  • 1篇2016
  • 1篇2015
  • 1篇2014
5 条 记 录,以下是 1-5
排序方式:
基于合作作者与隶属机构信息的同名排歧方法被引量:6
2018年
同名排歧是实体分辨领域的重要研究内容之一,其旨在分辨出相同姓名对应的不同人。针对传统同名排歧方法需要丰富的信息以及无法解决信息缺乏时的排歧问题,提出了一种基于合作作者和隶属机构信息的同名排歧方法。根据作者间的合作关系以及作者与机构间的隶属关系构造实体关系图,采用广度优先搜索策略搜索图中两两同名作者间的有效路径;根据有效路径长度、数目及路径上边的类型,计算两个同名作者间的连接强度,并将其与阈值进行比较,实现同名排歧。实验结果表明,所提方法比当前最好的方法具有更好的同名排歧效果,且能够实现单一作者的同名排歧。
尚玉玲曹建军李红梅郑奇斌
关键词:数据质量
结合局部敏感哈希的k-近邻数据填补算法
数据缺失是常见的数据质量问题,典型的缺失数据处理方法一般分为忽略缺失值和填补缺失值.由于忽略缺失值会丢失很多数据的信息,所以对缺失值进行填补是更为合理的方式.k-近邻算法是一种常见的数据填补方法,但是由于其要计算待填补数...
郑奇斌刁兴春曹建军周星许永平
结合局部敏感哈希的k近邻数据填补算法被引量:4
2016年
k近邻(kNN)算法是缺失数据填补的常用算法,但由于需要逐个计算所有记录对之间的相似度,因此其填补耗时较高。为提高算法效率,提出结合局部敏感哈希(LSH)的k NN数据填补算法LSH-k NN。首先,对不存在缺失的完整记录进行局部敏感哈希,为之后查找近似最近邻提供索引;其次,针对枚举型、数值型以及混合型缺失数据分别提出对应的局部敏感哈希方法,对每一条待填补的不完整记录进行局部敏感哈希,按得到的哈希值找到与其疑似相似的候选记录;最后在候选记录中通过逐个计算相似度来找到其中相似程度最高的k条记录,并按照k NN算法对不完整记录进行填补。通过在4个真实数据集上的实验表明,结合局部敏感哈希的k NN填补算法LSH-k NN相对经典的k NN算法能够显著提高填补效率,并且保持准确性基本不变。
郑奇斌刁兴春曹建军周星许永平
关键词:数据质量数据完整性K近邻算法
结合缺失模式的不完整数据模糊聚类被引量:4
2017年
数据的完整性是数据可用性的重要维度。由于数据采集等过程中存在的问题,现实中的数据往往存在缺失。现有的聚类算法在面对不完整数据时一般采用忽略缺失或填补缺失的策略,但是当数据缺失属于非随机缺失时,这样的处理策略会导致聚类精度严重下降。当数据缺失属于非随机缺失时,数据缺失模式与缺失属性的取值相关,因此在不完整对象的相似度量中加入缺失模式相似的度量,提出了两种结合缺失模式的PCM(Possibilistic c-means)模糊聚类算法:最小化缺失模式距离之和的PatDistPCM算法和基于缺失模式聚类的PatCluPCM算法。在两个公开数据集上的实验证明,考虑缺失模式的模糊聚类PatDistPCM和PatCluPCM算法,在对存在非随机缺失的数据进行聚类时,能有效提高聚类结果的准确性。
郑奇斌刁兴春曹建军
关键词:数据完整性模糊聚类
对非随机缺失中的缺失依赖关系研究
缺失是一种十分重要而又很常见的数据质量问题.对缺失数据的常见处理方法为估计缺失值或者直接删除缺失记录.这两种方法都只用到了未缺失数据中的信息,而隐含在缺失记录中的信息则被舍弃了.在非随机缺失中各个缺失属性并不是独立的,其...
郑奇斌刁兴春曹建军
关键词:数据库信息缺失关联规则挖掘
共1页<1>
聚类工具0