您的位置: 专家智库 > >

李又奎

作品数:4 被引量:19H指数:2
供职机构:华中科技大学计算机科学与技术学院更多>>
发文基金:国家教育部博士点基金更多>>
相关领域:自动化与计算机技术更多>>

文献类型

  • 4篇中文期刊文章

领域

  • 4篇自动化与计算...

主题

  • 1篇数据分析
  • 1篇数据管理
  • 1篇数据管理系统
  • 1篇数据库
  • 1篇数据流
  • 1篇数据流管理
  • 1篇数据流管理系...
  • 1篇数据清理
  • 1篇流数据
  • 1篇SEMANT...
  • 1篇XML
  • 1篇XML模式
  • 1篇APPLIC...
  • 1篇DATA_W...
  • 1篇FUZZY
  • 1篇查询
  • 1篇MERGIN...

机构

  • 4篇华中科技大学
  • 2篇华为技术有限...

作者

  • 4篇李又奎
  • 2篇冯玉才
  • 2篇桂浩
  • 2篇李华
  • 1篇李华旸
  • 1篇张志兵
  • 1篇刘玉葆

传媒

  • 1篇计算机应用研...
  • 1篇小型微型计算...
  • 1篇计算机工程与...
  • 1篇Journa...

年份

  • 3篇2005
  • 1篇2004
4 条 记 录,以下是 1-4
排序方式:
Application of fuzzy equivalence theory in data cleaning
2004年
This paper presented a rule merging and simplifying method and an improved analysis deviation algorithm. The fuzzy equivalence theory avoids the rigid way (either this or that) of traditional equivalence theory. During a data cleaning process task, some rules exist such as included/being included relations with each other. The equivalence degree of the being-included rule is smaller than that of the including rule, so a rule merging and simplifying method is introduced to reduce the total computing time. And this kind of relation will affect the deviation of fuzzy equivalence degree. An improved analysis deviation algorithm that omits the influence of the included rules' equivalence degree was also presented. Normally the duplicate records are logged in a file, and users have to check and verify them one by one. It's time-cost. The proposed algorithm can save users' labor during duplicate records checking. Finally, an experiment was presented which demonstrates the possibility of the rule.
李华旸刘玉葆李又奎
关键词:MERGINGSEMANTICS
生成具有层次特征XML模式的简化算法被引量:1
2005年
XML已经广泛地应用于数据描述及数据交换,然而日常数据的大部分依旧存放在关系型数据库里,因此转换关系数据到XML文档的需求日益增长,如何高效生成用户满意的XML模式是其中的关键。NeT&CoT算法2是近年来提出的可根据给定的关系模式生成具有层次特征的XML的自动转换算法,然而它存在效率不高的问题。因此,该文在NeT&CoT算法的基础上提出了简化算法,通过引入四个简化性质,避免了费时的nest操作,提高了转换效率。
张志兵李华李又奎
关键词:XMLXML模式
面向流数据的数据管理系统的研究被引量:11
2005年
传统关系数据库系统通常用来存储没有时间概念的相对静止的数据,对于一些新的应用领域,信息是以数据序列的形式产生并且需要实时地、持续地进行处理,这就超出了传统系统的解决能力。数据流数据管理系统是面向流数据而设计的数据管理系统,它能有效地处理输入流数据并提供持续检索的功能。从整体上分析数据流管理系统的体系结构,重点讨论基于流数据的数据模型和流查询。
桂浩冯玉才李又奎
关键词:数据流管理系统数据库
数据分析和清理中相关算法研究被引量:7
2005年
数据清理的一个主要作用是识别重复的记录.结合过滤算法和启发式剪枝算法提出了启发式剪枝改进算法.然后,针对重复记录的特点提出了长度约束条件,能有效地提高比较字段不等长时的执行速度.数据库中经常会出现各种形式不同的缩写,而启发式剪枝算法等无法识别缩写情况下的重复记录,本文因此提出了基于动态规划的缩写发现算法,该算法既可以用于缩写发现也可用于缩写存在时的重复记录识别.另外,重复记录的甄别目前必须人工处理,传统方式下用户不得不逐条浏览和分析,工作时间冗长而且乏味,容易引入新的数据质量隐患,作者提出了聚类清除方案和聚类闭包算法,它将重复的记录聚类显示,用户一次可以处理完一个重复聚类,在有效提高速度的同时方便了用户.
冯玉才桂浩李华李又奎
关键词:数据清理
共1页<1>
聚类工具0