您的位置: 专家智库 > >

刘辉平

作品数:5 被引量:25H指数:2
供职机构:华东师范大学更多>>
发文基金:国家自然科学基金国家重点基础研究发展计划上海市教育委员会创新基金更多>>
相关领域:自动化与计算机技术理学更多>>

文献类型

  • 4篇期刊文章
  • 1篇学位论文

领域

  • 5篇自动化与计算...
  • 1篇理学

主题

  • 1篇等价
  • 1篇等价类
  • 1篇商圈
  • 1篇数据流
  • 1篇数据清洗
  • 1篇数据融合
  • 1篇数据修复
  • 1篇数据质量
  • 1篇字符
  • 1篇字符串
  • 1篇字符串相似度
  • 1篇最短路径
  • 1篇相似度
  • 1篇消费者
  • 1篇路径规划
  • 1篇路网
  • 1篇函数依赖
  • 1篇ER
  • 1篇KNN分类
  • 1篇KNN分类算...

机构

  • 5篇华东师范大学

作者

  • 5篇刘辉平
  • 3篇金澈清
  • 2篇周傲英
  • 1篇王晓玲
  • 1篇刘骁
  • 1篇赵大鹏
  • 1篇刘志

传媒

  • 1篇华东师范大学...
  • 1篇计算机学报
  • 1篇软件学报
  • 1篇计算机工程与...

年份

  • 1篇2018
  • 2篇2017
  • 1篇2016
  • 1篇2015
5 条 记 录,以下是 1-5
排序方式:
基于路网的路径规划问题研究
近年来随着移动互联网的迅猛普及和发展,日常生活中基于位置的服务变得无所不在。而路径规划作为基于位置服务中的一项基础功能,为人们出行提供了重要的路线参考。然而随着出行人数和物流运输规模的增加,新型的路径规划需求持续出现,而...
刘辉平
关键词:路径规划
一种基于模式的实体解析算法被引量:6
2015年
实体解析是数据融合和数据清洗的关键步骤,旨在从大量的数据集中找出描述相同实体的记录.当前主要有两种基本的解决思路,一种是穷尽式的实体解析,通过两两比较数据集中的所有记录,然后再合并相似的记录,从而找到描述某一个实体的若干记录集合.然而,该方法的计算复杂度比较高(O(n2),其中n表示数据集合的规模),难以处理大型数据集合.另一种思路是基于分块的实体解析,它调用特定的分块函数(如哈希函数、滑动窗口技术等)将集合中较为相似的记录划分到同一个块中,再仅对属于同一块中的记录进行两两比较.这种方法显著降低了运行时间,但会损失部分精度,因为某些描述同一实体的记录可能没有被分到同一个块中.文中提出了一种基于模式的实体解析算法,通过将相似的记录合并成记录集合并尝试生成对应的记录模式,然后进行模式之间的两两比较来产生一个边界值,以确定对应的记录集合是否需要进行进一步的精确比较,从而判断是否属于同一个实体.与第一种方法相比,该方法可有效地过滤部分不可能相似的记录,从而避免了针对所有数据记录进行两两比较,显著地降低了时间复杂度;与第二种方法相比,该方法并不损失任何精度.基于真实和模拟数据集合的实验结果验证了新方法的执行效率和有效性.
刘辉平金澈清周傲英
关键词:数据融合数据清洗字符串相似度
面向不确定数据流的近似ER-Topk查询处理
2017年
随着移动互联网的快速发展以及信息技术的普遍应用,在许多应用中都产生了海量、不确定性数据,包括金融、军事、位置服务、医疗以及气象等。然而,传统的确定性数据管理方法很难管理不确定数据,亟需开发新型数据管理方法。可能世界模型被广泛用于为不确定数据建模,通过该模型可以衍生出诸多确定性的可能世界实例。不确定性数据流是指高速到达的海量不确定元组序列,因而不确定数据流管理比不确定性静态数据管理更具挑战性。面向于不确定数据流的ER-Topk查询是一个典型问题,但是处理复杂度高。提出一种近似算法来处理该查询,具有较小的空间复杂度;同时,还通过搜索策略优化来进一步提升查询处理效率。实验结果验证了所提方法的有效性和高效性。
刘骁刘辉平金澈清
关键词:数据流不确定数据查询优化
基于移动轨迹数据的商圈消费者规模分析被引量:2
2017年
随着城市化的推进以及大数据技术的不断发展,智慧商圈成为智慧城市建设的重要组成部分.智慧商圈的热门程度、消费者的规模、消费层次等因素成为智慧商圈建设的关注热点.然而,传统的消费者规模的统计,还是基于传统的问卷调查或者抽样等,这些方法不仅成本昂贵而且效率低下.但随着数据挖掘技术的发展,使得通过分析用户行为轨迹来确定商圈消费者规模成为可能.本文提出了一种基于轨迹数据分析的商圈消费者规模分析方法.本文的主要工作包括:①在轨迹数据中,如何确定商圈的边界这是一个首要的问题,基于此,才能确定一位消费者是在商圈内活动,还是在商圈外面.本文提出了根据商圈内基站点的位置分布,运用k-Nearest Neighbor(kNN)分类算法,对该商圈的范围进行圈定的方法.②由于轨迹数据的不确定性特点,确定一个用户与商圈的关系也是一个难题.本文利用计算不规则多边形面积的方法计算基站点的权重值,结合时间阈值分析该区域内每天的消费者规模.③最后,鉴于轨迹数据的海量性,本文提出了一个大数据计算框架BPDA(Business-Circle Parallel Distributed Algorithm),基于Hadoop大数据处理平台和Kafka分布式消息系统,实现了基于移动轨迹数据的商圈消费者规模分析系统,并使用中山公园商圈基站数据,展示了本文所提方法的可行性.
刘志刘辉平赵大鹏王晓玲
关键词:KNN分类算法
基于函数依赖与条件约束的数据修复方法被引量:16
2016年
随着经济与信息技术的发展,在许多应用中均产生大量数据.然而,受硬件设备、人工操作、多源数据集成等诸多因素的影响,在这些应用之中往往存在较为严重的数据质量问题,特别是不一致性问题,从而无法有效管理数据.因此,首要的任务就是开发新型数据清洗技术来提升数据质量,以支持后续的数据管理与分析.现有工作主要研究基于函数依赖的数据修复技术,即以函数依赖来描述数据一致性约束,通过变更数据库中部分元组的属性值(而非增加/删除元组)来使得整个数据库遵循函数依赖集合.从一致性约束描述的角度来看,函数依赖并非是唯一的表达方式,还存在其他表达方式,例如硬约束、数量约束、等值约束、非等值约束等.然而,随着一致性约束种类的增加,其处理难度也远比仅有函数依赖的场景要困难.考虑以函数依赖与其他一致性约束共同表述数据库的一致性约束,并在此基础上设计数据修复算法,从而提升数据质量.实验结果表明,所提方法的执行效率较高.
金澈清刘辉平周傲英
关键词:数据质量数据修复函数依赖等价类
共1页<1>
聚类工具0