李晖 作品数:55 被引量:46 H指数:3 供职机构: 贵州大学计算机科学与技术学院 更多>> 发文基金: 国家自然科学基金 贵州省科技计划项目 贵州省工业攻关项目 更多>> 相关领域: 自动化与计算机技术 医药卫生 天文地球 文化科学 更多>>
FastATB:科学数据分析任务的可视化构建系统 2016年 为有效解决领域科学家编写复杂分析任务的难题,帮助领域科学家快速定义科学数据分析任务,减轻领域科学家学习复杂查询语言的复杂语法和语义规则的负担,提出一种数据查询和分析语句的可视化构建策略。基于该策略,结合阵列对象的特点,设计科学数据分析任务的基本组件,在此基础上实现一个科学数据分析任务的可视化构建系统,使用拖拽操作可视化构建复杂查询序列,其可用性已在天文学领域得到验证。 吴彦 陈梅 李晖关键词:科学数据 天文学 CSSAQP:一种基于聚类的分层抽样近似查询处理算法 被引量:1 2017年 近似查询处理技术常被应用于海量数据的多维分析,以缩短查询执行的时间,同时返回尽可能准确的结果。由于海量数据中常存在许多极端值,会严重影响近似查询处理的结果。因此针对海量数据的聚集操作,论文提出CSSAQP算法,先将原始数据集按某一数值列直观的聚为三类,分别代表大值簇、小值簇和常值簇,再对各簇按分组属性分别进行分层抽样,构建总体样本集,最后通过查询重写在总体样本集上执行查询,以缩短海量数据聚集操作的查询时间,同时提高查询任务的准确性。通过实验验证,证明了该算法不仅可以缩短聚集查询的时间,同时还能有效提高查询结果的精度。 谢金星 李晖 陈梅 戴振宇关键词:聚集查询 聚类 分层抽样 一种多媒体对象的相似检索方法及装置 本发明公开了一种多媒体对象的相似检索方法及装置,通过对多媒体对象进行特征提取,获取多媒体对象的d维特征向量,对d维特征向量进行降维处理,提取待检索多媒体对象的d维特征向量,并通过iDistance算法,将待检索多媒体对象... 李晖 陈梅FastNavi:巡天数据的交互式探索系统 被引量:2 2018年 目前,我国天文科学领域的重大科学工程FAST(500 m口径球面射电望远镜)已于2016年9月建成并进入调试和试运行阶段。为满足FAST建成后开展科学研究的需要,采用基于阵列模型的科学型数据库系统作为巡天数据的存储支撑系统,设计实现了一个能够满足对大规模巡天数据进行高效读写、复杂分析的交互式探索系统FastNavi。该系统涵盖了最为常用的巡天数据可视化探索的核心功能,通过优化对巡天数据的可视化分析及观测信息导航的实现,向天文学家或其他非专业人士进行天文研究提供了一种新的交互式探索方式。FastNavi目前已在国家天文台FAST工程科学部巡天数据研究规划中应用,并被其列为巡天数据科学研究的支撑软件。 周彧 李晖 梁青青 陈梅 朱明关键词:科学数据 数据分析 天文学 面向区块链节点负载预测的ARIMA组合预测方法 被引量:2 2019年 准确预测服务器的剩余负载率可以合理地分配系统资源,提高系统的资源使用率。为了能有效提高区块链应用中各节点剩余负载率序列预测的准确度,提出了一种差分自回归移动平均(AutoregressiveIntegrated MovingAverage,ARIMA)模型、BP神经网络以及局部异常因子(Local Outlier Factor, LOF)算法的组合预测模型。对比ARIMA模型、ARIMA-BP模型、LOFARIMA-BP模型的预测结果,比较三个模型的预测能力。实验结果表明,LOF-ARIMA-BP组合模型的预测精度优于ARIMA模型以及ARIMA-BP模型。 孙凯俐 李晖 陈梅关键词:ARIMA模型 BP神经网络 一种面向工作负载预测的基于小波变换的特征提取方法 被引量:1 2020年 在资源受限条件下,根据数据挖掘任务在执行过程中实时产生的资源和任务状态来准确地预测任务执行时间是非常重要的。为有效地使用时间序列数据实现准确预测,提出一种降载策略来确定预测的切入点和数据处理方案。该策略使用动态时间规整(Dynamic Time Warping,DTW)距离度量子序列与整个序列之间相似度的变化以确定用于预测的数据,然后利用小波变换计算小波系数并提取小波系数的能量值作为预测的特征,最后预测任务执行时间。实验结果表明,该方法提取的特征信息包含原序列较多信息,在预测任务执行时间方面具有较高的准确性。 王可 李晖 陈梅 陈梅 朱明关键词:降载 小波变换 特征提取 FastSky:巡天数据的天图系统 被引量:1 2017年 随着我国天文科学领域的重大科学工程FAST(500米口径球面射电望远镜)的建成,亟需一套可用于进行可视化展现和数据处理的天图系统。研究并实现了一套致力于满足FAST巡天数据可视化展现和数据处理基本需求的天图系统Fast Sky。该系统基于Healpix球面分割技术实现对天区的分割和索引的构建,并基于Web浏览器实现各类预置和自定义的天图分析及巡天数据处理。Fast Sky目前已被FAST工程科学部列为巡天数据科学研究的支撑软件,在FAST巡天数据科学研究规划中应用。 梁青青 李晖 周彧 陈梅 朱明关键词:可视化工具 一种面向海量天文数据的存取优化系统 本发明公开了一种面向海量天文数据的存取优化系统,采用Greenplum分布式并行数据库集群存储海量天文数据,所述存取优化系统包括:数据库集群模块、构建模块、扫描模块和客户端,所述客户端用于输入查询语句以及显示查询结果,所... 李晖 戴震宇 陈梅 梁青青文献传递 一种负载敏感的OLAP查询结果缓存管理技术 2016年 OLAP(On Line Analysis Processing)是数据仓库的典型应用,在数据仓库中频繁并发地执行涉及较大数据量的OLAP查询时,其查询处理效率易于逐渐降低。缓存技术是一种有效降低OLAP查询处理延时的方法。在现有的缓存数据存储、淘汰策略等研究工作的基础上,结合OLAP任务的负载特性、OLAP任务的结果集大小等因素对性能的影响,提出了一种负载敏感的OLAP查询缓存管理技术Workload-LRU,并实现了一个ROLAP(Relational OLAP)原型系统。实验证明,Workload-LRU技术获得了较好的性能提升效果。 阳颖灿 张小平 李晖关键词:联机分析处理 缓存策略 数据仓库 查询效率 ADCS:一种基于SSD的阵列数据库缓存技术 被引量:1 2017年 论文提出了在阵列数据库中引入固态硬盘作为Cache的内存-SSD-磁盘的多级存储架构,研发了以阵列数据库的存储单元chunk为粒度的缓存技术—ADCS,并在FASTDB中进行了实现。ADCS采用最近最少使用(LRU)算法作为缓存淘汰算法,得益于内存和磁盘之间的SSD cache构建技术,阵列数据库的查询性能提升了34%左右。 杨庆 李晖 陈梅 戴震宇 朱明关键词:二级缓存 ADCS LRU