游进国
- 作品数:98 被引量:144H指数:7
- 供职机构:昆明理工大学更多>>
- 发文基金:国家自然科学基金云南省自然科学基金广东省科技计划工业攻关项目更多>>
- 相关领域:自动化与计算机技术电子电信理学文化科学更多>>
- 在PC集群上的封闭立方体计算被引量:1
- 2009年
- 封闭立方体是联机分析处理中一种有效的数据立方体压缩技术,但封闭立方体的并行算法目前很少有相关文献研究。提出了一种简单而实用的解决方案,即基于MapReduce计算框架,在非共享内存的PC集群上对封闭立方体进行分布式的预计算和查询。相关实验表明,本方法能快速处理千万级的数据,具有较好的线性加速比,而且能够更大地压缩数据立方体存储空间。
- 游进国奚建清张平健刘艳霞
- 关键词:联机分析处理并行计算
- 基于数据仓库的库存分析应用架构被引量:1
- 2011年
- 在数据仓库项目实际开发时,由于要分析的历史性数据量非常庞大,如何有效提高系统性能是关注的焦点,其中着重要解决数据增量更新与预计算之间的矛盾,此外,一般数据分析系统只能对历史性数据分析和预测,而在实际需求中可能需要对实时数据进行分析。本文以广东某集团公司信息系统建设为研究背景,以钢材库存分析为主题,提出一种高性能数据仓库架构,有效解决以上矛盾,具有较好应用价值。
- 刘志游进国段培娟
- 关键词:数据仓库联机分析处理物化视图预计算
- S-Clique:属性约束的极大团枚举
- 2018年
- 极大团枚举是图论中一个基础性研究问题,并被广泛应用到社交网络等各种领域。现实生活中的图数据不仅规模大,而且顶点上往往都带有重要的属性信息。然而当前极大团枚举算法主要关注图的结构特性,很大程度上忽视了顶点上的属性信息。提出一种结合图的结构特性和顶点属性的极大团S-Clique:各顶点属性值集合的交集的大小满足最小支持度的极大团,并提出了它的应用场景。针对S-Clique问题,提出一种有效求解算法SCE-PE,其充分利用父结点等价剪枝策略。同时重新优化顶点访问次序提出SCE-PES,进一步提高SCE-PE算法性能。实验结果表明,算法SCE-PES的效率较SCE-PE提高了40%左右。
- 周翠莲游进国张婷简兴明
- 一种引入元路径相似性度量的材料实体检索方法
- 2024年
- 近年来,随着材料数据的积累以及“材料基因组计划”的普及,面对大量需要处理和管理的材料数据,快速准确地检索并获取相应信息已成为一个重要问题。传统的检索方法由于仅能查询某一材料的相关信息,并且存在检索结果不全面、无法处理复杂语义关系等问题,难以获取相似程度较高的材料。为了快速、准确地找到与某种材料相似的材料,提出可度量不同节点的加权材料相似度计算模型WM-PathSim。首先,使用metapath2vec学习材料节点的嵌入表示;其次,引入TFIDF-CBOW模型学习材料路径实例的存在概率,进而计算不同元路径的权重;最后,加权求和符合条件的元路径得到最后的相似性度量,来预测不同材料之间的相似程度。在真实数据集上的结果表明,在不同的路径关系中,所提模型相比于基线方法在性能上有较大提升,其AUC和precision指标分别提升了0.37~5.02百分点和1~7.33百分点,说明所提模型得到材料间的相似程度更加准确和有效,从而能够获得相似材料。
- 黄华泽胡紫璇游进国黄星瑞陶静梅陶静梅
- 数据仓库中多维数据的高效高性能计算技术研究
- 游进国
- 关键词:数据仓库联机分析处理数据立方体
- Spark环境下的分布式OLAP查询被引量:3
- 2017年
- 数据立方体是数据仓库的核心数据模型,其元组可以划分为封闭元组和非封闭元组,通过去掉非封闭单元进行压缩并分层形成了分层封闭立方体.以Hadoop为主的云计算环境通常以离线批量计算为主,查询分析有一定的延迟,不能达到OLAP的在线性和交互性.Spark是一个基于内存的快速通用的大数据并行计算框架,对此本文基于分层封闭立方体,利用Spark,设计和实现了两种有效的分布式OLAP查询算法:SLCCQuery及其优化算法SLCC_Layered Query.不同参数的数据集上的实验验证了本文提出的Spark环境下的分布式OLAP查询算法的有效性及其优化算法的相对高效性.
- 崔红波游进国简兴明张正凡丁家满
- 关键词:SPARKOLAP查询
- 一种减少重复计算的数据库查询关系建模方法
- 本发明提出一种减少重复计算的数据库查询关系建模方法,属于数据库技术领域,包括如下步骤:在历史查询负载中,依据查询、子查询或算子间的包含或等价且结果相等的关系形成等价查询集,通过等价查询集的特点:其具有凸集性质;包含上、下...
- 游进国何培蕾徐静文柳大格王宇轩贾连印
- 基于双向LSTM的民航客运量预测被引量:3
- 2022年
- 传统的基于时间序列的民航客运量预测方法难以解决序列中非线性、非平稳性关系以及多维度问题,预测准确性较低。针对此问题,文中提出一种基于双向长短期记忆网络的客运量预测模型(PVPM_BiLSTM)。该模型利用两层双向长短期记忆网络捕获客运量序列正序和逆序的时间依赖,从而有效地解决客运量序列存在的非线性、非平稳性关系。首先,对民航公司提供的民航数据进行处理,包括删除重复值、填补缺失值和构建“日”粒度的客运量时间序列数据等;然后,基于训练样本对模型进行训练;最后,基于测试集,对已训练的模型进行实验分析。结果表明,PVPM_BiLSTM在RMSE和MAE评价指标上优于门控循环单元、一维卷积神经网络和时间卷积网络等基准模型,模型预测的准确性较高,具有可行性。
- 甘国育游进国张婷
- 关键词:客运量预测时间序列非线性
- 融合1D-CNN和LSTM的民航客运量预测模型被引量:3
- 2022年
- 在民航客运领域,准确地预测航线每日的客运量对民航公司具有重要的指导意义。循环神经网络能较好地预测民航的客运量,但在准确率,尤其是时间效率方面仍需提高。因此,提出一种融合一维卷积神经网络和长短期记忆网络的客运量预测模型,利用一维卷积神经网络计算代价小和可以识别序列局部模式的特性以及长短期记忆网络可以捕获客运量序列的时间依赖特性,对客运量进行预测。实验结果表明,所提模型在RMSE和MAE评价指标上均优于门控循环单元、时间卷积网络等基准模型,且在效率方面也较具优势。
- 甘国育游进国段培娟
- 关键词:时间序列客运量预测
- 一种基于特征增强和决策融合的花卉图像分类算法
- 本发明提供一种基于特征增强和决策融合的花卉图像分类算法,属于图像分类技术领域。包括数据预处理阶段、特征提取与增强阶段、训练阶段和决策融合分类阶段。数据预处理阶段对数据集进行相应的裁剪、缩放、归一化等操作;特征提取与增强阶...
- 贾连印翟红淞丁家满李润鑫李晓武游进国