周纯葆 作品数:28 被引量:11 H指数:2 供职机构: 中国科学院计算机网络信息中心 更多>> 发文基金: 国家自然科学基金 国家高技术研究发展计划 江苏省预防医学科研基金 更多>> 相关领域: 自动化与计算机技术 理学 医药卫生 生物学 更多>>
空间位置的关联分析及其向量化表示方法 2020年 理解地理空间位置的空间相关性,对于地理信息检索、推荐系统,城市交通管理,居民出行模式探究等应用研究具有重要支撑作用.为更具体表义空间位置及其关联关系,本文基于多种居民出行轨迹数据,提出一种基于深度学习的空间位置向量化表示方法,而后通过空间位置向量的向量运算,可计算得到空间位置的关联程度.首先将长、短距离出行轨迹进行匹配连接,构建大规模交通网络,覆盖多种出行模式,得到对不同位置间空间关联信息的完整识别.然后基于图神经网络模型,本文提出融合位置特征与轨迹信息的空间向量化表示方法,并优化其训练学习中节点采样方法,提高空间向量的表达能力.最后以北京市共享单车轨迹数据与公共交通路网数据进行实证分析,实验结果表明基于本文提出方法生成的空间向量在空间位置的关联分析、聚类分析中相比DeepMove等已有方法拥有更好的效果. 张舒 郭旦怀 周纯葆 周纯葆 靳薇关键词:空间向量 一种基于卷积神经网络的脑电异常信号检测方法、装置及设备 本发明提供一种基于卷积神经网络的脑电异常信号检测方法、装置及设备。通过对脑电异常信号数据进行降噪处理、数据切分,并将其信号数据的一维时序信息转换为二维频域信息,得到信号的幅值数据和相位数据,然后将其两种数据输入至预设的目... 王彦棡 周纯葆 王晓光 梁智强 娄宏伟 林卫红 韩金波 王婧一种异构计算环境中多源账号的用户统一账号标识系统 本发明涉及一种异构计算环境中多源账号的用户统一账号标识系统,其包括:登录账号映射模块、计算账号映射模块、统一账号管理模块、映射管理模块和账号代理模块;其中,登录账号映射模块实现多来源登录账号到统一账号的动态绑定过程,并负... 曹荣强 王晓光 王珏 周纯葆 张博尧 王彦棡文献传递 一种基于MCMC的并行分类方法 本发明公开了一种基于MCMC的并行分类方法,包括:根据初始状态计算似然估计;根据似然估计计算出参数的后验概率;根据后验概率进行MCMC模拟运算,以当前状态为基础,产生新状态;根据新状态计算接受概率,并产生第一随机数,当第... 迟学斌 周纯葆 郎显宇 王珏 邓笋根文献传递 基于集成学习的计算集群作业时长预测与调度方法 2023年 【目的】本文的研究是为了提升作业时长预测的准确度,改善作业回填调度的性能,进而提高计算集群的计算资源利用率。【应用背景】作业调度在提升计算集群计算资源利用率方面发挥着重要作用,而作业时长预测是作业回填调度策略的关键判断依据。【方法】本论文基于集成学习方法对计算集群作业时长进行预测,集成了支持向量回归、随机森林、梯度提升回归树和自动机器学习等算法,并且采用本论文预测的作业时长进行了作业回填调度实验。【结果】采用本方法分别在HPC2N、CEA Curie和KIT FH2三个典型数据集上进行了测试,作业时长预测值的均方根误差比用户预估方法分别降低60.30%、51.91%、63.51%,比线性回归方法分别降低44.37%、31.98%、52.69%。【结论】作业回填调度模拟实验结果表明,本方法能够大幅提升作业时长预测的准确度,作业平均等待时间比用户预估方法分别降低9.07%、8.80%、1.83%,并且能够改善作业回填调度的性能,平均有界减速值比用户预估方法分别降低7.72%、0.96%、9.05%,提高了计算集群的计算资源利用率。 李贺 修涵文 刘彦君 曹荣强 周纯葆 周纯葆关键词:计算集群 一种基于深度学习的前瞻因子筛选方法 本发明涉及一种基于深度学习的前瞻因子筛选方法,包括:通过分词,词频统计和词性分析得到因子数据库中的各个因子关键字,并建立因子黑名单;在行业数据库中查询得到行业的时间序列数据;在图表数据库中查询得到该行业的研报图表;通过字... 周纯葆 张博尧 王彦棡 曹荣强 王珏文献传递 一种企业经营业绩预测先行指标筛选方法及系统 本发明提供一种企业经营业绩预测先行指标筛选方法,包括:获取目标企业的研报图表和营业收入,并从所述研报图表中提取研报关键词并计算研报关键词向量;从行业数据库中获取所述目标企业所属行业的宏观指标和产业指标的指标关键词,并计算... 周纯葆 王彦棡 王珏文献传递 一种大模型并行训练通信优化方法及装置 一种大模型并行训练通信优化方法,应用于多个计算设备组成的系统,每个计算设备配置有GPU,GPU包含至少一个进程,进程用于大模型并行训练中的一个任务分区,方法用于对ZeRO数据的ZeRO‑1阶段的优化,该方法包括:执行模型... 王彦棡 谢一浩 石君函 汪嘉恒 周纯葆 王珏 刘芳隔离迁移(Isolation with Migration)模型数值计算的并行实现 被引量:2 2012年 在群体遗传学和分子生态学研究中,种群的分化分析是一个重要的内容。IM(Isolation with Migration)模型以DNA序列数据为基础同时评估两个种群分化过程中分化时间和迁移概率。IM模型能够模拟许多真实世界中一个种群分行为两个种群的现象。IM模型应用MCMC(Markov Chain Monte Carlo)方法进行参数的推断。然而马尔科夫链需要经过漫长的时间才能达到一个稳定的概率分布,并且参数推断所需要的空间可能超过一个计算机的内存。本文利用MPI(Message Passing Interface)实现了基于数据并行的IM模型,在减少单个计算机内存使用和总的运行时间方面都有很好的效果。 周纯葆 郎显宇 王彦棡 朱朝东关键词:MCMC方法 MPI 数据并行 一种基于深度学习的前瞻因子筛选方法 本发明涉及一种基于深度学习的前瞻因子筛选方法,包括:通过分词,词频统计和词性分析得到因子数据库中的各个因子关键字,并建立因子黑名单;在行业数据库中查询得到行业的时间序列数据;在图表数据库中查询得到该行业的研报图表;通过字... 周纯葆 张博尧 王彦棡 曹荣强 王珏文献传递