秦进 作品数:51 被引量:223 H指数:6 供职机构: 贵州大学计算机科学与技术学院 更多>> 发文基金: 国家自然科学基金 贵州省科学技术基金 贵州省自然科学基金 更多>> 相关领域: 自动化与计算机技术 文化科学 理学 电子电信 更多>>
结合新颖性和风险评估的内在奖励方法 被引量:1 2023年 强化学习算法依赖于精心设计的外在奖励,然而Agent在和环境交互过程中,环境反馈给Agent的外在奖励往往是非常稀少的或延迟,这导致了Agent无法学习到一个好的策略。为了解决该问题,从新颖性和风险评估这两方面设计一个内在奖励,使Agent能充分地探索环境以及考虑环境中存在不确定性动作。该方法分为两部分,首先是新颖性描述为对当前状态-动作和转换后状态的访问次数,将具体执行的动作考虑进去;其次是动作的风险程度,风险评估从累积奖励方差考虑,来判断当前动作对状态的意义是有风险的还是无风险的。该方法在Mujoco环境下进行了评估,实验验证该方法取得了更高的平均奖励值,尤其是在外在奖励延迟的情况下,也能取得不错的平均奖励值。说明该方法能有效地解决外在奖励稀疏的问题。 赵英 秦进 袁琳琳关键词:风险评估 一种智能物联网网关 本实用新型公开了一种智能物联网网关,包括网关主体,所述网关主体的一侧侧壁顶部位置嵌入设置有显示屏、电源开关和急停开关,所述急停开关设置在电源开关的下方,所述显示屏设置装置急停开关的一侧,所述网关主体的侧壁靠近显示屏的一侧... 何勇 秦进文献传递 RBAC模型在信息化平台建设的权限管理中的研究与应用 被引量:1 2015年 阐述了基于角色的权限管理模型(RBAC~[1])在高等教育信息化平台中的运用,提出了RBAC的权限管理的解决方案。将RBAC模型应用到系统中增强了系统的安全性。系统采用三层架构~[2],基于Java平台实现,项目中使用了S2SH~[3]框架,RBAC模型的实现是基于Struts2的原有代码的重写,保证了技术上的可靠性,有效地解决了信息化平台中的遇到的权限和安全问题。 任伟 秦进关键词:JAVA S2SH 访问控制 一种求解动态优化问题的改进自适应差分进化算法 被引量:2 2021年 针对原始动态自适应差分进化(SADE)算法局部搜索能力弱和寻优精度低的问题,提出一种求解动态优化问题的邻域搜索差分进化(NSDE)算法。通过引入邻域搜索机制,在划分种群最优个体的邻域空间范围内产生候选解,选取候选解集合中的最优解并对种群最优个体进行迭代,增强算法局部搜索能力。在传统基于距离的排斥方案中,引入hill-valley函数追踪邻近峰,提高算法寻优精度。实验结果表明,与SADE、人工免疫网络动态优化、多种群竞争差分进化和改进差分进化算法相比,NSDE算法在49个测试问题中分别有28、38、29和38个测试问题的平均误差更小,综合性能表现更好。 刘树强 秦进关键词:动态优化问题 邻域搜索 基于图辅助学习的会话推荐 2024年 针对现有的自监督对比任务未能充分利用原始数据中的丰富语义以及缺乏通用性的问题,提出一种基于图辅助学习的会话推荐(SR-GAL)模型。首先,在图神经网络(GNN)的基础上引入具有表示一致性(RC)的编码通道,从原始数据中挖掘更有价值的自监督信号;其次,为了充分利用这些自监督信号,设计了与目标任务关系紧密的预测性辅助任务和约束性辅助任务;最后,开发了一个简单且与GNN模型无关的辅助学习框架,将两个辅助任务与推荐任务统一起来,从而提高GNN模型的推荐性能。与次优的对比模型CGSNet(Contrastive Graph Self-attention Network)相比,在Diginetica数据集上,所提模型的精确率P@20和平均倒数排名MRR@20提升了0.58%和1.61%;在Tmall数据集上,所提的模型的P@20和MRR@20分别提升了12.65%和8.41%,验证了该模型的有效性。在多个真实数据集上的实验结果表明,SR-GAL模型优于较先进的模型,并且具有良好的可扩展性和通用性。 唐廷杰 黄佳进 秦进关键词:推荐系统 中文文本校对技术的研究与实现 被引量:8 2003年 文本自动校对工作的计算机化是说所有的校对工作应在计算机上自动完成;具体地说是计算机应在文字处理上增加专为校对服务的功能,主要是查(侦)错和改(纠)错. 陈笑蓉 秦进 汪维家 陆汝占关键词:中文文本 基于动态迁移的光传送网SDN低时延调度研究 被引量:2 2021年 光传送网SDN调度较传统网络具有更好的动态性,为了使SDN网络性能与大数据和云计算需求匹配,提出了一种低时延动态迁移策略。先以SDN网络结构、流表耗时、以及时延调整系数等变量构建通信代价模型,得到通信代价的目标与约束。基于通信代价模型对SDN网络架构采取动态迁移,根据路径请求量计算控制器的平均时延与累计效用,再利用控制与数据信道负载对流表采取动态调整。通过仿真,确定了光传送网SDN调度过程中,当控制器个数改变时,时延几乎不受影响;当数据量增加时,时延及其增速也能得到有效控制;在动态迁移后,负载差异度降低至迁移前的71.92%。实验结果表明所提方法能够有效降低光传送网SDN调度时延,并保证良好的网络负载均衡。 刘春林 李韦鹏 秦进关键词:通信代价 信道负载 基于最大熵原理的汉语词义消歧 被引量:9 2005年 词义消歧是自然语言处理中亟待解决的一个关键问题,本文提出一种基于最大熵模型的有监督的机器学习方法,用于汉语词义消歧。该方法综合了词标记、词性、主题等上下文特征,并用一种统一的表示方法规范化特征形式,解决了多种不同特征之间的融合和特征的知识表示。实验对20个汉语高频多义词进行了测试,平均正确率为87%,验证了该方法的有效性。 陈笑蓉 秦进关键词:词义消歧 最大熵原理 机器学习方法 最大熵模型 多义词 特征和语言模型结合的中文文本查错 该文引入上下文词、搭配两种特征作为约束,利用最大熵原理构建查错模型,以期解决词语搭配不当、长距离的语言限制等词一级的错误.基本思想是,构建词语y在上下文x上出现的条件概率分布模型p(y|x),查错时根据句子中的上下文x计... 秦进关键词:查错 语言模型 搭配 最大熵 文献传递 一种深度Q网络的改进算法 被引量:6 2019年 深度Q网络存在严重的过估计问题,导致智能体寻找最优策略的能力下降。为了缓解深度Q网络中存在的过估计问题,提出一个更正函数用于对深度Q网络中的评价函数进行改进,当选择的动作为最优动作时更正函数为1,不对当前状态-动作值进行修改,当选择的动作不是最优动作时更正函数小于1,缩小当前状态-动作值,从而使得最优状态-动作值与非最优状态-动作值的差异增大,减少过估计问题的影响。实验证明改进的算法在Playing Atari 2600视频游戏以及Open AI Gym中取得了更好的性能。说明改进的算法比深度Q网络寻得了更优的策略。 夏宗涛 秦进