钟珊 作品数:33 被引量:541 H指数:5 供职机构: 常熟理工学院计算机科学与工程学院 更多>> 发文基金: 国家自然科学基金 江苏省自然科学基金 江苏省高校自然科学研究项目 更多>> 相关领域: 自动化与计算机技术 文化科学 交通运输工程 电气工程 更多>>
BSCRP网:机器人规划的赋时有色网实现方法 2011年 为了解决情景演算无法解决框架问题和生成动作序列效率底的问题,提出了一种基于情景演算推理规则的表示机器人规划的赋时有色网实现方法——BSCRP网(representation based on situation calculus for robot plan),并提出了一种基于双向搜索策略的BSCRP网系统的构造方法。实验结果表明了机器人规划的BSCRP网系统不仅能形式化地描述动作、状态以及动作和状态之间的关系,而且能动态地规划出实现目标的动作序列并计算执行动作序列所需时间。 钟珊 刘一松 常晋义关键词:情景演算 FCRP网:机器人规划的赋时有色网实现 2011年 针对流演算无法表示动作执行时间和单向搜索动作序列的问题,提出了一种基于流演算的表示机器人规划的赋时有色网实现方法——FCRP网(a representation based on fluent calculus for robot plan);提出了一种双向搜索策略,并将其应用到FCRP网系统的构造方法中。FCRP网系统不仅能对动作、状态以及它们之间的关系进行形式化的描述,而且能动态地规划出机器人实现目标的动作序列,并计算实际执行动作序列所需时间。最后,通过对机器人取咖啡规划实例进行了建模和仿真,证明了FCRP网系统作为一种机器人规划系统可行性以及采用双向搜索策略能提高规划效率。 钟珊 常晋义 刘一松 殷旭东关键词:PETRI网 一种近似模型表示的启发式Dyna优化算法 被引量:4 2015年 针对基于查询表的Dyna优化算法在大规模状态空间中收敛速度慢、环境模型难以表征以及对变化环境的学习滞后性等问题,提出一种新的基于近似模型表示的启发式Dyna优化算法(a heuristic Dyna optimization algorithm using approximate model representation,HDyna-AMR),其利用线性函数近似逼近Q值函数,采用梯度下降方法求解最优值函数.HDyna-AMR算法可以分为学习阶段和规划阶段.在学习阶段,利用agent与环境的交互样本近似表示环境模型并记录特征出现频率;在规划阶段,基于近似环境模型进行值函数的规划学习,并根据模型逼近过程中记录的特征出现频率设定额外奖赏.从理论的角度证明了HDyna-AMR的收敛性.将算法用于扩展的Boyan chain问题和Mountain car问题.实验结果表明,HDyna-AMR在离散状态空间和连续状态空间问题中能学习到最优策略,同时与Dyna-LAPS(Dyna-style planning with linear approximation and prioritized sweeping)和Sarsa(λ)相比,HDyna-AMR具有收敛速度快以及对变化环境的近似模型修正及时的优点. 钟珊 刘全 傅启明 章宗长 朱斐 龚声蓉关键词:函数逼近 基于深度特征融合的图像语义分割 被引量:3 2020年 在图像语义分割中使用卷积网络进行特征提取时,由于最大池化和下采样操作的重复组合引起了特征分辨率降低,从而导致上下文信息丢失,使得分割结果失去对目标位置的敏感性。虽然基于编码器-解码器架构的网络通过跳跃连接在恢复分辨率的过程中逐渐细化了输出精度,但其将相邻特征简单求和的操作忽略了特征之间的差异性,容易导致目标局部误识别等问题。为此,文中提出了基于深度特征融合的图像语义分割方法。该方法采用多组全卷积VGG16模型并联组合的网络结构,结合空洞卷积并行高效地处理金字塔中的多尺度图像,提取了多个层级的上下文特征,并通过自顶向下的方法逐层融合,最大限度地捕获上下文信息;同时,以改进损失函数而得到的逐层标签监督策略为辅助支撑,联合后端像素建模的全连接条件随机场,无论是在模型训练的难易程度还是预测输出的精度方面都有一定的优化。实验数据表明,通过对表征不同尺度上下文信息的各层深度特征进行逐层融合,图像语义分割算法在目标对象的分类和空间细节的定位方面都有所提升。在PASCAL VOC 2012和PASCAL CONTEXT两个数据集上获得的实验结果显示,所提方法分别取得了80.5%和45.93%的mIoU准确率。实验数据充分说明,并联框架中的深度特征提取、特征逐层融合和逐层标签监督策略能够联合优化算法架构。特征对比表明,该模型能够捕获丰富的上下文信息,得到更加精细的图像语义特征,较同类方法具有明显的优势。 周鹏程 龚声蓉 钟珊 包宗铭 戴兴华关键词:上下文信息 条件随机场 增量式双自然策略梯度的行动者评论家算法 被引量:2 2017年 针对强化学习中已有连续动作空间算法未能充分考虑最优动作的选取方法和利用动作空间的知识,提出一种对自然梯度进行改进的行动者评论家算法。该算法采用最大化期望回报作为目标函数,对动作区间上界和下界进行加权来求最优动作,然后通过线性函数逼近器来近似动作区间上下界的权值,将最优动作求解转换为对双策略参数向量的求解。为了加快上下界的参数向量学习速率,设计了增量的Fisher信息矩阵和动作上下界权值的资格迹,并定义了双策略梯度的增量式自然行动者评论家算法。为了证明该算法的有效性,将该算法与其他连续动作空间的经典强化学习算法在3个强化学习的经典测试实验中进行比较。实验结果表明,所提算法具有收敛速度快和收敛稳定性好的优点。 章鹏 刘全 钟珊 翟建伟 钱炜晟关键词:自然梯度 连续空间中的一种动作加权行动者评论家算法 被引量:5 2017年 经典的强化学习算法主要应用于离散状态动作空间中.在复杂的学习环境下,离散空间的强化学习方法不能很好地满足实际需求,而常用的连续空间的方法最优策略的震荡幅度较大.针对连续空间下具有区间约束的连续动作空间的最优控制问题,提出了一种动作加权的行动者评论家算法(Action Weight Policy Search Actor Critic,AW-PS-AC).AW-PS-AC算法以行动者评论家为基本框架,对最优状态值函数和最优策略使用线性函数逼近器进行近似,通过梯度下降方法对一组值函数参数和两组策略参数进行更新.对两组策略参数进行加权获得最优策略,并对获得的最优动作通过区间进行约束,以防止动作越界.为了进一步提高算法的收敛速度,设计了一种改进的时间差分算法,即采用值函数的时间差分误差来更新最优策略,并引入了策略资格迹调整策略参数.为了证明算法的收敛性,在指定的假设条件下对AW-PS-AC算法的收敛性进行了分析.为了验证AW-PS-AC算法的有效性,在平衡杆和水洼世界实验中对AW-PS-AC算法进行仿真.实验结果表明AW-PS-AC算法在两个实验中均能有效求解连续空间中近似最优策略问题,并且与经典的连续动作空间算法相比,该算法具有收敛速度快和稳定性高的优点. 刘全 章鹏 钟珊 钱炜晟 翟建伟关键词:函数逼近 梯度下降 人工智能 一种基于视觉注意力机制的深度循环Q网络模型 被引量:20 2017年 由现代强化学习和深度学习相结合形成的深度强化学习方法是目前人工智能领域一个新的研究热点,已经在各种需要感知高维度原始输入数据和决策控制的任务中取得了实质性的突破.尤其是一种被称为深度Q网络的模型在处理诸如Atari 2600游戏这类趋于真实环境的复杂问题时表现出了和人类玩家相媲美的水平.然而,当存在有延迟的奖赏而导致需要长时间步规划才能优化策略的情形中,深度Q网络的表现就会急剧下降.这说明深度Q网络并不擅长解决战略性深度强化学习任务.针对此问题,文中使用带视觉注意力机制的循环神经网络改进了传统的深度Q网络模型,提出了一种较为完善的深度强化学习模型.新模型的关键思想有两点:一是使用双层门限循环单元构成的循环神经网络模块来记忆较长时间步内的历史信息.这使得Agent能够及时使用有延迟的反馈奖赏来正确地指导下一步的动作选择;二是通过视觉注意力机制自适应地将注意力集中于面积较小但更具价值的图像区域,从而使得Agent能够更加高效地学习近似最优策略.该文通过选取一些经典的Atari 2600战略性游戏作为实验对象来评估新模型的有效性.实验结果表明,与传统的深度强化学习模型相比,新模型在一些战略性任务上具有很好的性能表现和较高的稳定性. 刘全 翟建伟 钟珊 章宗长 周倩 章鹏关键词:循环神经网络 人工智能 一种用于解析问答推理过程的多轮迭代检索算法研究 2024年 【目的】针对当前阅读理解类问答推理过程中传统无监督检索方式句子关联性不足的问题,设计一种检索模型,研究问答任务的推理过程,探求问答任务的可解释性。【方法】提出一种新型无监督检索模型ISR,模型中融合皮尔逊相关系数、GloVe词嵌入、IDF加权等主要模块,ISR模型通过多轮迭代方式细粒度检索推理句。【结果】对比模型MSSwQ,ISR模型在MultiRC数据集上进行实验,P、R、F_(1)指标平均高出2.4、1.8、2.1个百分点;在HotPotQA数据集上进行实验,P、R、F_(1)指标平均高出4.8、2.6、3.7个百分点。【局限】检索采用硬匹配,可能存在过分匹配的情形。【结论】本文模型能够提升检索推理句的准确性,检索的推理句能够有效应用于问答任务的推理过程。 周长顺 应文豪 钟珊 龚声蓉基于HSV颜色空间特征的视频烟雾检测 被引量:5 2022年 由于烟雾具有形状不规则、扩散缓慢的特性,导致传统烟雾识别方法对烟雾检测存在一定的缺陷,如烟雾检测准确率低、烟雾警报响应时间长等问题。为了满足野外空旷场景下烟雾检测的准确性和实时性,提出了基于HSV(Hue, Saturation, Brightness,色调,饱和,明亮)颜色空间特征和卷积神经将网络相结合的视频烟雾检测的识别方法。通过将烟雾图像的RGB颜色空间特征映射到HSV颜色空间特征后提取烟雾候选区域,提取到的烟雾候选区域经过高斯混合模型进行运动判断,然后将符合运动特征的烟雾候选区域图像送入到训练好的卷积神经网络中进行烟雾识别。针对传统烟雾检测效率问题,设计了卷积神经网络conv-12用于烟雾识别。实验结果表明,基于HSV颜色空间特征和卷积神经网络conv-12相结合的视频烟雾识别方法对视频烟雾检测的准确率为96.45%,烟雾检测率为93.3%,烟雾报警平均响应时间为0.9 s。相较于其他方法,在烟雾检测准确率、烟雾检测率、烟雾警报响应时间都有一定的提升。 曹灿灿 龚声蓉 周立凡 钟珊关键词:卷积神经网络 QSRM:一种带约束处理的定性空间推理实现方法 2010年 针对以往距离关系空间推理中只能进行同方向距离推理,提出了任意方向上距离关系的推理方法,并通过细化分离关系融入了粗粒度的定性距离关系,从而将RCC-8扩充为RCC-9拓扑关系.在此基础上加入经典的基于锥形的方向关系组合表推理,提出了一种利用约束处理规则对空间拓扑关系、方向关系、距离关系组合推理的实现方法QSRM(Quantitative Spatial Reasoning Method),并将此方法应用于小区规划的实例,实例证明了该实现方法的有效性. 钟珊 常晋义 万军朋