您的位置: 专家智库 > >

江爱文

作品数:38 被引量:109H指数:5
供职机构:江西师范大学计算机信息工程学院更多>>
发文基金:国家自然科学基金江西省自然科学基金江西省教育厅科学技术研究项目更多>>
相关领域:自动化与计算机技术文化科学更多>>

文献类型

  • 24篇期刊文章
  • 12篇专利
  • 1篇会议论文

领域

  • 26篇自动化与计算...
  • 2篇文化科学

主题

  • 11篇图像
  • 11篇网络
  • 7篇视觉
  • 4篇人脸
  • 4篇神经网
  • 4篇神经网络
  • 3篇图像特征
  • 3篇细粒度
  • 3篇卷积
  • 3篇卷积神经网络
  • 3篇感知
  • 3篇WSN
  • 3篇传感
  • 2篇对抗式
  • 2篇多尺度
  • 2篇语义
  • 2篇遮挡
  • 2篇人脸识别
  • 2篇上下文
  • 2篇识别方法

机构

  • 37篇江西师范大学
  • 1篇九江学院
  • 1篇西安电子科技...
  • 1篇南昌大学第一...
  • 1篇中国科学院自...
  • 1篇重庆锦禹云能...
  • 1篇中国电力科学...
  • 1篇甘肃同兴智能...

作者

  • 37篇江爱文
  • 15篇王明文
  • 13篇叶继华
  • 7篇刘长红
  • 3篇万剑怡
  • 2篇揭安全
  • 2篇刘凯
  • 2篇左家莉
  • 1篇王娟
  • 1篇肖波
  • 1篇李茂西
  • 1篇王敏
  • 1篇田玉敏
  • 1篇李丹
  • 1篇化志章
  • 1篇王春恒
  • 1篇孟祥申
  • 1篇肖柏华
  • 1篇胡珍新
  • 1篇万文涛

传媒

  • 6篇中文信息学报
  • 3篇数据采集与处...
  • 3篇计算机科学与...
  • 2篇计算机应用
  • 2篇传感技术学报
  • 1篇自动化学报
  • 1篇浙江大学学报...
  • 1篇计算机学报
  • 1篇江西师范大学...
  • 1篇中国科技成果
  • 1篇郑州大学学报...
  • 1篇软件导刊
  • 1篇中国科学:信...

年份

  • 4篇2024
  • 2篇2023
  • 6篇2022
  • 5篇2021
  • 5篇2020
  • 3篇2019
  • 3篇2018
  • 2篇2017
  • 2篇2016
  • 2篇2015
  • 2篇2013
  • 1篇2011
38 条 记 录,以下是 1-10
排序方式:
基于GaborSIFT+NNScSPM图像特征抽取算法研究被引量:2
2011年
视觉信息的特征表示是计算机视觉场景图像理解研究中的核心内容.基于GaborSIFT+NNScSPM的图像特征抽取算法,借鉴生物视觉机制中的相关研究成果,有机结合了HMAX层次计算模型的思想和非负稀疏编码的策略,较为合理地模拟了生物视觉皮层中视觉处理的过程.在15类场景图像和Caltech101两个公开数据集上进行了实验验证,实验结果表明我们所提出的算法较同期算法有着良好的分类性能.
江爱文王春恒肖柏华
关键词:特征抽取非负稀疏编码语义分类
基于ListMLE排序学习方法的机器译文自动评价研究被引量:2
2013年
机器翻译译文质量的自动评价是推动机器翻译技术快速发展的一条重要途径。该文提出了基于List-MLE排序学习方法的译文自动评价方法。在此基础上,探讨引入刻画译文流利度和忠实度的特征,来进一步提高译文自动评价结果和人工评价结果的一致性。实验结果表明,在评价WMT11德英任务和IWSLT08BTEC CEASR任务上的多个翻译系统的输出译文质量时,该文提出的方法预测准确率高于BLEU尺度和基于RankSVM的译文评价方法。
李茂西江爱文王明文
语义耦合相关的判别式跨模态哈希学习算法被引量:13
2019年
基于哈希的跨模态检索以其存储消耗低、查询速度快等优点受到广泛的关注.跨模态哈希学习的核心问题是如何对不同模态数据进行有效地共享语义空间嵌入学习.大多数算法在对多模态数据进行共享空间嵌入的过程中忽略了特征表示的语义判别性,从而导致哈希码表示的类别区分性不强,降低了最近邻搜索的准确性和鲁棒性.该文提出了基于语义耦合相关的判别式跨模态哈希特征表示学习算法.算法在模型的优化目标函数设计上综合了线性判别分类器的思想和跨模态相关性最大化思路,通过引入线性分类器,使得各模态都能够分别学习到各自具有判别性的二进制哈希码.同时利用耦合哈希表示在嵌入语义空间中最大化不同模态之间的相关性,不仅克服了把多种数据投影到一个共同嵌入语义空间的缺陷,而且能够捕捉到不同模态之间的语义相关性.算法在Wiki、LabelMe以及NUS_WID三个基准数据集上与最近相关的算法进行了实验比较.实验结果表明该文提出的方法在检索精度和计算效率上有明显的优势.
严双咏刘长红江爱文叶继华王明文
关键词:线性分类器语义相关性
一种信息提示装置
本实用新型实施例公开了一种信息提示装置,该装置包括:图像采集设备、声音输出设备、距离传感器、信息输入输出设备、供电设备、无线传输电路、存储器、控制器和信号处理电路,其中:图像采集设备、声音输出设备和信息输入输出设备安装在...
张惠晴江爱文黄苏佳
文献传递
基于多通道多步融合的生成式视觉对话模型
2024年
当前视觉对话任务在多模态信息融合和推理方面取得了较大进展,但是,在回答一些涉及具有比较明确语义属性和位置空间关系的问题时,主流模型的能力依然有限。比较少的主流模型在正式响应之前能够显式地提供有关图像内容的、语义充分的细粒度表达。视觉特征表示与对话历史、当前问句等文本语义之间缺少必要的、缓解语义鸿沟的桥梁,因此提出一种基于多通道多步融合的视觉对话模型MCMI。该模型显式提供一组关于视觉内容的细粒度语义描述信息,并通过“视觉−语义−对话”历史三者相互作用和多步融合,能够丰富问题的语义表示,实现较为准确的答案解码。在VisDial v0.9/VisDial v1.0数据集中,MCMI模型较基准模型双通道多跳推理模型(DMRM),平均倒数排名(MRR)分别提升了1.95和2.12个百分点,召回率(R@1)分别提升了2.62和3.09个百分点,正确答案平均排名(Mean)分别提升了0.88和0.99;在VisDial v1.0数据集中,较最新模型UTC(Unified Transformer Contrastive learning model),MRR、R@1、Mean分别提升了0.06百分点,0.68百分点和1.47。为了进一步评估生成对话的质量,提出类图灵测试响应通过比例M1和对话质量分数(五分制)M2两个人工评价指标。在VisDial v0.9数据集中,相较于基准模型DMRM,MCMI模型的M1和M2指标分别提高了9.00百分点和0.70。
陈思航江爱文崔朝阳王明文
基于细粒度视觉特征和知识图谱的视觉故事生成算法被引量:2
2022年
视觉故事生成是图像内容描述衍生的跨模态学习任务,在图文游记自动生成、启蒙教育等领域有较好的应用研究意义。目前主流方法存在对图像细粒度特征描述薄弱、故事文本的图文相关性低、语言不丰富等问题。为此,该文提出了基于细粒度视觉特征和知识图谱的视觉故事生成算法。该算法针对如何对图像内容进行充分挖掘和扩展表示,在视觉和高层语义方面,分别设计实现了图像细粒度视觉特征生成器和图像语义概念词集合生成器两个重要模块。在这两个模块中,细粒度视觉信息通过含有实体关系的场景图结构进行图卷积学习,高层语义信息综合外部知识图谱与相邻图像的语义关联进行扩充丰富,最终实现对图像序列内容较为全面细致的表示。该文算法在目前视觉故事生成领域规模最大的VIST数据集上与主流先进的算法进行了测试。实验结果表明,该文所提算法生成的故事文本,在图文相关性、故事逻辑性、文字多样性等方面,在Distinct-N和TTR等客观指标上均取得较大领先优势,具有良好的应用前景。
李朦朦江爱文龙羽中宁铭彭虎王明文
关键词:场景图知识图谱
基于预训练模型自适应匹配的视觉故事生成算法
2024年
视觉故事生成任务是为一组图像序列生成具有表现力和连贯性的、能准确描述所涉及视觉内容的语句段落,是当前计算机视觉和自然语言处理交叉领域中一个有趣而又快速发展的多模态研究方向。随着预训练模型在各种下游任务的成功,基于预训练模型的视觉故事生成算法也被广泛研究。但因为数据模态的差异和语义鸿沟的存在,预训练模型在微调学习过程中会产生灾难性遗忘问题。如何协调视觉和语言两种模态数据的预训练模型,是当前多模态预训练模型研究的主要目标之一。该文提出基于预训练模型自适应匹配的视觉故事生成算法,一方面综合挖掘图像流的视觉、关系、序列等多样化互补信息,弥补语义差异;同时,另一方面用适应性损失对图文两种模态数据进行特征对齐,以及对图像流数据进行连续信息对齐,取得了较好的效果。算法在目前已公开的视觉故事生成数据集(VIST)上与近年的先进算法进行实验比较。评测结果表明,该文算法在生成故事的图文相关性、文本多样性、内容逻辑连贯性等指标上取得了具有竞争力的结果。
宁铭江爱文崔朝阳刘长红王明文
关键词:图像序列
基于特征子空间直和的跨年龄人脸识别方法被引量:2
2021年
针对跨年龄人脸识别任务,在同时进行人脸身份识别和年龄分类这两个任务的多任务卷积神经网络的基础上加入直和模块,提出了一种基于特征子空间直和的多任务卷积神经网络(FSDS-CNN)。该网络利用2个并行子网分别从深度特征中提取出身份相关特征和年龄相关特征,并对这2个相关特征所对应的特征子空间施加直和约束,使得身份相关特征与年龄相关特征尽可能无关。通过多损失的联合监督学习,该网络可以获得随年龄变化鲁棒的年龄无关人脸身份特征。分别在Morph Album 2、CACD-VS和Cross-Age LFW数据集上进行实验,其中在CACD-VS数据集中,所提方法的AUC最优值为99.7%;在Cross-Age LFW数据集中,所提方法在等错误率(EER)和错误匹配率(FMR)为0.1时的错误非匹配率(FNMR)上分别取得了最优值10.1%和10.2%。同时在3个数据集上的实验均进行了消融对比实验以验证直和模块的有效性。实验结果表明,身份特征与年龄特征的相关性被FSDS-CNN中的直和模块有效地降低,从而有效提升了模型跨年龄人脸识别的性能。
叶继华郭祺玥江爱文黎欣
关键词:人脸识别多任务特征子空间
MAFDNet:复杂环境下图像自适应分类新方法
2023年
复杂环境下,往往困难样本和简单样本并存,现有分类方法主要针对困难样本进行设计,所构建网络用于分类简单样本时会造成计算资源的浪费;而网络修剪和权重量化等方法则不能同时兼顾模型的准确度和存储开销。为提升计算资源的使用效率并有更好的准确率,本文着眼于输入样本的空间冗余,提出了复杂环境下图像自适应分类网络MAFDNet,并引入置信度作为分类准确性的判断,同时提出了由内容损失、融合损失和分类损失组成的自适应损失函数。MAFDNet由3个子网组成,输入图像首先被送入到低分辨率子网中,该子网有效提取了低分辨率的特征,具有高置信度的样本先被识别并从网络中提前退出,低置信度的样本则需要依次进入更高分辨率的子网中,而网络中的高分辨率子网具有识别困难样本的能力。MAFDNet将分辨率自适应和深度自适应结合在一起,通过实验表明,在相同计算资源条件下,MAFDNet在CIFAR?10、CIFAR?100和ImageNet这3个复杂环境数据集上的top?1准确率均得到提升。
叶继华黎欣陈进江爱文化志章万文涛
关键词:复杂环境自适应分类置信度
改进型任意风格快速迁移元网络算法
2020年
基于元网络的任意风格快速迁移方法得到业界的高度关注和评价。然而,该模型的结果图中经常出现灰色风格不协调的像素缺块,颜色色调与目标风格图不一致,严重影响了迁移质量。提出了该方法的改进策略。使用Gram矩阵作为风格统计量,用于元网络信息输入和计算网络训练损失函数。同时,综合Gram矩阵平均池化操作和元网络分组全连接策略,有效避免了传统Gram矩阵带来网络参数整体过大的问题。实验结果显示,该方法不仅有效去除了不协调风格缺块问题,而且在纹理和颜色布局上较原方法取得了更好的视觉效果。通过理论分析、实验佐证,在算法收敛性和视觉效果方面,进一步确认了采用Gram矩阵作为风格损失和特征统计量的优越性。
刘运鑫江爱文叶继华王明文
关键词:GRAM矩阵神经网络
共4页<1234>
聚类工具0