陈雁翔 作品数:60 被引量:112 H指数:5 供职机构: 合肥工业大学 更多>> 发文基金: 国家自然科学基金 安徽省自然科学基金 中国博士后科学基金 更多>> 相关领域: 自动化与计算机技术 电子电信 机械工程 交通运输工程 更多>>
梯度方向直方图在语谱图映射中的应用 2011年 语谱图是显示时变频谱幅度特征的图形,基于梯度方向直方图建立语谱图之间的映射关系,找出它们对应的频率结构,为说话人规整及进一步的语音处理提供了途径。在提取特征参数之前,用梯度方向直方图描述语谱图中点的特征,进而实现两个说话人的语谱图在频率轴上的非线性映射,其实质是在频率点相似性的条件下,运用动态规划准则的最佳匹配问题。在TIDIGITS数据库上的实验表明,该方法在训练集与测试集不匹配时能明显降低系统的误识率。 陈雁翔 刘鸣关键词:梯度方向直方图 动态规划 一种驾驶员多种行为预警系统及危险评估方法 本发明公开了一种驾驶员多种行为预警系统及其危险评估方法,其特征是包括:视频采集模块、关键部位定位模块、行为识别模块、视线分析模块、驾驶员状态预警模块和离线训练模块;离线训练模块用于获得混合定位模型和三种分类模型;视频采集... 陈雁翔 林新宇 王猛 宋明龙 任洪梅文献传递 基于三维显著度的图像剪裁方法 本发明公开了一种基于三维显著度的图像剪裁方法,其特征是按如下步骤进行:1利用深度数据获得目标图像的深度图;2将深度图和二维模型结合起来构建三维显著度模型;3根据图像灰度的分布自适应的更新深度数据和二维模型之间的权重;4利... 汪萌 高欣健 陈雁翔 潘宜飞文献传递 音视频数据处理方法、系统、电子设备及存储介质 本发明提供一种音视频数据处理方法、系统、电子设备及存储介质,所述音视频数据处理方法包括获取第一数据集,所述第一数据集包括若干数据对,所述第一数据集中的每个所述数据对包括相互匹配的视频帧序列单元和音频数据单元;构建多路特征... 陈雁翔 檀华东 赵鹏铖 武广文献传递 基于地形特征重要度的地形网格简化与调整 被引量:2 2019年 山地是应急决策过程的主要场景之一,面向移动终端和WEB展示等资源受限平台上的大场景优化显示方法是图形学和可视化领域的研究热点。文章在已有的DEM地形网格简化算法的基础上,提出了一种基于地形特征重要度的地形网格简化与调整算法。通过K-means算法将地形网格顶点进行聚类,并且引入地形特征重要度来调整特定区域地形网格的大小,达到突出特定地形的效果;采用细节层次(levels of detail,LOD)算法指导地形网格的细分和简化,提高地形网格的绘制效率。实验结果表明,该算法有效地保留且突出了山地区域地形地貌,并且减少了顶点数量,提高了地形绘制和渲染的效率。 肖铭杰 路强 陆亦扬 邹彬 刘号 陈雁翔关键词:地形网格 视点相关 面向多模态自监督特征融合的音视频对抗对比学习 被引量:1 2023年 目的同一视频中的视觉与听觉是两个共生模态,二者相辅相成,同时发生,从而形成一种自监督模式。随着对比学习在视觉领域取得很好的效果,将对比学习这一自监督表示学习范式应用于音视频多模态领域引起了研究人员的极大兴趣。本文专注于构建一个高效的音视频负样本空间,提高对比学习的音视频特征融合能力。方法提出了面向多模态自监督特征融合的音视频对抗对比学习方法:1)创新性地引入了视觉、听觉对抗性负样本集合来构建音视频负样本空间;2)在模态间与模态内进行对抗对比学习,使得音视频负样本空间中的视觉和听觉对抗性负样本可以不断跟踪难以区分的视听觉样本,有效地促进了音视频自监督特征融合。在上述两点基础上,进一步简化了音视频对抗对比学习框架。结果本文方法在Kinetics-400数据集的子集上进行训练,得到音视频特征。这一音视频特征用于指导动作识别和音频分类任务,取得了很好的效果。具体来说,在动作识别数据集UCF-101和HMDB-51(human metabolome database)上,本文方法相较于Cross-AVID(cross-audio visual instance discrimination)模型,视频级别的TOP1准确率分别高出了0.35%和0.83%;在环境声音数据集ECS-50上,本文方法相较于Cross-AVID模型,音频级别的TOP1准确率高出了2.88%。结论音视频对抗对比学习方法创新性地引入了视觉和听觉对抗性负样本集合,该方法可以很好地融合视觉特征和听觉特征,得到包含视听觉信息的音视频特征,得到的特征可以提高动作识别、音频分类任务的准确率。 盛振涛 陈雁翔 齐国君一种基于生成对抗网络的音频异常检测方法 本发明公开了一种基于GAN的音频异常检测方法,包括以下步骤:1收集音频数据集,并对所得音频数据集中每个音频文件进行端点检测,获取空音位置并删除相应空音,从而得到预处理后的音频文件;2预训练分类器;3训练生成对抗网络;4使... 陈雁翔 周杰 武广 赵鹏铖 丁凯旋 凡双根一种基于图像翻译的云数据访问控制方法 本发明公开了一种基于图像翻译的云数据访问控制方法,认证中心通过训练循环图像翻译模型生成加密密钥和解密密钥;数据拥有者和数据用户在云服务器获得数据的上传权限和下载权限;数据拥有者向认证中心提交身份令牌并完成身份认证;数据拥... 姚远志 陈雁翔 齐美彬可训练语音合成在侗语合成中的应用 2012年 侗语自1958年创造了拉丁字母的文字方案后,形成了一种拼音化的文字形式。本文通过HMM的语音合成方法,结合侗语自身的语言特点,确定了语音语料的选取、录音方式、音素列表、标注以及上下文问题集和属性集的设计,实现了对于侗语语音的合成。通过在HTS上搭建语音合成平台进行测试,测试结果表明合成语音的可懂度较高。 龙润田 陈雁翔关键词:侗语 隐马尔科夫模型 语音合成 基于PSPICE的电路优化设计 被引量:2 2006年 PSPICE软件是目前应用最广的电子线路仿真软件,它提供的电路设计优化程序Optimizer可以对电路进行最优化设计,使设计的电路性能更加理想。介绍电路优化设计的条件和步骤,并利用优化设计器Optimizer对两级小信号调谐放大器进行最优化设计,结果表明用优化设计器可以很方便地使电路的指标达到最优化,为提高设计的准确性和设计效率提供依据。 刘正琼 王琼 陈雁翔 吴玺关键词:PSPICE 优化设计 调谐放大器