叶婉玲
- 作品数:3 被引量:13H指数:2
- 供职机构:华南理工大学电子与信息学院更多>>
- 发文基金:国家自然科学基金中央高校基本科研业务费专项资金中国博士后科学基金更多>>
- 相关领域:电子电信自动化与计算机技术更多>>
- 基于特定发音单元的音视频信息一致性评估方法及实现
- 我国老龄化日益严重,社保金的发放面临日益严峻的冒领等欺诈问题,合适的受益人的身份认证问题日益突出;时时报道大型音乐会存在假唱问题,但又拿不出确实的证据,有必要对疑似假唱进行检测;动漫产业是国家鼓励的低碳产业,动漫配音质量...
- 叶婉玲
- 文献传递
- 基于时空相关度融合的语音唇动一致性检测算法被引量:5
- 2014年
- 本文在传统发音唇动分析模型的基础上,构建一个发音唇动时空模型.提出了唇动时域特征、空域特性与语音的相关度度量方法,以及融合时空度量的语音唇动一致性检测方法.利用唇宽、唇高与音频幅度变化之间的联系获得语音唇动的时域一致性评分;通过协惯量分析法获得语音与唇部空域特征的初始相关度,并提出了针对语音、唇动自然延时的相关度修订方法;最后将时空上的得分进行融合以判断语音唇动是否一致.初步实验结果表明,对于四种不一致音视频数据,与常用的协惯量方法相比,EER(Equal Error Rate)平均下降了约8.2%.
- 朱铮宇贺前华奉小慧叶婉玲李艳雄杨继臣
- 一种基于倒排索引的音频检索方法被引量:8
- 2012年
- 传统的基于实例的音频检索算法采用顺序索引,检索时需遍历数据库并导致难以忍受的等待时间。针对传统的顺序的索引方法,该文提出基于倒排索引的音频检索算法。该方法首先利用多种音频特征构成的超向量,通过多层音频分割方法将连续音频流分割为特征数值波动幅度小的短时音频段;然后利用事先训练好的音频字典,将短时音频段序列转换为可以表征音频内容的音频字序列,并建立倒排索引;检索时,将用户提交的查询转换为音频字后利用倒排索引无须遍历数据库即可直接定位候选段落,并根据候选段落与查询的内容相似度大小对候选段落进行排序,将排好序的列表作为检索结果。仿真实验以匹配项排名、同类检索结果比例、定位准确性和检索用时4个方面作为评价指标,实验结果显示,该算法能够在平均1.101 s时间内实现92.58%的检索准确率。
- 张雪源贺前华李艳雄叶婉玲
- 关键词:音频信号处理音频检索内容相似度倒排索引