国家自然科学基金(61171128)
- 作品数:4 被引量:11H指数:2
- 相关作者:张秀李念祖李伟肖川王淞昕更多>>
- 相关机构:复旦大学上海大学上海财经大学更多>>
- 发文基金:国家自然科学基金国家高技术研究发展计划上海市科学技术委员会资助项目更多>>
- 相关领域:自动化与计算机技术电子电信更多>>
- 用递归图和状态空间嵌入改进的歌曲摘要检测算法
- 2014年
- 是歌曲中最让人印象深刻的片段,通常是重复度最高的副歌的一部分.提出一种新的歌曲摘要提取算法.该算法首先在特征提取阶段引入状态空间嵌入来增强音频特征本身的鲁棒性.然后,我们设计了使用递归图的新算法来检测歌曲内所有可能的相似片段集合.最后对相似片段集合进行归类统计,从中选择重复度最高的那一段.在不同语言和不同种类的歌曲库上的实验验证了该算法的有效性,并且对比实验显示该算法优于其他典型的基准系统.
- 沈迤淳肖川
- 关键词:非线性时间序列
- 基于Chroma-based BOW特征的多版本音乐识别被引量:6
- 2015年
- 多版本音乐识别,作为音乐信息检索领域内的一个重要课题,得到了人们的广泛专注.受海量音乐资源的驱动,人们对高效算法的需求呼之欲出.词袋模型是一种在自然语言处理和数字图像处理领域中的广泛应用的特征表示模型,本文将其引入到多版本音乐识别技术研究中,基于目前业界广泛应用的Chroma特征,提出一种新的高层次特征,Chroma-based BOW特征对歌曲的旋律信息进行表示,实现了特征空间到线性矢量的降维映射.同时,设计并实现了一套完整的多版本音乐识别算法.实验证明该特征对于多版本音乐识别是有效的,相应的识别算法能够大幅度提高了传统音乐识别系统的效率.
- 张秀李念祖李晓强王淞昕李会永李伟
- 关键词:聚类
- Chroma特征的鲁棒性验证被引量:5
- 2014年
- 基于内容的多版本音乐识别是近些年来音乐信息检索领域一个比较热门的研究课题。考虑到多版本音乐可能在节奏、速度、音调、音色以及结构等方面的变化,该研究的关键在于选取能反映音乐主要旋律走向的相对稳定的音频特征,在不同的音乐版本之间进行相似度的比较。Chroma特征反映了音频能量在各个音调类间的相对分布,考虑了和声信息、与音色无关、对噪声鲁棒,所以成为多数多版本音乐识别算法使用的特征。通过设计和实验,探究不同的音频干扰形式对Chroma特征的影响,就Chroma特征对音调无关因素的鲁棒性进行验证。
- 张秀李念祖李伟
- 关键词:鲁棒性
- 一种改进的音频内容认证算法
- 2013年
- 介绍了一种基于内容的数字音频认证算法,主要目的在于突破现有音频认证算法仅能判断音频是否受到篡改、而难以定位一个乃至多个具体受篡改位置的局限性,提供更具意义的认证结果。现有的算法通过鲁棒性哈希和半脆弱水印来进行内容的认证,一般采用固定时间分帧并且缺乏重新同步的机制,因此当多处剪切、插入这类失同步的攻击发生时,这些算法都无法在攻击的结束位置重新同步从而导致认证结果有较高的漏警率。文章所述的算法通过提取音频中的关键锚点,以此将音频划分为一系列不等长片段,利用动态时间规整的方法完成同步,最后由机器学习训练得到的模型协助音频的内容认证。实验结果证明了该方法在多于一次的失同步攻击的情况下仍然保持良好的认证效果。
- 殷玥肖川肖晓滨
- 关键词:动态时间规整