罗志军
- 作品数:1 被引量:1H指数:1
- 供职机构:北京理工大学更多>>
- 相关领域:自动化与计算机技术更多>>
- 双哈希索引的高精度大规模音频样例检索被引量:1
- 2015年
- 实时音频流中对大规模音频样例进行检索时,在保证准确率的条件下,检索速度直接影响音频流实时处理能力。提出一种基于双哈希索引的大规模音频样例检索方法。该方法通过对大规模音频样例的音频特征进行自相似量化后,分别根据自相似序列的分段向量均值和模值建立线性双哈希索引,然后在音频流中进行搜索,最后对搜索结果利用音频的时序和空间信息进行判断得到检索结果。实验结果表明,本方法实现了大规模音频样例的一次检索,且当采用12维MFCC音频特征,音频样例时长为16 s、音频样例规模小于3100时,音频样例的检索准确率在90%以上,检索速度大于12000倍速,最高达到16000倍速。该方法在有效提高检索精度的基础上,保证较高的检索速度。
- 高晓芳罗森林吕英罗志军潘丽敏
- 关键词:音频流索引哈希音频特征