专利名称:一种基于音频指纹的分片音频检索方法专利类型:发明专利发明人:胡峰松,张永
申请号:CN201710044606.9申请日:20170119公开号:CN106802960A公开日:20170606
摘要:本发明公开了一种基于音频指纹的分段音频检索方法。该方法包括:步骤1,对待检音频片段进行音频长度检测及判断,判断长度是否大于N秒,这里设定为3秒,否进入步骤2,是则对音频片段分成3秒和剩余音频片段;步骤2,对步骤1的音频片段进行数字化、预处理;步骤3,对步骤2的音频信号提取音频指纹特征;步骤4,和音频指纹特征库进行特征匹配,判断最大匹配率是否大于阈值,是的话,返回原始音频信息,检索结束,否的话利用音频分片再提取指纹以及指纹匹配。本方法先对待检音频片段进行分片,并逐片进行特征提取和特征匹配,并对音频指纹特征进行优化,所以相比现有技术,本发明能大幅度提高音频检索的准确率和效率。
申请人:湖南大学
地址:410082 湖南省长沙市岳麓区麓山南路麓山门
国籍:CN
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容