看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于梅尔频率倒谱系数的音频分类研究 收藏
基于梅尔频率倒谱系数的音频分类研究

基于梅尔频率倒谱系数的音频分类研究

作     者:屈晓渊 崔青 QU Xiaoyuan;CUI Qing

作者机构:榆林学院信息工程学院陕西榆林719000 榆林学院艺术学院陕西榆林719000 

基  金:陕西省科技厅项目(2019NY-179) 榆林市产学研合作项目(2019-93-2,2019-93-3) 

出 版 物:《电子设计工程》 (Electronic Design Engineering)

年 卷 期:2022年第30卷第9期

页      码:82-87,92页

摘      要:梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)是一种符合人耳听觉特征,并与频率呈非线性对应关系的频谱特征,广泛应用在语音识别、音频特征分析等方面。对于目前广泛使用的通过单一特征进行音频分类的方法,存在分类准确度低、处理速度慢等方面的不足,提出了基于梅尔频率倒谱的音频分类算法,该算法对音频设定采样率,获取音频的时间序列,并根据时间序列提取梅尔频率倒谱系数特征,将获取的二维特征值进行数据拟合、标准化处理。构建多层卷积神经网络模型,将标准化处理后的梅尔频率倒谱系数特征作为网络的输入,通过交叉熵验证的方法,对模型的输出进行分类。通过实验数据可知,梅尔频率倒谱系数特征通过多层卷积网络处理后,分类结果准确率达到92.8%,使用模型进行分类时,速度达到每个样本7 ms的耗时,模型能对音频进行准确快速的分类。

主 题 词:梅尔频率倒谱系数 音乐特征 音频分类 多层卷积神经网络 

学科分类:0809[工学-计算机类] 08[工学] 

D O I:10.14022/j.issn1674-6236.2022.09.017

馆 藏 号:203111309...

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分