MFCC(Mel-frequency cepstral coefficients):梅尔频率倒谱系数。梅尔频率是基于人耳听觉特性提出来的, 它与Hz频率成非线性对应关系。梅尔频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征。主要用于语音数据特征提取和降低运算维度。例如:对于一帧有512维(采样点)数据,经过MFCC后可以提取出最重要的40维(一般而言)数据同时也达到了降维的目的。【原文链接:/fengzhonghen/article/details/51722555】
有兴趣的朋友可以百度一下相关的更多的介绍。后续本站也会再陆续发表如何使用Python提取,以及它在语音识别、语音分类的一些应用点的例子,欢迎大家讨论关注。
提取数据
这个脚本在git目录里的第33个脚本。33-MFCC_by_Praat_script\Get_MFCC.Praat
Praat运行脚本,Praat->Open Script->Get_MFCC.Praat
第一个输入:就是你的WAV
所在的目录,这里是wavs/
;第二个输入:就是你需要转化后的MFCC
保存的目录,这里是MFCC/
;
最终运行之后可以得到转化后的MFCC文件。
这里说明一下:
本站之前发布的大多数脚本都是采用的相对路径,即textgrids/
这样,没有将哪个盘,哪个目录都列出来,这是因为这些目录本身就在和脚本同样的目录下,这是完全没有问题的,经常在咨询群里看到有一些同学自己并不熟悉路径,总是弄错路径,其实我提到过多次了,你就不要动我现在设置的路径,将你的数据放在我的目录里运行就可以了。
获取脚本
/feelins/Praat_Scripts
本站所有Praat脚本
都可以在上述github的项目目录
里找到,如果日常对代码、脚本操作比较熟练的可通过下载、安装、配置github for windows
在自己的电脑上通过git clone
将代码下载到本机,这样的好处是可以跟主站及时更新代码。
不想费如此脑筋,可以通过点击如下图Code位置所示,下载整站的代码,可直接使用。
关注
公众号:极地语音工作室, QQ讨论群720939827
版权说明
1、版权归本博客作者所有;
2、未经本站或者作者允许, 不得任意转载本文内容,否则将视为侵权;
3、转载或者引用本文内容请注明来源及原作者;
4、对于不遵守此声明或者其他违法使用本站内容者,本人依法保留追究权等。