此算法在去噪过程中其变换核函数(变换矩阵)是随帧改变而改变的,每一帧语音都会更新一次变换核函数,所以该算法具有帧间自适应增强。 4算法仿真实验 4.1实验材料(语音样本) 实验用的语音取自笔者的导师建立的语音样本库。其语料为诗词、短句和文章,录制转换后的数字语音均为8kHz采样、8bit量化、线性PCM编码。语音样本库的容量是186MB。实验时用的语音是从样本库中挑选的诗词和短句,加入高斯白噪声后形成带噪的语音。实验用的语音样本取帧长320点、帧移160点。 4.2实验结果及其分析 图1是用不同方法进行基音检测的实验结果,图(a)是一帧浊音的自相关函数波形,图(b)是平均幅度差函数波形,图(c)是二者比值的平方波形。从图1可看出,二者比值的平方波形要比单一自相关、平均幅度差的波形尖锐得多,在峰值处尤为明显。在图2中,(a)为纯净的语音信号“蓝天,白云,碧绿的大海”的基音周期轨迹,(b)为单一自相关或平均幅度差函数方法对信噪比为5dB的带噪语音进行基音检测的实验结果,(c)为本文算法对带噪语音进行基音检测的实验结果。结果显示,加入噪声后提取的基音周期(图b)相比纯净语音的基音周期(图a),部分帧有缺失或减小现象,这是由于背景噪声的干扰造成的。而经过本文算法提取语音的基音周期轨迹(图c)几乎与纯净语音的基音周期轨迹(图a)一致。 5结束语 本文将自相关函数、平均幅度差函数二者比值平方的基音检测法和正交变换相结合,提出了一种在随机背景噪声下的基音周期提取方法。实验结果表明,与单一的自相关法和平均幅度差函数法相比,该算法获取的基音周期有较高的准确性和对噪声有较强的鲁棒性,有利于语音识别和编码的实时处理。 【参考文献】 [1] Rabiner L R.On the use of autocorrelation analysis for pitch detection[J]. IEEE Trans on Acoustics, Speech and Signal Processing,1977,25(1):24-33. [2] Noll A M.Cepstrum pitch determination[J].Journal of the Acoustical Society of America,1967,41(2):293-309. [3] Boersma P.Accurate short-term analysis of the fundamental frequency and the harmonics-to-noise ratio of a sampled sound[C]. Proc of the Institute of Phonetic Sciences of the University of Amsterdam,1993:97-110. [4]KobayashiH,ShimamuraT.Amodifiedcepstrummethodforpitchextraction[C].The1998IEEEAsia-PacificConferenceonCircuitsandSystems,1998:299-302. [5]AhmadiS,SpaniasAS.Cepstrum-basedpitchdetectionusinganewstatisticalV/UVclassificationalgorithm[J].IEEETransonSpeechandAudioProcessing,1999,7(3):333-338. [6]姜占才,姚刚.一种无门限U/V判决和基音检测算法[J].计算机工程与应用,2011,47(25):140-142. [7]林琴,郭玉堂,刘亚楠.基于自相关平方函数与小波变换的基音检测[J].计算机应用,2009,29(5):1432-1436. [8]徐金甫,陈小利.基于线性预测的综合基音检测法[J].计算机工程与设计,2008,29(4):891-893. [9]陈小利,徐金甫.利用小波变换加权自相关的基音检测法[J].数据采集与处理,2007,22(4):463-467. |