当前位置: > 论文中心 > 计算机论文 >

基于正交变换的基音检测算法

时间:2016-03-08 13:36 点击:
【论文摘要】针对随机背景噪声下的基音周期检测,提出了一种基于正交变换的基音检测算法。该算法通过正交变换对含噪的语音进行消噪,再求消噪后语音的自相关函数(ACF)和平均幅度差函数(AMDF),对其求出比值(ACF/AMDF)的平方以突显基音周期的峰值,以便
  【论文摘要】针对随机背景噪声下的基音周期检测,提出了一种基于正交变换的基音检测算法。该算法通过正交变换对含噪的语音进行消噪,再求消噪后语音的自相关函数(ACF)和平均幅度差函数(AMDF),对其求出比值(ACF/AMDF)的平方以突显基音周期的峰值,以便获取较准确的基音周期参数。实验结果表明,与单一的自相关法和平均幅度差函数法相比,该算法获取的基音周期有较高的准确性和对噪声有较强的鲁棒性。
  【论文关键词】语音;正交变换;自相关函数;平均幅度差函数;基音周期检测
  Abstract: Aiming at pitch period detection under random background noise,a kind of pitch detection algorithm based on orthogonal transform is put forward. Noisy speech signal was first preprocessed by orthogonal transform, the autocorrelation function (ACF) and the average magnitude difference function (AMDF) for speech signal were obtained. The square of the ratio for ACF and AMDF had been applied to emphasize the peak of the true pitch period. This algorithm can get the exact pitch of the speech signal in strong noisy environment. Experimental results indicate that, compared with single autocorrelation and average magnitude difference method, the proposed algorithm has better robustness and higher accuracy.
  Key words: speech; orthogonal transform; autocorrelation function; average magnitude difference function; pitch detection
  1概述
  基音周期是语音信号处理及语音识别中的重要参数之一,基音周期参数的准确度越高便对语音编码、合成、识别等方面越有益。经典的基音周期提取算法有短时自相关法(ACF)、短时平均幅度差法(AMDF)、倒谱法[1-2]及其改进算法[3-5]。理论上讲,这些算法可以准确地提取纯净语音的基音周期。但语音通常会受到外界随机背景噪声的干扰,所以噪声环境下的基音周期检测是十分有必要的。因此,为了在随机背景噪声环境下提取较为准确的基音周期参数,研究人员们提出了很多新的基音周期检测算法,一种无门限U_V判决和基音检测算法[6],基于自相关平方函数与小波变换的基音检测[7],基于线性预测的综合基音检测法[8]以及利用小波变换加权自相关的基音检测法[9]等,这些算法在不同的应用范围内都取得了显著的成效。本文提出了一种基于正交变换和自相关函数、平均幅度差函数相结合的基音检测算法。即首先利用正交变换滤除随机背景噪声的影响;然后把正交变换后的结果作为被处理信号,计算其自相关函数与平均幅度差函数比值的平方;最后利用在基音周期的各整数倍点上具有较高的峰值,通过搜索算法就可以检测出基音周期。该算法与单一自相关、平均幅度差法相比,具有较高的准确性和较强的鲁棒性。
  2基本原理
  2.1自相关函数
  在语音信号中,清音帧是没有周期性的,故其自相关函数也没有周期性;浊音帧具有准周期性,它的自相关函数与信号具有相同的周期。
  2.2平均幅度差函数
  AMDF只需加减法和取绝对值运算,与自相关函数相比其运算量明显提高。AMDF定义为:
  对于具有周期性的语音帧[x(n)],其平均幅度差函数也呈周期性。平均幅度差函数在周期的各整数倍点上是谷值,而不是峰值。由此可见,AMDF也可以用于基音周期的检测,而且计算上都是加减法,故比短时自相关法的乘法运算更为简单。
  自相关函数与平均幅度差函数比值的平方,记作[Sr(k)=(R(k)/γn(k))2],目的是突显基音周期的峰值以便获取较准确的基音周期。
  由上式可以看出,要使均方误差达到最小,就必须舍去部分的特征值尽可能的小,即将n个特征值按大小排列,即[λ1>λ2>…>λm>…>λn],将[λm+1,…,λn]舍去后,应使余下的特征值保留最大的能量,即[ε]最小原则。所以K-L变换是在MSE准则意义下实现完全去除原信号中的冗余。
  3算法步骤
  本文具体算法步骤如下。
  1)将语音信号分成长度为320点的语音帧x;
  2)对该帧语音信号去直流,即语音信号的每个数据减去该帧数据的均值;
  3)将去均值后的语音信号作自相关,取正半轴上的320点数据;
  4)把自相关后的语音信号按照托普利兹矩阵的特点进行排列构造协方差矩阵Cx,为方便起见,现以[x=[12345]T]为例,省略(2)至(3)步骤直接对x构造协方差阵,即:
  由[Cy]可以看出,除对角线以外的元素都为零,这说明[y]的各个分量互不相关。因此,对x作K-L变换后完全去除了原信号中的相关性。
  7)将特征值从小到大排列,舍去较小的特征值,由余下较大的特征值及其对应的特征向量构造重构矩阵A,;
  8)用重构矩阵A,对变换系数向量y作逆变换得到重构语音信号x,,即去除原语音信号x中的冗余达到语音增强的目的;
  9)将去噪后的语音信号x,作为输入信号,对其求取自相关函数和平均幅度差函数,利用自相关函数与平均幅度差函数比值的平方在基音周期的各整数倍点上具有较高的峰值,检测出基音周期;
  10)求出所有语音帧的基音周期后,对其进行平滑处理,纠正个别基音周期值的错误。

   论文榜(www.zglwb.com),是一个专门从事期刊推广、投稿辅导的网站。
本站提供如何投稿辅导,寻求投稿辅导代理,快速投稿辅导,投稿辅导格式指导等解决方案:省级投稿辅导/国家级投稿辅导/核心期刊投稿辅导//职称投稿辅导。


栏目列表
联系方式
推荐内容
 
QQ在线咨询
投稿辅导热线:
189-6119-6312
微信号咨询:
18961196312