贾川
随着语音识别技术日益成熟,语音识别系统开始步入实用,因而如何提高语音识别系统在背景噪声环境下的性能成为识别系统走向实用的关键问题之一。本论文在总结和分析现有的针对噪声鲁棒识别问题的算法的基础之上,依据噪声在信号、特征和模型空间对语音的影响,在端点检测、语音增强、语音特征增强、语音模型补偿和特征补偿的联合等方面做了大量的研究工作:一、端点检测在语音识别中有很重要的应用。本文对语音谱熵特征进行了深入的研究,提出引入常数到其中的概率密度函数的计算形式中,得到改进的语音谱熵特征,并且提出了相应的端点检测策略。改进的谱熵能够更容易地区分语音和噪声信号,而且,在不同信噪比下引入不同的常数,使得改进的谱熵几乎不受信噪比变化的影响,从而门限更易于设定和调节。大量实验表明该端点检测算法大大改善了基本的谱熵的性能,端点检测的准确程度大大高于传统的基于能量的端点检测方法。二.语音增强算法可以有效提高语音的感知质量和可懂度。本文分析了基于AR-HMM模型的最大后验估计算法在低信噪比下的缺陷,提出结合码本限制的维纳滤波算法,来限制原有算法中的混合维纳滤波器,使其满足以码本描述的某些声道谱的限制条件。本文提出的算