语音增强

维基百科,自由的百科全书

语音增强(Speech enhancement)其目的是借由使用各种演算法来提高说话语音质量。增强的目的是为改进"了解度(Intelligibility (communication))"及/或"使用音频信号处理技术提升退化语音信号时"之整体感知质量。

增强因噪声、或噪声减少之语音衰减,为语音增强的最重要领域。也应用于许多应用上,诸如移动电话VoIP视讯会议系统、语音识别,以及助听器等领域。[1]

演算法

用于降低噪语增强语音处理的算法可以分为三个基本类别:过滤技术,频谱恢复,及模式方法。[2]

  • 过滤技术
  • 频谱差减法。
  • 维纳滤波。
  • 信号子空间的法(SSA)。
  • 频谱恢复
  • 最小均方误差短时谱幅度估计器(MMSE-STSA)。
  • 基于语音模型

参见

注释

  1. ^ J. Benesty, S. Makino, J. Chen (ed). Speech Enhancement. pp.1-8. Springer, 2005. ISBN 978-3-540-24039-6.
  2. ^ J. Benesty, M. M. Sondhi, Y. Huang (ed). Springer Handbook of Speech Processing. pp.843-869. Springer, 2007. ISBN 978-3-540-49125-5.

参考文献

外部链接