語音增強

维基百科,自由的百科全书

語音增強(Speech enhancement)其目的是藉由使用各種演算法來提高說話語音質量。增強的目的是為改進"了解度(Intelligibility (communication))"及/或"使用音频信号处理技術提升退化語音信號時"之整體感知質量。

增強因噪聲、或噪聲減少之語音衰減,為語音增強的最重要領域。也應用於許多應用上,諸如移动电话VoIP視訊會議系統、语音识别,以及助聽器等領域。[1]

演算法

用於降低噪語增強語音處理的算法可以分為三個基本類別:過濾技術,頻譜恢復,及模式方法。[2]

  • 過濾技術
  • 頻譜差减法。
  • 維納濾波。
  • 信號子空間的法(SSA)。
  • 頻譜恢復
  • 最小均方誤差短時譜幅度估計器(MMSE-STSA)。
  • 基於語音模型

參見

註釋

  1. ^ J. Benesty, S. Makino, J. Chen (ed). Speech Enhancement. pp.1-8. Springer, 2005. ISBN 978-3-540-24039-6.
  2. ^ J. Benesty, M. M. Sondhi, Y. Huang (ed). Springer Handbook of Speech Processing. pp.843-869. Springer, 2007. ISBN 978-3-540-49125-5.

參考文獻

外部連結