


言語知覺的運動理論(Motor theory of speech perception),是一種認為人們通過辨認發音的聲道姿勢而非語言的發音習慣來理解話語的假說[1][2][3][4][5]。它最初聲稱言語知覺是通過一個人類天生特有的特殊模塊完成的。雖然這個模塊在近幾年的理論中得到認證,[5]但人們還是認為言語運動系統的角色不僅是產生發音,還有檢測它們。











  • 語音發音器官的不變運動[8]
  • 傳達到肌肉導致聲道發聲運動的不變運動指令[11]










  • 人們發現在噪音中,如果他們能看到說話者,會更容易聽到講話內容。[15]
  • 當音節的產生能夠憑觸覺感知到時,人們能更好地聽到它們。[16]


使用言語合成器時,語音可以沿着一個連續的發音位置變化,從/ba/到/da/到/ga/,或語音發生時間的連續(例如/da/到/ta/)。當聽者被要求區分兩個不同的聲音時,他們認為這屬於非連續的聲音,雖然聲音是連續變化的。換句話說,十種聲音(從一個聲音的極端/da/到另一個極端/ta/,以及中間按比例變化的聲音)可以全部是聲學上彼此不同的,但聽者將把這些聲音全部聽成/da/或/ta/。同樣,英語輔音/ d /在不同的語音語境中可能會有聽覺細節上的不同(例如,/du/和/di/中的/d/嚴格來說發音並不相同),但所有/d/』 聽者都會歸為同一類(濁齒齦塞音),這是因為「語言表述是抽象和規範的語音部分或其背後的發音姿勢。[17]」 這表明,人類通過類別知覺識別語音。因此,像言語知覺的運動理論所提出的專門模塊,有可能是正確的[18]




  • 聽音能夠刺激聲道肌肉[21],運動皮層[22]和前運動皮層[23]。言語知覺的聽覺和視覺輸入整合也涉及這些區域[24]
  • 擾亂前運動皮層也會破壞語音單位的認知,如爆破音[25]
  • 同產生語音姿勢的聲道發聲器官有關的音位特徵會激活運動區[26]
  • 講話聲音的感知是藉助於先發制人地刺激發聲器官的運動表達[27]
  • 聽覺和運動皮層的耦合被限制在特定的神經元放電頻率範圍內[28]










  • 多方的證據都沒能支持專門的語言模塊這一想法。
  • 雙工感知可以通過摔門觀察到[13]
  • 麥格克效應也可以通過非語言刺激實現,如播放一段籃球彈動視頻,但是播放乒乓球彈動的聲音[來源請求]
  • 至於類別知覺,聽者對單一語音類別的聲音差異也可能很敏感。










