口語語料庫

維基百科,自由的百科全書

口語語料庫為語言音頻文件和文字副本的數據庫。在語音技術英語Speech technology里,口語語料庫可用於創建聲學模型,配合語音識別引擎使用。在語言學里,口語語料庫可用於語音學會話分析英語Conversation Analysis方言學等方面的研究。

口語語料庫主要分為朗讀語料和自然口語兩類。

參考文獻

  • Edwards, Jane / Lampert, Martin (eds.) (1992): Talking Data – Transcription and Coding in Discourse Research. Hillsdale: Erlbaum.
  • Leech, Geoffrey / Myers, Greg / Thomas, Jenny (eds.) (1995): Spoken English on Computer: Transcription, Markup and Application. Harlow: Longman.