跳至內容

計量語言學

維基百科,自由的百科全書

計量語言學(Quantitative Linguistics)是語言學數理語言學的一個分支,主要用數理統計方法研究和描述自然語言,形成系統的語言理論。計量語言學的一個主要流派為協同語言學(Synergetic linguistics)。計量語言學基於語言各層面的實證數據,因此經常採用語料庫語言學和計算語言學的實證數據。

歷史

語言的計量研究可追溯到古希臘和古印度時期。歷史文獻有關於組合數學和基礎統計應用於語言研究的例子。

計量語言學中的定律

在計量語言學領域,定律可以理解為由理論所推導出來的一些假設,以數學形式表達,與該領域其它語言定律關聯,並被語言實證數據有效證明成立,也就是說,無論怎樣都無法被推翻。Köhler就計量語言學定律提出:「語言單位的特性及它們的相互關係遵守普遍的定律,這些定律可以像自然科學中的定律一樣用嚴格的數學方法表達。必須謹記的是,在此語境當中,這些定律具有隨機性;它們並不適用於每一個單獨的例子(這種做法既無必要也無可能);它們僅決定所研究事件的可能性或比率。上述所提及的例子很容易找到反例;然而,這些事例並不違反相應的定律,因為圍繞統計中值的變化不僅是允許的還是非常必要的;它們本身就是由對應的定律所定量精確決定的。這種情況與自然科學中的狀況並無不同,自然科學研究早已擯棄了原有的關於確定性和因果關係性的觀念轉而採用統計或概率模型。」

著名語言定律

多樣化定律:語法範疇的單位如詞性或詞尾屈折變化的頻次受某種法則的支配。

長度(複雜度)分布定律:語篇中的不同語言單位的長度服從不同的分布定律。目前已研究了下述語言單位的長度分布定律: 詞素長度分布定律; 韻律長度分布定律; 句子長度分布定律; 音節長度分布定律; 單詞長度分布定律。

Martin定律:用於單詞釋義的單詞以及解釋這些釋義單詞的單詞形成一個具有層級的詞鏈。處於低一層級的詞較上一級次更具有普遍意義。

Menzerath (Menzerath—Altmann)定律:一個語言單位的子結構越多,其子結構的長度越短。 如一個單詞的音節越多,那麼組成每個音節的成分(如字母)越少;又如句子含子句越多,其子句的長度(指子句單詞的數量)越短。

頻次定律:語言單位的頻次及按頻次所排的次序(最高頻次排序為1)遵守一定的規律。如ZIPF定律 F·R = C,即詞頻F與按詞頻的排序R的乘積為常數C。

語言變化定律:詞彙增長、外來語的使用、屈折體系的變化等遵守PIOTROWSKI定律,即一種邏輯斯蒂模型(LOGISTIC MODEL)。

文體學研究

詩體和非詩體風格可藉助統計方法來研究;而且,不同風格的文本,也可以在語言規律所採用的具體形式(參數)基礎上進行相應研究。在這些方面,文章的風格可用計量語言學的方法來研究:其總體目標之一就是依據語言規律儘可能找尋客觀的證據。計量語言學的主要假設之一就是一些定律(例如詞長的分布)要求不同的模型,至少這些定律(分布或功能)的不同參數值取決於一個文本所屬的文本類。如果研究詩體文本,計量語言學方法就形成了一個文學作品計量研究的分支領域。

主要學者

  • Gabriel Altmann (1931-2020)
  • Otto Behaghel (1854-1936]
  • Sergej Grigor'evič Čebanov (1897-1966)
  • William Palin Elderton (1877-1962)
  • Sheila Embleton, Toronto
  • Ernst Wilhelm Förstemann (1822-1906)
  • Wilhelm Fucks (1902-1990)
  • Peter Grzybek (1957-2019)
  • Pierre Guiraud
  • Gustav Herdan (1897-1968)
  • Luděk Hřebíček (1934)
  • Friedrich Wilhelm Kaeding (1843-1928)
  • Reinhard Köhler
  • Werner Lehfeldt (1943)
  • Viktor Vasil'evič Levickij (1938-2012)
  • Haitao Liu(1962-)
  • Helmut Meier (1897-1973)
  • Paul Menzerath (1883-1954)
  • Sizuo Mizutani (1926)
  • Augustus de Morgan (1806-1871).
  • Charles Muller, Straßburg
  • Raijmund G. Piotrowski
  • L.A. Sherman
  • Juhan Tuldava (1922-2003)
  • Andrew Wilson, Lancaster
  • Albert Thumb (1865-1915)
  • George Kingsley Zipf (1902-1950)
  • Eberhard Zwirner (1899-1984)

參考文獻

  • Karl-Heinz Best, Otto Rottmann: Quantitative Linguistics, an Invitation. RAM-Verlag, Lüdenscheid 2017. ISBN 978-3-942303-51-4.
  • Reinhard Köhler with the assistance of Christiane Hoffmann: Bibliography of Quantitative Linguistics. Benjamins, Amsterdam/ Philadelphia 1995, ISBN 90-272-3751-4.
  • Reinhard Köhler, Gabriel Altmann, Gabriel, Rajmund G. Piotrowski (eds.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch – An International Handbook. de Gruyter, Berlin/ New York 2005, ISBN 3-11-015578-8. (Papers in English and German)
  • Cornelia Schindelin: Zur Geschichte quantitativ-linguistischer Forschungen in China (The history of quantitative-linguistic research in China). In: Reinhard Köhler, Gabriel Altmann, Gabriel, Rajmund G. Piotrowski (eds.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch – An International Handbook. de Gruyter, Berlin/ New York 2005, S. 96-115. (In German)
  • Cornelia Schindelin: Die quantitative Erforschung der chinesischen Sprache und Schrift (Quantitative research on Chinese language and script). In: Reinhard Köhler, Gabriel Altmann, Gabriel, Rajmund G. Piotrowski (eds.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch – An International Handbook. de Gruyter, Berlin/ New York 2005, S. 947-970. (In German)
  • 劉海濤、黃偉,計量語言學的現狀、理論與方法,《浙江大學學報(人文社會科學版),2012,43(2):178-192.
  • 劉海濤,計量語言學:語言研究的科學化途徑,載《光明日報》(2012年2月15日第16 版)

外部連結