跳至內容

樹模型

維基百科,自由的百科全書

歷史語言學中,樹模型樹狀模型發生模型分類模型是與譜系圖相似的語言演化模型,尤其與物種演化系統發生樹相似。有同一共同祖先的語言屬於同一個語系

樹模型由德國語言學家德國語言學家奧古斯特·施萊謝爾在1853年推廣,[1][2]自首次嘗試以來一直是描述語言間語系關係的常用方法。它也是比較語言學的核心,涉及用已知語言的證據和觀察到的語言特徵演變規律來重構每個語系的祖語,例如原始印歐語印歐語系。但這在很大程度上是一種理論的、定性的追求,語言學家一直強調樹模型的固有局限性,因為水平轉移也在語言演化的過程中發揮了重要作用,從借詞到有多個祖先的克里奧爾語,都是其可能的後果。[1]波浪模型於1872年由施萊歇謝爾的學生約翰內斯·施密特提出,作為含水平轉移的樹模型的替代。[3]

量化連續現象方面,樹模型也具有與生物分類學相同的局限性,如生物學中的環物種和語言中的方言連續體等。語聯英語Linkage (linguistics)指從方言連續體而不是從單一的祖語演變而來的一組語言。[2]

歷史

《聖經》部落的譜系樹

《舊約》與聖奧古斯丁

希波的奧古斯丁認為諾亞的每名後代都建立了自己的民族,都有一種語言:阿舒爾阿卡德語希伯希伯來語等等。[4]他總共確定了72個民族、部落奠基者和語言,主要的分歧出現在諾亞-閃姆-希伯-法勒一脈。[5][6]奧古斯丁的假說與後來歷史語言學家的假設沒什麼不同,即希伯家族「保留了這種語言,並沒有被無理認為是該種族的通用語言……因此命名為希伯來語。」 然而,這72種語言中的大多數都可以追溯到希伯後的許多代人。聖奧古斯丁通過假設活了430歲的希伯在上帝指定72歲時還活着,從而解決了第一個問題。[7]:123

原語,天堂的語言

聖奧古斯丁的假說一千多年來都沒受到什麼質疑。托馬斯·布朗爵士在1684年出版的一系列小冊子中,對各種信仰,尤其是聖經信仰表示懷疑:[8]

「儘管在洪水之前地球上人口眾多……但是,經過大範圍的分散,以及長達1600年的時間,人們是否在各個地方都保持着如此統一的語言……很可能值得懷疑。」

原語的起源地,伊甸園

到那時,新大陸的開闢與遠東的探索使得新發現的語言數量遠超聖奧古斯丁計算的72種。布朗引用美洲原住民語言,論證「起初,語言的混亂只發生在那些在Sinaar建造巴別塔的人身上……」對於那些「在山腳下,方舟停泊的地方……他們的原始語言可能會隨時間擴展到歐洲和亞洲的幾個部分......」[9]這正暗示着樹模型。布朗認為,從比希伯來語更大的土著語言簡化的假設出發,可以解釋語言的差異。[10]:225

布朗提到當時學者們主持的構擬活動:[11]:226–228

「博學的Casaubon認為對話可以用撒克遜語組成,只用源自希臘語的詞......Verstegan確信他可以設計出一個英語、荷蘭語和東弗里斯蘭語通用的字母……如果,正如博學的Buxhornius所說,斯基泰語的後代遍及歐洲各國,甚至遠至波斯,那麼許多國家之間許多社群的許多詞,都能有更合理的翻譯,且是來自於他們所有人的共同語言,而不是來自任何特定的國家,後者也借用並持有,但只是二手的。」

巴別塔的混亂就這樣被擱置一旁,作為障礙被消除了。在所有語言中尋找相似之處的嘗試導致逐漸發現一種古老的母語,所有其他語言都源自該母語。毫無疑問,布朗在1684年之前的寫作和思考都做得很好。在英國的同一個革命世紀,James Howell出版了第二卷《書信》,該書是寫給該領域各種重要人物的准虛構信件集,其中包含有效的歷史信息。在第八封信中,語言樹的隱喻似乎被完全提出了,但尚未得到成為專業語言學家的支持:[12]

「我現在要從荷蘭揚帆起航,它的語言與英語同屬一種語言,從一開始就是這樣,因為它們都源自高地荷蘭語[Howell這裏搞錯了]:丹麥語也是同一棵樹的一個分枝……現在,高地荷蘭語或條頓語,是歐洲最主要、分佈最廣的母語之一……它是哥特人汪達爾人的語言,至今仍分佈在波蘭大部分和匈牙利,那裏分佈着的是更口語的方言……她的一些文學家會讓這個世界相信她是天堂里的語言。」

歐洲所有語言學家都在尋找「天堂的語言」,拉丁語寫作lingua prima、lingua primaeva或lingua primigenia,德語中是Ursprache或hebräische Ursprache。有人認為它就是希伯來語,這種神秘的語言有着純潔和不朽的氣息,這些特質正是選拔候選的標準。如此概念的「原語」(Ursprache)早在新語法學派將其應用於各色祖語之前就已經開始使用了。大相逕庭的語系間的鴻溝仍未消除。[來源請求]

印歐模型

1786年2月2日,威廉·瓊斯爵士以亞洲學會主席的身份向亞洲學會發表了他關於印度人的《三周年演講》。其中,他將樹模型的邏輯應用於希臘語、拉丁語和梵語,這是歷史上第一次純粹基於語言學的理由做出的如此分類,並指出它們「在動詞的詞根和語法形式上都很像,很不可能是巧合……」他繼續假設它們來自「某個共同的來源,這來源也許早已消失。」後來他又加上了哥特語、凱爾特語和波斯語。[13]

瓊斯沒有命名他的「共同來源」,也沒有進一步拓展這個想法,但它被當時的語言學家所接受。 在1813-1814年末的《(倫敦)季刊評論》中,托馬斯·楊發表了對約翰·克里斯托弗·阿德隆的《米特里達特,或語言通史》的評論,第一卷於1806年出版,第二、三卷,則在1809-1812年陸續由Johann Severin Vater續寫。阿德隆描述了約500種「語言和方言」,並假設從位於克什米爾中央的「天堂語言」下降到500種語言的總範圍。托馬斯·楊首先指出阿德隆對康拉德·格斯納1555年的《米特里達特:論語言的差異》引用時的虧欠,以及其他後續的語言和文字目錄。Young 1813</ref>:251

克什米爾(紅色),阿德隆認為的伊甸園位置

楊重新解釋了阿德隆的分類:單音節語言是最古老的類型,分佈在亞洲的伊甸園以東部分,也就是亞當出伊甸園的方向。接下來是瓊斯那個仍未命名的分類:「另一類古老而廣泛的語言,其中的相似之處多到不可能是偶然。」他提議將其暫時稱作「印歐語」[14]:255,這也是該詞首次出現在語言學領域中。此前不列顛東印度公司使用「印歐貿易」來表示印度和歐洲之間的商品貿易[15]。楊為存在這樣的祖先群體引用的所有證據都是最相似的詞:母親、父親等。

阿德隆後加的是韃靼人、非洲人和美洲人,這取決於地理位置和假定的伊甸後裔。楊並不贊同阿德隆對天堂語言的如此熱情,並認為這過於投機性。[來源請求]

在英語學界取得勝利的楊的稱呼只是1810-1867年間產生的諸多名稱中堅持到最後的那個,其他候選名稱還有:印度-日耳曼(indo-germanique)(康拉德·馬爾特·布戎 1810)、japetisk(拉斯穆斯·拉斯克 1815)、印度-日耳曼(Indo-Germanisch)(朱利斯·克拉普羅特 1823)、印度-德意志(indisch-teutsch)(F. Schmitthenner, 1826)、梵語系(sanskritisch)(威廉·馮·洪堡 1827)、印度-凱爾特(indokeltisch)(A. F. Pott, 1840)、阿里奧-歐羅巴(arioeuropeo)(Graziadio Isaia Ascoli 1854)、雅利安(Aryan)(馬克斯·繆勒 1861)、雅利安(aryaque)(H. Chavée, 1867)等。他們都是通曉多種語言的天才。克拉普羅特通曉漢語、日語、藏語和好幾種其他文字,批評瓊斯用的方法不嚴謹。《聖經》原語的概念深深吸引了他們的想像力,隨着尋找這種語言的希望逐漸破滅,他們轉而尋找歐亞平原上游牧部落所說的所謂共同印歐語。儘管他們很好地證明了這種語言能用比較語言學的方法來推斷,但在事實上,這不是他們獲得它的方式。[來源請求]

新語法學派模型

這種模型依賴於威廉·瓊斯弗蘭茨·博普奧古斯特·施萊謝爾等人的早期概念,因新語法學派無例外的語音變化規則而著名。

施萊謝爾的樹模型

施萊謝爾在1863年寫給恩斯特·海克爾的公開信中,說正在將自己的Stammbaum(語系樹)與達爾文的進化論相比較,但這信在他身後才公開發表。1869年,海克爾寫信建議他讀一讀《物種起源》。[來源請求]

施萊謝爾讀完後寫了《達爾文理論和語言學》。[16]在一個讓人想起達爾文和華萊士分別獨立發現進化論的情景中,施萊歇爾贊同達爾文的觀點,但批評它沒有引用任何物種就進行了推理。之後他出版了關於語言的Stammbaum,這已不是他第一次出版。[來源請求]

語言的演化並不是達爾文進化論的靈感來源,而是物種的變異,例如在加拉帕戈斯群島觀察到的雀類,似乎都來自某個共同祖先。用本地品種互相雜交以產生新品種也在他的結論中發揮了作用。《物種起源》第一版出版於1859年,也在系屬分類的主題下從頭討論了語言樹的概念。達爾文批評林奈設計的共時方法,建議將其替換為基於進化的「自然安排」。[來源請求] He says:[17]

「通過以語言為例來說明這種分類觀點可能是值得的。如果人類的基因是理想的,那麼種族的譜系排列就可以對現在全世界使用的各種語言進行最好的分類。如果必須包括所有已滅絕的語言,以及所有中間和緩慢變化的方言,我認為這樣的安排將是唯一可能的安排。然而,可能一些非常古老的語言幾乎沒有改變,並且幾乎沒有產生新的語言,而其他語言(由於幾個種族的傳播和隨後的隔離和文明狀態,來自一個共同種族)發生了很大變化,並產生了許多新的語言和方言。來自同一種群的語言的不同程度的差異,必須由從屬於群體的群體來表達。但是適當的、甚至唯一可能的安排仍然是譜系的;這將是非常自然的,因為它將通過最密切的親緣關係將所有已滅絕的和現代的語言聯繫在一起,並給出每種語言的血統和起源。」

在海克爾提醒施萊謝爾之前,施萊謝爾甚至沒聽說過達爾文。他在1853年的一篇文章中發表了自己Stammbaum的想法,這比第一版《物種起源》早了6年。語言起源的概念絕不是新的。托馬斯·傑斐遜本人是位虔誠的語言學家,他提出新詞的持續需要意味着語言必須「進步」並「演化」[18]。這些想法預示着生物或語言的進化,在施萊謝爾與達爾文的思想接觸後,進化論被引入了語言變遷的研究,這種演化思想成為後世語言分類的依據。[來源請求]

系統發生樹

約瑟·哈羅德·格林伯格在1950年左右開始發表的一系列論文中以舊名稱賦予了這個舊隱喻一個全新的含義。查爾斯·達爾文首先系統地提出了進化的概念,並獲生物學普遍接受。由卡爾·林奈發明的生物分類學使用二名法為每個已知的生物體分配種名名,被安排在數個之下依一定次序形成一定的等級,最終分支到各種物種。這種生物分類的基礎是觀察到的物種共有的物理特徵。[來源請求]

而達爾文重新起用了「生命之樹」的古老比喻,假設林奈分類(今日的分類單元)隨時間推移在某種樹結構中從最簡單下降到最複雜。林奈的層次樹是共時的;達爾文設想了一個有共同起源的歷時過程。林奈構想了不同的分類階元,這與理性主義者採用的存在鎖鏈一致,達爾文則構想了演化血統。達爾文之後的幾十年裏,很明顯林奈的層次與血統並不完全對應。發現譜系並改變分類以反映它們成為分類學的主要目標,它在命名法的總體指導下進行,國際組織保存的規則手冊授權和發佈重新分類物種和其他分類群的建議。這種新方法被稱為系統發育,其中蘊含的樹被稱作系統發生樹。樹中一個單元及其所有後代單元形成一個演化支,進化支的發現即是支序分類學[來源請求]

非洲語言系屬分類

格林伯格寫論文時,系統發育學尚缺乏計算機(計算系統學)和DNA測序(分子系統發育學)的輔助,為發現支序關係,研究人員要依靠儘量多的種間形態相似性來定義和制表。從統計上看,相似性越多,物種就越有可能在同一個進化支中。這種方法吸引了對發現語言普遍性感興趣的格林伯格。他試圖改變樹模型以使語系樹成為系統發育樹:[19]

「任何語言都由數千種音義結合形式組成……任何聲音都可能表達任何意義。因此,如果兩種語言在相當多的相似音義組合上達成一致……我們必然得出它們具有共同歷史淵源的結論。這樣的遺傳分類不是任意的......這與生物分類學的類比非常接近......就像在生物學中我們將物種分類為同一屬一樣,相似性足以暗示共同血統的假設,所以我們假設語言中也存在這種遺傳。」

這個類比中,語系自成一演化支,語言就像物種祖語就是某個分類單元的共同祖先,語言樹就像系統發生樹,語言和方言就像種和亞種。格林伯格制定了非洲、美洲、印度尼西亞和歐亞大陸北部迄今被忽視的語言的特徵大表,並據它們的相似性對它們進行了分類。他將這種方法稱為「語言類型學分類」,由描寫語言學派方法而非比較語言學方法得出。[20]

日期與語言年代學

歷史語言學家已經使用比較法來拼湊離散詞彙、詞法和音係數據的樹模型。甚至可以在沒有文獻支持的情況下建立年表,但沒有絕對的日期估計。

語言年代學使得人們可以估計語言使用的絕對日期,同源詞數量與比例是計算分歧時間的重要標準。然而,後來發現該方法很可能因數據不可靠而作廢,因此歷史語言學家難以確定印歐語系的準確年齡。[21][22]

這一困難可能得到計算系統發育學的解決。進化模型等技術提高了樹枝長度和拓撲的準確性,使用計算系統發育方法使研究人員能夠用進化生物學方法分析語言數據。這進一步有助於理論的相互檢驗,例如墳塚假說安納托利亞假說,兩者都是印歐語系起源的理論。[22]

計算系統發生學於歷史語言學的功用

比較法是通過比較各種語言的特徵,以評估一種語言與另一種語言的相似度。這種評估的結果是面向數據的;也就是說,結果取決於特徵的數量和比較的語言數量。在計算機降落在歷史語言學領域之前,兩種方法的數字都必然很小,效果像是用少量像素來描繪照片。[來源請求]

20世紀晚期,語言學家開始使用本為生物分類開發的軟件對語言進行分類,程序和方法變得越來越複雜。到21世紀初,歷史語言學計算系統發育(CPHL)項目獲得了美國國家科學基金會的資助[23]。印歐語系是主要的研究課題。至2012年1月,他們已經收集並編碼了一個「已篩選」的「22個語音特徵、13個形態特徵和259個詞彙特徵」的數據庫,還包括24種印歐語的詞彙表,以及含更多特徵的未篩選數據庫。更大的特徵和語言數量能提高精度,前提是它們滿足某些標準。+他們用專門的計算機軟件測試了各種系統發育假設,以了解它們通過遺傳血統來解釋特徵的能力。[來源請求]

樹模型的局限性

樹模型的一個特有限制是它所基於的非常基本的假設:它需要基於語言的分類,或者更一般地說,基於語言變體。由於變體是從全部語言特徵中抽象出來的,因此在將數據(從同言線地圖)轉換為樹的過程中可能會丟失信息,例如方言連續體的問題。它們提供的變體不是明確的一種語言,而是包含不止一種語言的特徵。它們如何分類的問題類似於環狀物種在物種分類中的問題一樣。[來源請求]

樹模型的局限性,特別是其無法處理方言連續體中共同創新的非離散分佈,已通過非分支(不基於樹模型)方法的開發得到解決,如波浪模型語聯等。[3]

樹模型的另一個限制涉及混合語言,以及一般的語言混合,因為樹模型只允許分化。例如,據Zuckermann (2009:63)[24],現代希伯來語就是一種半歐洲語言混合體,「表明現實的語言起源遠比簡單的系統發生樹複雜。『復活』的語言不太可能有單親。」

理想的系統發育

系統發育軟件的目的是生成分支圖,這種樹中的連結只分叉,也就是說,在同一方向的任何節點處,僅能有兩個分支。輸入數據是一組特徵,可以匹配不同語言的狀態,例如存在 (1) 或不存在 (0)。這樣,一種語言可以由一個唯一的由所有特徵的狀態值組成的坐標集來描述,共享最多狀態的語言彼此最相似。[來源請求]

該軟件通過幾種數學方法之一對所有語言所有特徵的所有狀態進行分析,以完成每種語言與所有其他語言的成對比較。接着,它根據相似度構造一個分支圖;例如,假設語言a和b僅彼此最接近,那麼就假定它們有共同祖先a-b。假設下一個最接近的語言c與a-b有共同祖先,就依此類推。結果是從整體的共同祖先(根)到語言(葉子)的一系列歷史路徑的預測,每條路徑都是獨一無二的,且路徑之間沒有連結。每個葉子和節點都有且僅有一個祖先。所有的狀態都是由其他狀態來計算的。符合這些要求的分支圖就是理想的系統發育樹。[25]:383

起初,在改變假定相關因素的試驗中,結果似乎幾乎沒有一致性,任何變化都會產生一個新的分支圖,這表明該方法沒有捕捉到語言的潛在演變,而只是反映了研究人員的臨時判斷。為了找到影響系統發育的因素,研究人員需要對其結果的準確性進行一些衡量;即需要根據已知的系統發育校準結果。他們使用不同的假設進行實驗,以尋找與最安全的印歐系統發育最接近的假設。這些假設可以更有把握地用於印歐系統發育的存疑領域。[來源請求]

為了獲得合理有效的系統發育,研究人員發現他們需要輸入語音、詞彙和形態三種特徵,才能用計算系統發育得到足夠詳細的圖景。這其中,又只有定性特徵才能產生有意義的結果。[25]:384–385

理想系統發生網

系統發育網絡,CPHL提出的眾多網絡之一。系統發育樹以黑線顯示,接觸邊緣為紅線。這裏有三條,是為印歐語生成可行網絡所需的最小數字。

儘管他們小心翼翼地編碼足夠數量的最佳定性特徵,研究人員還是無法獲得某些群體的完美系統發育,如印歐語系中的日耳曼語族和阿爾巴尼亞語族。他們推斷有大量特徵被借用了,這些特徵無法用該組計算出的共祖特徵來解釋。如果解釋借用的波浪模型能完整解釋該群體的特徵,那麼根本就不會存在它的系統發育樹。如果這兩種模型都部分有效,那就會存在一棵需要通過非遺傳解釋來補充的樹。 因此,研究人員修改了軟件和方法,以囊括借用的可能性。[26]

研究人員在實驗中引入了界面(interface)的概念,也即允許特徵流動的邊界。直系演化的稱為單向界面,或稱邊緣。如果只用單向界面就足以解釋一種語言中所有狀態的存在,那就沒必要應用理想系統發育以外的模型。如果不是,則可以在系統發育中添加一個或多個接觸邊緣或雙向界面。這樣,一種語言可能有不止一個狀態的來源。[來源請求]

一棵經過如此修改的樹不再是一棵樹:從根到葉的路徑不止一條,而形成一張網。特徵的狀態仍沿着從根到葉的獨特路徑演變,但它的起源可能是所考慮的根或有接觸的語言。如果網可以解釋所有狀態,則稱為理想系統發育網。[25]:388–391

相容性與可行性

理想系統發育網的產生有兩個階段。第一階段,研究人員設計了許多用於測試兼容性的系統發育樹,稱為候選樹。首先,使用印歐語數據集(特徵狀態的字符串)輸入系統發育生成軟件,然後將生成的樹修改為要測試的其他假設,來獲得候選樹。當一個特徵的起源能用生成的系統發育樹解釋時,則稱它是相容的[25]:387。在理想系統發育中,所有特徵都是相容的,即樹的相容性是100%。根據簡約性原則或奧卡姆剃刀,沒有網絡是必須的。[來源請求]

最初的候選樹都不是完美的系統發育,不過其中一些子樹是完美的。下一階段是選用相容性最高的樹,一次添加一個界面,從中生成網絡,選擇相容性最高的界面,直到整張網的相容性最高,即獲得充分性。事實證明,生成的兼容網數量可能從沒有到十幾個不等。然而,並非所有可能的界面在歷史上都是可行的,一些語言間的界面在時空上不太可能。研究人員檢查結果,排除那些不可行的接口,直到只剩下可行網絡的列表,再按相容性得分的順序排列。[來源請求]

最可行的印歐語網絡

研究人員從印歐語系五棵用字母A-E表示的候選樹開始。一棵由系統發育軟件生成,接着進行了兩次修改;兩棵由歷史語言學家和印歐語學家Craig Melchert提出。這些樹的主要區別在於最模稜兩可的組:日耳曼語和阿爾巴尼亞語的位置,後者沒有足夠的特徵。A樹有14個互相無關的特徵;B,19;C,17;D,21;E,18。A、C樹的相容性得分最高,不兼容都是詞彙上的,A是C的子樹。[25]:396

後來生成的網絡發現,除E樹外,所有不相容都可通過至少三個接觸來解決。E樹因其相容性不高,被排除在外。A樹有16個可能的網,經過可行性檢查減少到3個。C樹有一個網絡,但由於它需要波羅的海而不是斯拉夫界面,因此不可行。[25]:400 A樹是最相容、最可行的樹,假設4000-2250 BC間從原始印歐語分裂出7個支:[25]:398

  • 第一個分離的是安納托利亞語族,分離於約4000 BC。
  • 隨後約3500 BC吐火羅語族分離出去。
  • 此後不久,約3250 BC,原始意大利-凱爾特(西印歐)分離,約2500 BC再分裂為原始意大利語和原始凱爾特語。
  • 約3000 BC,原始阿爾巴尼亞-日耳曼語分離,約2000 BC進一步分裂為原始阿爾巴尼亞語和原始日耳曼語。
  • 與此同時,原始希臘-亞美尼亞(南印歐)也分離,約1800 BC進一步分裂為原始希臘語和原始亞美尼亞語。
  • 約2500 BC波羅的-斯拉夫語分離,約1000 BC進一步分裂為原始波羅的語和原始斯拉夫語。
  • 最後,約2250 BC原始印歐語變為原始印度-伊朗語(東印歐)。

B、E樹則給出原始日耳曼-波羅的-斯拉夫語(北印歐),使阿爾巴尼亞語成為一個獨立的分支。只有最後一次演化的時間是可以確證比較準確的,這基於顏那亞文化安德羅諾沃文化和已知的印度-雅利安語文化的連續性。[27]:401

A樹還需要3次接觸事件才能滿足相容性要求,這也是要求接觸事件最少的組:[27]

  • 2000 BC後原始意大利語和原始日耳曼語間的接觸;
  • 2500 BC後原始意大利語和原始希臘-亞美尼亞語間的接觸;
  • 1000 BC後原始日耳曼語和原始波羅的語間的接觸。

學者們稱,具有上述接觸的A樹是「最好的PPN」[25]:407。在所有PPN中,很明顯,儘管最初的子語言在相對孤立的情況下變得不同,但只有與其他語言相互影響的波模型可以解釋演化組的後期演變。

另見

註釋

  1. ^ 1.0 1.1 List, Johann-Mattis; Nelson-Sathi, Shijulal; Geisler, Hans; Martin, William. Networks of lexical borrowing and lateral gene transfer in language and genome evolution. BioEssays. 2014, 36 (2): 141–150. ISSN 0265-9247. PMC 3910147可免費查閱. PMID 24375688. doi:10.1002/bies.201300096. 
  2. ^ 2.0 2.1 François (2014).
  3. ^ 3.0 3.1 See Bloomfield 1933,第311頁; Heggarty et al. (2010); François (2014).
  4. ^ Saint Augustine. XVI: 9-11. City of God. 
  5. ^ Genesis 10:25
  6. ^ 1 Chronicles 1:19.
  7. ^ Saint Augustine (Bishop of Hippo.). The Works of Aurelius Augustine: A New Translation. T. & T. Clark. 1871 [2022-01-29]. (原始內容存檔於2022-04-19). 
  8. ^ Browne 1684,第223–241頁
  9. ^ Browne 1684:224
  10. ^ Browne 1684
  11. ^ Browne 1684
  12. ^ Howell, James. Letter LVIII To the Right Honourable the Earl R.. Epistolae Ho-Elianae, Familiar Letters, Domestic and Forren, Divided into Four Books, Partly Historical, Political, Philosophical, Upon Emergent Occasions II 6th. London: Thomas Guy. 1688: 356 [1645]. 
  13. ^ Jones, William, Third Anniversary Discourse, on the Hindus, Lord Teignmouth (編), The Works of Sir William Jones with the life of the Author, in Thirteen Volumes III, London: John Stockdale and John Walker: 34, 1807 [1786] 
  14. ^ Young 1813
  15. ^ Grant, Robert. A sketch of the history of the East-India company, from its first formation to the passing of the Regulating act of 1773; with a summary view of the changes that have taken place since that period in the internal administration of British India. London: Black, Parry, and Co. [etc.] 1813: xxxiv–xxxv. 
  16. ^ D M Williams, D.M.; Malte C Ebach; Gareth J Nelson. Foundations of systematics and biogeography有限度免費查閱,超限則需付費訂閱. New York, NY: Springer. 2008: 45. 
  17. ^ Darwin, Charles. On the origin of species by means of natural selection, or, The preservation of favoured races in the struggle for life. London: J. Murray. 1860: 422. 以語言為例來說明這種達爾文式分類觀點可能是值得的 
  18. ^ Post, David G. In search of Jefferson's moose: notes on the state of cyberspace有限度免費查閱,超限則需付費訂閱. Oxford; New York: Oxford University Press. 2009: 125. 
  19. ^ Greenberg, Joseph H., A Quantitative Approach to the Typological Morphology of Language, Denning, Keith M.; Kemmer, Suzanne (編), On language: selected writings of Joseph H. Greenberg, Stanford: Stanford University Press: 3–4, 1990 [1954] 
  20. ^ Greenberg, Joseph Harold. Language, culture, and communication需要免費註冊. Stanford: Stanford University Press. 1971: 113. 
  21. ^ Dixon, R. M. W. The Rise and Fall of Languages by R. M. W. Dixon. Cambridge Core. 1997 [2017-09-26]. ISBN 9780511612060. doi:10.1017/CBO9780511612060. (原始內容存檔於2017-09-27) (英語). 
  22. ^ 22.0 22.1 D, Gray, Russell; D, Atkinson, Quentin. Language-tree Divergence Times Support the Anatolian Theory of Indo-European Origin. Nature (Nature Publishing Group). 2003-11-27, 426 (6965): 435–9 [2022-01-29]. PMID 14647380. S2CID 42340. doi:10.1038/nature02029. (原始內容存檔於2022-04-14) (英語). 
  23. ^ CPHL: Computational Phylogenetics in Historical Linguistics. 2004–2012 [2022-01-29]. (原始內容存檔於2022-04-02). 
  24. ^ Zuckermann, Ghil'ad. 2009. "Hybridity versus Revivability: Multiple Causation, Forms and Patterns."頁面存檔備份,存於互聯網檔案館Journal of Language Contact, Varia 2:40-67.
  25. ^ 25.0 25.1 25.2 25.3 25.4 25.5 25.6 25.7 Nakhleh 2005
  26. ^ The technical details of the algorithms used are stated in Nakhleh 2005,Appendix A. The details of the dataset are stated in Appendix B.
  27. ^ 27.0 27.1 Nakhleh 2005

書目

外部連結