跳转到内容

词 (语言)

维基百科,自由的百科全书

语言学中,(英语:word),在台湾又称为单字,在中国大陆外语教学中又称为单词,是能独立运用并含有“语义内容”或“语用内容”(即具有表面含义或实际含义)的最小单位。词的集合称为“词汇”,例如:所有中文词统称为“中文词汇”等。词典是为词语提供音韵(phonology)、词义解释、例句、用法等等的工具书,有的词典只修录特殊领域的词汇。

从语法单位来说,词比语素(morpheme )大(语素含有语意,但不一定能独立运用),而又比词组小(又称短语,由词构成)。一个词可能只会有一个语素,(例如英语的 oh!、rock、red、quick、run、expect 等),但也有可能有很多个(例如 rocks、redness、quickly、running、unexpected)。而语素可能不能独立存在(例如 -s,-ness,-ly,-ing,un-,-ed)。一个复杂的词通常会包括一个词根和一或多个词缀(rock-s,red-ness,quick-ly,run-ning,un-expect-ed),但合成词可能会有多于一个词根(black-board(黑板),rat-race(激烈的竞争))。构词学是研究词的内部结构和形成方式等的语言学分支。

词可以拼凑起来组成更大的语言单位,例如:词组(a red rock),子句(I threw a rock)和句子(He threw a red rock too but he missed.)。

“词”这个术语可以指口语的词或书面语的词。口语的词是由音位(音素/phoneme)所组成的,是语言中能够区别意义的最小声音单位。书面语的词则是由字位(形素/grapheme)所组成的,拉丁文字里的每个字母中文的每个汉字都是一个字位。

定义

帮一个词取定义的难易度取自于语言。部分字典将它的词汇分类成词元英语Lemma (morphology)(若词库里有ran和run,因ran是run的过去式,所以run是词元),代表一个词怎么构成取自于作者在该语言的想法。

语意的定义

在1926年,伦纳德·布龙菲尔德提出了“最小自由形式”的概念。词常常被认为是人类言语中,能自行独立存在的最小单位。[1]而这跟音位和词素有关。但有些书面文字不是最小自由形式,因为当他们被单独念出来时,没有任何意义[2]

很多语义学家提出了“语义元”的理论,指的是不可定义的词代表著在直觉上有意义的基本概念(像 the 或 of)。根据这项理论,语义元是描述一个词的含义的基础,且没有与任何一个词或与它们相关的概念上的意义产生循环。[3] [4]

特性

句法学中最简方案(Minimalist Program)的学派中,词(在文献中称为“词项”)在被诠释为一束一束的“语言特性”,并合并成一个有形式和含义的结构。[5]举例来说,英文词“bears”有语义(以表示“熊”),词性(为名词),(为复数,须与其域内(如所在的子句或词组)的其他成分(如动词、指示词等)达成一致)和音韵(能被念出来,国际音标:[bairz]),等等特性。

词的分界

在不同的语言中,词分界会呈现出不同的面貌。例如以拉丁字母并写的语言,词呈现为以空格来区分的一串字母;在书写中文时,词由一个或多个汉字构成,但词和词之间没有用空格区分;在口语中,词有固定的语音形式,词的语音变化通常只出现在其开端和结尾,而词之间可以停顿。

要界定什么构成词,将牵涉到词在哪里开始和结尾—换句话说,即是定义“词的分界”。有多种方式可以指出词的分界在哪:

句子中潜在的停顿
说话者被要求念同一个句子两遍,中间必有停顿。说话者会在词的分界中加上停顿。但这个方法并非是万无一失的:说话者可能故意将多音节的词拆开,或将两或多个有关连的词从中分开。
词的不可分割性
说话者被要求念一个句子,并再被要求念同一个句子一次,但在第二次时加上其他在第一句未曾出现过的词。例如:I have lived in this village for ten years“我已在这个村子里生活了十年”变为 My family and I have lived in this little village for about ten or so years“我和我的家人已在这个小村庄再了十几年。)这些词会被说话者加到原句中词的分界里。但是在一些语言里,有被放进词的中缀的存在。类似地,有些语言里,有被分开的词缀的存在;例如在德文中:“ "Ich komme gut zu Hause an."(我在家里很好)”,动词ankommen(到达)是分离的。
用声音来定义词的分界
在一些语言里,有特定的读音规则,利于发现词的分界在哪里。例如一个语言在最后一个音节重音,它的词分界较可能在于发重音的音节后。另一个例子是有元音和谐律的语言(例如土耳其语,或大部分阿尔泰语系的语言);[5]在任何一个词中的母音基本上都同调,因此只要找出母音换调的地方,就能大约知道词分界在哪。虽说这样,但没有一个语言有这么方便的读音规则,就算是有上面那些规则的也不例外。
用拼字来定义词的分界

正写法

在能被书写的语言里,一个词与它的正写法有相互关系。使用字母来拼写的语言中,词之间常出现分隔符号(尤其是空格)在有用字母系统现代语言里很常见,但分隔符号与字母系统相比,算是较创新的做法。

不过,书写上的分隔不一定等于词的分界。例如在英文正写法里,有些合成词里可能会含有空格。例如ice cream(冰淇淋),air raid shelter(),get up(起床)等由于以空格分开,故被视为多个词。(ice、cream、air 等字无疑是以自由形式,但 get 较不明确。)相反地,brownstone(上流社会)拼成一个词也被视为一个词,虽然 brown 和 stone 都是以自由形式存在的。

此外,书写上的分隔有时只反映语音上的分界而非词的分界。例如在越南语正写法里,虽以拉丁字母拼写,但却以“单音节语素”而非词来划定书写的分隔。在东亚语言里(用CJKV的语言),也用音节中文汉字)和音拍日文假名)而非完整的词来划定书写的界线。在韩文里的谚文里,音节和词两者有书写上的分界:由音节来组成方块字,但也在词之间加上空格)。

相反地,部分综合语用语素组成词,与分析语相比,更难让人难以归结词。尤其在多式综合语里(如因纽特语尤比克语),特别难划定词间的界线,因为一个句子可能只有一个词。

词与汉字的关系

在中文里,词(word)有时会和字(character)混淆。词是一个语法单位,而字是一个书写单位。 汉字是中文的书写单位,通常一个汉字表示一个音节(普通话中的儿化是例外,一个音节由两个汉字表示)。所以汉字与词没有直接的对应关系,一个词可以只占一音节并由一个汉字写成(例如“我”、“死”、“很”),也可占多个音节并以多个汉字写成(例如“维他命”、“个性”、“独特”)。

词由语素(不可分割的音义结合体)构成。由一个语素组成的词称为单纯词,而由多于一个语素构成的词称为合成词

以中文为例,单纯词多数是单音节的,例如“地”、“东”、“五”、“看”等;除单音节词外,也有多音节的单纯词,例如“玲珑”、“参差”、“徘徊”、“叮咛”、“鹦鹉”、“马虎”、“葡萄”、“卡通”、“巧克力”、“葡萄牙”、“马达加斯加”等,它们不论音节数目多少,都不能分拆为词义相关的较小部分。另一方面,现代中文有许多合成词,例如“政府”、“学者”、“石头”、“民主”、“问责制”等,这些词都可以分为更小的单位,并且这些小单位是构成词义的元素。

英语为例,词 lady 可分割为两个音节(可以用 la 和 dy 表示),但它们却不带任何意义与 lady 的词义相关,所以 lady 是单纯词。blackboard 也是一个词,它可以分为 black 和 board 两个部分,而且它们所带的意义与 blackboard 的词义相关,所以 blackboard 是合成词。

在语言类型学中,词和语素的关系是语言分类的一种方法——语言的型态分类综合语是指该语言有着高的语素词比(morpheme-per-word ratio),即每个词平均包含语素数目较多,例如拉丁语;相对地,分析语的语素词比较低,例如汉语。

综合语里,一个语干(例如:love“爱”)可能会有多个词形(例:loves,loving,loved)。但在某些情况下,他们不会被视为不同的词,而是有不同词形的同一个词。在这些语言里,词可能是由多个语素所组成的。尤其是在印欧语系里的语言里,不同的语素可能是:

例如,原印欧语系词*wŗdhom可以被分析成四个部分:

  1. *wŗ-,词根*wer-的元音变换
  2. 词根延伸*-dh-,使词根更复杂*wŗdh
  3. 元音词干,-o-
  4. 中性主格受格单数词尾,*-m

分类

词有许多的分类准则和方式,下举数例:

  • 音节的数目分类:即单音词、双音词、多音词等。某些文学作品如诗词、对联等,这种分类有其特殊的重要性。
  • 语素的数目:单纯词只有一个语素,合成词有多于一个语素。
  • 合成词可以依构词形式进行分类:例如中文的合成词有联合式、偏正式、主谓式、动宾式、补充式、重叠式、附加式,其中首五类合成词又叫做复合词。英语的合成词有复合词和派生词两大类。
  • 依词的语法性质(即“词性”、“词类”):例如名词、动词、副词、连词等。日语的词可分为用言和体言两大类。传统的中文语法研究把中文词汇分为实词和虚词。
  • 依词的来源:例如词可以分为固有词和外来词。

事实上,词的分类不限于此。此外,从上例中也可以看出,不同的语言对词可以有不同的分类准则,或即使分类准则相同但具体的分类方式也因语言而别。

词类

词类”一词不是以上各种词的分类准则和分式的统称,而是专指词的语法性质分类,与上述的“词性”相通。依据语法性质,一个语法将一个语言的词汇分成好几个组。其中,最基本的二分法(几乎适用于所有语言)是名词动词

希腊文字学狄俄尼索斯·特拉克斯是首先将文字分成许多个组的人。他把希腊文的词汇分成:名词动词形容词代名词介词副词连接词感叹词

印度文字学家波你尼提倡了一个类似的分类法。它将梵语词汇分成名词性词和口头词,依照词的词尾来分类。

名词

名词是指待人、物、事、时、地、情感、概念等实体或抽象事物的词。名词可以独立成句。在短语或句子中通常可以用代词来替代。

例子有:苹果太阳空气婚礼社会等等

动词

动词是用来形容或表示各类动作的词汇

例子有:等等

基本上每个完整的子句都有一个动词。例如:

  1. “他正在读书。”(在这句“读”字是动词)
  2. “小鸟在天空飞。”(在这句“飞”字是动词)

但在中文句子中,动词的原形“是”字可以被隐去。例句:

  1. “生命是美好的!”(在这句“是”是动词,可写作“生命美好!”)
  2. “你真是聪明。”(在这句“真是”是动词,可写作“你好叻。”)

英语等语言,动词会有过去式现在式将来式等等的语法时态。

形容词

形容词词类中的一类。其根本特点是自由的作定语、修饰名词或名词性短语。在语义上,形容词多表示性质、状态、属性、描述等含义。

例子有:漂亮、高兴等。

代名词

代名词是指代替名词或名词短语的形式词(是否附加限定词各个语言不同),如中文的“你”、“我”、“他”,法语的“nous”、“elle”,英语的“he”、“she”、“ it”等。问句中代替被询问物体的代词叫做疑问代词,比如“谁”等。

哲学

至少从公元前5世纪开始,哲学家们就对词的意义开始着迷,形成了语言哲学的基础。柏拉图根据词的来源和构成它们的声音来分析词。他认为,尽管词随时间演变了很多,但在声音和意义之间仍旧有一些联系。约翰·洛克说过,“字眼底功用就在于能明显的标记出各种观念”,人们选择字眼“并非因为特殊的音节分明的声音和一些观念之间有一种自然的联络,因为若是如此,则一切人底语言应该只有一种。语言所以有表示作用,乃是由于人们随意赋予它们一种意义,乃是由于人们随便来把一个字当做一个观念底标记”。 [6]维特根斯坦对词的看法由一个词是一个意思的代表演变到“一个词的意义就是它在我们语言中的用法(Meaning is using)”。[7]

参考文献

  1. ^ Katamba, Francis. English Words: Structure, History, Usage. Routledge. 2005. ISBN 0-415-29893-8. :11
  2. ^ Fleming, Michael; et al. Meeting the Standards in Secondary English: A Guide to the ITT NC. Routledge. 2001: 77. ISBN 0-415-23377-1. 
  3. ^ Goddard, Cliff. The search for the shared semantic core of all languages. Cliff Goddard and Anna Wierzbicka (编). Meaning and Universal Grammar: Theory and Empirical Findings (PDF). Volume I. Amsterdam: John Benjamins. 2002: 5–40 [2012-07-31]. (原始内容 (PDF)存档于2010-01-07). 
  4. ^ Wierzbicka, Anna. Semantics: Primes and Universals. Oxford University Press. 1996. ISBN 0-19-870002-4. 
  5. ^ 5.0 5.1 Adger, David. Core Syntax: A Minimalist Approach. Oxford: Oxford University Press. 2003: pp36–7. ISBN 0-19-924370-0. 
  6. ^ 约翰·洛克. 《人类理解论》第三卷 第二章 字眼底意义. 中南财经政法大学法学图书馆. [2013-11-24]. (原始内容存档于2013-12-02). 
  7. ^ Biletzki, Anat and Matar, Anat. Ludwig Wittgenstein. Edward N. Zalta (编). The Stanford Encyclopedia of Philosophy. Stanford: The Metaphysics Research Lab, Center for the Study of Language and Information, Stanford University. 2011 [2013-11-24]. (原始内容存档于2020-05-19). 

书籍

外部链接