维基百科:地区词处理
![]() |
| ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
|
地区词处理和繁简处理是中文维基百科字词转换系统的两大部分,地区词转换旨在为中国大陆、香港、澳门、台湾、新加坡、马来西亚的中文用户提供贴近其语言习惯的转换模式。中国大陆(zh-cn)、新加坡(zh-sg)及马来西亚(zh-my)的地区词为简体中文;台湾(zh-tw)、香港(zh-hk)及澳门(zh-mo)的地区词为繁体/繁体中文。
修改历程
- 港澳繁体:原以zh-hk参数涵盖zh-mo,社群于2013年讨论后,正式激活zh-mo参数,拆分“香港繁体”和“澳门繁体”。
- 马新简体:原以zh-sg参数涵盖zh-my,而在2018年经过社群讨论后,正式激活zh-my参数,拆分“新加坡简体”和“大马简体”。
转换涵盖顺序
- 中文:zh兼容zh-hans、zh-hant
- 简体:zh-hans ⊃ zh-cn ⊃ zh-sg ⊃ zh-my
- 繁体:zh-hant ⊃ zh-tw ⊃ zh-hk ⊃ zh-mo
因此若顺位较低的地区词与上一顺位者相同,择该上位者涵盖即可。zh虽兼容zh-hans、zh-hant直接取代,但下位区域转换不影响。
全局转换
地区词的全局转换总共通过五张转换表来实现:分别是MediaWiki内置转换表、大陆简体转换表、台湾正体转换表、港澳繁体转换表和新马简体转换表。
全局转换是最方便快速的转换处理方式,但也较易过度转换。为了避免过度转换造成的错误,除了稳定和使用广泛的地区对应词汇(判定依据见下方的先决条件),维基百科一般不接受其他情况的全局地区转换。
对于地区词的全局转换,维基百科特别设立了字词转换/地区词候选页,用户可根据需求在该页面并在符合后文列出的先决条件之情况下提交希望加入全局转换的地区词,并以社群投票产生共识,再由管理员加到相应转换页面。
判断投票通过的一般依据是:7天内共获得6名有投票资格的维基人支持,且反对票数不超过总票数的三分之一。
以下为提请加入全局地区词转换的先决条件(申请删除全局地区词转换没有这限制,提报位置见下):
- 单字转换绝不能出现在全局转换,如“宏→巨集”;
- 申请全局转换的词必须至少在100篇条目中出现(可用搜索引擎判断);
此外,如欲转换字数较少(不多于三字)的词,社群在投票过程中还应考虑其中汉字的字频,以及可能导致过度转换的可能性。
关于汉字字频方面的研究,可参考汉字单字字频总表、现代汉语常用字表与其他相关统计。
如果您发现地区词过度转换错误,请在Wikipedia:字词全局转换修复请求提报。
全文转换
全文转换适用于特定的单篇条目,针对性极强。
“-{A|转换内容}-”是全文转换的源代码实现,但这一方式实现的全文转换往往会导致转换代码与条目正文的代码混淆不清,不利维护。因此,维基百科推荐内嵌全文转换的{{NoteTA}}模版来作为实现全文转换的方式。要使用这一模版实现该功能,只需在特定条目源代码的顶端插入“{{NoteTA}}
”的模版,并依照该模版页面的说明输入转换内容即可。
由于全文转换的针对性极强,所以较难出现过度转换。但有些情况也需要利用单独转换来实现。
公共组转换
对于一些主题、领域相同和相似的条目,其中要转换的内容大同小异,可以把这些多个条目中要用到的共同转换字词单独创建一个公共转换组。公共转换组的方便程度处于全局转换与全文转换之间,而过度转换程度也处于这两者之间。
创建一组公共转换组时,要依据这一组大多数词汇在多篇条目中转换的可能性,而不应依据转换词的类别。比如,各国现任领导人的姓名转换,存在复用的可能性非常低,就不应当创建这类别的公共组。创建公共转换组的方法可参见Wikipedia:字词转换处理/公共转换组。
公共组转换中的转换内容可由普通用户控制,而它所影响到的范围也没有全局转换这么大。公共组转换甚至可以用来填补在全局转换中受限制的二字转换,典型的例子是“數位→数码”的转换:对于全局转换来说,与电脑和信息技术无关的条目中,“數位”后面可能会搭配“人士”组成“數位人士”一词,这样就会过度转换成“数码人士”。然而,在电脑和信息技术的公共组转换中,所涉及到的条目大多是技术类条目,其中有许多本来就应该转换的“數位”词语,同时,技术性的内容也导致“數位人士”的用法几乎不会出现。
然而,也正如上述所说,假如真的碰巧出现了“數位人士”,公共组转换也有其局限。过度的地区转换可以通过繁简处理的全局转换来修复(详见该页面),也可以通过后文中提供的其他方式实现。
单独转换
“-{转换内容}-”或“避免过度-{}-转换内容”是单独转换的源代码实现。单独转换可以用于避免特定的过度转换,或者实现其他的一些特殊功能。
举例而言,条目艾奥瓦州单独转换“又譯作'''-{zh-hans:爱荷华州;zh-hant:愛荷華州;zh-tw:愛阿華州;zh-hk:愛荷華州;zh-mo:愛荷華州;}-'''、'''爱我华州'''或'''衣阿華州'''
”可以用于别名的展示。其展示的结果便是“又译作爱荷华州、爱我华州或衣阿华州”。或者用“{{各地中文名}}”等模板,说明之间差异。
又举例说明避免特定的过度转换:上文所述的“數位人士”,在存在“數位→数码”转换的同时可通过“數-{}-位人士”来避免过度转换。
注意事项
手动转换书写格式
- 概括而言:您可以只使用zh-hans与zh-hant便达到目的,也欢迎您按照推荐的格式来书写
虽然,地区词处理只涉及zh-cn、zh-tw、zh-hk、zh-mo、zh-sg、zh-my六种模式,但出于方便实际操作的原因,并不强制要求按照何种方式填写,只要填写的转换能够满足预期的要求,并在各种模式下都不出现错误即可。
然而,上述的操作实际上并不完全符合于繁简转换与地区词转换分立的思想。因此,这里还推荐另一种做法,即让zh-hans、zh-hant的名称保持一致,只填写繁简体对应词,不要填写对应地区词。对A转换采用哪一地区词先到先得(即先编辑转换的),对于T转换,要求除繁简之别外与标题一致。这一做法并不要求所有的编者都要掌握,因此不会对第一种简便做法填写造成任何妨碍,了解第二种做法的编者会逐渐地将第一种做法修正。
参考文献应避免情况
此外,参考文献的文字不应转换繁简(非中文的标题、姓名、引文等内容的中译除外),因此,如果不在参考文献停用繁简转换,则无论是在全局转换、主题转换还是全文转换中,都有可能会影响当中文字。为避免此类现象发生,请在引用参考文献时使用可停用繁简转换的{{cite}}系列模板。
官方中文名称处理
当一个机构或人物已有官方的汉字或中文名时,社群对应否转换地区词出现分歧。根据讨论结果,临时解决方案为:条目名遵从“名从主人”原则,使用条目描述事物(人、物、事件等)所在地的最常用用法(如新马简体版本马哈迪);但其他地区语言版本依然显示该地区的最常用用法(如大陆简体版本马哈蒂尔),在内文以“地区词转换”方式显示名称(注:此方案不反对在文中个别地方标明条目描述事物在其他地区的名称)。
|