本页使用了标题或全文手工转换
Semi-protection-shackle.svg

维基百科:地区词处理

维基百科,自由的百科全书
跳到导航 跳到搜索
Chinese conversion.svg 字词转换
主页 讨论
转换请求
错误修复请求
地区词候选
转换介绍
字词转换处理 讨论
  繁简处理 讨论
  地区词处理 讨论
  公共转换组 讨论
帮助文档
繁简与地区词处理 讨论
  转换原理 讨论
  手工转换 讨论
  高级语法 讨论
  显示模式选择说明
相关模板
NoteTA 全文字词转换
CGroup 公共转换组列表
地区用词 地区词模板
地区用词2 高级地区词模板
各地中文名 地区用词信息框
查看 - 讨论 - 编辑 - 变动

中文维基百科里,地区词处理繁简处理字词转换系统的两大组成部分。地区词转换旨在为中国大陆、香港、澳门、新加坡、马来西亚、台湾的中文用户提供贴近其语言习惯的转换模式。其中,中国大陆(zh-cn)、新加坡(zh-sg)及马来西亚(zh-my)的地区词为简体中文;台湾(zh-tw)、香港(zh-hk)与澳门(zh-mo)的地区词为繁体(繁体)中文。

修改历程

  • 港澳繁体:原以zh-hk参数涵盖zh-mo,社群于2013年讨论后,正式激活zh-mo参数,拆分“香港繁体”和“澳门繁体”。
  • 马新简体:原以zh-sg参数涵盖zh-my,而在2018年经过社群讨论后,正式激活zh-my参数,拆分“新加坡简体”和“大马简体”。

转换涵盖顺序

  • 中文:zh兼容zh-hans、zh-hant
  • 简体:zh-hans zh-cn ⊃ zh-sg ⊃ zh-my
  • 繁体:zh-hant ⊃ zh-tw ⊃ zh-hk ⊃ zh-mo

因此若顺位较低的地区词与上一顺位者相同,择该上位者涵盖即可。zh虽兼容zh-hans、zh-hant直接取代,但下位区域转换不影响。

全局转换

地区词的全局转换总共通过五个转换表来实现:分别是MediaWiki内置的转换表大陆简体转换表台湾正体转换表港澳繁体转换表新马简体转换表

全局转换是最为方便快速的转换处理方式,但也较容易出现过度转换的问题。为了避免过度转换造成的错误,除了稳定和使用广泛的地区对应词汇(判定依据见下方的先决条件),维基百科一般不接受其他情况的全局地区转换。

对于地区词的全局转换,维基百科特别设立了一个字词转换/地区词候选的页面,在该页面中,用户可根据需求,并在符合后文中列出的先决条件的情况下,提交其希望加入全局转换的地区词。并通过社群投票产生共识,再由管理员加入相应的转换页面中。

判断投票通过的一般依据是:在7天时间里,总共获得6名具备投票资格的维基人的支持,且反对票数不超过总票数的三分之一。

以下为提请加入全局地区词转换的先决条件(申请删除全局地区词转换没有这样的限制,提报位置见下):

  1. 被转换词为单字的转换绝不能出现在全局转换中,例如“宏=>巨集”的转换;
  2. 提请进行全局转换的被转换词必须至少在100篇条目中出现(可通过搜索引擎以判断);

此外,被转换词字数较少(不大于三字)的转换,社群在投票过程中还应考虑其中汉字的字频,以及可能导致过度转换的可能性。

关于汉字字频方面的研究,可参考汉字单字字频总表现代汉语常用字表其他的相关统计

如果您发现了地区词的过度转换错误,请前往Wikipedia:字词全局转换修复请求提报。

全文转换

全文转换适用于特定的单个条目,有极强的针对性。

“-{A|转换内容}-”是全文转换的源代码实现,但这一方式实现的全文转换往往会导致转换代码与条目正文的代码混淆不清,不利于进行维护。因此,维基百科推荐内嵌全文转换的{{NoteTA}}模版来作为实现全文转换的方式。要使用这一模版实现该功能,只需在特定条目源代码的顶端插入“{{NoteTA}}”的模版,并依照该模版页面的说明输入转换内容即可。

由于全文转换的针对性极强,所以较难出现过度转换的情况。但有些情况也需要利用单独转换来实现。

公共组转换

对于一些主题、领域相同和相似的条目,其中需要被转换的内容是大同小异的,可以把这些多个条目中要用到的共同转换字词单独创建一个公共转换组。公共转换组的方便程度处于全局转换与全文转换之间,而过度转换程度也处于这两者之间。

创建一个公共转换组时,要依据这一组大多数词汇在多个条目中被转换的可能性,而不应依据转换词汇的类别。比如,各国现任领导人的姓名转换,存在复用的可能性非常低,就不应当创建这样类别的公共组。创建公共转换组的方法可参见Wikipedia:字词转换处理/公共转换组中。

公共组转换中的转换内容可由普通用户所控制,而它所影响到的范围也没有全局转换这么大。公共组转换甚至可以用来填补在全局转换中受限制的二字转换。一个典型的例子是“數位=>数码”的转换:对于全局转换来说,在非电脑和信息技术相关的条目中,“數位”的后侧极有可能会搭配“人士”并组成“數位人士”一词,这样便会导致“数码人士”的过度转换结果产生。然而,在电脑和信息技术的公共组转换中,所涉及到的条目大多是技术类型的条目,其中有许多本来就应该被转换的“數位”词语,同时,技术性的内容也导致“數位人士”的用法几乎不会出现。

然而,也正如上述所说,假如真的碰巧出现了“數位人士”,公共组转换也有其局限。过度的地区转换可以通过繁简处理的全局转换来进行修复(详见该页面),也可以通过后文中提供的其他方式实现。

单独转换

“-{转换内容}-”或“避免过度-{}-转换内容”是单独转换的源代码实现。单独转换可以用于避免特定的过度转换,或者实现其他的一些特殊功能。

举例而言,在条目艾奥瓦州中,单独转换“又譯作'''-{zh:爱荷华州;zh-hans:爱荷华州;zh-hant:愛荷華州;zh-tw:愛阿華州;zh-hk:愛荷華州;zh-mo:愛荷華州;}-'''、'''爱我华州'''或'''衣阿華州'''”可以用于别名的展示。其展示的结果便是“又译作爱荷华州爱我华州衣阿华州”。或者,使用“{{各地中文名}}”等模板,说明之间差异。

又举例说明避免特定的过度转换:上文所述的“數位人士”,在存在“數位=>数码”转换的同时可通过“數-{}-位人士”来避免过度转换。

注意事项

手动转换书写格式

概括而言:您可以只使用zh-hans与zh-hant便达到目的,也欢迎您按照推荐的格式来书写

虽然,地区词处理只涉及zh-cn、zh-tw、zh-hk、zh-mo、zh-sg、zh-my六种模式,但出于方便实际操作的原因,并不强制要求按照何种方式填写,只要填写的转换能够满足预期的要求,并在各种模式下都不出现错误即可。

然而,上述的操作实际上并不完全符合于繁简转换与地区词转换分立的思想。因此,这里还推荐另一种做法,即让zh-hans、zh-hant的名称保持一致,只填写繁简体对应词,不要填写对应地区词。对A转换采用哪一地区词先到先得(即先编辑转换的),对于T转换,要求除繁简之别外与标题一致。这一做法并不要求所有的编者都要掌握,因此不会对第一种简便做法填写造成任何妨碍,了解第二种做法的编者会逐渐地将第一种做法修正。

参考文献应避免情况

此外,参考文献中的文字应不进行繁简转换(非中文的标题、姓名、引文等内容的中文翻译除外)。因此,如果在参考文献中不进行避免过度转换的处理,则无论是在全局转换、主题转换还是全文转换中,都有可能会对其中的文字造成影响。为避免此类现象发生,请在引用参考文献时使用可防止地区词转换的{{cite}}系列模板

官方中文名称处理

当一个机构或人物已经有官方的汉字或中文名称时,社群对应否进行地区词转换出现分歧。根据讨论结果,临时解决方案为:条目名称遵从“名从主人”原则,使用条目描述事物(人、物、事件等)所在地的最常用用法(例如新马简体版本:马哈迪);但其他地区语言版本依然显示该地区的最常用用法(例如大陆简体版本:马哈蒂尔),在内文以“地区词转换”方式显示名称(注:此方案不反对在文中个别地方标明条目描述事物在其他地区的名称)。