维基百科:字词转换/修复请求
|
| ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
|
本页面为维基百科:字词转换下属子页面,用于处理各维基计划全域转换和中文维基百科本地全局转换中的所有繁简与地区词错误转换修复的请求。
转换与修复原理
由于简体中文、繁体中文之间存在一对多现象,即以单一简化字或繁体字来对应多个繁体字或简化字[1][2],因此必须有额外的数据来补足原先丢失的信息。例如,繁体中的“髮”或“發”,在简体下都是“发”。在程序里,我们有一个默认的对应,比如说“發”。那么一般情况下要从简体转换成繁体时,程序遇到“发”就会先将其转换成“發”。那么什么时候对应成“髮”呢?这就要看词库而定。比如词库中有“头发=>頭髮”的关系,这样“头发”就会被转换成“頭髮”。如果没有这一关联,那“头发”就会被错误地转换成“頭發”。
那词库是如何创建的呢?我们先有每个字的默认对应,比如“发”转换成“發”。然后我们在一个现有的繁体词库中寻找包含繁体“發”的词,再转换成简体。这样得到一个从简体到繁体的词汇对应关系。所以,我们先要确定一个多对应字的默认对应关系。同样,修复过度转换也是由上述的方法来处理。
外部链接
错误转换修复请求
繁简转换请求存档 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
错误修复请求存档 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
早于7日的讨论将会由Jimmy-bot存档。 |
峯
请修复简体模式下错误转换:“峯”,正确转换应为“峰”。出错页面:金峯山寺。其他说明:峯在《通用规范汉字表》作为峰的异体字,同羣和群。--Kethyga(留言) 2024年4月7日 (日) 09:56 (UTC)
- 异体字是相互的,不等同于繁体字。虽然有些异体关系中存在正体字,但是“峯”并不罕见于简体中文环境的人名地名专名,不宜统统被“峰”取代。--— Gohan 2024年4月28日 (日) 07:49 (UTC)
- 简体中文环境常见“峯”?“峯”在《通用规范汉字表》中就是“峰”的异体字,繁体字和异体字在《中华人民共和国国家通用语言文字法》的地位是完全一致的,都是限定在一些场合使用(见第十七条),在中维的转换规则自然也应视同繁体字(既是规范汉字又作为另一个字异体字的情况除外,如“喆”“昇”等,但繁体字同有这种情况如“乾”,仍进一步说明它们地位是一致的)。既然异体字“棄”转换为了“弃”,“峯”当然也应转换,正式场合中国大陆也用“林峰”而不用“林峯”([1])。--自由雨日(留言) 2024年6月9日 (日) 16:06 (UTC)
- 维基的转换规则不会完全拘泥于《通用规范汉字表》规定,因为规定往往是滞后的,当前媒体与社会的用字倾向随时有可能突破(近年甚至出现了黄霄雲这样的极端人名用字,但目前只是孤例)。不过对于本案,仍可继续讨论。—Chiefwei(论 - 历) 2024年6月10日 (一) 03:08 (UTC)
- 感谢阁下提醒!您的回复给了我很大启发。不过……《通用规范汉字表》虽可能滞后,但却是强符合“可供查证”的(以及相对滞后也意味着相对稳定),根据媒体社会用字倾向来决定转换,是否会有原创研究/总结之嫌?比如黄霄云,在今年(2024年)文联旗下中国文艺网中的人名还是“云”而非“雲”([2]),在看不到当事人身份证的情况下,不同可靠来源中有不同用字,该如何定夺呢?--自由雨日(留言) 2024年6月10日 (一) 03:24 (UTC)
- 文联既不代表在可靠来源中常用,亦非黄霄雲的主人或本人。在简体中文环境的主流媒体中,“黄霄云”并不比“黄霄雲”常用。--— Gohan 2024年6月29日 (六) 08:37 (UTC)
在简体中文环境的主流媒体中,“黄霄云”并不比“黄霄雲”常用。
[来源请求]--自由雨日(留言) 2024年6月29日 (六) 08:43 (UTC)
- 文联既不代表在可靠来源中常用,亦非黄霄雲的主人或本人。在简体中文环境的主流媒体中,“黄霄云”并不比“黄霄雲”常用。--— Gohan 2024年6月29日 (六) 08:37 (UTC)
- 感谢阁下提醒!您的回复给了我很大启发。不过……《通用规范汉字表》虽可能滞后,但却是强符合“可供查证”的(以及相对滞后也意味着相对稳定),根据媒体社会用字倾向来决定转换,是否会有原创研究/总结之嫌?比如黄霄云,在今年(2024年)文联旗下中国文艺网中的人名还是“云”而非“雲”([2]),在看不到当事人身份证的情况下,不同可靠来源中有不同用字,该如何定夺呢?--自由雨日(留言) 2024年6月10日 (一) 03:24 (UTC)
- 请阁下留意简体字在维基百科并非只有中国大陆使用——也会影响星马用字,并区分“应然”与“实然”。维基百科的“应然”取决于现实的“实然”,而不由中国大陆的“应然”决定。另外,对于中国大陆,仍有不少人“名”中违法使用异体字,也曾闹出不少交通站名借字改地名引发争议、甚或最终改回异体字原名的新闻。--— Gohan 2024年6月13日 (四) 07:29 (UTC)
- 维基的转换规则不会完全拘泥于《通用规范汉字表》规定,因为规定往往是滞后的,当前媒体与社会的用字倾向随时有可能突破(近年甚至出现了黄霄雲这样的极端人名用字,但目前只是孤例)。不过对于本案,仍可继续讨论。—Chiefwei(论 - 历) 2024年6月10日 (一) 03:08 (UTC)
- 简体中文环境常见“峯”?“峯”在《通用规范汉字表》中就是“峰”的异体字,繁体字和异体字在《中华人民共和国国家通用语言文字法》的地位是完全一致的,都是限定在一些场合使用(见第十七条),在中维的转换规则自然也应视同繁体字(既是规范汉字又作为另一个字异体字的情况除外,如“喆”“昇”等,但繁体字同有这种情况如“乾”,仍进一步说明它们地位是一致的)。既然异体字“棄”转换为了“弃”,“峯”当然也应转换,正式场合中国大陆也用“林峰”而不用“林峯”([1])。--自由雨日(留言) 2024年6月9日 (日) 16:06 (UTC)
鳽
请修复大陆简体模式下错误转换:“鳽”,正确转换应为“𫛚”。出错页面:小苇鳽。其他说明:疑似在中日韩统一表意文字扩展区内的部分简化字有数个并未被顺利转换成对应的繁体,并导致小苇𫛚及小苇鳽不被视作同等词汇。另外可能一些同样以鸟部类推简化的字,如F区“𮭥”也有有类似情况。(但与𫛚字同区的“𫛭”就有成功转换。)--WiTo🐤💬 2024年4月24日 (三) 08:37 (UTC)
- @T45614631:“𫛚”和“𮭥”属于通用规范汉字表以外的汉字(简称“表外字”)而“𫛭”属于表内字。表内字肯定是得到简化了的,但表外字是否需要类推简化具有争议性,因为中国政府态度模糊并未明言表外字需要或不需要简化(多数实际操作中类推简化了)。我不是要说上述两个字不可以简化,但可能需要更多讨论。可以看这里关于应不应该无限类推简化的一堆文章。另外我想到了植物也有一个“苦蘵”,当中的“蘵”要不要简化也可以讨论一下。--微肿头龙(留言) 2024年5月6日 (一) 09:58 (UTC)
- 好,我去客栈开个话题。--WiTo🐤💬 2024年5月6日 (一) 15:30 (UTC)
- 等待共识,暂不处理。—Chiefwei(论 - 历) 2024年6月9日 (日) 11:35 (UTC)
打印尼
请修复大陆简体模式下错误转换:“打印尼”,正确转换应为“列印尼”。出错页面:Viu。其他说明:“列印-打印”。常见组合“位列印尼”、“一列印尼”、“名列印尼”。举例,营多面的“系列印尼”,印度尼西亚驻泰国大使馆的“并列印尼”,桑迪亚加·乌诺的“名列印尼”。可能需要排除“列印尼龍”。--Kethyga(留言) 2024年8月12日 (一) 06:20 (UTC)
- 这个问题貌似在各个出问题的条目中直接用
-{}-
打断比较好?--竹林下小径,月光映一叶 2024年8月21日 (三) 03:48 (UTC)
吉他們
请修复所有简体、台湾繁体模式下错误转换:“吉他們”,正确转换应为“結他們”。其他说明:建议是全转换直接改成加入这个词组就好,其他的可以考虑拿掉,因为维基百科可能还会有其他的“x結他們”这样的描述,这样做可以彻底修复这个词的转换错误,用google搜寻了一下,还是有一些:“site:zh.wikipedia.org "吉他们"”--maki※有事请留言 2024年8月14日 (三) 12:25 (UTC)
餘力生
请修复繁体模式下错误转换:“餘力生”,正确转换应为“余力生”。出错页面:余力生。其他说明:其个人印章作余(见 [3] 及 [4]),且餘姓远比余姓罕见。--RcAlex36(留言) 2024年8月15日 (四) 11:17 (UTC)
散無線電子
请修复繁体模式下错误转换:“散無線電子”,正确转换应为“散射电子”。出错页面:低能电子衍射、电子微探针、原子序数衬度像技术、扫描电子显微镜、电子束诱导沉积。其他说明:多个相关物理条目出现,简体的“散射电子”或“背散射电子”在繁体模式下触发“射电”—“無線電”机械转换,导致繁体模式下相关专有名词被转换成错误词语--Sufangxi(留言) 2024年8月18日 (日) 16:27 (UTC)
- 补充条目:埃弗哈特-索恩利探测器、电子能量损失谱。类似地还包括含有“透射电子”,“透射电子显微镜”,“衍射电子”等专有名词的条目--Sufangxi(留言) 2024年8月18日 (日) 16:41 (UTC)
麵臨
请修复繁体模式下错误转换:“麵臨”,正确转换应为“面臨”。出错页面:艾米琳·潘克斯特。其他说明:面字前面匹配到了“食面”(原文“允許對因絕食面臨健康不良的女權運動者進行釋放”),另外有阿卜杜勒-麦立克·本·麦尔万的“哈里發麵臨”,丹那美拉的“窮人和麵臨處決的被告的捍衛者”,约阿希姆·冯·里宾特洛甫的“蒂索面臨著一個選擇”(Google搜索结果,现已随“索面”更正)等。--Kethyga(留言) 2024年8月20日 (二) 00:34 (UTC)
鬍子春
请修复繁体模式下错误转换:“鬍子春”,正确转换应为“胡子春”。出错页面:佛香阁。其他说明:姓氏作胡不作胡。--RcAlex36(留言) 2024年8月23日 (五) 05:23 (UTC)
向量-H
请修复香港繁体模式下错误转换:“向量-H”,正确转换应为“矢量-H”。出错页面:矢量-H。其他说明:查阅香港教育局公布《中学物理科常用英汉辞汇》"Vector"存在多处译作“矢量”,应该不用全局转换。--Kethyga(留言) 2024年8月28日 (三) 07:18 (UTC)
- 文件给出的是在理工科领域“vector”两种译法均可,倒不是根据出现次数多少来判定何者为正统。(顺便在大陆理工科领域矢量和向量均可等同使用,没有正统一说)。倒不如讨论该页面中的“vector heaven”这个非数学和物理领域的专有名词有没有香港媒体或官方机构对其命名。--Sufangxi(留言) 2024年8月28日 (三) 07:37 (UTC)
- 上面没有强调正统,只是说至少在物理领域用“矢量”没问题,不需要强制转换。上面只是给出一个例子,物理中不止此一处。该公司名称可能没有特别常用名称,香港估计没有介绍,也不可能事事都有地区译名。--Kethyga(留言) 2024年8月28日 (三) 09:46 (UTC)
- 或者其制造公司“Vector Launch”在香港官方名字是什么,毕竟该条目中的“vector”大概率源自其制造公司的名字中“vector”。--Sufangxi(留言) 2024年8月28日 (三) 07:53 (UTC)
石樑
请修复繁体模式下错误转换:“石樑”,正确转换应为“石梁”。出错页面:石梁镇。其他说明:樑为俗梁字,台湾标准视之为梁的异体字,不属于繁简转换之列,建议移除该转换。--SteveLLL(留言) 2024年8月29日 (四) 11:09 (UTC)
- 全局转换中存在zh2hant/zh2hk中“'木梁' => '木樑'”、“'石梁' => '石樑'”,覆盖到了台湾变体,“樑”字现在好像主要用在香港中文环境中。之前提报是手动修复条目,Wikipedia:字词转换/修复请求/存档/2022年5月。感觉石梁不需要转换,用在地名“石梁”的似乎不少。--Kethyga(留言) 2024年8月29日 (四) 13:21 (UTC)
同一水平在线
请修复大陆简体模式下错误转换:“同一水平在线”,正确转换应为“同一水平线上”。出错页面:毁灭战士 (1993年游戏)。其他说明:繁体“同一水平线上”中“线上”被过度转换为“在线”,实际“水平线”为同一词,并不应当转换--Ilharp(留言) 2024年8月29日 (四) 16:08 (UTC)
- 完成。这个是Module:CGroup/Games自动转换的关系,已在"水平线"和"上"之间用-{}-打断。--竹林下小径,月光映一叶 2024年8月30日 (五) 08:15 (UTC)
裏約
请修复zh-hk, zh-tw, zh-hant模式下错误转换:“裏約”,正确转换应为“里約”。出错页面:n:中国奥运金牌运动员访港 政治议题无法回避。--Kitabc12345 海南 2024年8月30日 (五) 17:46 (UTC)