維基百科:字詞轉換/修復請求
|
| ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
|
本頁面為維基百科:字詞轉換下屬子頁面,用於處理各維基計劃全域轉換和中文維基百科本地全局轉換中的所有繁簡與地區詞錯誤轉換修復的請求。
轉換與修復原理
由於簡體中文、繁體中文之間存在一對多現象,即以單一簡化字或繁體字來對應多個繁體字或簡化字[1][2],因此必須有額外的資料來補足原先丟失的資訊。例如,繁體中的「髮」或「發」,在簡體下都是「发」。在程式裡,我們有一個預設的對應,比如說「發」。那麼一般情況下要從簡體轉換成繁體時,程式遇到「发」就會先將其轉換成「發」。那麼什麼時候對應成「髮」呢?這就要看詞庫而定。比如詞庫中有「头发=>頭髮」的關係,這樣「头发」就會被轉換成「頭髮」。如果沒有這一關聯,那「头发」就會被錯誤地轉換成「頭發」。
那詞庫是如何建立的呢?我們先有每個字的預設對應,比如「发」轉換成「發」。然後我們在一個現有的繁體詞庫中尋找包含繁體「發」的詞,再轉換成簡體。這樣得到一個從簡體到繁體的詞彙對應關係。所以,我們先要確定一個多對應字的預設對應關係。同樣,修復過度轉換也是由上述的方法來處理。
外部連結
錯誤轉換修復請求
繁簡轉換請求存檔 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
錯誤修復請求存檔 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
早於7日的討論將會由Jimmy-bot存檔。 |
峯
請修復簡體模式下錯誤轉換:「峯」,正確轉換應為「峰」。出錯頁面:金峯山寺。其他說明:峯在《通用規範漢字表》作為峰的異體字,同羣和群。--Kethyga(留言) 2024年4月7日 (日) 09:56 (UTC)
- 異體字是相互的,不等同於繁體字。雖然有些異體關係中存在正體字,但是「峯」並不罕見於簡體中文環境的人名地名專名,不宜統統被「峰」取代。--— Gohan 2024年4月28日 (日) 07:49 (UTC)
- 簡體中文環境常見「峯」?「峯」在《通用規範漢字表》中就是「峰」的異體字,繁體字和異體字在《中華人民共和國國家通用語言文字法》的地位是完全一致的,都是限定在一些場合使用(見第十七條),在中維的轉換規則自然也應視同繁體字(既是規範漢字又作為另一個字異體字的情況除外,如「喆」「昇」等,但繁體字同有這種情況如「乾」,仍進一步說明它們地位是一致的)。既然異體字「棄」轉換為了「弃」,「峯」當然也應轉換,正式場合中國大陸也用「林峰」而不用「林峯」([1])。--自由雨日(留言) 2024年6月9日 (日) 16:06 (UTC)
- 維基的轉換規則不會完全拘泥於《通用規範漢字表》規定,因為規定往往是滯後的,當前媒體與社會的用字傾向隨時有可能突破(近年甚至出現了黄霄雲這樣的極端人名用字,但目前只是孤例)。不過對於本案,仍可繼續討論。—Chiefwei(論 - 歷) 2024年6月10日 (一) 03:08 (UTC)
- 感謝閣下提醒!您的回覆給了我很大啟發。不過……《通用規範漢字表》雖可能滯後,但卻是強符合「可供查證」的(以及相對滯後也意味着相對穩定),根據媒體社會用字傾向來決定轉換,是否會有原創研究/總結之嫌?比如黃霄雲,在今年(2024年)文聯旗下中國文藝網中的人名還是「云」而非「雲」([2]),在看不到當事人身份證的情況下,不同可靠來源中有不同用字,該如何定奪呢?--自由雨日(留言) 2024年6月10日 (一) 03:24 (UTC)
- 文聯既不代表在可靠來源中常用,亦非黃霄雲的主人或本人。在簡體中文環境的主流媒體中,「黃霄雲」並不比「黃霄雲」常用。--— Gohan 2024年6月29日 (六) 08:37 (UTC)
在簡體中文環境的主流媒體中,「黃霄雲」並不比「黃霄雲」常用。
[來源請求]--自由雨日(留言) 2024年6月29日 (六) 08:43 (UTC)
- 文聯既不代表在可靠來源中常用,亦非黃霄雲的主人或本人。在簡體中文環境的主流媒體中,「黃霄雲」並不比「黃霄雲」常用。--— Gohan 2024年6月29日 (六) 08:37 (UTC)
- 感謝閣下提醒!您的回覆給了我很大啟發。不過……《通用規範漢字表》雖可能滯後,但卻是強符合「可供查證」的(以及相對滯後也意味着相對穩定),根據媒體社會用字傾向來決定轉換,是否會有原創研究/總結之嫌?比如黃霄雲,在今年(2024年)文聯旗下中國文藝網中的人名還是「云」而非「雲」([2]),在看不到當事人身份證的情況下,不同可靠來源中有不同用字,該如何定奪呢?--自由雨日(留言) 2024年6月10日 (一) 03:24 (UTC)
- 請閣下留意簡體字在維基百科並非只有中國大陸使用——也會影響星馬用字,並區分「應然」與「實然」。維基百科的「應然」取決於現實的「實然」,而不由中國大陸的「應然」決定。另外,對於中國大陸,仍有不少人「名」中違法使用異體字,也曾鬧出不少交通站名借字改地名引發爭議、甚或最終改回異體字原名的新聞。--— Gohan 2024年6月13日 (四) 07:29 (UTC)
- 維基的轉換規則不會完全拘泥於《通用規範漢字表》規定,因為規定往往是滯後的,當前媒體與社會的用字傾向隨時有可能突破(近年甚至出現了黄霄雲這樣的極端人名用字,但目前只是孤例)。不過對於本案,仍可繼續討論。—Chiefwei(論 - 歷) 2024年6月10日 (一) 03:08 (UTC)
- 簡體中文環境常見「峯」?「峯」在《通用規範漢字表》中就是「峰」的異體字,繁體字和異體字在《中華人民共和國國家通用語言文字法》的地位是完全一致的,都是限定在一些場合使用(見第十七條),在中維的轉換規則自然也應視同繁體字(既是規範漢字又作為另一個字異體字的情況除外,如「喆」「昇」等,但繁體字同有這種情況如「乾」,仍進一步說明它們地位是一致的)。既然異體字「棄」轉換為了「弃」,「峯」當然也應轉換,正式場合中國大陸也用「林峰」而不用「林峯」([1])。--自由雨日(留言) 2024年6月9日 (日) 16:06 (UTC)
鳽
請修復大陸簡體模式下錯誤轉換:「鳽」,正確轉換應為「𫛚」。出錯頁面:小葦鳽。其他說明:疑似在中日韓統一表意文字擴展區內的部分簡化字有數個並未被順利轉換成對應的繁體,並導致小葦𫛚及小葦鳽不被視作同等詞彙。另外可能一些同樣以鳥部類推簡化的字,如F區「𮭥」也有有類似情況。(但與𫛚字同區的「鵟」就有成功轉換。)--WiTo🐤💬 2024年4月24日 (三) 08:37 (UTC)
- @T45614631:「𫛚」和「𮭥」屬於通用規範漢字表以外的漢字(簡稱「表外字」)而「鵟」屬於表內字。表內字肯定是得到簡化了的,但表外字是否需要類推簡化具有爭議性,因為中國政府態度模糊並未明言表外字需要或不需要簡化(多數實際操作中類推簡化了)。我不是要說上述兩個字不可以簡化,但可能需要更多討論。可以看這裡關於應不應該無限類推簡化的一堆文章。另外我想到了植物也有一個「苦蘵」,當中的「蘵」要不要簡化也可以討論一下。--微腫頭龍(留言) 2024年5月6日 (一) 09:58 (UTC)
- 好,我去客棧開個話題。--WiTo🐤💬 2024年5月6日 (一) 15:30 (UTC)
- 等待共識,暫不處理。—Chiefwei(論 - 歷) 2024年6月9日 (日) 11:35 (UTC)
打印尼
請修復大陸簡體模式下錯誤轉換:「打印尼」,正確轉換應為「列印尼」。出錯頁面:Viu。其他說明:「列印-打印」。常見組合「位列印尼」、「一列印尼」、「名列印尼」。舉例,營多麵的「系列印尼」,印度尼西亞駐泰國大使館的「並列印尼」,桑迪亞加·烏諾的「名列印尼」。可能需要排除「列印尼龍」。--Kethyga(留言) 2024年8月12日 (一) 06:20 (UTC)
- 這個問題貌似在各個出問題的條目中直接用
-{}-
打斷比較好?--竹林下小徑,月光映一葉 2024年8月21日 (三) 03:48 (UTC)
吉他們
請修復所有簡體、台灣繁體模式下錯誤轉換:「吉他們」,正確轉換應為「結他們」。其他說明:建議是全轉換直接改成加入這個詞組就好,其他的可以考慮拿掉,因為維基百科可能還會有其他的「x結他們」這樣的描述,這樣做可以徹底修復這個詞的轉換錯誤,用google搜尋了一下,還是有一些:「site:zh.wikipedia.org "結他們"」--maki※有事請留言 2024年8月14日 (三) 12:25 (UTC)
餘力生
請修復繁體模式下錯誤轉換:「餘力生」,正確轉換應為「余力生」。出錯頁面:餘力生。其他說明:其個人印章作余(見 [3] 及 [4]),且餘姓遠比余姓罕見。--RcAlex36(留言) 2024年8月15日 (四) 11:17 (UTC)
散無線電子
請修復繁體模式下錯誤轉換:「散無線電子」,正確轉換應為「散射电子」。出錯頁面:低能電子衍射、電子微探針、原子序數襯度像技術、掃描電子顯微鏡、電子束誘導沉積。其他說明:多個相關物理條目出現,簡體的“散射电子”或“背散射电子”在繁體模式下觸發「射电」—「無線電」機械轉換,導致繁體模式下相關專有名詞被轉換成錯誤詞語--Sufangxi(留言) 2024年8月18日 (日) 16:27 (UTC)
- 補充條目:埃弗哈特-索恩利探測器、電子能量損失譜。類似地還包括含有「透射电子」,「透射电子显微镜」,「衍射电子」等專有名詞的條目--Sufangxi(留言) 2024年8月18日 (日) 16:41 (UTC)
麵臨
請修復繁體模式下錯誤轉換:「麵臨」,正確轉換應為「面臨」。出錯頁面:艾米琳·潘克斯特。其他說明:面字前面匹配到了「食面」(原文「允許對因絕食面臨健康不良的女權運動者進行釋放」),另外有阿卜杜勒-麥立克·本·麥爾萬的「哈里發麵臨」,丹那美拉的「窮人和麵臨處決的被告的捍衛者」,約阿希姆·馮·里賓特洛甫的「蒂索面臨著一個選擇」(Google搜索結果,現已隨「索面」更正)等。--Kethyga(留言) 2024年8月20日 (二) 00:34 (UTC)
鬍子春
請修復繁體模式下錯誤轉換:「鬍子春」,正確轉換應為「胡子春」。出錯頁面:佛香閣。其他說明:姓氏作胡不作鬍。--RcAlex36(留言) 2024年8月23日 (五) 05:23 (UTC)
向量-H
請修復香港繁體模式下錯誤轉換:「向量-H」,正確轉換應為「矢量-H」。出錯頁面:矢量-H。其他說明:查閱香港教育局公布《中學物理科常用英漢辭彙》"Vector"存在多處譯作「矢量」,應該不用全局轉換。--Kethyga(留言) 2024年8月28日 (三) 07:18 (UTC)
- 文件給出的是在理工科領域「vector」兩種譯法均可,倒不是根據出現次數多少來判定何者為正統。(順便在大陸理工科領域矢量和向量均可等同使用,沒有正統一說)。倒不如討論該頁面中的「vector heaven」這個非數學和物理領域的專有名詞有沒有香港媒體或官方機構對其命名。--Sufangxi(留言) 2024年8月28日 (三) 07:37 (UTC)
- 上面沒有強調正統,只是說至少在物理領域用「矢量」沒問題,不需要強制轉換。上面只是給出一個例子,物理中不止此一處。該公司名稱可能沒有特別常用名稱,香港估計沒有介紹,也不可能事事都有地區譯名。--Kethyga(留言) 2024年8月28日 (三) 09:46 (UTC)
- 或者其製造公司「Vector Launch」在香港官方名字是什麼,畢竟該條目中的「vector」大概率源自其製造公司的名字中「vector」。--Sufangxi(留言) 2024年8月28日 (三) 07:53 (UTC)
石樑
請修復繁體模式下錯誤轉換:「石樑」,正確轉換應為「石梁」。出錯頁面:石樑鎮。其他說明:樑爲俗梁字,臺灣標準視之爲梁的異體字,不屬於繁簡轉換之列,建議移除該轉換。--SteveLLL(留言) 2024年8月29日 (四) 11:09 (UTC)
- 全局轉換中存在zh2hant/zh2hk中「'木梁' => '木樑'」、「'石梁' => '石樑'」,覆蓋到了臺灣變體,「樑」字現在好像主要用在香港中文環境中。之前提報是手動修復條目,Wikipedia:字詞轉換/修復請求/存檔/2022年5月。感覺石樑不需要轉換,用在地名「石梁」的似乎不少。--Kethyga(留言) 2024年8月29日 (四) 13:21 (UTC)
同一水平在线
請修復大陸簡體模式下錯誤轉換:「同一水平在线」,正確轉換應為「同一水平线上」。出錯頁面:毀滅戰士 (1993年遊戲)。其他說明:繁體「同一水平線上」中「線上」被過度轉換為「在線」,實際「水平線」為同一詞,並不應當轉換--Ilharp(留言) 2024年8月29日 (四) 16:08 (UTC)
- 完成。這個是Module:CGroup/Games自動轉換的關係,已在"水平線"和"上"之間用-{}-打斷。--竹林下小徑,月光映一葉 2024年8月30日 (五) 08:15 (UTC)
裏約
請修復zh-hk, zh-tw, zh-hant模式下錯誤轉換:「裏約」,正確轉換應為「里約」。出錯頁面:n:中國奧運金牌運動員訪港 政治議題無法迴避。--Kitabc12345 海南 2024年8月30日 (五) 17:46 (UTC)