Talk:中日韓統一表意文字

页面内容不支持其他语言。
维基百科,自由的百科全书
          本条目页属于下列维基专题范畴:
汉字文化圈专题 (获评未知重要度
中日韓統一表意文字」是漢字文化圈專題的一部分,一個主要對(即漢字文化圈,或称「東亞文化圈」「儒家文化圈」等)為主題的文章作編輯、收集、整理、完善的專題。如果您愿意參與,可以編輯這篇文章,或者访问本專題頁面了解專題的工作,並歡迎參與討論
 未评级未评  根据专题质量评级标准,本条目页尚未接受评级。
 未知  根据专题重要度评级标准,本條目尚未接受评级。

條目名稱問題

改"中日韓漢字統一"至此,理由:

  1. 此詞來自英字"Han Unification",本無"中日韓"之義.
  2. Unicode 漢字現已加入越南漢字.202.64.84.251 07:35 2005年6月14日 (UTC)

Unicode里有两个用语,一叫"Han Unification",另一叫"CJK Ideograph"(中日韩表意文字)。应否把此条目移到中日韩表意文字? -Hello World! 06:10 2005年6月15日 (UTC)

"Han Unification"是指統一的過程和規範。"CJK Ideograph"指的是表意文字,可以說即是漢字,只不過各地的寫法不同。202.64.84.251 09:29 2005年6月15日 (UTC)
  1. 你實行之前,應先行好好學習維基的習慣和各命令的用途。
  2. Han unification 應該叫統漢碼。不過先前有其他用戶改了這麼一個名稱,無謂搞對抗。現在可以統一採用正名。
  3. 任何改動都應該盡可能保留舊有條目,而不是另行開立新條目,而把別人的心血搬進自己的條目去。
  4. 很多指令是要注冊後才可以使用,例如:把條目移往新的名稱去。

--202.75.78.240 02:21 2005年6月16日 (UTC)

我没有查到Han Unification被翻译成漢字統一,实际上,Han Unification目前基本上还没有对应的中文译名-百無一用是書生 () 02:27 2005年6月16日 (UTC)

這是因為此類文獻中文版本少之又少--Hello World! 02:38 2005年6月16日 (UTC)
Han Unification翻译成“汉字统一”其实挺奇怪的。看不出来是将电脑中的汉字集中到一个编码中。Unicode一般翻译成“统一码”,所以是不是可以改用“汉字统码化”?--Kren 02:57 2005年6月18日 (UTC)
"Unification"原來的意思就是統一,不是“將之統一碼(Unicode)化”或“將之統一編碼”。漢字統一的概念其實已存在很久,有不少大陸學者(1949年後)都曾倡議漢字簡化時要和日本的簡化漢字看齊,如“国”、“变”等字,以利溝通。因為原來ISO 10646的構想就是將編碼空間切開,讓中日韓分別置入自己的字元(如中國的“一”和日本漢字的“一”可能就要分開編碼)。統一就是將同源的字(如大家的“一”的都是源自中國古代,意思也相同)統一,只編一個碼。就像英文的a和法文的a,讀音可能不同,但大家都源自拉丁字母。202.64.84.251 04:55 2005年6月18日 (UTC)
讓中日韓分別置入自己的字元,是日本一方的看法;此看法並非ISO 10646的構想,更遑論被接納 --Hello World! 09:55 2005年6月20日 (UTC)

建议把名称改为“汉语表意文字统一计划”之类的。 dbslikacheung 16:21 2006年8月16日 (UTC)

第二平面字元

Unicode 裏並沒有「第二平面字元」這東西。只有「表意文字補充平面」(SIP)和Extension B.202.64.84.251 01:34 2005年6月17日 (UTC)

「表意文字補充平面」(SIP)=「第二辅助平面」 -Hello World! 02:23 2005年8月11日 (UTC)
但「第二平面字元」≠「第二辅助平面」。--水水 09:27 2005年10月20日 (UTC)
「第二平面字元」∈「第二辅助平面」,但「第二辅助平面」只有「第二平面字元」--Hello World! 09:53 2005年10月20日 (UTC)
為何不直接說Extension B?--水水 01:29 2005年10月21日 (UTC)
已把本來第二平面字元的條目,合併到中日韓統一表意文字和輔助平面。--利用者:Sl 09:38 2007年2月3日 (UTC)

字源分離原則

我所列的全部都是在ISO/IEC JTC1/SC2/WG2的字源分離原則文件之中有的字(請勿在表中加添或刪減任何字。)。請留意在內地被視為簡化字的字,在其他地方並不視作簡化字,只視作異體,而且,漢字不只是中文或中國在用。

舉例來說,並不是的簡化字,的簡化字是也並非的簡化字。的簡化字是字,與字的編碼並不相同。--Hello World! 08:56 2005年6月28日 (UTC)

想問問: 那一份官方文件有沒有超連結?可不可以更改?--石添小草 14:48 2005年7月5日 (UTC)
ISO/IEC 10646 Annex S,可在IRG網站找到 --Hello World! 02:27 2005年7月6日 (UTC)

以下的字應該也不是繁簡分別,而是字形的分別:狰(猙)、睁(睜)、决(決)、况(況)、凄(淒)、凉(涼)、减(減)、凑(湊)、羡(羨)、蹰(躕)、㛟(𡞵)、唤(喚)、奂(奐)、换(換)、涣(渙)、焕(煥)、痪(瘓)、荆(荊) --Hello World! (誰搶劫了我的乳酪) 2008年12月12日 (五) 07:33 (UTC)[回复]

以下字是利用“字源分離表”中的構件組成的字。似乎這些字都應該符合該表的定義。

Unicode Unicode Unicode
U+20775 𠝵 U+524F U+5259
U+6EDE U+6EEF
U+6F5F U+6F99
U+72F0 U+7319
U+7741 U+775C
U+8780 U+87BF
U+8E97 U+8E9B
U+69E9 U+3BA3
U+504B U+20338 𠌸
U+50B3 U+2B74A 𫝊
U+5BC3 U+21A18 𡨘
U+5D88 U+21E83 𡺃
U+5E85 U+221DD 𢇝
U+6158 U+2280A 𢠊
U+6164 U+22871 𢡱
U+61E1 U+228D7 𢣗
U+6226 U+229D0 𢧐
U+646A U+2BF63 𫽣
U+64E3 U+22DEC 𢷬
U+6A69 U+23727 𣜧
U+6BF5 U+23B9F 𣮟
U+71FD U+2442D 𤐭
U+7361 U+2486F 𤡯
U+78D9 U+25566 𥕦
U+7AB4 U+259D1 𥧑
U+8158 U+266E2 𦛢
U+83DF U+2B7CF 𫟏
U+8412 U+26CC6 𦳆
U+8E61 U+2C9C0 𬧀
U+902F U+284FB 𨓻
U+93D8 U+28A99 𨪙
U+93F8 U+28ACD 𨫍
U+348C U+203BD 𠎽
U+3912 U+3913
U+3B36 㬶(月部) U+266E9 𦛩
U+3B43 U+233C8 𣏈
U+3E91 U+24859 𤡙
U+20195 𠆕 U+221A3 𢆣
U+22A7B 𢩻 U+22A7C 𢩼
U+23368 𣍨(月部) U+26673 𦙳
U+24C4F 𤱏 U+2C3C2 𬏂
U+25CA4 𥲤 U+25CC1 𥳁
U+26637 𦘷 U+2C072 𬁲(月部)
U+26671 𦙱 U+2667D 𦙽
U+2688B 𦢋 U+268CD 𦣍
U+26A33 𦨳 U+26A3C 𦨼
U+26EBA 𦺺 U+26F53 𦽓
U+279BD 𧦽 U+279C2 𧧂
U+27A71 𧩱 U+27AEE 𧫮
U+2837D 𨍽 U+2838A 𨎊
U+28599 𨖙 U+285BC 𨖼
U+29149 𩅉 U+29167 𩅧
U+29451 𩑑 U+29457 𩑗
U+2A14F 𪅏 U+2A1AA 𪆪

-Hello World! 2015年9月24日 (四) 10:05 (UTC)[回复]

Han Unification

「Han Unification」即「CJK Unified Ideographs」,Microsoft譯為「中日韓統一表意文字」,我認為這個名稱比較恰當就移動了。「漢字統一」看字面,還以為是漢字文化圈各國要統一漢字寫法呢。Koika 18:56 2005年11月5日 (UTC)

「Han Unification」是一個過程,「CJK Unified Ideographs」是一個結果。我認為還是應該把兩者分開來比較好。--minghong 01:43 2005年11月11日 (UTC)
「中日韓相容表意文字」區怎可能只有12個字?前往[1],然後再選取以「CJK Compatibility Ideographs」標題的PDF檔案,就可看出此區最多可以有512個字!158.182.31.158 11:57 2006年7月24日 (UTC)
該區意思是,有12個字被錯放到「表意文字兼容區」(當然表意文字兼容區不只有12個字) --Hello World!13:10 2006年10月7日 (UTC)
該十二個字沒有放到正字區中是因為它們雖然有獨立的形音義,但不是來自官方字集(即 G-, T-, J- 和 K-source)。--水水 09:48 2006年11月12日 (UTC)

以下五對漢字,其實一點兒分別也沒有:

  • U+34A8 㒨 = U+20457 𠑗
  • U+3DB7 㶷 = U+2420E 𤈎
  • U+8641 虁 = U+27144 𧅄
  • U+204F2 𠓲 = U+23515 𣔕
  • U+249BC 𤦼 = U+249E9 𤧩

資料來源:http://babelstone.blogspot.com/2007/06/brief-history-of-cjk-c.html --Hello World! 2008年2月16日 (六) 11:35 (UTC)[回复]

U+4695 ←→ CNS 5-7A38 ←→ U+2F9CB,不知是哪裡出了錯。 --Hello World! 2008年2月14日 (四) 04:38 (UTC)[回复]

其他東亞象形文字

之前有人提過把西夏文併入中日韓越統一表意文字之內,但現時看Unicode的roadmaps,發覺西夏文、契丹文、女真文,同被寫到了U+17xxx的範圍裡。這似乎解釋不到為何喃字會與CJK合併,而西夏文則不會。--利用者:Sl 09:51 2007年2月3日 (UTC)

其實李元昊自己也說過,西夏文字是獨自的創立,可能字形有些相似,但不是依從既有漢字而創立的。所以,我認為不應與CJKV合併。--石添小草 2007年7月22日 (日) 17:14 (UTC)[回复]
N3297 西夏文 U+17000–U+18715 共 5910 個 -Hello World! 2007年8月27日 (一) 15:41 (UTC)[回复]
方塊壯字如何?--Hello World! (誰搶劫了我的乳酪) 2008年12月12日 (五) 07:33 (UTC)[回复]

首先,你所说的这些都不是象形文字,其次,看过西夏文、契丹文、女真文的人都会知道,它们与汉字差别甚大(当然,它们的创立受到了汉字的影响,基本遵从方块的特点),而喃字、壮字等字,与汉字类似,很多都是采用汉字已有的部件所组成,甚至不少字本身就是汉字。因此Unicode如此区分是完全正确的。Dreamer in Utopia留言2018年6月3日 (日) 10:04 (UTC)[回复]

Untitled

To use "CKJ" is meaningless. The term "CJK" is well-known for years. It's base on the alphabetic order, so we called it CJK. I don't think it good to use "CKJ" or even some of the people use KJC.—以上未簽名的留言由Arithmandar對話貢獻)於2008年3月31日 (一) 05:54 (UTC)加入。[回复]

雖說本人對日本不懷好感,但卻也同意中日韓(朝)越的順序,除了因為拉丁字母的次序以及和「中日韓表意字」的譯名連貫外,還可以從使用漢字(或類似漢字文字)的數量來看,中國排行第一,日本次之,朝韓兩地差不多日常寫作不用,越南早已完全放棄。 朝韓兩地差不多不再用漢字,怎麼反倒可以放在第一位?日本比它更常用漢字,怎麼會排在它之後? 朱仁一月 (留言) 2009年6月29日 (一) 09:27 (UTC)[回复]

擴展B區兼容漢字

【原張貼在 Talk:香港增補字符集】 以下6個擴展B區兼容漢字是來自HKSCS的:

  • 2F840 HKSCS A047
  • 2F894 HKSCS FC48
  • 2F8CD HKSCS 9C52
  • 2F994 HKSCS 8EFD
  • 2F9B2 HKSCS 8FA8
  • 2F9D4 HKSCS 8FF0

不知為什麼,Unicode竟聲稱整個區段為 CNS 11643 兼容漢字。CNS 11643 並沒有這6個字。--Hello World! 2008年2月14日 (四) 04:43 (UTC)[回复]

建議分割

建議把過程和批評部分分割至"統一漢字",而統一的結果留於本條目。--Emphrase💬📝 2016年8月11日 (四) 09:48 (UTC)[回复]

個人認為,叫“漢字統一”較好,因英語叫 Han Unification, “統一”是動名詞。--Hello World! 2017年1月2日 (一) 02:53 (UTC)[回复]

這裡列出了不少相同的字

https://github.com/cjkvi/cjkvi-variants/blob/master/duplicate-chars.txt --維基小霸王留言2016年10月22日 (六) 10:26 (UTC)[回复]

国标源的G7真的是“现代汉语通用字表”吗?

Unicode里国标源G7的汉字,基本都没有在所谓的“现代汉语通用字表”中找到。可否有相关人士提供一下这个说法的来源?非常怀疑这种说法。
--Ming Fan 617留言2017年3月11日 (六) 10:15 (UTC)[回复]

官方文件寫的是“General Purpose Hanzi List for Modern Chinese Language, and General List of Simplified Hanzi”。它的中譯是什麼?--Hello World! 2017年3月12日 (日) 14:52 (UTC)[回复]
@Sl抱歉这么久了,把这事忘了。GB13000-2010的第25页(本链接第30页)显示为“现代汉语通用字表,简化字总表”,但这些字多半在这两个表中找不到。--Ming Fan 617留言2017年8月24日 (四) 06:02 (UTC)[回复]

澳門資訊系統字集/澳門增補字符集

官方文件中提及的“Macao Supplementary Character Set”(簡稱 MSCS),應該對應為“澳門增補字符集”,葡文是“Colectânea de Caracteres Chineses de Macau – Novos e Complementares”[2][3][4]

而“澳門資訊系統字集”,其實是另一項東西,至今尚未誕生。它的英文是“Macao Information System Character Set”(簡稱 MISCS)、葡文是“Colectânea dos Caracteres Chineses dos Sistemas Informáticos de Macau”[5]。第一版將叫 MISCS-2016[6]。它除了包含“澳門增補字符集”字外,還包括 Big-5 碼字和香港字。而負責此項目的“資訊系統中文編碼工作小組”,英文是“The Computer Chinese Characters Encoding Workgroup”、葡文是“Grupo de Trabalho para a Codificação dos Caracteres Chineses dos Sistemas Informáticos”。

一項尚未誕生的東西,我不知道怎樣能成為 CJKV 字符的來源。要麼是 IRG 出錯,要麼就是澳門政府自己也搞亂了,又或者某日把“Macao Information System Character Set”這個名字挪用了。--Hello World! 2017年3月12日 (日) 15:19 (UTC)[回复]

“Macao Information System Character Set”,在2016年的幾個網頁,又被改成“Macao SAR Information Systems Character Set”,多了 SAR、System 後面加了一個 s。-Hello World! 2017年9月2日 (六) 18:31 (UTC)[回复]

条目名称:CJK 还是 CJKV?

本条目已在「中日韓統一表意文字」和「中日韓越統一表意文字」之间数次移动。当前的条目名称为「中日韓統一表意文字」,但条目的首节中又有「旧称中日韩(CJK)统一表意文字,后来,此计划加入了越南文的喃字,所以合称中日韩越(CJKV)统一表意文字」的记述。是否应当将条目名称统一为「中日韓越統一表意文字」?——Arnie97留言2017年5月30日 (二) 04:11 (UTC)[回复]

个人认为"CJK"只是一种常见的泛称,并没有正式定义说一定只能包括Chinese Japanese和Korean文字,(唯一接近定义的只有在Unicode中,而且用的也是“CJK”而非“CJKV”)。所以虽然CJK确实包含喃字不假,仍然应该选用CJK其来作为标题名。但是与此同时,首节那段应该稍加修改(譬如,真的有“CJK计划”这种东西吗?难道不只是Unicode计划的一部分吗)减少歧义。-小烈 (找我?) 2017年5月31日 (三) 19:26 (UTC)[回复]
旧称中日韩(CJK)统一表意文字这样的说法,是很明显有误的。首先中日韩统一表意文字,是一个Unicode当中的概念。而参考CJK Unified Ideographs的官方说明,“Historically, Vietnam used Chinese ideographs too, so sometimes the abbreviation «CJKV» is used.”,且全文从未提及过CJKV可以作为其正式名称而出现。此外Unicode的名称原则上是一经确认,无法更改的,即便是命名错误也是如此。比如一个典型的错误示例:苏州码子,它的Unicode名称是Hangzhou Numeral。这是一个明显的错误,但一经发布,只能将错就错,无法修正,只能通过说明信息的方式补充纠正这个问题。至于没有错误的编码名称就更不会予以修改了。比如名为蒙古文(Mongolian)的编码,实质上同时用于表示蒙古文,满文和锡伯文。(Mongolian is a Unicode block containing characters for dialects of Mongolian, Manchu, and Sibe languages)但绝不会因为这样的原因就将编码名称进行修改并加入满文和锡伯文字样。目前中日韩统一表意文字从始至终都是Unicode里的标准说法,即便在说明信息当中也是如此,并没有被废除和更换,反而使用CJKV才是不符合Unicode标准和实际情况的。--Popcorner留言2018年7月19日 (四) 08:52 (UTC)[回复]

外部链接已修改

各位维基人:

我刚刚修改了中日韓統一表意文字中的3个外部链接,请大家仔细检查我的编辑。如果您有疑问,或者需要让机器人忽略某个链接甚至整个页面,请访问这个简单的FAQ获取更多信息。我进行了以下修改:

有关机器人修正错误的详情请参阅FAQ。

祝编安。—InternetArchiveBot (報告軟件缺陷) 2018年6月30日 (六) 05:16 (UTC)[回复]

外部链接已修改

各位维基人:

我刚刚修改了中日韓統一表意文字中的2个外部链接,请大家仔细检查我的编辑。如果您有疑问,或者需要让机器人忽略某个链接甚至整个页面,请访问这个简单的FAQ获取更多信息。我进行了以下修改:

有关机器人修正错误的详情请参阅FAQ。

祝编安。—InternetArchiveBot (報告軟件缺陷) 2018年7月30日 (一) 13:08 (UTC)[回复]

令和

Unicode 12.1 加的「U+32FF,㋿」位於中日韓圍繞字元及月份,真算是漢字嗎?--水水留言2019年7月10日 (三) 06:18 (UTC)[回复]

舊的日本年號位於中日韓相容字元--水水留言2019年7月10日 (三) 06:20 (UTC)[回复]
中日韓相容字元區早已填滿,所以迫不得已加到其他區段而已。由3000-33FF 之間,現在只有 3040 & 3097 & 3098 (平假名)、3100-3104 (注音符號)、3130 & 318F (諺文兼容字母)、31E4-31EF (CJK筆劃)、321F (圍繞字元及月份區段之中的諺文小段) 還未使用。(31BB-31BF 已有5個注音符號在13.0版填上。)--Hello World! 2019年8月19日 (一) 18:04 (UTC)[回复]

Unicode 13.0 新增字 (2020年3月)

一批条目名翻译有误,能否批量修改/重定向


下列模板通向9个条目名需要修改。

“中日韓統一表意文字擴展區A”到“I”,其原文是“CJK Unified Ideographs Extension A~I”,属于Unicode區段,而“区”的原文是“block”。Extension不译作“擴展區”,正如“Georgian Extended block”不译作“格鲁吉亚扩充区区段”,同时它的范围已定也不再“展开”了,因此译作“扩充”为宜。同时请注意“Georgian Supplement”即“格鲁吉亚补充”是另一个不同的区段,维基百科内翻译最好统一。

参照“Unicode Standard 译介尝试”等资料,这9个条目名应直译为并重定向到:“中日韩统一表意扩充A”到“I”(补充:Unicode划定的区段不意味着里面是文字,尤其“CJK Unified Ideographs Extension”里经查有形似而非汉字的东西,因此直译反而更好),或意译“中日韩统一表意文字扩充A”到“I”

--观赏植物留言2023年12月10日 (日) 18:28 (UTC)[回复]

除了Github,有无其他来源支持?--及时雨 留言 2023年12月11日 (一) 08:33 (UTC)[回复]
如我解释,这个不是“有无其他来源支持”的问题,是对与错的问题,维基目前是错的,甚至Unicode區段列举的除CJK Unified Ideographs以外对“Extension”都不译作“擴展區”,换言之维基自己翻译都不统一,可能有必要建立类似这样的翻译对照表。观赏植物留言2023年12月13日 (三) 13:32 (UTC)[回复]
“扩展”这个名字已经约定俗成了,要改就成原创研究了。“区”不要也可以,感觉“扩展A区”、“扩A区”的说法见的多些,可以把“区”排除出专名,当普通名词处理。--DvXg 📬 2023年12月12日 (二) 07:38 (UTC)[回复]
恕我直言,维基的译名本身已经是违背原称的原创研究,如有哪些语言学术语翻译得并不恰当? - 知乎所述,维基目前许多Unicode區段名称翻译完全是“原创研究”的,例如不统一,有的是“文”有的是“字母”有的是“文字”,甚至有“阿拉伯文字母”这种错误译名,而且Unicode划定的区段内从来都不全是“字母”或“文字”,比如第一个区段就有几十个非字母,不应译作“基本拉丁字母”(原名“Basic Latin”也不是这个意思)。又例如Old South Arabian与“阿拉伯字母”无关,Arabian不是Arabic(阿拉伯),不译作“古南阿拉伯字母”……私以为维基有必要建立类似这样的翻译对照表,以批量修改,如果不方便,至少建立重定向。观赏植物留言2023年12月13日 (三) 13:32 (UTC)[回复]
不是方不方便的问题,维基向来就是要收权威的二手资料,而不是自身创作。如果要创建类似WP:外语译音表的文字译名表、Unicode词汇对照表也可以,但是仍然需要有来源。现在的状态是一直没有靠谱来源、长期消极地容忍原创译名的结果。像现在提出来要改革了,那么这种潜在的容忍就被破坏了,so, ...--DvXg 📬 2023年12月25日 (一) 15:56 (UTC)[回复]
可能属于Wikipedia:可靠来源#采用在线或者作者自行发表的来源?如果能找到在相关技术或者学术上符合我们项目的可靠来源要求作为依据的话,或者可以考虑重新确定译名的问题?——Sakamotosan路过围观 | 避免做作,免敬 2023年12月14日 (四) 01:33 (UTC)[回复]
没理解你的意思。你仿佛在说维基的翻译是正确的(即便同一个页面上同一词的译文都没统一),而我请求的是“在线或者作者自行发表的来源”?可事实上也许刚好相反,至少维基这一块不正确、缺乏来源显然是无需赘述的吧。还是维基这一块编辑者过于业余,也是Unicode字符平面映射这页的Makasar“望加锡”,维基谁译作“玛卡莎”这么搞笑的译文放了几年都没人指出,还是我修正的,要让我提供来源,我只能回复“请问玛卡莎的来源”观赏植物留言2023年12月19日 (二) 06:44 (UTC)[回复]
意思是您可以指出条目中的内容有误或缺乏来源,以及建议改成什么,但您给出的依据仍然是非可靠来源,其他人可以据此再改成别的、用其他博客来源为据。WP:NRSNVNA是一种观点。维基数据没删[7]diff--YFdyh000留言2023年12月19日 (二) 07:10 (UTC)[回复]
是不是应该去条目版讨论?--落花有意12138 2023年12月16日 (六) 11:55 (UTC)[回复]
注意到 GB 18030GB/T 13000 均译作 「CJK统一汉字扩充A」到「CJK统一汉字扩充G」,此标准性文件当可认为非原创研究,且 GB/T 13000 实则可以理解为 Unicode / ISO/IEC10646 的官方翻译。
扩充与扩展的区分似不应过分强调,两可。或可考虑到称为“扩展X区”已是约定俗成,而取扩展一词。
现有翻译将“Extension”翻译为「扩展区」,将标号后置,实则确属问题。Block本身译作“区”、“块”、“区块”、“区段”,Block名称中实则不应当包含“区”字。即使为了交流的便利而添加,也应当作为后缀置于最末。--Kero9sene留言2023年12月24日 (日) 07:08 (UTC)[回复]
扩展x区确实是约定俗成了,可以理解为从CJK(狭义)区扩展出去。 ——魔琴 留言 贡献 新手2023计划 ] 2023年12月25日 (一) 09:59 (UTC)[回复]