User:Mrhso2014/普及區
本页面有关 Wikipedia:Unicode扩展汉字。
在 ISO 10646,一個字符集,裏面有 CJKV 统一表意文字,收錄了喃字、簡化字、繁體字等。Unicode 與其保持同步。
中日韓越統一表意文字也有擴展區,一些生僻字、類推簡化在擴展區是有的,例如擴展 E 區就有「𬎆」。截至 2017 年,正式發佈的擴展區就有兼容擴展、擴展 A 區、擴展 B 區、擴展 C 區、擴展 D 區、擴展 E 區、擴展 F 區。
目前仍然有很多汉字没有被收录进 Unicode,关于汉字的收录其实和 IRG 有关。
GB 18030 是一种特殊的 UTF,为了兼容 GB 2312 形成了诡异的排序。根据 Ishisashi 制作的 GB 18030 与 Unicode Code Point 的对应表,可以看出 GB 18030 的基本结构。
GB 18030 完全兼容 GB 2312,多数兼容 GBK。GB 18030 除了相对 GBK 映射到 PUA 的汉字映射有改变以及欧元的调整外,基本是兼容的。
GB 18030 的报批稿中同时有单字节和双字节欧元,在正式版删去。