用戶:Mrhso2014/普及區
本頁面有關 Wikipedia:Unicode擴展漢字。
在 ISO 10646,一個字符集,裏面有 CJKV 統一表意文字,收錄了喃字、簡化字、繁體字等。Unicode 與其保持同步。
中日韓越統一表意文字也有擴展區,一些生僻字、類推簡化在擴展區是有的,例如擴展 E 區就有「𬎆」。截至 2017 年,正式發佈的擴展區就有兼容擴展、擴展 A 區、擴展 B 區、擴展 C 區、擴展 D 區、擴展 E 區、擴展 F 區。
目前仍然有很多漢字沒有被收錄進 Unicode,關於漢字的收錄其實和 IRG 有關。
GB 18030 是一種特殊的 UTF,為了兼容 GB 2312 形成了詭異的排序。根據 Ishisashi 製作的 GB 18030 與 Unicode Code Point 的對應表,可以看出 GB 18030 的基本結構。
GB 18030 完全兼容 GB 2312,多數兼容 GBK。GB 18030 除了相對 GBK 映射到 PUA 的漢字映射有改變以及歐元的調整外,基本是兼容的。
GB 18030 的報批稿中同時有單字節和雙字節歐元,在正式版刪去。