私人使用區
私人使用區 Private Use Area | |
---|---|
範圍 | U+E000..U+F8FF (6,400個碼位) |
平面 | 基本多文種平面(BMP) |
文字 |
|
已分配 | 6,400個碼位 |
未分配 | 0個保留碼位 |
統一碼版本歷史 | |
1.0.0 | 5,632 (+5,632) |
1.0.1 | 6,400 (+768) |
註釋:Unicode 1.0.1 版移動並擴充了私人使用區。 (1.0.0 版中曾位於 U+E800-U+FDFF。)[1][2][3] |
補充私人使用區-A | |
---|---|
範圍 | U+F0000..U+FFFFD (65,534個碼位) |
平面 | 私人使用區-A |
文字 | 未知 |
已分配 | 65,534個碼位 |
未分配 | −2個保留碼位 2個非字元 |
統一碼版本歷史 | |
2.0 | 65,534 (+65,534) |
註釋:[2][3] |
補充私人使用區-B | |
---|---|
範圍 | U+100000..U+10FFFD (65,534個碼位) |
平面 | 私人使用區-B |
文字 | 未知 |
已分配 | 65,534個碼位 |
未分配 | −2個保留碼位 2個非字元 |
統一碼版本歷史 | |
2.0 | 65,534 (+65,534) |
註釋:[2][3] |
在Unicode中,私人使用區(英語:Private Use Areas,PUA)指其解釋未在Unicode標準中指定,而是由合作用戶之間的私人協定決定其用途的一系列碼位。[4] 目前定義了三個私人使用區:一個在基本多語言平面(U+E000-U+F8FF)中,另外兩個幾乎包含了整個第15和第16平面(分別為U+F0000-U+FFFFD,U+100000-U+10FFFD)。[5]
私人使用區字元的分配,可以不由字面意義上的「私人」決定。一些組織已經發佈了一些分配計劃。但根據其定義,私人使用區相同的代碼點可分配為不同的字元,因此使用某種字型的用戶看到其顯示為一種形態,但使用其它字型的用戶看到的字元可能完全不同。
使用實例
- 中國國家標準 GB/T 20542-2006(「藏文編碼字元集擴充A」)和 GB/T 22238-2008(「藏文編碼字元集擴充B」)使用私人使用區存放藏文連字。
- GB 18030和GBK使用私人使用區臨時編碼Unicode標準之外的字元。
- 愛沙尼亞語言研究院使用私人使用區編碼Unicode標準未收錄的拉丁字母和西里爾字母。[6]
- 機讀編目格式標準MARC 21使用私人使用區編碼未被Unicode收錄的東亞字元。
- 美國國際語言暑期學院使用私人使用區編碼Unicode標準未收錄的語言中的字元。
分配
Unicode 私人使用區 | ||||
---|---|---|---|---|
按字元屬性定義: General Category=Co [a][b]
| ||||
範圍 | 平面 | 區塊名 | 碼位總數 | 註釋 |
U+E000..U+F8FF | 基本多語言平面 | 私人使用區 Private Use Area |
6,400 | |
U+F0000..U+FFFFD[c] | 第15平面[d] | 補充私人使用區-A Supplementary Private Use Area-A |
65,534 | UTF-16使用在基本多文種平面中的高半私人代用區(U+DB80..U+DBFF)編碼這些字元。 |
U+100000..U+10FFFD[c] | 第16平面[d] | 補充私人使用區-B Supplementary Private Use Area-B |
65,534 | |
註釋
|
參見
參考
- ^ Unicode 1.0.1 Addendum (PDF). The Unicode Standard. 1992-11-03 [2022-07-09]. (原始內容 (PDF)存檔於2022-07-02).
- ^ 2.0 2.1 2.2 Unicode character database. The Unicode Standard. [2022-07-09]. (原始內容存檔於2016-03-12).
- ^ 3.0 3.1 3.2 Enumerated Versions of The Unicode Standard. The Unicode Standard. [2021-07-09]. (原始內容存檔於2022-12-25).
- ^ Unicode Consortium. Glossary of Unicode Terms: "Private Use Area (PUA)" (頁面存檔備份,存於互聯網檔案館)
- ^ Chapter 16: Special Areas and Format Characters (PDF). The Unicode Standard. Unicode Consortium. [2021-03-19]. (原始內容 (PDF)存檔於2022-01-17).
- ^ Letter Database. Eki.ee. [2013-04-11]. (原始內容存檔於2018-05-21).