跳转到内容

Unicode数字

维基百科,自由的百科全书

数字符号(又称Unicode数字)表示一个数字的字符和字符序列。相同的阿拉伯文数字广泛用于全球多种书写系统,它们使用相同的表数语义,但是在不同的书写系统之间,表示这些数字的字母存在较大差异。为了支持这些字母的差异,Unicode将这些数字编码包含在许多书写系统区块之中。小数在23个独立的块中重复:在阿拉伯مرات باللغة العربية中出现2次。六个附加的块还以富文本形式包含了数字,其主要是作为一个专门的数字使用的字母面板。除了各种阿拉伯语数字外,Unicode还包含了一下不常见的数字,例如:爱琴海数字、罗马数字、计数杆数字、楔形文字数字和古希腊数字。

数字符号总是会涉及字形的合成,有限数量的字符组合成为其他的数字符号。例如在阿拉伯语数字中9-9-0序列组成了数字九百九十(990)。在罗马数字中,相同的数字表示为数字符号Ⅹↀ或ⅩⅯ。它们是表示相同抽象数字的不同数字符号。数字符号的语义在其特定的组合中是不同的。阿拉伯语小数是位置-值的组合,而罗马数字是符号-值的组合并且根据其组合增减。

数字符号的数字属性

按照在文本使用的数字属性分组,Unicode有四个数值类型值。首先是“非数字(not a number)”类型。其次是十进制底数数字符号,通常用于西式数字(普通0-9),也可以是非十进制系统的数字,如罗马数字,和经过排版的十进制数,如环绕数字。

数字类型(Unicode字符属性)
数字类型 代码 有数字值 示例 备注
非数字 None
  • A X(拉丁与) α ! [ § À Д μ に 晓 와
数字值="NaN"
十进制数字 De
  • 0 1 9 ६(梵文字母6) ೬(坎那达语6) 𝟨(数学符号,无衬线字体)
直接数字(十进制底数)。对应两种方式,通用类型=Nd
十进制表意文字 Di
    • ¹(上标) ① ⒈(有句号的数字)
十进制,但经过排版
数字 Nu
    • ¾ ௰(泰米尔语数字十) Ⅹ(罗马数字符号) 六(汉数字6) 壹(汉语,用于会计时的值1)
数字值,但并非十进制底数

十六进制数

Unicode的十六进制数并非单独字符,而是使用现有的字母和数字。这些字符的字符属性标为Hex_digit=Yes,某些字符还标记了ASCII_Hex_digit=Yes。

标记了Hex_Digit=Yes的Unicode字符
0123456789ABCDEF 基本拉丁文、大写 同时ASCII_Hex_Digit=Yes
0123456789abcdef 基本拉丁文、小写 同时ASCII_Hex_Digit=Yes
0123456789ABCDEF 全角形式、大写
0123456789abcdef 全角形式、小写

不同文字的数字符号

阿拉伯数字

小数

十进制小数

无理数、集合和其他常量的字符

富文本和其他兼容数字符号

中日韩花码数字符号numerals

Unicode中的花码数字符号

日语和韩语数字符号

古希腊数字

罗马数字

算筹

Unicode 5.0 开始,在多文种补充平面中增加了一个区块用于算筹数字。其包含九个“水平向”数字(U+1D360 到 U+1D368)和九个“垂直向”数字(U+1D369 到 U+1D371),水平向数字用于奇数次幂的位置,而垂直向数字用于偶数次幂的位置。而零则用 U+3007 (〇, ideographic number zero) 来表示,负数符号则使用 U+20E5 (combining reverse solidus overlay)。[1]

算筹数字
Counting Rod Numerals[1][2]
Unicode Consortium 官方码表(PDF)
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1D36x 𝍠 𝍡 𝍢 𝍣 𝍤 𝍥 𝍦 𝍧 𝍨 𝍩 𝍪 𝍫 𝍬 𝍭 𝍮 𝍯
U+1D37x 𝍰 𝍱 𝍲 𝍳 𝍴 𝍵 𝍶 𝍷 𝍸
注释
1.^ 依据 Unicode 14.0
2.^ 灰色区域表示未分配的码位

引用

  1. ^ The Unicode Standard, Version 5.0 – Electronic edition (PDF), Unicode, Inc.: 499–500, 2006 [2013-02-18], (原始内容存档 (PDF)于2023-08-03)