Unicode 官方中文名称为统一码,是计算机科学领域的业界标准。它整理、编码了世界上大部分的文字系统,使得电脑可以用更为简单的方式来呈现和处理文字。
Unicode 14.0 Beta 日前已经对外公布,而 14.0 正式版本的字符库、码表和附件将于 2021 年 9 月 14 日发布。Unicode 14.0 增加了 838 个字符,目前总字符数来到了 144,697 个;这些新增的内容中还包括 5 个新的字母表,总字母表数量目前共有 159 个;以及新增了 37 个表情符号。
14.0 版中的新字母表和字符增加了对世界上较少使用的语言和独特的书面要求的支持,新的字母表和字符包括:
- Toto,用于书写位于不丹附近的印度 Toto 语;
- Cypro-Minoan,一种主要用于塞浦路斯岛的未破译的历史文字;
- Vithkuqi,一种用于书写阿尔巴尼亚语的历史文字;
- 古维吾尔语,一种在中亚和其他地区用于书写突厥语、汉语、蒙古语、藏语和阿拉伯语的历史文字;
- 坦桑语,一种现代文字,用于书写印度和缅甸的坦桑语;
- 许多用于扩展 IPA 的拉丁文新增内容;
- 用于书写非洲、伊朗、巴基斯坦、马来西亚、印度尼西亚、爪哇和波斯尼亚的语言的阿拉伯文字;
- 其他字符的添加,支持菲律宾、北美、印度和蒙古的语言;
流行的符号:
- 新增37 个 Emoji 字符(见下图);
其他增加的符号包括:
- 吉尔吉斯共和国使用的索姆货币符号;
- Znamenny 音乐符号用于书写 Znamenny Chant,这是一种在公元 11 世纪在俄罗斯发展起来的礼仪唱法。它源于早期的拜占庭音乐符号;
对较少使用的语言和学术工作的额外支持得到了扩展,包括:
- 阿洪语、巴厘语、婆罗米语、加拿大原住民语言(UCAS)、格拉戈里特语、凯蒂语、卡纳达语、蒙古语、他加禄语、塔克里语和泰卢固语;
更多关于 Unicode 14.0 版的详细情况,可以查看官方说明:https://www.unicode.org/versions/Unicode14.0.0/