美国国家标准协会 (American National Standards Institute) 的缩写。ANSI 提议不同计算语言的标准定义。由 ANSI C X3J11 委员会所准备的最新的 C 语言标准,包括了国际化过程所需的用于计算处理多字节字符的库功能块以及可以处理四字节字符的新的数据类型 wchar_t。该标准尚未完成,因而被称为"建议的 ANSI C 标准",或 ANSI C-X3J11。
美国信息交换标准代码 (American Standard Code for Information Interchange) 的缩写。七位代码包括英文大小写字母、标点符号、数字和控制代码。每个字节中的第八码位在不同的应用程序中被用于奇偶校验、通讯和信息传输协议、数据压缩或其他的用途。打算作国际化的应用程序不能使用这一码位,如果这些程序准备使用多代码集或多字节字符,以及可以处理多代码集或多字节字符的工具。
在简体中文 Solaris 文档集中,种类与本地化关联。一个种类是一个国家的语言表现形式和文化惯例的一个部分。例如日期在美国通常表示为月,日,年,而在另一国家里日期可能被表示为日,月,年。日期和时间可被认为是一种地方语言的一个种类。种类也指程序的种类、与种类相关的环境变量、以及相应于每一种类的 ANSI 本地化列表。
字符集被定义为用于组织、控制或表现数据的元素集。字符集可由字母 、表意文字或其他单元所组成。这看来似乎有些开放,但字符集可包含其他字 符集,这就使得界限不那么清楚。
也称编码字符集,这是一组明确规则,它建立字符集,并在字符集每个字符及其位表示之间建立一一对应关系。例如,英文字符集 (包括标点和数字) 可以按以下方式映射到 ASCII 代码集:每个字符对应唯一的一个位代码,且没有一个位代码对应于一个以上的字符。
扩展 UNIX 代码 (Extended UNIX Code)。描述 ISO-2022 的四个代码集模型。每一代码集可以包含一个或多个不同的字符集,如 KS C 5601 中的 Hangul 和 Hanja 字符集。四个代码集分别被称为代码集 0、代码集 1、代码集 2 和代码集 3。在此文本里,有时简称它们为 cs0、cs1、cs2 和 cs3。其他国际文献有时称这些集为 g0、g1、g2 和 g3。代码集 0 也称为主代码集,代码集 1、代码集 2 和代码集 3 称为补充代码集。在韩文和中文版的 EUC 代码里,主代码集 (cs0) 包含 ASCII 并且其最高位为零。
国际标准化组织 (International Standards Organization) 的缩写。这一组织由许多专业协会和公司所组成,对于有关国际化的事项作出研究和建议。ISO 2022 提议并描述扩展 UNIX 代码。其他的 ISO 倡议包括欧洲 8 位代码和国际化通讯协议等。
一个语言环境描述一个语言或文化的环境。其设置值影响到显示或对于与语言相关的特性的使用。简体中文 Solaris 软件为美国提供 C,为简体中文提供 zh。
用于计算机环境的可移植式操作系统 (Portable Operating System for Computer Environments) 的缩写。一个由七个委员会组成的 IEEE 标准群,为 UNIX 的标准化和国际化创造文档。POSIX 文档 1003.1 描述系统内核和系统调用。文档 1003.2 描述 C shell 和标准库。另外五个文档描述实时计算、通讯和网络和其他的事项。
Unicode Consortium 所开发的国际化字符集和编码方法。
一种定常宽度、四字节代码,在亚洲版 Solaris 文档中称为 WC,其对于 EUC 代码的内部表示使用新的 ANSI-C 数据类型 wchar_t。尽管 EUC 并没有对补充代码集的大小作出限制 (代码集 0 总是一个字节),WC 指定一个字符为四字节。如果环境主要是 ASCII,四字节的标准化占用的内存空间比所必要的多,不过这样的标准化加速了对于混合字符组成的字符串的处理过程。第 1000 个字符总是开始于第 4000 字节 (第 0 个字符开始于第 0 字节)。这有助于应用程序使用任何类型索引方法的情形。
X/Open 开始时是一个由欧洲、美国和亚洲的国际 UNIX 厂家所组成的联合组织。现在它已成为主要的标准组织之一,与 POSIX 和 ANSI 等平分秋色。是 X/Open System Interface Portability Guide (X/Open 系统界面可移植性指南) 的发行者。