简体中文 Solaris 用户指南

词汇表

ANSI

美国国家标准协会(American National Standards Institute)的缩写。ANSI提议不同计算语言的标准定义。由ANSI C X3J11委员会所准备的最新的C语言标准,包括了国际化过程所需的用于计算处理多字节字符的库功能块以及可以处理四字节字符的新的数据类型wchar_t。该标准尚未完成,因而被称为"建议的ANSI C标准",或ANSI C-X3J11。

ASCII

美国信息交换标准代码(American Standard Code for Information Interchange)的缩写。七位代码包括英文大小写字母、标点符号、数字和控制代码。每个字节中的第八码位在不同的应用程序中被用于奇偶校验、通讯和信息传输协议、数据压缩或其它的用途。打算作国际化的应用程序不能使用这一码位,如果这些程序准备使用多代码集或多字节字符,以及可以处理多代码集或多字节字符的工具。

EUC

扩展UNIX代码(Extended UNIX Code)。描述ISO-2022的四代码集模型。每一 代码集可以包含一个或多个不同的字符集,如KS C 5601中的Hangul和Hanja字符集。 四个代码集分别被称为代码集0、代码集1、代码集2和代码集3。在此文本里,有时简称它们为cs0、cs1、cs2和cs3。其他国际文献有时称这些集为g0、g1、g2和g3。代码集0也称为主代码集,代码集1、代码集2和代码集3称为补充代码集。在韩文和中文版的EUC代码里,主代码集(cs0)包含ASCII并且其最高位为零。

ISO

国际标准化组织(International Standards Organization)的缩写。这一组织由许多专业协会和公司所组成,对于有关国际化的事项作出研究和建议。ISO 2022提议并描述扩展UNIX代码。其它的ISO倡议包括欧州8位代码和国际化通讯协议等。

POSIX

用于计算机环境的可移植式操作系统(Portable Operating System for Computer Environments)的缩写。一个由七个委员会组成的IEEE标准群,为UNIX的标准化和国际化创造文档。POSIX文档1003.1描述系统内核和系统调用。文档1003.2描述C shell和标准库。另外五个文档描述实时计算、通讯和网络和其它的事项。

Unicode

Unicode Consortium所开发的国际化字符集和编码方法。

X/Open

X/Open开始时是一个由欧州、美国和亚洲的国际UNIX厂家所组成的联合组织。现在它已成为主要的标准组织之一,与POSIX和ANSI等平分秋色。是X/Open System Interface Portability Guide (X/Open系统界面可移植性指南)的发行者。

代码集

也称为代码化字符集,这是一套不含糊的规则建立起一个字符集,以及该字符集中的每一字符和该字符的位码表示法之间的一一对应关系。例如英文字符集,包括标点符号和数字,可以映射到ASCII代码集,其映射方式使每一字符仅相应于一个代码而且没有一个代码代表多于一个的字符。

宽字符代码(WC)

一种定常宽度、四字节代码,在亚洲版Solaris文档中称为WC,其对于EUC代码的内部表示使用新的ANSI-C数据类型wchar_t。尽管EUC并没有对补充代码集的大小作出限制(代码集0总是一个字节),WC指定一个字符为四字节。如果环境主要是ASCII,四字节的标准化占用的内存空间比所必要的多,不过这样的标准化加速了对于混合字符组成的字符串的处理过程。第1000个字符总是开始于第4000字节(第0个字符开始于第0字节)。这有助于应用程序使用任何类型索引方法的情形。

类别

在简体中文Solaris文档集中,类别与本地化关联。一个类别是一个国家的语言表现形式和文化惯例的一个部分。例如日期在美国通常表示为月,日,而在另一国家里日期可能被表示为。日期和时间可被认为是一种地方语言的一个类别。类别也指程序的类别、与类别相关的环境变量、以及相应于每一类别的ANSI本地化列表。

语言环境

一个语言环境描述一个语言或文化的环境。其设置值影响到显示或对于与语言相关的特性的使用。简体中文Solaris软件为美国提供C,为简体中文提供zh

字符集

字符集被定义为用于组织、控制或表现数据的元素集。字符集可由字母、表意文字或其它单元所组成。这看来似乎有些开放,但字符集可包含其它字符集,这就使得界限不那么清楚。