Sun Studio 12:C 用户指南

6.7.1 亚洲语言需要多字节字符

亚洲语言计算机环境的主要难点在于,I/O 需要大量的表意字符。为了适用于通常的计算机体系结构约束,这些表意字符被编码为字节序列。相关的操作系统、应用程序和终端将这些字节序列理解为单个表意字符。此外,所有这些编码都允许将常规单字节字符与表意字符字节序列混杂在一起。识别不同表意字符的难度取决于使用的编码方案。

无论使用什么编码方案,ISO C 均将术语“多字节字符”定义为表示为表意字符编码的字节序列。所有多字节字符都是“扩展字符集”的成员。常规的单字节字符仅仅是多字节字符的特殊情形。对编码的唯一要求是多字节字符不能将空字符用作它的编码的一部分。

ISO C 指定程序注释、字符串文字、字符常量和头文件名均为多字节字符序列。