国际语言环境指南

代码转换

Unicode 语言环境通过 iconvsdtconvtool 实用程序,增加了对在多个国家/地区的主要代码集之间进行各种代码转换的支持。

在当前 Solaris 环境中,实用程序 geniconvtbl 可启用用户定义的代码转换。使用 geniconvtbl 实用程序创建的用户定义代码转换可以同时用于 iconv(1) 和 iconv(3)。有关该实用程序的详细信息,请参阅 geniconvtbl(1) 和 geniconvtbl(4) 手册页。

附录 A,iconv 代码转换 中的表中列出了可应用于iconviconv_opensdtconvtoolfromcodetocode 名称。有关 iconv 代码转换的更多信息,请参见 iconv(1)sdtconvtool(1) 手册页。有关可用代码转换的更多信息,请参见 iconv(5) 手册页。另请参见附录 A,iconv 代码转换


注意 –

UCS-2、UCS-4、UTF-16 和 UTF-32 均为 Unicode/ ISO/IEC 10646 表示形式,用于当 Unicode 4.0 和 ISO/IEC 10646-1:2000 标准定义的 Byte Order Mark (BOM) 字符出现在字符流开头时对这些字符加以区别。其他形式(如 UCS-2BE、UCS-4BE、UTF-16BE 和 UTF-32BE)为固定宽度的 Unicode/ISO/IEC 10646 表示形式,它们不识别 BOM 字符,并且同样采用大尾数法字节排序。其他表示形式(如 UCS-2LE、UCS-4LE、UTF-16LE 和 UTF-32LE)将采用小尾数法字节排序。这些形式也不识别 BOM 字符。

有关 ISO8859-* 和 KO18-* 的关联脚本和语言的信息,请参见 http://czyborra.com/charsets/iso8869.html