国际语言环境指南

代码转换

Unicode 语言环境支持通过 iconv(1)iconv(3C)sdtconvtool(1) 在多个国家/地区的主要代码集之间增加了各种代码转换。

在 Solaris 9 环境下,公用程序 geniconvtbl 可启用用户定义的代码转换。用 geniconvtbl 公用程序创建的用户定义代码转换可以同时用于 iconv(1) 和 iconv(3)。 有关该公用程序的详细信息,请参考 geniconvtbl( 1) geniconvtbl( 4) 手册页。

附录 A,iconv 代码转换 中的表中显示了可应用于iconv(1)、iconv_open (3C) 和 sdtconvtool(1) 的可用 fromcodetocode 名称。 有关 iconv 代码转换的详细信息,请参见 iconv( 1)iconv_open(3C)iconv(3C)iconv_close(3C) geniconvtbl(1) geniconvtbl(4) sdtconvtool(1) 手册页。 有关可用代码转换的详细信息,请参见 iconv_en_US.UTF-8(5)、iconv(5)、iconv_ja (5)、iconv_ko(5)、iconv_zh(5) 和 iconv_zh_TW(5) 手册页。 另见 附录 A,iconv 代码转换


注意:

UCS-2、UCS-4、UTF-16 和 UTF-32 均为 Unicode/ ISO/IEC 10646 表示形式,用于当 Unicode 3.1 和 ISO/IEC 10646-1:2000 标准定义的 Byte Order Mark (BOM) 字符出现在字符流的开头时对这些字符加以识别。其它形式(如 UCS-2BE、UCS-4BE、UTF-16BE 和 UTF-32BE)均为固定宽度的 Unicode/ISO/IEC 10646 表示形式,它们不识别 BOM 字符,并且同样采用大尾数法字节排序。其它表示形式(如 UCS-2LE、UCS-4LE、UTF-16LE 和 UTF-32LE)将采用小尾数法字节排序。它们也不识别 BOM 字符。

有关 ISO8859–* 和 KO18–* 的关联语言 (script) 和语言的信息,请参见 http://czyborra.com/charsets/iso8869.html。