Unicode 语言环境支持通过 iconv(1)、iconv(3C) 和 sdtconvtool(1) 在多个国家/地区的主要代码集之间增加了各种代码转换。
在 Solaris 9 环境下,公用程序 geniconvtbl 可启用用户定义的代码转换。用 geniconvtbl 公用程序创建的用户定义代码转换可以同时用于 iconv(1) 和 iconv(3)。 有关该公用程序的详细信息,请参考 geniconvtbl( 1) 和 geniconvtbl( 4) 手册页。
附录 A,iconv 代码转换 中的表中显示了可应用于iconv(1)、iconv_open (3C) 和 sdtconvtool(1) 的可用 fromcode 和 tocode 名称。 有关 iconv 代码转换的详细信息,请参见 iconv( 1)、iconv_open(3C)、iconv(3C)、iconv_close(3C)、 geniconvtbl(1) geniconvtbl(4) 和 sdtconvtool(1) 手册页。 有关可用代码转换的详细信息,请参见 iconv_en_US.UTF-8(5)、iconv(5)、iconv_ja (5)、iconv_ko(5)、iconv_zh(5) 和 iconv_zh_TW(5) 手册页。 另见 附录 A,iconv 代码转换。
UCS-2、UCS-4、UTF-16 和 UTF-32 均为 Unicode/ ISO/IEC 10646 表示形式,用于当 Unicode 3.1 和 ISO/IEC 10646-1:2000 标准定义的 Byte Order Mark (BOM) 字符出现在字符流的开头时对这些字符加以识别。其它形式(如 UCS-2BE、UCS-4BE、UTF-16BE 和 UTF-32BE)均为固定宽度的 Unicode/ISO/IEC 10646 表示形式,它们不识别 BOM 字符,并且同样采用大尾数法字节排序。其它表示形式(如 UCS-2LE、UCS-4LE、UTF-16LE 和 UTF-32LE)将采用小尾数法字节排序。它们也不识别 BOM 字符。
有关 ISO8859–* 和 KO18–* 的关联语言 (script) 和语言的信息,请参见 http://czyborra.com/charsets/iso8869.html。