国際化対応言語環境の利用ガイド

コード変換

en_US.UTF-8 ロケールは、iconv(1) および iconv(3) により、いくつかの国の主なコードセット間のコード変換をサポートしています。


注 -

Solaris 8 環境では、ユーティリティ geniconvtbl によって、ユーザー定義のコード変換が行えます。geniconvtbl ユーティリティを使って作成したユーザー定義コード変換は、iconv(1) と iconv(3) の両方で使用できます。このユーティリティの詳細については、geniconvtbl(1) と geniconvtbl(4) のマニュアルページを参照してください。


iconv(1) と iconv_open(3) に適用できる利用可能な fromcodetocode の名前は、以下の表に表示されています。iconv コード変換の詳細については、iconv(1) および iconv_open(3)、iconv(3)、iconv_close(3) のマニュアルページを参照してください。利用可能なコード変換に関する情報については、iconv_en_US.UTF-8(5) を参照してください。

また、付録 A 「iconv コード変換」 も参照してください。


注 -

UCS-2、UCS-4、UTF-16 は、Unicode 3.0 と ISO/IEC10646-1:1999 の規格で定義されたバイト順序マーク (BOM) を認識するすべての固定幅 Unicode/ISO/IEC 10646 表示書式です。UCS-2BE、UCS-4BE、UTF-16BE のような他の書式は、BOM 文字を認識せず、Big Endian バイト順序を仮定する、すべての固定幅 Unicode/ISO/IEC 10646 表示書式です。一方、UCS-2LE、UCS-4LE、UTF-16LE のような表示書式は、Little Endian バイト順序を仮定します。また、これらの表示書式も、BOM 文字を認識しません。



注 -

ISO 8859-* と KOI8-* の関連スクリプトおよび言語については、http://czyborra.com/charsets/iso8859.html を参照してください。