国際化対応言語環境の利用ガイド

コード変換

Unicode ロケールがサポートされることにより、iconv(1)iconv(3C)sdtconvtool(1) を使って、多くの国の主なコードセット間のさまざまなコード変換を行うことができるようになります。

Solaris 9 環境では、ユーティリティ geniconvtbl によって、ユーザー定義のコード変換が行えます。geniconvtbl ユーティリティを使って作成したユーザー定義コード変換は、 iconv(1)iconv(3) の両方で使用できます。このユーティリティの詳細については、geniconvtbl(1)geniconvtbl(4) のマニュアルページを参照してください。

iconv(1)iconv_open(3C)sdtconvtool(1) に適用できる fromcodetocode の名前については、付録 A 「iconv コード変換」 の表を参照してください。iconv コード変換の詳細については、iconv(1)iconv_open(3C)iconv(3)iconv_close(3C)geniconvtbl(1)geniconvtbl(4)sdtconvtool(1) のマニュアルページを参照してください。利用可能なコード変換については、 iconv_en_US.UTF-8(5)iconv(5)iconv_ja(5) iconv_ko(5)iconv_zh(5)iconv_zh_TW(5) のマニュアルページを参照してください。 また、付録 A 「iconv コード変換」 も参照してください。


注 –

UCS-2、UCS-4、UTF-16、UTF-32 はすべて、Unicode 3.1 と ISO/IEC 10646-1:2000 規格で定義されているバイト順序マーク (BOM) 文字を認識する Unicode/ ISO/IEC 10646 表示書式です。ただし、この文字が文字ストリームの最初の位置になければなりません。UCS-2BE、UCS-4BE、UTF-16BE、UTF-32BE など他の書式はすべて、BOM 文字を認識しない固定幅の Unicode/ISO/IEC 10646 表示書式です。この書式のバイト順序は、ビッグエンディアンであるとみなされます。一方、UCS-2LE、UCS-4LE、UTF-16LE、UTF-32LE などの表示書式のバイト順序はリトルエンディアンであるとみなされます。また、これらの表示書式も、BOM 文字を認識しません。

対応する ISO8859–* や KO18–* のスクリプトや言語については、http://czyborra.com/charsets/iso8869.html を参照してください。