コード変換 (iconv)
iconv(3) および iconv(1) を通して利用できるコード変換に以下のものが追加されました。
|
(入力側コードセット)
|
(出力側コードセット)
|
|
UTF-8
|
ISO-2022-JP
|
|
ISO-2022-JP
|
UTF-8
|
|
eucJP
|
UTF-8-Java
|
|
UTF-8-Java
|
eucJP
|
|
PCK
|
UTF-8-Java
|
|
UTF-8-Java
|
PCK
|
|
eucJP
|
ISO-2022-JP.RFC1468
|
|
PCK
|
ISO-2022-JP.RFC1468
|
|
UTF-8
|
ISO-2022-JP.RFC1468
|
|
eucJP
|
ibmj-EBCDIK
|
|
ibmj-EBCDIK
|
eucJP
|
|
PCK
|
ibmj-EBCDIK
|
|
ibmj-EBCDIK
|
PCK
|
上記コードセット名のうち Solaris 2.6 で使われていないものは以下のとおりです。
|
(コードセット名)
|
(概要)
|
|
UTF-8-Java
|
このコードセットと他のコードセットとの間の変換では JDK 内の対応するコード変換クラスと同様の変換を行う。
|
|
ISO-2022-JP.RFC1468
|
RFC (Request For Comments) 1468 で定義されている ISO-2022-JP コードセットで、以下の点を除き ISO-2022-JP と同じ。このコードセットへの変換では JIS X 0201 のカタカナ (半角カタカナ) は JIS X 0208 のカタカナ (全角カタカナ) で置き換えられ、また、以下の文字は置換文字で置き換えられる。
-
JIS X 0212 (補助漢字)
-
ベンダー定義文字
-
ユーザー定義文字
|
|
ibmj-EBCDIK
|
IBM ホストコードの 1 バイトコードセット (SBCS) に、一般に「EBCDIK」と呼ばれるコードセットと同じ文字セットを割り当てる。この文字セットは IBM の コードページ 290 に '`' (0x79) '{' (0xc0) '}' (0xd0) の 3 文字を加えたもので、カタカナ文字を含むが英小文字は含まない。2 バイトコードセット (DBCS) に関してはコードセット名 「ibmj」の場合と同じ。
|