コード変換 (iconv)
iconv(3) および iconv(1) を通して利用できるコード変換に以下のコードセットが追加されました。
入力側コードセット | 出力側コードセット |
UTF-8 |
ISO-2022-JP
|
ISO-2022-JP |
UTF-8
|
eucJP |
UTF-8-Java
|
UTF-8-Java |
eucJP
|
PCK |
UTF-8-Java
|
UTF-8-Java |
PCK
|
eucJP
| ISO-2022-JP.RFC1468 |
PCK
|
ISO-2022-JP.RFC1468
|
UTF-8
|
ISO-2022-JP.RFC1468
|
eucJP
|
ibmj-EBCDIK
|
ibmj-EBCDIK
|
eucJP
|
PCK
|
ibmj-EBCDIK
|
ibmj-EBCDIK
|
PCK
|
上記コードセット名のうち Solaris 2.6 で使われていないものは次のとおりです。
入力側コードセット | 出力側コードセット |
UTF-8-Java |
このコードセットと他のコードセットとの間の変換では JDK 内の対応するコード変換クラスと同様の変換を行う
|
ISO-2022-JP.RFC1468 |
RFC (Request For Comments) 1468 で定義されている ISO-2022-JP コードセットで、以下の点を除き ISO-2022-JP と同じ。このコードセットへの変換では JIS X 0201 のカタカナ (半角カタカナ) は JIS X 0208 のカタカナ (全角カタカ) で置き換えられ、また、以下の文字は置換文字で置き換えられる
-
JIS X 0212 (補助漢字)
-
ベンダー定義文字
-
ユーザー定義文字
|
ibmj-EBCDIK
|
IBM ホストコードの 1 バイトコードセット (SBCS) に、一般に EBCDIK と呼ばれるコードセットと同じ文字セットを割り当てる。この文字セットは IBM のコードページ 290 に ''' (0x79) '{' (0xc0) '}' (0xd0) の 3 文字を加えたもので、カタカナ文字を含むが英小文字は含まない。2 バイトコードセット (DBCS) に関してはコードセット名 ibmj の場合と同じ
|