名前 | 機能説明 | eucJP から PCK (SJIS)・PCK (SJIS) から eucJP | eucJP から ISO–2022–JP (JIS7)・ISO–2022–JP (JIS7) から eucJP | eucJP から ISO–2022–JP.RFC1468 | eucJP から jis・jis から eucJP | eucJP から UTF–8・UTF–8 から eucJP | eucJP から UTF–8–Java・UTF–8–Java から eucJP | eucJP から ibmj・ibmj から eucJP | eucJP から ibmj-EBCDIK・ibmj-EBCDIK から eucJP | PCK (SJIS) から ISO–2022–JP・ISO–2022–JP から PCK (SJIS) | PCK (SJIS) から ISO–2022–JP.RFC1468 | PCK (SJIS) から UTF–8・UTF–8 から PCK (SJIS) | PCK (SJIS) から UTF–8–Java・UTF–8–Java から PCK (SJIS) | PCK (SJIS) から jis・jis から PCK (SJIS) | PCK (SJIS) から ibmj・ibmj から PCK (SJIS) | PCK から ibmj-EBCDIK・ibmj-EBCDIK から PCK | ISO–2022–JP から UTF–8・UTF–8 から ISO–2022–JP | UTF–8 から ISO–2022–JP.RFC1468 | eucJP,PCK,UTF–8 から ibm930,ibm931,ibm939,ibm5026,ibm5035 | ibm930,ibm931,ibm939,ibm5026,ibm5035 から eucJP,PCK,UTF–8 | ms932 から UTF–8・UTF–8 から ms932 | UTF–8 から UTF–8–ms932・UTF–8–ms932 から UTF–8 | 関連項目
ja ロケールでは、以下のコードセット変換が可能です。
サポートしているコードセット変換 | |
変換元文字集合 | 変換先文字集合 |
eucJP | PCK |
eucJP | ISO-2022-JP |
eucJP | ISO-2022-JP.RFC1468 |
eucJP | JIS7 |
eucJP | SJIS |
eucJP | UTF-8 |
eucJP | UTF-8-Java |
eucJP | jis |
eucJP | ibmj |
eucJP | ibmj-EBCDIK |
SJIS | eucJP |
SJIS | ISO-2022-JP |
SJIS | UTF-8 |
SJIS | jis |
SJIS | ibmj |
PCK | eucJP |
PCK | UTF-8 |
PCK | UTF-8-Java |
PCK | ISO-2022-JP |
PCK | ISO-2022-JP.RFC1468 |
PCK | jis |
PCK | ibmj |
PCK | ibmj-EBCDIK |
ISO-2022-JP | eucJP |
ISO-2022-JP | PCK |
ISO-2022-JP | SJIS |
ISO-2022-JP | UTF-8 |
UTF-8 | eucJP |
UTF-8 | SJIS |
UTF-8 | PCK |
UTF-8 | ISO-2022-JP |
UTF-8 | ISO-2022-JP.RFC1468 |
UTF-8-Java | eucJP |
UTF-8-Java | PCK |
JIS7 | eucJP |
jis | eucJP |
jis | PCK |
jis | SJIS |
ibmj | eucJP |
ibmj | PCK |
ibmj | SJIS |
ibmj-EBCDIK | eucJP |
ibmj-EBCDIK | PCK |
サポートしているコードセット変換 | |
変換元文字集合 | 変換先文字集合 |
eucJP | ibm930 |
eucJP | ibm931 |
eucJP | ibm939 |
eucJP | ibm5026 |
eucJP | ibm5035 |
PCK | ibm930 |
PCK | ibm931 |
PCK | ibm939 |
PCK | ibm5026 |
PCK | ibm5035 |
UTF-8 | ibm930 |
UTF-8 | ibm931 |
UTF-8 | ibm939 |
UTF-8 | ibm5026 |
UTF-8 | ibm5035 |
UTF-8 | ms932 |
UTF-8 | UTF-8-ms932 |
UTF-8-ms932 | UTF-8 |
ibm930 | eucJP |
ibm930 | PCK |
ibm930 | UTF-8 |
ibm931 | eucJP |
ibm931 | PCK |
ibm931 | UTF-8 |
ibm939 | eucJP |
ibm939 | PCK |
ibm939 | UTF-8 |
ibm5026 | eucJP |
ibm5026 | PCK |
ibm5026 | UTF-8 |
ibm5035 | eucJP |
ibm5035 | PCK |
ibm5035 | UTF-8 |
ms932 | UTF-8 |
上記の文字集合の意味は以下のとおりです。
符号化文字集合の意味 | |
文字集合名 | 意味 |
eucJP | 日本語 EUC |
PCK | PC 漢字 |
SJIS | PC 漢字と同じ (将来はなくなる予定) |
ISO-2022-JP | ISO 2022 情報交換用符号による G0 への指示機能を用いて UI/OSF 日本語環境実装規約 Version 1.1 の項目 7.1 の規定に従い表現された、ISO 646 IRV または JIS X 0201、JIS X 0208 、および JIS X 0212 |
JIS7 | ISO-2022-JP と同じ |
ISO-2022-JP.RFC1468 | ISO 2022 情報交換用符号による G0 への指示機能を用いて RFC1468 (Request for Comments: 1468 Japanese Character Encoding for Internet Messages) の規定に従い表現された、ISO 646 IRV または JIS X 0201-1976 (片仮名用図形キャラクタ集合を除く) および JIS X 0208-1983 |
jis | JLE、JFP 2.4 以前に提供されていた 7 ビット JIS コード |
ibmj | IBM 漢字コード |
ibmj-EBCDIK | IBM ホストコードの 1 バイトコードセット (SBCS) に、一般に「EBCDIK」と呼ばれるコードセットと同じ文字セットを割り当てる。この文字セットは IBM のコードページ 290 に '`' (0x79) 、'{' (0xc0) 、'}' (0xd0) の 3 文字を加えたもので、カタカナ文字を含むが英小文字は含まない。2 バイトコードセット (DBCS) に関してはコードセット名 「ibmj」の場合と同じ |
UTF-8 | UNI CODE |
UTF-8-Java | Java で実装されている UNICODE |
符号化文字集合の意味 | |
文字集合名 | 意味 |
ibm930 | IBM CCSID 930: SBSC コードページ 290 (拡張)、文字セット 1172、DBCS コードページ 300、文字セット 1001 ユーザー定義文字 4370 文字 |
ibm931 | IBM CCSID 931: SBSC コードページ 37、文字セット 101、DBCS コードページ 300、文字セット 1001 ユーザー定義文字 4370 文字 |
ibm939 | IBM CCSID 930: SBSC コードページ 1027、文字セット 1172、DBCS コードページ 300、文字セット 1001 ユーザー定義文字 4370 文字 |
ibm5026 | IBM CCSID 5026: ユーザー定義文字が 1880 文字である点以外は ibm930 と同じ |
ibm5035 | IBM CCSID 5035: ユーザー定義文字が 1880 文字である点以外は ibm939 と同じ |
ms932 | Windows NT 3.51 で使用されているシフト JIS コード。このコードセットと UTF-8 との間の変換では Windows NT 3.51 と同様の文字の対応を行う。 |
UTF-8-ms932 | ms932 から変換された UTF-8 表現の Unicode |
変換処理は、以下に示すように行われます。 各変換処理は変換元の文字集合に含まれるが、 変換先の文字集合に含まれない場合には、すべて「置換文字」に変換されて出力されます。
eucJP と PCK (SJIS) 間の変換は、 「TOG 日本語ベンダ協議会推奨日本語 EUC・シフト JIS 間コード変換仕様」 に基づいて JIS X 0201 、 JIS X 0208 、 JIS X 0212 とユーザーおよびベンダー定義文字が 変換可能です。変換元の文字集合に属さない入力データが与えられた 場合は、 iconv(3C) は errno に EILSEQ を設定して戻ります。 iconv(1) は、 最後に変換が成功した箇所で終了します。
eucJP と ISO–2022–JP (JIS7) 間の変換は、JIS X 0201、JIS X 0208、 JIS X 0212 の文字が変換可能です。変換元の文字集合に属さない入力 データが与えられた場合は、 iconv(3C) は errno に EILSEQ を設定して戻ります。 iconv(1) は、最後に変換が成功した箇所で終了します。
eucJP から ISO–2022–JP.RFC1468 への変換は、 JIS X 0201 ( 片仮名用図形キャラクタ集合を除く) および JIS X 0208 が変換可能です。 JIS X 0201 ( 片仮名用図形キャラクタ集合)、 JIS X 0212、 ユーザー定義文字およびベンダー定義文字が与えられた場合は置換文字 「?」(0x3f) に変換されます。 変換元の文字集合に属さない入力データが与えられた場合は、 iconv(3C) は errno に EILSEQ を設定して戻ります。 iconv(1) は、最後に変換が成功した箇所で終了します。
eucJP と jis 間の変換は、ujtojis7() および jis7touj() ライブラリと、euctojis および jistoeuc ユーティリティ との互換性を保つために 提供されますが、JIS X 0212 を扱えるように拡張されています。 jisconv(3X) および jistoeuc(1) を参照してください。
eucJP と UTF–8 間の変換は、JIS X 0201、JIS X 0208、JIS X 0212 とユーザーおよびベンダー定義文字が変換可能です。変換先の文字集合に対応する文字のない入力データが与えられた場合は、置換文字 (eucJP: 「?」(0x3f)、 UTF–8: U+FFFD (0xefbfbd)) に変換されます。変換元の文字集合に属さない入力データが与えられた場合は、iconv(3C) は errno に EILSEQ を設定して戻ります。 iconv(1) は、最後に変換が成功した箇所で終了します。
eucJP と UTF–8–Java 間の変換は、JIS X 0201、JIS X 0208、JIS X 0212 の文字が変換可能です。入力データとしてユーザー定義文字またはベンダー定義文字が与えられた場合は、置換文字 (eucJP: 「?」(0x3f)、UTF-8: U+FFFD (0xefbfbd)) に変換されます。変換元の文字集合に属さない入力データが与えられた場合は、iconv(3C) は errno に EILSEQ を設定して戻ります。 iconv(1) は、最後に変換が成功した箇所で終了します。
eucJP と ibmj 間の変換は、IBM 漢字コード一覧表 (第 4 版、1987 年 9 月)、JIS X 0201 および JIS X 0208–1983 に基づいています。eucJP から ibmj に変換する場合、JIS X 0201 カナおよび JIS X 0212 はすべて「置換文字」に変換されます。 ibmjcode(3X) を参照してください。
eucJP と ibmj-EBCDIK 間の変換は、IBM 漢字コード一覧表 (第 4 版、1987 年 9 月)、JIS X 0201 および JIS X 0208–1983 に基づいています。eucJP から ibmj-EBCDIK に変換する場合、ibmj-EBCDIK 側に対応する文字のない JIS X 0201 英小文字および JIS X 0212 文字はすべて「置換文字」に変換されます。
PCK (SJIS) と ISO–2022–JP 間の変換は、「TOG 日本語ベンダ協議会推奨日本語 EUC・シフト JIS 間コード変換仕様」 に基づいて、JIS X 0201、JIS X 0208、JIS X 0212 とユーザーおよびベンダー定義文字が 変換可能です。変換元の文字集合に属さない入力データが与えられた場合は、 iconv(3C) は errno に EILSEQ を設定して戻ります。 iconv(1) は、 最後に変換が成功した箇所で終了します。
PCK (SJIS) から ISO–2022–JP.RFC1468 への変換は、JIS X 0201 (片仮名用図形キャラクタ集合を除く) および JIS X 0208 が変換可能です。JIS X 0201 (片仮名用図形キャラクタ集合)、ユーザー定義文字およびベンダー定義文字が与えられた場合は置換文字 「?」(0x3f) に変換されます。変換元の文字集合に属さない入力データが与えられた場合は、 iconv(3C) は errno に EILSEQ を設定して戻ります。 iconv(1) は、最後に変換が成功した箇所で終了します。
PCK (SJIS) と UTF–8 間の変換は、JIS X 0201、JIS X 0208 とユーザー定義文字およびベンダー定義文字が変換可能です。変換先の文字集合に対応する文字のない入力データが与えられた場合は、置換文字 (PCK: 「?」(0x3f)、 UTF-8: U+FFFD (0xefbfbd)) に変換されます。変換元の文字集合に属さない入力データが与えられた場合は、iconv(3C) は errno に EILSEQ を設定して戻ります。 iconv(1) は、最後に変換が成功した箇所で終了します。
PCK (SJIS) と UTF–8–Java 間の変換は、JIS X 0201、JIS X 0208 の文字が変換可能です。入力データとしてユーザー定義文字またはベンダー定義文字が与えられた場合は、置換文字 (PCK: 「?」(0x3f)、UTF–8: U+FFFD (0xefbfbd)) に変換されます。変換元の文字集合に属さない入力データが与えられた場合は、iconv(3C) は errno に EILSEQ を設定して戻ります。 iconv(1) は、最後に変換が成功した箇所で終了します。
PCK (SJIS) と jis 間の変換は、sjtojis7() および jis7tosj() ライブラリと、sjtojis および jistosj ユーティリティ との互換性を保つために 提供されますが、「TOG 日本語ベンダ協議会推奨日本語 EUC・シフト JIS 間コード変換仕様」 に基づいて拡張されています。 jisconv(3X) および jistoeuc(1) を参照してください。
PCK (SJIS) と ibmj 間の変換は、IBM 漢字コード一覧表 (第 4 版、1987 年 9 月)、JIS X 0201 および JIS X 0208–1983 に基づいています。PCK (SJIS) から ibmj に変換する場合、0xa1 から 0xdf のカナ文字および 「TOG 日本語ベンダ協議会推奨日本語 EUC・シフト JIS 間コード変換仕様」 によって JIS X 0212 領域へ変換される文字はすべて「置換文字」に変換されます。 ibmjcode(3X) を参照してください。
PCK と ibmj-EBCDIK 間の変換は、IBM 漢字コード一覧表 (第 4 版、1987 年 9 月)、JIS X 0201 および JIS X 0208–1983 に基づいています。PCK から ibmj-EBCDIK に変換する場合、JIS X 0201 の英小文字および 「TOG 日本語ベンダ協議会推奨日本語 EUC・シフト JIS 間コード変換仕様」 によって JIS X 0212 領域へ変換される文字はすべて「置換文字」に変換されます。
ISO–2022–JP と UTF–8 間の変換は、 JIS X 0201、JIS X 0208、JIS X 0212 とユーザー定義文字およびベンダー定義文字が変換可能です。変換先の文字集合に対応する文字のない入力データが与えられた場合は、置換文字 (ISO–2022–JP: 「?」(0x3f)、UTF-8: U+FFFD (0xefbfbd)) に変換されます。変換元の文字集合に属さない入力データが与えられた場合は、 iconv(3C) は errno に EILSEQ を設定して戻ります。 iconv(1) は、最後に変換が成功した箇所で終了します。
UTF–8 から ISO–2022–JP.RFC1468 への変換は、JIS X 0201 (片仮名用図形キャラクタ集合を除く) および JIS X 0208 が変換可能です。JIS X 0201 (片仮名用図形キャラクタ集合)、JIS X 0212、ユーザー定義文字およびベンダー定義文字が与えられた場合は置換文字 「?」(0x3f) に変換されます。変換元の文字集合に属さない入力データが与えられた場合は、 iconv(3C) は errno に EILSEQ を設定して戻ります。 iconv(1) は、最後に変換が成功した箇所で終了します。
eucJP,PCK,UTF–8 から ibm930,ibm931,ibm939,ibm5026,ibm5035 への変換は、JIS X 0201、JIS X 0208、JIS X 0212、IBM 拡張文字、ユーザー定義文字の変換が可能です。変換先の文字集合に対応する文字のない入力データが 与えられた場合は、置換文字に変換されます。ibm931 は 1 バイト文字セット (SBCS) にカタカナを含まないため、ibm931 への変換では JIS X 0201 カナ文字は置換文字に変換されます。
ibm930, ibm931,ibm939,ibm5026,ibm5035 から eucJP,PCK,UTF-8 への変換は、それぞれの IBM コード化文字セットでサポートされている文字の変換が可能です。変換先の文字集合に対応する文字のない入力データが与えられた場合は、置換文字に変換されます。
ms932 と UTF-8 との間の変換は、シフト JIS コード (ms932) と Unicode の間の文字の対応を Windows NT 3.51 で実装されているのと同じ方法で行います。
「UTF-8」は変換元文字集合 PCK から変換された結果の Unicode (UTF-8 表現)、「UTF-8-ms932」は変換元文字集合 ms932 から変換された結果の Unicode (UTF-8 表現) とし、それら相互の変換を行います。
名前 | 機能説明 | eucJP から PCK (SJIS)・PCK (SJIS) から eucJP | eucJP から ISO–2022–JP (JIS7)・ISO–2022–JP (JIS7) から eucJP | eucJP から ISO–2022–JP.RFC1468 | eucJP から jis・jis から eucJP | eucJP から UTF–8・UTF–8 から eucJP | eucJP から UTF–8–Java・UTF–8–Java から eucJP | eucJP から ibmj・ibmj から eucJP | eucJP から ibmj-EBCDIK・ibmj-EBCDIK から eucJP | PCK (SJIS) から ISO–2022–JP・ISO–2022–JP から PCK (SJIS) | PCK (SJIS) から ISO–2022–JP.RFC1468 | PCK (SJIS) から UTF–8・UTF–8 から PCK (SJIS) | PCK (SJIS) から UTF–8–Java・UTF–8–Java から PCK (SJIS) | PCK (SJIS) から jis・jis から PCK (SJIS) | PCK (SJIS) から ibmj・ibmj から PCK (SJIS) | PCK から ibmj-EBCDIK・ibmj-EBCDIK から PCK | ISO–2022–JP から UTF–8・UTF–8 から ISO–2022–JP | UTF–8 から ISO–2022–JP.RFC1468 | eucJP,PCK,UTF–8 から ibm930,ibm931,ibm939,ibm5026,ibm5035 | ibm930,ibm931,ibm939,ibm5026,ibm5035 から eucJP,PCK,UTF–8 | ms932 から UTF–8・UTF–8 から ms932 | UTF–8 から UTF–8–ms932・UTF–8–ms932 から UTF–8 | 関連項目