サポートされているエンコーディング

java.io.InputStreamReader、java.io.OutputStreamWriter、java.lang.String、および java.nio.charset パッケージのクラスを使用すると、Unicode とその他のいくつかの文字エンコーディング間の変換を行うことができます。サポートされるエンコーディングは、Java Platform, Standard Edition 7 (Java SE 7) の実装によって異なります。Java Platform, Standard Edition 7 の各実装によるサポートが必要なエンコーディングの一覧は、 java.nio.charset.Charset のクラスの説明を参照してください。

Oracle の Java SE Development Kit 7 (Java SE 7) の全プラットフォーム (Solaris、Linux、Microsoft Windows) 版と Java SE Runtime Environment 7 (JRE 7) の Solaris および Linux 版は、このページに掲載されているすべてのエンコーディングをサポートしています。Oracle の JRE 7 の Microsoft Windows 版は、完全な国際版とヨーロッパ言語版のどちらのバージョンでもインストールすることができます。JRE 7 のインストールプログラムは、ホストオペレーティングシステムがヨーロッパ言語だけをサポートしていることを識別すると、デフォルトでヨーロッパ言語版をインストールします。インストールプログラムがほかの言語の必要性を識別した場合、またはカスタマイズされたインストールでユーザーがヨーロッパ言語以外のサポートを要求した場合は、完全な国際化版がインストールされます。ヨーロッパ言語版では、次の基本エンコーディングセットの表に掲載されているエンコーディングだけがサポートされます。lib/charsets.jar ファイルを含む国際化版では、このページに示すエンコーディングがすべてサポートされています。

次の各表は、Java SE 7 でサポートされているエンコーディングセットを示します。新しい java.nio API で使用される正準名は、多くの場合、java.io API および java.lang API で使用される名前とは異なります。

基本エンコーディングセット (lib/rt.jar に含まれている)

`java.nio` API 用の正準名	`java.io` API と `java.lang` API 用の正準名	説明
IBM00858	Cp858	Cp850 の拡張機能でユーロ文字を含む
IBM437	Cp437	MS-DOS 米国、オーストラリア、ニュージーランド、南アフリカ
IBM775	Cp775	PC バルト諸語
IBM850	Cp850	MS-DOS ラテン文字-1
IBM852	Cp852	MS-DOS ラテン文字-2
IBM855	Cp855	IBM キリル文字
IBM857	Cp857	IBM トルコ語
IBM862	Cp862	PC ヘブライ語
IBM866	Cp866	MS-DOS ロシア語
ISO-8859-1	ISO8859_1	ISO -8859-1、ラテンアルファベット No. 1
ISO-8859-2	ISO8859_2	ラテンアルファベット No. 2
ISO-8859-4	ISO8859_4	ラテンアルファベット No. 4
ISO-8859-5	ISO8859_5	ラテン/キリル文字アルファベット
ISO-8859-7	ISO8859_7	ラテン/ギリシャ文字アルファベット (ISO-8859-7:2003)
ISO-8859-9	ISO8859_9	ラテンアルファベット No. 5
ISO-8859-13	ISO8859_13	ラテンアルファベット No. 7
ISO-8859-15	ISO8859_15	ラテンアルファベット No. 9
KOI8-R	KOI8_R	KOI8-R、ロシア語
KOI8-U	KOI8_U	KOI8-U、ウクライナ語
US-ASCII	ASCII	American Standard Code for Information Interchange
UTF-8	UTF8	8 ビット Unicode (UCS) Transformation Format
UTF-16	UTF-16	16 ビット Unicode (UCS) Transformation Format、オプションのバイト順マークによって識別されるバイト順
UTF-16BE	UnicodeBigUnmarked	16 ビット Unicode (UCS) Transformation Format、ビッグエンディアンバイト順
UTF-16LE	UnicodeLittleUnmarked	16 ビット Unicode (UCS) Transformation Format、リトルエンディアンバイト順
UTF-32	UTF_32	32 ビット Unicode (UCS) Transformation Format、オプションのバイト順マークによって識別されるバイト順
UTF-32BE	UTF_32BE	32 ビット Unicode (UCS) Transformation Format、ビッグエンディアンバイト順
UTF-32LE	UTF_32LE	32 ビット Unicode (UCS) Transformation Format、リトルエンディアンバイト順
x-UTF-32BE-BOM	UTF_32BE_BOM	32 ビット Unicode (UCS) Transformation Format、ビッグエンディアンバイト順、バイト順マーク付き
x-UTF-32LE-BOM	UTF_32LE_BOM	32 ビット Unicode (UCS) Transformation Format、リトルエンディアンバイト順、バイト順マーク付き
windows-1250	Cp1250	Windows 東欧
windows-1251	Cp1251	Windows キリル文字
windows-1252	Cp1252	Windows ラテン文字-1
windows-1253	Cp1253	Windows ギリシャ文字
windows-1254	Cp1254	Windows トルコ語
windows-1257	Cp1257	Windows バルト諸語
利用できない	UnicodeBig	16 ビット Unicode (UCS) Transformation Format、ビッグエンディアンバイト順、バイト順マーク付き
x-IBM737	Cp737	PC ギリシャ文字
x-IBM874	Cp874	IBM タイ
x-UTF-16LE-BOM	UnicodeLittle	16 ビット Unicode (UCS) Transformation Format、リトルエンディアンバイト順、バイト順マーク付き

拡張エンコーディングセット (lib/charsets.jar に含まれている)

`java.nio` API 用の正準名	`java.io` API と `java.lang` API 用の正準名	説明
Big5	Big5	Big5、中国語 (繁体字)
Big5-HKSCS	Big5_HKSCS	Big5 (香港の拡張付き)、中国語 (繁体字、2001 改訂を組み込み)
EUC-JP	EUC_JP	JISX 0201、0208、0212、EUC エンコーディング、日本語
EUC-KR	EUC_KR	KS C 5601、EUC エンコーディング、韓国語
GB18030	GB18030	中国語 (簡体字)、中華人民共和国標準
GB2312	EUC_CN	GB2312、EUC エンコーディング、中国語 (簡体字)
GBK	GBK	GBK、中国語 (簡体字)
IBM-Thai	Cp838	IBM タイ拡張 SBCS
IBM01140	Cp1140	Cp037 の拡張機能でユーロ文字を含む
IBM01141	Cp1141	Cp273 の拡張機能でユーロ文字を含む
IBM01142	Cp1142	Cp277 の拡張機能でユーロ文字を含む
IBM01143	Cp1143	Cp278 の拡張機能でユーロ文字を含む
IBM01144	Cp1144	Cp280 の拡張機能でユーロ文字を含む
IBM01145	Cp1145	Cp284 の拡張機能でユーロ文字を含む
IBM01146	Cp1146	Cp285 の拡張機能でユーロ文字を含む
IBM01147	Cp1147	Cp297 の拡張機能でユーロ文字を含む
IBM01148	Cp1148	Cp500 の拡張機能でユーロ文字を含む
IBM01149	Cp1149	Cp871 の拡張機能でユーロ文字を含む
IBM037	Cp037	米国、カナダ (2 か国語、フランス語)、オランダ、ポルトガル、ブラジル、オーストラリア
IBM1026	Cp1026	IBM ラテン文字-5、トルコ
IBM1047	Cp1047	ラテン文字-1 (EBCDIC ホスト用)
IBM273	Cp273	IBM オーストリア、ドイツ
IBM277	Cp277	IBM デンマーク、ノルウェー
IBM278	Cp278	IBM フィンランド、スウェーデン
IBM280	Cp280	IBM イタリア
IBM284	Cp284	IBM カタロニア語/スペイン、スペイン語圏ラテンアメリカ
IBM285	Cp285	IBM 英国、アイルランド
IBM297	Cp297	IBM フランス
IBM420	Cp420	IBM アラビア語
IBM424	Cp424	IBM ヘブライ語
IBM500	Cp500	EBCDIC 500V1
IBM860	Cp860	MS-DOS ポルトガル語
IBM861	Cp861	MS-DOS アイスランド語
IBM863	Cp863	MS-DOS カナダ系フランス語
IBM864	Cp864	PC アラビア語
IBM865	Cp865	MS-DOS 北欧
IBM868	Cp868	MS-DOS パキスタン
IBM869	Cp869	IBM 近代ギリシャ語
IBM870	Cp870	IBM 多言語ラテン文字-2
IBM871	Cp871	IBM アイスランド
IBM918	Cp918	IBM パキスタン (ウルドゥー語)
ISO-2022-CN	ISO2022CN	ISO 2022 CN 形式の GB2312 および CNS11643、簡体字および繁体字中国語 (Unicode への変換のみ)
ISO-2022-JP	ISO2022JP	ISO 2022 形式の JIS X 0201、0208、日本語
ISO-2022-KR	ISO2022KR	ISO 2022 KR、韓国語
ISO-8859-3	ISO8859_3	ラテンアルファベット No. 3
ISO-8859-6	ISO8859_6	ラテン/アラビア語アルファベット
ISO-8859-8	ISO8859_8	ラテン/ヘブライ語アルファベット
JIS_X0201	JIS_X0201	JIS X 0201
JIS_X0212-1990	JIS_X0212-1990	JIS X 0212
Shift_JIS	SJIS	Shift-JIS、日本語
TIS-620	TIS620	TIS620、タイ
windows-1255	Cp1255	Windows ヘブライ語
windows-1256	Cp1256	Windows アラビア語
windows-1258	Cp1258	Windows ベトナム語
windows-31j	MS932	Windows 日本語
x-Big5-Solaris	Big5_Solaris	Big5 (Solaris zh_TW.BIG5 ロケール用の 7 つの追加 Hanzi 表意文字マッピング付き)
x-euc-jp-linux	EUC_JP_LINUX	JISX 0201、0208、EUC エンコーディング、日本語
x-EUC-TW	EUC_TW	CNS11643 (Plane 1-7,15)、EUC エンコーディング、中国語 (繁体字)
x-eucJP-Open	EUC_JP_Solaris	JISX 0201、0208、0212、EUC エンコーディング、日本語
x-IBM1006	Cp1006	IBM AIX パキスタン (ウルドゥー語)
x-IBM1025	Cp1025	IBM 多言語キリル文字: ブルガリア、ボスニア、ヘルツェゴビナ、マケドニア (旧ユーゴスラビアマケドニア共和国)
x-IBM1046	Cp1046	IBM アラビア語 - Windows
x-IBM1097	Cp1097	IBM イラン (現代ペルシャ語)/ペルシャ語
x-IBM1098	Cp1098	IBM イラン (現代ペルシャ語)/ペルシャ語 (PC)
x-IBM1112	Cp1112	IBM ラトビア、リトアニア
x-IBM1122	Cp1122	IBM エストニア
x-IBM1123	Cp1123	IBM ウクライナ
x-IBM1124	Cp1124	IBM AIX ウクライナ
x-IBM1381	Cp1381	IBM OS/2、DOS 中国 (中華人民共和国)
x-IBM1383	Cp1383	IBM AIX 中国 (中華人民共和国)
x-IBM33722	Cp33722	IBM-eucJP - 日本語 (5050 のスーパーセット)
x-IBM834	Cp834	IBM EBCDIC DBCS 専用韓国語
x-IBM856	Cp856	IBM ヘブライ語
x-IBM875	Cp875	IBM ギリシャ語
x-IBM921	Cp921	IBM ラトビア、リトアニア (AIX、DOS)
x-IBM922	Cp922	IBM エストニア (AIX、DOS)
x-IBM930	Cp930	UDC 4370 文字を含む日本語カタカナ漢字、5026 のスーパーセット
x-IBM933	Cp933	UDC 1880 文字を含む韓国語、5029 のスーパーセット
x-IBM935	Cp935	UDC 1880 文字を含む簡体字中国語ホスト、5031 のスーパーセット
x-IBM937	Cp937	UDC 6204 文字を含む繁体字中国語ホスト、5033 のスーパーセット
x-IBM939	Cp939	UDC 4370 文字を含む日本語ラテン文字漢字、5035 のスーパーセット
x-IBM942	Cp942	IBM OS/2 日本語、Cp932 のスーパーセット
x-IBM942C	Cp942C	Cp942 の拡張機能
x-IBM943	Cp943	IBM OS/2 日本語、Cp932 および Shift-JIS のスーパーセット
x-IBM943C	Cp943C	Cp943 の拡張機能
x-IBM948	Cp948	OS/2 中国語 (台湾)、938 のスーパーセット
x-IBM949	Cp949	PC 韓国語
x-IBM949C	Cp949C	Cp949 の拡張機能
x-IBM950	Cp950	PC 中国語 (香港、台湾)
x-IBM964	Cp964	AIX 中国語 (台湾)
x-IBM970	Cp970	AIX 韓国語
x-ISCII91	ISCII91	インド語派 ISCII91 エンコーディング
x-ISO2022-CN-CNS	ISO2022_CN_CNS	ISO 2022 CN 形式の CNS11643、繁体字中国語 (Unicode からの変換のみ)
x-ISO2022-CN-GB	ISO2022_CN_GB	ISO 2022 CN 形式の GB2312、簡体字中国語 (Unicode からの変換のみ)
x-iso-8859-11	x-iso-8859-11	ラテン/タイ語アルファベット
x-JIS0208	x-JIS0208	JIS X 0208
x-JISAutoDetect	JISAutoDetect	Shift-JIS、EUC-JP、ISO 2022 JP の検出および変換 (Unicode への変換のみ)
x-Johab	x-Johab	韓国語、Johab 文字セット
x-MacArabic	MacArabic	Macintosh アラビア語
x-MacCentralEurope	MacCentralEurope	Macintosh ラテン文字-2
x-MacCroatian	MacCroatian	Macintosh クロアチア語
x-MacCyrillic	MacCyrillic	Macintosh キリル文字
x-MacDingbat	MacDingbat	Macintosh Dingbat
x-MacGreek	MacGreek	Macintosh ギリシャ語
x-MacHebrew	MacHebrew	Macintosh ヘブライ語
x-MacIceland	MacIceland	Macintosh アイスランド語
x-MacRoman	MacRoman	Macintosh Roman
x-MacRomania	MacRomania	Macintosh ルーマニア
x-MacSymbol	MacSymbol	Macintosh シンボル
x-MacThai	MacThai	Macintosh タイ
x-MacTurkish	MacTurkish	Macintosh トルコ語
x-MacUkraine	MacUkraine	Macintosh ウクライナ
x-MS950-HKSCS	MS950_HKSCS	Windows 繁体字中国語 (香港の拡張付き)
x-mswin-936	MS936	Windows 簡体字中国語
x-PCK	PCK	Solaris 版の Shift_JIS
x-SJIS_0213	x-SJIS_0213	Shift_JISX0213
x-windows-50220	Cp50220	Windows Codepage 50220 (7 ビット実装)
x-windows-50221	Cp50221	Windows Codepage 50221 (7 ビット実装)
x-windows-874	MS874	Windows タイ語
x-windows-949	MS949	Windows 韓国語
x-windows-950	MS950	Windows 繁体字中国語
x-windows-iso2022jp	x-windows-iso2022jp	拡張 ISO-2022-JP (MS932 ベース)

連絡先