3 サポートされるエンコーディング

java.io.InputStreamReader、java.io.OutputStreamWriter、java.lang.String、およびjava.nio.charsetパッケージのクラスを使用すると、Unicodeとその他のいくつかの文字エンコーディング間の変換を行うことができます。サポートされるエンコーディングは、Java Platform, Standard Edition 9 (Java SE 9)の実装によって異なります。Java SE 9の各実装によるサポートが必要なエンコーディングの一覧は、java.nio.charset.Charsetのクラスの説明を参照してください。

次の各表は、Oracle Java SE 9でサポートされているエンコーディング・セットを示します。java.nio APIで使用される正準名は、多くの場合、java.io APIおよびjava.lang APIで使用される名前とは異なります。

基本エンコーディング・セット(java.baseモジュールに含まれる)

java.nio API用の正準名	java.io APIとjava.lang API用の正準名	説明
IBM00858	Cp858	Cp850の拡張機能でユーロ文字を含む
IBM437	Cp437	MS-DOS米国、オーストラリア、ニュージーランド、南アフリカ
IBM775	Cp775	PCバルト諸語
IBM850	Cp850	MS-DOSラテン文字-1
IBM852	Cp852	MS-DOSラテン文字-2
IBM855	Cp855	IBMキリル文字
IBM857	Cp857	IBMトルコ語
IBM862	Cp862	PCヘブライ語
IBM866	Cp866	MS-DOSロシア語
ISO-8859-1	ISO8859_1	ISO -8859-1、ラテン・アルファベットNo. 1
ISO-8859-2	ISO8859_2	ラテン・アルファベットNo. 2
ISO-8859-4	ISO8859_4	ラテン・アルファベットNo. 4
ISO-8859-5	ISO8859_5	ラテン/キリル文字アルファベット
ISO-8859-7	ISO8859_7	ラテン/ギリシャ文字アルファベット(ISO-8859-7:2003)
ISO-8859-9	ISO8859_9	ラテン・アルファベットNo. 5
ISO-8859-13	ISO8859_13	ラテン・アルファベットNo. 7
ISO-8859-15	ISO8859_15	ラテン・アルファベットNo. 9
KOI8-R	KOI8_R	KOI8-R、ロシア語
KOI8-U	KOI8_U	KOI8-U、ウクライナ語
US-ASCII	ASCII	米国の情報交換標準コード
UTF-8	UTF8	8ビットUnicode (UCS) Transformation Format
UTF-16	UTF-16	16ビットUnicode (UCS) Transformation Format、オプションのバイト順マークによって識別されるバイト順
UTF-16BE	UnicodeBigUnmarked	16ビットUnicode (UCS) Transformation Format、ビッグエンディアン・バイト順
UTF-16LE	UnicodeLittleUnmarked	16ビットUnicode (UCS) Transformation Format、リトルエンディアン・バイト順
UTF-32	UTF_32	32ビットUnicode (UCS) Transformation Format、オプションのバイト順マークによって識別されるバイト順
UTF-32BE	UTF_32BE	32ビットUnicode (UCS) Transformation Format、ビッグエンディアン・バイト順
UTF-32LE	UTF_32LE	32ビットUnicode (UCS) Transformation Format、リトルエンディアン・バイト順
x-UTF-32BE-BOM	UTF_32BE_BOM	32ビットUnicode (UCS) Transformation Format、ビッグエンディアン・バイト順、バイト順マーク付き
x-UTF-32LE-BOM	UTF_32LE_BOM	32ビットUnicode (UCS) Transformation Format、リトルエンディアン・バイト順、バイト順マーク付き
windows-1250	Cp1250	Windows東欧
windows-1251	Cp1251	Windowsキリル文字
windows-1252	Cp1252	Windowsラテン文字-1
windows-1253	Cp1253	Windowsギリシャ文字
windows-1254	Cp1254	Windowsトルコ語
windows-1257	Cp1257	Windowsバルト諸語
該当なし	UnicodeBig	16ビットUnicode (UCS) Transformation Format、ビッグエンディアン・バイト順、バイト順マーク付き
x-IBM737	Cp737	PCギリシャ文字
x-IBM874	Cp874	IBMタイ
x-UTF-16LE-BOM	UnicodeLittle	16ビットUnicode (UCS) Transformation Format、リトルエンディアン・バイト順、バイト順マーク付き

拡張エンコーディング・セット(jdk.charsetsモジュールに含まれる)

java.nio API用の正準名	java.io APIとjava.lang API用の正準名	説明
Big5	Big5	Big5、中国語(繁体字)
Big5-HKSCS	Big5_HKSCS	Big5 (香港の拡張付き)、中国語(繁体字、2001改訂を組み込み)
EUC-JP	EUC_JP	JISX 0201、0208、0212、EUCエンコーディング、日本語
EUC-KR	EUC_KR	KS C 5601、EUCエンコーディング、韓国語
GB18030	GB18030	中国語(簡体字)、中華人民共和国標準
GB2312	EUC_CN	GB2312、EUCエンコーディング、中国語(簡体字)
GBK	GBK	GBK、中国語(簡体字)
IBM-Thai	Cp838	IBMタイ拡張SBCS
IBM01140	Cp1140	Cp037の拡張機能でユーロ文字を含む
IBM01141	Cp1141	Cp273の拡張機能でユーロ文字を含む
IBM01142	Cp1142	Cp277の拡張機能でユーロ文字を含む
IBM01143	Cp1143	Cp278の拡張機能でユーロ文字を含む
IBM01144	Cp1144	Cp280の拡張機能でユーロ文字を含む
IBM01145	Cp1145	Cp284の拡張機能でユーロ文字を含む
IBM01146	Cp1146	Cp285の拡張機能でユーロ文字を含む
IBM01147	Cp1147	Cp297の拡張機能でユーロ文字を含む
IBM01148	Cp1148	Cp500の拡張機能でユーロ文字を含む
IBM01149	Cp1149	Cp871の拡張機能でユーロ文字を含む
IBM037	Cp037	米国、カナダ(2か国語、フランス語)、オランダ、ポルトガル、ブラジル、オーストラリア
IBM1026	Cp1026	IBMラテン文字-5、トルコ
IBM1047	Cp1047	ラテン文字-1 (EBCDICホスト用)
IBM273	Cp273	IBMオーストリア、ドイツ
IBM277	Cp277	IBMデンマーク、ノルウェー
IBM278	Cp278	IBMフィンランド、スウェーデン
IBM280	Cp280	IBMイタリア
IBM284	Cp284	IBMカタロニア語/スペイン、スペイン語圏ラテン・アメリカ
IBM285	Cp285	IBM英国、アイルランド
IBM290	Cp290	EBCDIC-JP-kana、日本語EBCDIC
IBM297	Cp297	IBMフランス
IBM300	Cp300	Japan DB EBCDIC、日本語EBCDIC
IBM420	Cp420	IBMアラビア語
IBM424	Cp424	IBMヘブライ語
IBM500	Cp500	EBCDIC 500V1
IBM860	Cp860	MS-DOSポルトガル語
IBM861	Cp861	MS-DOSアイスランド語
IBM863	Cp863	MS-DOSカナダ系フランス語
IBM864	Cp864	PCアラビア語
IBM865	Cp865	MS-DOS北欧
IBM868	Cp868	MS-DOSパキスタン
IBM869	Cp869	IBM近代ギリシャ語
IBM870	Cp870	IBM多言語ラテン文字-2
IBM871	Cp871	IBMアイスランド
IBM918	Cp918	IBMパキスタン(ウルドゥー語)
ISO-2022-CN	ISO2022CN	ISO 2022 CN形式のGB2312およびCNS11643、簡体字および繁体字中国語(Unicodeへの変換のみ)
ISO-2022-JP	ISO2022JP	ISO 2022形式のJIS X 0201、0208、日本語
ISO-2022-KR	ISO2022KR	ISO 2022 KR、韓国語
ISO-8859-3	ISO8859_3	ラテン・アルファベットNo. 3
ISO-8859-6	ISO8859_6	ラテン/アラビア語アルファベット
ISO-8859-8	ISO8859_8	ラテン/ヘブライ語アルファベット
JIS_X0201	JIS_X0201	JIS X 0201
JIS_X0212-1990	JIS_X0212-1990	JIS X 0212
Shift_JIS	SJIS	Shift-JIS、日本語
TIS-620	TIS620	TIS620、タイ
windows-1255	Cp1255	Windowsヘブライ語
windows-1256	Cp1256	Windowsアラビア語
windows-1258	Cp1258	Windowsベトナム語
windows-31j	MS932	Windows日本語
x-Big5-Solaris	Big5_Solaris	Big5 (Solaris zh_TW.BIG5ロケール用の7つの追加Hanzi表意文字マッピング付き)
x-euc-jp-linux	EUC_JP_LINUX	JISX 0201、0208、EUCエンコーディング、日本語
x-EUC-TW	EUC_TW	CNS11643 (Plane 1-7,15)、EUCエンコーディング、中国語(繁体字)
x-eucJP-Open	EUC_JP_Solaris	JISX 0201、0208、0212、EUCエンコーディング、日本語
x-IBM1006	Cp1006	IBM AIXパキスタン(ウルドゥー語)
x-IBM1025	Cp1025	IBM多言語キリル文字: ブルガリア、ボスニア、ヘルツェゴビナ、マケドニア(旧ユーゴスラビア・マケドニア共和国)
x-IBM1046	Cp1046	IBMアラビア語 - Windows
x-IBM1097	Cp1097	IBMイラン(現代ペルシャ語)/ペルシャ語
x-IBM1098	Cp1098	IBMイラン(現代ペルシャ語)/ペルシャ語(PC)
x-IBM1112	Cp1112	IBMラトビア、リトアニア
x-IBM1122	Cp1122	IBMエストニア
x-IBM1123	Cp1123	IBMウクライナ
x-IBM1124	Cp1124	IBM AIXウクライナ
x-IBM1381	Cp1381	IBM OS/2、DOS中国(中華人民共和国)
x-IBM1383	Cp1383	IBM AIX中国(中華人民共和国)
x-IBM33722	Cp33722	IBM-eucJP - 日本語(5050のスーパー・セット)
x-IBM834	Cp834	IBM EBCDIC DBCS専用韓国語
x-IBM856	Cp856	IBMヘブライ語
x-IBM875	Cp875	IBMギリシャ語
x-IBM921	Cp921	IBMラトビア、リトアニア(AIX、DOS)
x-IBM922	Cp922	IBMエストニア(AIX、DOS)
x-IBM930	Cp930	UDC 4370文字を含む日本語カタカナ漢字、5026のスーパー・セット
x-IBM933	Cp933	UDC 1880文字を含む韓国語、5029のスーパー・セット
x-IBM935	Cp935	UDC 1880文字を含む簡体字中国語ホスト、5031のスーパー・セット
x-IBM937	Cp937	UDC 6204文字を含む繁体字中国語ホスト、5033のスーパー・セット
x-IBM939	Cp939	UDC 4370文字を含む日本語ラテン文字漢字、5035のスーパー・セット
x-IBM942	Cp942	IBM OS/2日本語、Cp932のスーパー・セット
x-IBM942C	Cp942C	Cp942の拡張機能
x-IBM943	Cp943	IBM OS/2日本語、Cp932およびShift-JISのスーパー・セット
x-IBM943C	Cp943C	Cp943の拡張機能
x-IBM948	Cp948	OS/2中国語(台湾)、938のスーパー・セット
x-IBM949	Cp949	PC韓国語
x-IBM949C	Cp949C	Cp949の拡張機能
x-IBM950	Cp950	PC中国語(香港、台湾)
x-IBM964	Cp964	AIX中国語(台湾)
x-IBM970	Cp970	AIX韓国語
x-ISCII91	ISCII91	インド語派ISCII91エンコーディング
x-ISO2022-CN-CNS	ISO2022_CN_CNS	ISO 2022 CN形式のCNS11643、繁体字中国語(Unicodeからの変換のみ)
x-ISO2022-CN-GB	ISO2022_CN_GB	ISO 2022 CN形式のGB2312、簡体字中国語(Unicodeからの変換のみ)
x-iso-8859-11	x-iso-8859-11	ラテン/タイ語アルファベット
x-JIS0208	x-JIS0208	JIS X 0208
x-JISAutoDetect	JISAutoDetect	Shift-JIS、EUC-JP、ISO 2022 JPの検出および変換(Unicodeへの変換のみ)
x-Johab	x-Johab	韓国語、Johab文字セット
x-MacArabic	MacArabic	Macintoshアラビア語
x-MacCentralEurope	MacCentralEurope	Macintoshラテン文字-2
x-MacCroatian	MacCroatian	Macintoshクロアチア語
x-MacCyrillic	MacCyrillic	Macintoshキリル文字
x-MacDingbat	MacDingbat	Macintosh Dingbat
x-MacGreek	MacGreek	Macintoshギリシャ語
x-MacHebrew	MacHebrew	Macintoshヘブライ語
x-MacIceland	MacIceland	Macintoshアイスランド語
x-MacRoman	MacRoman	Macintosh Roman
x-MacRomania	MacRomania	Macintoshルーマニア
x-MacSymbol	MacSymbol	Macintoshシンボル
x-MacThai	MacThai	Macintoshタイ
x-MacTurkish	MacTurkish	Macintoshトルコ語
x-MacUkraine	MacUkraine	Macintoshウクライナ
x-MS950-HKSCS	MS950_HKSCS	Windows繁体字中国語(香港の拡張付き)
x-mswin-936	MS936	Windows簡体字中国語
x-PCK	PCK	Solaris版のShift_JIS
x-SJIS_0213	x-SJIS_0213	Shift_JISX0213
x-windows-50220	Cp50220	Windows Codepage 50220 (7ビット実装)
x-windows-50221	Cp50221	Windows Codepage 50221 (7ビット実装)
x-windows-874	MS874	Windowsタイ語
x-windows-949	MS949	Windows韓国語
x-windows-950	MS950	Windows繁体字中国語
x-windows-iso2022jp	x-windows-iso2022jp	拡張ISO-2022-JP (MS932ベース)