サポートされているエンコーディング

java.io.InputStreamReaderjava.io.OutputStreamWriterjava.lang.String、および java.nio.charset パッケージのクラスを使用すると、Unicode とその他のいくつかの文字エンコーディング間の変換を行うことができます。サポートされるエンコーディングは、Java Platform, Standard Edition 7 (Java SE 7) の実装によって異なります。Java Platform, Standard Edition 7 の各実装によるサポートが必要なエンコーディングの一覧は、 java.nio.charset.Charset のクラスの説明を参照してください。

Oracle の Java SE Development Kit 7 (Java SE 7) の全プラットフォーム (Solaris、Linux、Microsoft Windows) 版と Java SE Runtime Environment 7 (JRE 7) の Solaris および Linux 版は、このページに掲載されているすべてのエンコーディングをサポートしています。Oracle の JRE 7 の Microsoft Windows 版は、完全な国際版とヨーロッパ言語版のどちらのバージョンでもインストールすることができます。JRE 7 のインストールプログラムは、ホストオペレーティングシステムがヨーロッパ言語だけをサポートしていることを識別すると、デフォルトでヨーロッパ言語版をインストールします。インストールプログラムがほかの言語の必要性を識別した場合、またはカスタマイズされたインストールでユーザーがヨーロッパ言語以外のサポートを要求した場合は、完全な国際化版がインストールされます。ヨーロッパ言語版では、次の基本エンコーディングセットの表に掲載されているエンコーディングだけがサポートされます。lib/charsets.jar ファイルを含む国際化版では、このページに示すエンコーディングがすべてサポートされています。

次の各表は、Java SE 7 でサポートされているエンコーディングセットを示します。新しい java.nio API で使用される正準名は、多くの場合、java.io API および java.lang API で使用される名前とは異なります。

基本エンコーディングセット (lib/rt.jar に含まれている)

java.nio API 用の正準名

java.io API と java.lang API 用の正準名

説明

IBM00858

Cp858

Cp850 の拡張機能でユーロ文字を含む

IBM437

Cp437

MS-DOS 米国、オーストラリア、ニュージーランド、南アフリカ

IBM775

Cp775

PC バルト諸語

IBM850

Cp850

MS-DOS ラテン文字-1

IBM852

Cp852

MS-DOS ラテン文字-2

IBM855

Cp855

IBM キリル文字

IBM857

Cp857

IBM トルコ語

IBM862

Cp862

PC ヘブライ語

IBM866

Cp866

MS-DOS ロシア語

ISO-8859-1

ISO8859_1

ISO -8859-1、ラテンアルファベット No. 1

ISO-8859-2

ISO8859_2

ラテンアルファベット No. 2

ISO-8859-4

ISO8859_4

ラテンアルファベット No. 4

ISO-8859-5

ISO8859_5

ラテン/キリル文字アルファベット

ISO-8859-7

ISO8859_7

ラテン/ギリシャ文字アルファベット (ISO-8859-7:2003)

ISO-8859-9

ISO8859_9

ラテンアルファベット No. 5

ISO-8859-13

ISO8859_13

ラテンアルファベット No. 7

ISO-8859-15

ISO8859_15

ラテンアルファベット No. 9

KOI8-R

KOI8_R

KOI8-R、ロシア語

KOI8-U

KOI8_U

KOI8-U、ウクライナ語

US-ASCII

ASCII

American Standard Code for Information Interchange

UTF-8

UTF8

8 ビット Unicode (UCS) Transformation Format

UTF-16

UTF-16

16 ビット Unicode (UCS) Transformation Format、オプションのバイト順マークによって識別されるバイト順

UTF-16BE

UnicodeBigUnmarked

16 ビット Unicode (UCS) Transformation Format、ビッグエンディアンバイト順

UTF-16LE

UnicodeLittleUnmarked

16 ビット Unicode (UCS) Transformation Format、リトルエンディアンバイト順

UTF-32

UTF_32

32 ビット Unicode (UCS) Transformation Format、オプションのバイト順マークによって識別されるバイト順

UTF-32BE

UTF_32BE

32 ビット Unicode (UCS) Transformation Format、ビッグエンディアンバイト順

UTF-32LE

UTF_32LE

32 ビット Unicode (UCS) Transformation Format、リトルエンディアンバイト順

x-UTF-32BE-BOM

UTF_32BE_BOM

32 ビット Unicode (UCS) Transformation Format、ビッグエンディアンバイト順、バイト順マーク付き

x-UTF-32LE-BOM

UTF_32LE_BOM

32 ビット Unicode (UCS) Transformation Format、リトルエンディアンバイト順、バイト順マーク付き

windows-1250

Cp1250

Windows 東欧

windows-1251

Cp1251

Windows キリル文字

windows-1252

Cp1252

Windows ラテン文字-1

windows-1253

Cp1253

Windows ギリシャ文字

windows-1254

Cp1254

Windows トルコ語

windows-1257

Cp1257

Windows バルト諸語

利用できない

UnicodeBig

16 ビット Unicode (UCS) Transformation Format、ビッグエンディアンバイト順、バイト順マーク付き

x-IBM737

Cp737

PC ギリシャ文字

x-IBM874

Cp874

IBM タイ

x-UTF-16LE-BOM

UnicodeLittle

16 ビット Unicode (UCS) Transformation Format、リトルエンディアンバイト順、バイト順マーク付き

 

拡張エンコーディングセット (lib/charsets.jar に含まれている)

java.nio API 用の正準名

java.io API と java.lang API 用の正準名

説明

Big5

Big5

Big5、中国語 (繁体字)

Big5-HKSCS

Big5_HKSCS

Big5 (香港の拡張付き)、中国語 (繁体字、2001 改訂を組み込み)

EUC-JP

EUC_JP

JISX 0201、0208、0212、EUC エンコーディング、日本語

EUC-KR

EUC_KR

KS C 5601、EUC エンコーディング、韓国語

GB18030

GB18030

中国語 (簡体字)、中華人民共和国標準

GB2312

EUC_CN

GB2312、EUC エンコーディング、中国語 (簡体字)

GBK

GBK

GBK、中国語 (簡体字)

IBM-Thai

Cp838

IBM タイ拡張 SBCS

IBM01140

Cp1140

Cp037 の拡張機能でユーロ文字を含む

IBM01141

Cp1141

Cp273 の拡張機能でユーロ文字を含む

IBM01142

Cp1142

Cp277 の拡張機能でユーロ文字を含む

IBM01143

Cp1143

Cp278 の拡張機能でユーロ文字を含む

IBM01144

Cp1144

Cp280 の拡張機能でユーロ文字を含む

IBM01145

Cp1145

Cp284 の拡張機能でユーロ文字を含む

IBM01146

Cp1146

Cp285 の拡張機能でユーロ文字を含む

IBM01147

Cp1147

Cp297 の拡張機能でユーロ文字を含む

IBM01148

Cp1148

Cp500 の拡張機能でユーロ文字を含む

IBM01149

Cp1149

Cp871 の拡張機能でユーロ文字を含む

IBM037

Cp037

米国、カナダ (2 か国語、フランス語)、オランダ、ポルトガル、ブラジル、オーストラリア

IBM1026

Cp1026

IBM ラテン文字-5、トルコ

IBM1047

Cp1047

ラテン文字-1 (EBCDIC ホスト用)

IBM273

Cp273

IBM オーストリア、ドイツ

IBM277

Cp277

IBM デンマーク、ノルウェー

IBM278

Cp278

IBM フィンランド、スウェーデン

IBM280

Cp280

IBM イタリア

IBM284

Cp284

IBM カタロニア語/スペイン、スペイン語圏ラテンアメリカ

IBM285

Cp285

IBM 英国、アイルランド

IBM297

Cp297

IBM フランス

IBM420

Cp420

IBM アラビア語

IBM424

Cp424

IBM ヘブライ語

IBM500

Cp500

EBCDIC 500V1

IBM860

Cp860

MS-DOS ポルトガル語

IBM861

Cp861

MS-DOS アイスランド語

IBM863

Cp863

MS-DOS カナダ系フランス語

IBM864

Cp864

PC アラビア語

IBM865

Cp865

MS-DOS 北欧

IBM868

Cp868

MS-DOS パキスタン

IBM869

Cp869

IBM 近代ギリシャ語

IBM870

Cp870

IBM 多言語ラテン文字-2

IBM871

Cp871

IBM アイスランド

IBM918

Cp918

IBM パキスタン (ウルドゥー語)

ISO-2022-CN

ISO2022CN

ISO 2022 CN 形式の GB2312 および CNS11643、簡体字および繁体字中国語 (Unicode への変換のみ)

ISO-2022-JP

ISO2022JP

ISO 2022 形式の JIS X 0201、0208、日本語

ISO-2022-KR

ISO2022KR

ISO 2022 KR、韓国語

ISO-8859-3

ISO8859_3

ラテンアルファベット No. 3

ISO-8859-6

ISO8859_6

ラテン/アラビア語アルファベット

ISO-8859-8

ISO8859_8

ラテン/ヘブライ語アルファベット

JIS_X0201

JIS_X0201

JIS X 0201

JIS_X0212-1990

JIS_X0212-1990

JIS X 0212

Shift_JIS

SJIS

Shift-JIS、日本語

TIS-620

TIS620

TIS620、タイ

windows-1255

Cp1255

Windows ヘブライ語

windows-1256

Cp1256

Windows アラビア語

windows-1258

Cp1258

Windows ベトナム語

windows-31j

MS932

Windows 日本語

x-Big5-Solaris

Big5_Solaris

Big5 (Solaris zh_TW.BIG5 ロケール用の 7 つの追加 Hanzi 表意文字マッピング付き)

x-euc-jp-linux

EUC_JP_LINUX

JISX 0201、0208、EUC エンコーディング、日本語

x-EUC-TW

EUC_TW

CNS11643 (Plane 1-7,15)、EUC エンコーディング、中国語 (繁体字)

x-eucJP-Open

EUC_JP_Solaris

JISX 0201、0208、0212、EUC エンコーディング、日本語

x-IBM1006

Cp1006

IBM AIX パキスタン (ウルドゥー語)

x-IBM1025

Cp1025

IBM 多言語キリル文字: ブルガリア、ボスニア、ヘルツェゴビナ、マケドニア (旧ユーゴスラビアマケドニア共和国)

x-IBM1046

Cp1046

IBM アラビア語 - Windows

x-IBM1097

Cp1097

IBM イラン (現代ペルシャ語)/ペルシャ語

x-IBM1098

Cp1098

IBM イラン (現代ペルシャ語)/ペルシャ語 (PC)

x-IBM1112

Cp1112

IBM ラトビア、リトアニア

x-IBM1122

Cp1122

IBM エストニア

x-IBM1123

Cp1123

IBM ウクライナ

x-IBM1124

Cp1124

IBM AIX ウクライナ

x-IBM1381

Cp1381

IBM OS/2、DOS 中国 (中華人民共和国)

x-IBM1383

Cp1383

IBM AIX 中国 (中華人民共和国)

x-IBM33722

Cp33722

IBM-eucJP - 日本語 (5050 のスーパーセット)

x-IBM834

Cp834

IBM EBCDIC DBCS 専用韓国語

x-IBM856

Cp856

IBM ヘブライ語

x-IBM875

Cp875

IBM ギリシャ語

x-IBM921

Cp921

IBM ラトビア、リトアニア (AIX、DOS)

x-IBM922

Cp922

IBM エストニア (AIX、DOS)

x-IBM930

Cp930

UDC 4370 文字を含む日本語カタカナ漢字、5026 のスーパーセット

x-IBM933

Cp933

UDC 1880 文字を含む韓国語、5029 のスーパーセット

x-IBM935

Cp935

UDC 1880 文字を含む簡体字中国語ホスト、5031 のスーパーセット

x-IBM937

Cp937

UDC 6204 文字を含む繁体字中国語ホスト、5033 のスーパーセット

x-IBM939

Cp939

UDC 4370 文字を含む日本語ラテン文字漢字、5035 のスーパーセット

x-IBM942

Cp942

IBM OS/2 日本語、Cp932 のスーパーセット

x-IBM942C

Cp942C

Cp942 の拡張機能

x-IBM943

Cp943

IBM OS/2 日本語、Cp932 および Shift-JIS のスーパーセット

x-IBM943C

Cp943C

Cp943 の拡張機能

x-IBM948

Cp948

OS/2 中国語 (台湾)、938 のスーパーセット

x-IBM949

Cp949

PC 韓国語

x-IBM949C

Cp949C

Cp949 の拡張機能

x-IBM950

Cp950

PC 中国語 (香港、台湾)

x-IBM964

Cp964

AIX 中国語 (台湾)

x-IBM970

Cp970

AIX 韓国語

x-ISCII91

ISCII91

インド語派 ISCII91 エンコーディング

x-ISO2022-CN-CNS

ISO2022_CN_CNS

ISO 2022 CN 形式の CNS11643、繁体字中国語 (Unicode からの変換のみ)

x-ISO2022-CN-GB

ISO2022_CN_GB

ISO 2022 CN 形式の GB2312、簡体字中国語 (Unicode からの変換のみ)

x-iso-8859-11

x-iso-8859-11

ラテン/タイ語アルファベット

x-JIS0208

x-JIS0208

JIS X 0208

x-JISAutoDetect

JISAutoDetect

Shift-JIS、EUC-JP、ISO 2022 JP の検出および変換 (Unicode への変換のみ)

x-Johab

x-Johab

韓国語、Johab 文字セット

x-MacArabic

MacArabic

Macintosh アラビア語

x-MacCentralEurope

MacCentralEurope

Macintosh ラテン文字-2

x-MacCroatian

MacCroatian

Macintosh クロアチア語

x-MacCyrillic

MacCyrillic

Macintosh キリル文字

x-MacDingbat

MacDingbat

Macintosh Dingbat

x-MacGreek

MacGreek

Macintosh ギリシャ語

x-MacHebrew

MacHebrew

Macintosh ヘブライ語

x-MacIceland

MacIceland

Macintosh アイスランド語

x-MacRoman

MacRoman

Macintosh Roman

x-MacRomania

MacRomania

Macintosh ルーマニア

x-MacSymbol

MacSymbol

Macintosh シンボル

x-MacThai

MacThai

Macintosh タイ

x-MacTurkish

MacTurkish

Macintosh トルコ語

x-MacUkraine

MacUkraine

Macintosh ウクライナ

x-MS950-HKSCS

MS950_HKSCS

Windows 繁体字中国語 (香港の拡張付き)

x-mswin-936

MS936

Windows 簡体字中国語

x-PCK

PCK

Solaris 版の Shift_JIS

x-SJIS_0213

x-SJIS_0213

Shift_JISX0213

x-windows-50220

Cp50220

Windows Codepage 50220 (7 ビット実装)

x-windows-50221

Cp50221

Windows Codepage 50221 (7 ビット実装)

x-windows-874

MS874

Windows タイ語

x-windows-949

MS949

Windows 韓国語

x-windows-950

MS950

Windows 繁体字中国語

x-windows-iso2022jp

x-windows-iso2022jp

拡張 ISO-2022-JP (MS932 ベース)


Copyright © 1993, 2013, Oracle and/or its affiliates. All rights reserved.