プライマリ・コンテンツに移動
Java Platform, Standard Edition国際化ガイド
リリース9
E90928-01
目次へ移動
目次

前
次

3 サポートされるエンコーディング

java.io.InputStreamReaderjava.io.OutputStreamWriterjava.lang.String、およびjava.nio.charsetパッケージのクラスを使用すると、Unicodeとその他のいくつかの文字エンコーディング間の変換を行うことができます。サポートされるエンコーディングは、Java Platform, Standard Edition 9 (Java SE 9)の実装によって異なります。Java SE 9の各実装によるサポートが必要なエンコーディングの一覧は、java.nio.charset.Charsetのクラスの説明を参照してください。

次の各表は、Oracle Java SE 9でサポートされているエンコーディング・セットを示します。java.nio APIで使用される正準名は、多くの場合、java.io APIおよびjava.lang APIで使用される名前とは異なります。

基本エンコーディング・セット(java.baseモジュールに含まれる)

java.nio API用の正準名 java.io APIとjava.lang API用の正準名 説明

IBM00858

Cp858

Cp850の拡張機能でユーロ文字を含む

IBM437

Cp437

MS-DOS米国、オーストラリア、ニュージーランド、南アフリカ

IBM775

Cp775

PCバルト諸語

IBM850

Cp850

MS-DOSラテン文字-1

IBM852

Cp852

MS-DOSラテン文字-2

IBM855

Cp855

IBMキリル文字

IBM857

Cp857

IBMトルコ語

IBM862

Cp862

PCヘブライ語

IBM866

Cp866

MS-DOSロシア語

ISO-8859-1

ISO8859_1

ISO -8859-1、ラテン・アルファベットNo. 1

ISO-8859-2

ISO8859_2

ラテン・アルファベットNo. 2

ISO-8859-4

ISO8859_4

ラテン・アルファベットNo. 4

ISO-8859-5

ISO8859_5

ラテン/キリル文字アルファベット

ISO-8859-7

ISO8859_7

ラテン/ギリシャ文字アルファベット(ISO-8859-7:2003)

ISO-8859-9

ISO8859_9

ラテン・アルファベットNo. 5

ISO-8859-13

ISO8859_13

ラテン・アルファベットNo. 7

ISO-8859-15

ISO8859_15

ラテン・アルファベットNo. 9

KOI8-R

KOI8_R

KOI8-R、ロシア語

KOI8-U

KOI8_U

KOI8-U、ウクライナ語

US-ASCII

ASCII

米国の情報交換標準コード

UTF-8

UTF8

8ビットUnicode (UCS) Transformation Format

UTF-16

UTF-16

16ビットUnicode (UCS) Transformation Format、オプションのバイト順マークによって識別されるバイト順

UTF-16BE

UnicodeBigUnmarked

16ビットUnicode (UCS) Transformation Format、ビッグエンディアン・バイト順

UTF-16LE

UnicodeLittleUnmarked

16ビットUnicode (UCS) Transformation Format、リトルエンディアン・バイト順

UTF-32

UTF_32

32ビットUnicode (UCS) Transformation Format、オプションのバイト順マークによって識別されるバイト順

UTF-32BE

UTF_32BE

32ビットUnicode (UCS) Transformation Format、ビッグエンディアン・バイト順

UTF-32LE

UTF_32LE

32ビットUnicode (UCS) Transformation Format、リトルエンディアン・バイト順

x-UTF-32BE-BOM

UTF_32BE_BOM

32ビットUnicode (UCS) Transformation Format、ビッグエンディアン・バイト順、バイト順マーク付き

x-UTF-32LE-BOM

UTF_32LE_BOM

32ビットUnicode (UCS) Transformation Format、リトルエンディアン・バイト順、バイト順マーク付き

windows-1250

Cp1250

Windows東欧

windows-1251

Cp1251

Windowsキリル文字

windows-1252

Cp1252

Windowsラテン文字-1

windows-1253

Cp1253

Windowsギリシャ文字

windows-1254

Cp1254

Windowsトルコ語

windows-1257

Cp1257

Windowsバルト諸語

該当なし

UnicodeBig

16ビットUnicode (UCS) Transformation Format、ビッグエンディアン・バイト順、バイト順マーク付き

x-IBM737

Cp737

PCギリシャ文字

x-IBM874

Cp874

IBMタイ

x-UTF-16LE-BOM

UnicodeLittle

16ビットUnicode (UCS) Transformation Format、リトルエンディアン・バイト順、バイト順マーク付き

 

拡張エンコーディング・セット(jdk.charsetsモジュールに含まれる)

java.nio API用の正準名 java.io APIとjava.lang API用の正準名 説明

Big5

Big5

Big5、中国語(繁体字)

Big5-HKSCS

Big5_HKSCS

Big5 (香港の拡張付き)、中国語(繁体字、2001改訂を組み込み)

EUC-JP

EUC_JP

JISX 0201、0208、0212、EUCエンコーディング、日本語

EUC-KR

EUC_KR

KS C 5601、EUCエンコーディング、韓国語

GB18030

GB18030

中国語(簡体字)、中華人民共和国標準

GB2312

EUC_CN

GB2312、EUCエンコーディング、中国語(簡体字)

GBK

GBK

GBK、中国語(簡体字)

IBM-Thai

Cp838

IBMタイ拡張SBCS

IBM01140

Cp1140

Cp037の拡張機能でユーロ文字を含む

IBM01141

Cp1141

Cp273の拡張機能でユーロ文字を含む

IBM01142

Cp1142

Cp277の拡張機能でユーロ文字を含む

IBM01143

Cp1143

Cp278の拡張機能でユーロ文字を含む

IBM01144

Cp1144

Cp280の拡張機能でユーロ文字を含む

IBM01145

Cp1145

Cp284の拡張機能でユーロ文字を含む

IBM01146

Cp1146

Cp285の拡張機能でユーロ文字を含む

IBM01147

Cp1147

Cp297の拡張機能でユーロ文字を含む

IBM01148

Cp1148

Cp500の拡張機能でユーロ文字を含む

IBM01149

Cp1149

Cp871の拡張機能でユーロ文字を含む

IBM037

Cp037

米国、カナダ(2か国語、フランス語)、オランダ、ポルトガル、ブラジル、オーストラリア

IBM1026

Cp1026

IBMラテン文字-5、トルコ

IBM1047

Cp1047

ラテン文字-1 (EBCDICホスト用)

IBM273

Cp273

IBMオーストリア、ドイツ

IBM277

Cp277

IBMデンマーク、ノルウェー

IBM278

Cp278

IBMフィンランド、スウェーデン

IBM280

Cp280

IBMイタリア

IBM284

Cp284

IBMカタロニア語/スペイン、スペイン語圏ラテン・アメリカ

IBM285

Cp285

IBM英国、アイルランド

IBM290

Cp290

EBCDIC-JP-kana、日本語EBCDIC

IBM297

Cp297

IBMフランス

IBM300

Cp300

Japan DB EBCDIC、日本語EBCDIC

IBM420

Cp420

IBMアラビア語

IBM424

Cp424

IBMヘブライ語

IBM500

Cp500

EBCDIC 500V1

IBM860

Cp860

MS-DOSポルトガル語

IBM861

Cp861

MS-DOSアイスランド語

IBM863

Cp863

MS-DOSカナダ系フランス語

IBM864

Cp864

PCアラビア語

IBM865

Cp865

MS-DOS北欧

IBM868

Cp868

MS-DOSパキスタン

IBM869

Cp869

IBM近代ギリシャ語

IBM870

Cp870

IBM多言語ラテン文字-2

IBM871

Cp871

IBMアイスランド

IBM918

Cp918

IBMパキスタン(ウルドゥー語)

ISO-2022-CN

ISO2022CN

ISO 2022 CN形式のGB2312およびCNS11643、簡体字および繁体字中国語(Unicodeへの変換のみ)

ISO-2022-JP

ISO2022JP

ISO 2022形式のJIS X 0201、0208、日本語

ISO-2022-KR

ISO2022KR

ISO 2022 KR、韓国語

ISO-8859-3

ISO8859_3

ラテン・アルファベットNo. 3

ISO-8859-6

ISO8859_6

ラテン/アラビア語アルファベット

ISO-8859-8

ISO8859_8

ラテン/ヘブライ語アルファベット

JIS_X0201

JIS_X0201

JIS X 0201

JIS_X0212-1990

JIS_X0212-1990

JIS X 0212

Shift_JIS

SJIS

Shift-JIS、日本語

TIS-620

TIS620

TIS620、タイ

windows-1255

Cp1255

Windowsヘブライ語

windows-1256

Cp1256

Windowsアラビア語

windows-1258

Cp1258

Windowsベトナム語

windows-31j

MS932

Windows日本語

x-Big5-Solaris

Big5_Solaris

Big5 (Solaris zh_TW.BIG5ロケール用の7つの追加Hanzi表意文字マッピング付き)

x-euc-jp-linux

EUC_JP_LINUX

JISX 0201、0208、EUCエンコーディング、日本語

x-EUC-TW

EUC_TW

CNS11643 (Plane 1-7,15)、EUCエンコーディング、中国語(繁体字)

x-eucJP-Open

EUC_JP_Solaris

JISX 0201、0208、0212、EUCエンコーディング、日本語

x-IBM1006

Cp1006

IBM AIXパキスタン(ウルドゥー語)

x-IBM1025

Cp1025

IBM多言語キリル文字: ブルガリア、ボスニア、ヘルツェゴビナ、マケドニア(旧ユーゴスラビア・マケドニア共和国)

x-IBM1046

Cp1046

IBMアラビア語 - Windows

x-IBM1097

Cp1097

IBMイラン(現代ペルシャ語)/ペルシャ語

x-IBM1098

Cp1098

IBMイラン(現代ペルシャ語)/ペルシャ語(PC)

x-IBM1112

Cp1112

IBMラトビア、リトアニア

x-IBM1122

Cp1122

IBMエストニア

x-IBM1123

Cp1123

IBMウクライナ

x-IBM1124

Cp1124

IBM AIXウクライナ

x-IBM1381

Cp1381

IBM OS/2、DOS中国(中華人民共和国)

x-IBM1383

Cp1383

IBM AIX中国(中華人民共和国)

x-IBM33722

Cp33722

IBM-eucJP - 日本語(5050のスーパー・セット)

x-IBM834

Cp834

IBM EBCDIC DBCS専用韓国語

x-IBM856

Cp856

IBMヘブライ語

x-IBM875

Cp875

IBMギリシャ語

x-IBM921

Cp921

IBMラトビア、リトアニア(AIX、DOS)

x-IBM922

Cp922

IBMエストニア(AIX、DOS)

x-IBM930

Cp930

UDC 4370文字を含む日本語カタカナ漢字、5026のスーパー・セット

x-IBM933

Cp933

UDC 1880文字を含む韓国語、5029のスーパー・セット

x-IBM935

Cp935

UDC 1880文字を含む簡体字中国語ホスト、5031のスーパー・セット

x-IBM937

Cp937

UDC 6204文字を含む繁体字中国語ホスト、5033のスーパー・セット

x-IBM939

Cp939

UDC 4370文字を含む日本語ラテン文字漢字、5035のスーパー・セット

x-IBM942

Cp942

IBM OS/2日本語、Cp932のスーパー・セット

x-IBM942C

Cp942C

Cp942の拡張機能

x-IBM943

Cp943

IBM OS/2日本語、Cp932およびShift-JISのスーパー・セット

x-IBM943C

Cp943C

Cp943の拡張機能

x-IBM948

Cp948

OS/2中国語(台湾)、938のスーパー・セット

x-IBM949

Cp949

PC韓国語

x-IBM949C

Cp949C

Cp949の拡張機能

x-IBM950

Cp950

PC中国語(香港、台湾)

x-IBM964

Cp964

AIX中国語(台湾)

x-IBM970

Cp970

AIX韓国語

x-ISCII91

ISCII91

インド語派ISCII91エンコーディング

x-ISO2022-CN-CNS

ISO2022_CN_CNS

ISO 2022 CN形式のCNS11643、繁体字中国語(Unicodeからの変換のみ)

x-ISO2022-CN-GB

ISO2022_CN_GB

ISO 2022 CN形式のGB2312、簡体字中国語(Unicodeからの変換のみ)

x-iso-8859-11

x-iso-8859-11

ラテン/タイ語アルファベット

x-JIS0208

x-JIS0208

JIS X 0208

x-JISAutoDetect

JISAutoDetect

Shift-JIS、EUC-JP、ISO 2022 JPの検出および変換(Unicodeへの変換のみ)

x-Johab

x-Johab

韓国語、Johab文字セット

x-MacArabic

MacArabic

Macintoshアラビア語

x-MacCentralEurope

MacCentralEurope

Macintoshラテン文字-2

x-MacCroatian

MacCroatian

Macintoshクロアチア語

x-MacCyrillic

MacCyrillic

Macintoshキリル文字

x-MacDingbat

MacDingbat

Macintosh Dingbat

x-MacGreek

MacGreek

Macintoshギリシャ語

x-MacHebrew

MacHebrew

Macintoshヘブライ語

x-MacIceland

MacIceland

Macintoshアイスランド語

x-MacRoman

MacRoman

Macintosh Roman

x-MacRomania

MacRomania

Macintoshルーマニア

x-MacSymbol

MacSymbol

Macintoshシンボル

x-MacThai

MacThai

Macintoshタイ

x-MacTurkish

MacTurkish

Macintoshトルコ語

x-MacUkraine

MacUkraine

Macintoshウクライナ

x-MS950-HKSCS

MS950_HKSCS

Windows繁体字中国語(香港の拡張付き)

x-mswin-936

MS936

Windows簡体字中国語

x-PCK

PCK

Solaris版のShift_JIS

x-SJIS_0213

x-SJIS_0213

Shift_JISX0213

x-windows-50220

Cp50220

Windows Codepage 50220 (7ビット実装)

x-windows-50221

Cp50221

Windows Codepage 50221 (7ビット実装)

x-windows-874

MS874

Windowsタイ語

x-windows-949

MS949

Windows韓国語

x-windows-950

MS950

Windows繁体字中国語

x-windows-iso2022jp

x-windows-iso2022jp

拡張ISO-2022-JP (MS932ベース)