java.io.InputStreamReader
、java.io.OutputStreamWriter
、java.lang.String
、およびjava.nio.charset
パッケージのクラスを使用すると、Unicodeとその他のいくつかの文字エンコーディング間の変換を行うことができます。サポートされるエンコーディングは、Java Platform, Standard Edition 9 (Java SE 9)の実装によって異なります。Java SE 9の各実装によるサポートが必要なエンコーディングの一覧は、java.nio.charset.Charsetのクラスの説明を参照してください。
次の各表は、Oracle Java SE 9でサポートされているエンコーディング・セットを示します。java.nio
APIで使用される正準名は、多くの場合、java.io
APIおよびjava.lang
APIで使用される名前とは異なります。
java.nio API用の正準名 | java.io APIとjava.lang API用の正準名 | 説明 |
---|---|---|
IBM00858 |
Cp858 |
Cp850の拡張機能でユーロ文字を含む |
IBM437 |
Cp437 |
MS-DOS米国、オーストラリア、ニュージーランド、南アフリカ |
IBM775 |
Cp775 |
PCバルト諸語 |
IBM850 |
Cp850 |
MS-DOSラテン文字-1 |
IBM852 |
Cp852 |
MS-DOSラテン文字-2 |
IBM855 |
Cp855 |
IBMキリル文字 |
IBM857 |
Cp857 |
IBMトルコ語 |
IBM862 |
Cp862 |
PCヘブライ語 |
IBM866 |
Cp866 |
MS-DOSロシア語 |
ISO-8859-1 |
ISO8859_1 |
ISO -8859-1、ラテン・アルファベットNo. 1 |
ISO-8859-2 |
ISO8859_2 |
ラテン・アルファベットNo. 2 |
ISO-8859-4 |
ISO8859_4 |
ラテン・アルファベットNo. 4 |
ISO-8859-5 |
ISO8859_5 |
ラテン/キリル文字アルファベット |
ISO-8859-7 |
ISO8859_7 |
ラテン/ギリシャ文字アルファベット(ISO-8859-7:2003) |
ISO-8859-9 |
ISO8859_9 |
ラテン・アルファベットNo. 5 |
ISO-8859-13 |
ISO8859_13 |
ラテン・アルファベットNo. 7 |
ISO-8859-15 |
ISO8859_15 |
ラテン・アルファベットNo. 9 |
KOI8-R |
KOI8_R |
KOI8-R、ロシア語 |
KOI8-U |
KOI8_U |
KOI8-U、ウクライナ語 |
US-ASCII |
ASCII |
米国の情報交換標準コード |
UTF-8 |
UTF8 |
8ビットUnicode (UCS) Transformation Format |
UTF-16 |
UTF-16 |
16ビットUnicode (UCS) Transformation Format、オプションのバイト順マークによって識別されるバイト順 |
UTF-16BE |
UnicodeBigUnmarked |
16ビットUnicode (UCS) Transformation Format、ビッグエンディアン・バイト順 |
UTF-16LE |
UnicodeLittleUnmarked |
16ビットUnicode (UCS) Transformation Format、リトルエンディアン・バイト順 |
UTF-32 |
UTF_32 |
32ビットUnicode (UCS) Transformation Format、オプションのバイト順マークによって識別されるバイト順 |
UTF-32BE |
UTF_32BE |
32ビットUnicode (UCS) Transformation Format、ビッグエンディアン・バイト順 |
UTF-32LE |
UTF_32LE |
32ビットUnicode (UCS) Transformation Format、リトルエンディアン・バイト順 |
x-UTF-32BE-BOM |
UTF_32BE_BOM |
32ビットUnicode (UCS) Transformation Format、ビッグエンディアン・バイト順、バイト順マーク付き |
x-UTF-32LE-BOM |
UTF_32LE_BOM |
32ビットUnicode (UCS) Transformation Format、リトルエンディアン・バイト順、バイト順マーク付き |
windows-1250 |
Cp1250 |
Windows東欧 |
windows-1251 |
Cp1251 |
Windowsキリル文字 |
windows-1252 |
Cp1252 |
Windowsラテン文字-1 |
windows-1253 |
Cp1253 |
Windowsギリシャ文字 |
windows-1254 |
Cp1254 |
Windowsトルコ語 |
windows-1257 |
Cp1257 |
Windowsバルト諸語 |
該当なし |
UnicodeBig |
16ビットUnicode (UCS) Transformation Format、ビッグエンディアン・バイト順、バイト順マーク付き |
x-IBM737 |
Cp737 |
PCギリシャ文字 |
x-IBM874 |
Cp874 |
IBMタイ |
x-UTF-16LE-BOM |
UnicodeLittle |
16ビットUnicode (UCS) Transformation Format、リトルエンディアン・バイト順、バイト順マーク付き |
java.nio API用の正準名 | java.io APIとjava.lang API用の正準名 | 説明 |
---|---|---|
Big5 |
Big5 |
Big5、中国語(繁体字) |
Big5-HKSCS |
Big5_HKSCS |
Big5 (香港の拡張付き)、中国語(繁体字、2001改訂を組み込み) |
EUC-JP |
EUC_JP |
JISX 0201、0208、0212、EUCエンコーディング、日本語 |
EUC-KR |
EUC_KR |
KS C 5601、EUCエンコーディング、韓国語 |
GB18030 |
GB18030 |
中国語(簡体字)、中華人民共和国標準 |
GB2312 |
EUC_CN |
GB2312、EUCエンコーディング、中国語(簡体字) |
GBK |
GBK |
GBK、中国語(簡体字) |
IBM-Thai |
Cp838 |
IBMタイ拡張SBCS |
IBM01140 |
Cp1140 |
Cp037の拡張機能でユーロ文字を含む |
IBM01141 |
Cp1141 |
Cp273の拡張機能でユーロ文字を含む |
IBM01142 |
Cp1142 |
Cp277の拡張機能でユーロ文字を含む |
IBM01143 |
Cp1143 |
Cp278の拡張機能でユーロ文字を含む |
IBM01144 |
Cp1144 |
Cp280の拡張機能でユーロ文字を含む |
IBM01145 |
Cp1145 |
Cp284の拡張機能でユーロ文字を含む |
IBM01146 |
Cp1146 |
Cp285の拡張機能でユーロ文字を含む |
IBM01147 |
Cp1147 |
Cp297の拡張機能でユーロ文字を含む |
IBM01148 |
Cp1148 |
Cp500の拡張機能でユーロ文字を含む |
IBM01149 |
Cp1149 |
Cp871の拡張機能でユーロ文字を含む |
IBM037 |
Cp037 |
米国、カナダ(2か国語、フランス語)、オランダ、ポルトガル、ブラジル、オーストラリア |
IBM1026 |
Cp1026 |
IBMラテン文字-5、トルコ |
IBM1047 |
Cp1047 |
ラテン文字-1 (EBCDICホスト用) |
IBM273 |
Cp273 |
IBMオーストリア、ドイツ |
IBM277 |
Cp277 |
IBMデンマーク、ノルウェー |
IBM278 |
Cp278 |
IBMフィンランド、スウェーデン |
IBM280 |
Cp280 |
IBMイタリア |
IBM284 |
Cp284 |
IBMカタロニア語/スペイン、スペイン語圏ラテン・アメリカ |
IBM285 |
Cp285 |
IBM英国、アイルランド |
IBM290 |
Cp290 |
EBCDIC-JP-kana、日本語EBCDIC |
IBM297 |
Cp297 |
IBMフランス |
IBM300 |
Cp300 |
Japan DB EBCDIC、日本語EBCDIC |
IBM420 |
Cp420 |
IBMアラビア語 |
IBM424 |
Cp424 |
IBMヘブライ語 |
IBM500 |
Cp500 |
EBCDIC 500V1 |
IBM860 |
Cp860 |
MS-DOSポルトガル語 |
IBM861 |
Cp861 |
MS-DOSアイスランド語 |
IBM863 |
Cp863 |
MS-DOSカナダ系フランス語 |
IBM864 |
Cp864 |
PCアラビア語 |
IBM865 |
Cp865 |
MS-DOS北欧 |
IBM868 |
Cp868 |
MS-DOSパキスタン |
IBM869 |
Cp869 |
IBM近代ギリシャ語 |
IBM870 |
Cp870 |
IBM多言語ラテン文字-2 |
IBM871 |
Cp871 |
IBMアイスランド |
IBM918 |
Cp918 |
IBMパキスタン(ウルドゥー語) |
ISO-2022-CN |
ISO2022CN |
ISO 2022 CN形式のGB2312およびCNS11643、簡体字および繁体字中国語(Unicodeへの変換のみ) |
ISO-2022-JP |
ISO2022JP |
ISO 2022形式のJIS X 0201、0208、日本語 |
ISO-2022-KR |
ISO2022KR |
ISO 2022 KR、韓国語 |
ISO-8859-3 |
ISO8859_3 |
ラテン・アルファベットNo. 3 |
ISO-8859-6 |
ISO8859_6 |
ラテン/アラビア語アルファベット |
ISO-8859-8 |
ISO8859_8 |
ラテン/ヘブライ語アルファベット |
JIS_X0201 |
JIS_X0201 |
JIS X 0201 |
JIS_X0212-1990 |
JIS_X0212-1990 |
JIS X 0212 |
Shift_JIS |
SJIS |
Shift-JIS、日本語 |
TIS-620 |
TIS620 |
TIS620、タイ |
windows-1255 |
Cp1255 |
Windowsヘブライ語 |
windows-1256 |
Cp1256 |
Windowsアラビア語 |
windows-1258 |
Cp1258 |
Windowsベトナム語 |
windows-31j |
MS932 |
Windows日本語 |
x-Big5-Solaris |
Big5_Solaris |
Big5 (Solaris zh_TW.BIG5ロケール用の7つの追加Hanzi表意文字マッピング付き) |
x-euc-jp-linux |
EUC_JP_LINUX |
JISX 0201、0208、EUCエンコーディング、日本語 |
x-EUC-TW |
EUC_TW |
CNS11643 (Plane 1-7,15)、EUCエンコーディング、中国語(繁体字) |
x-eucJP-Open |
EUC_JP_Solaris |
JISX 0201、0208、0212、EUCエンコーディング、日本語 |
x-IBM1006 |
Cp1006 |
IBM AIXパキスタン(ウルドゥー語) |
x-IBM1025 |
Cp1025 |
IBM多言語キリル文字: ブルガリア、ボスニア、ヘルツェゴビナ、マケドニア(旧ユーゴスラビア・マケドニア共和国) |
x-IBM1046 |
Cp1046 |
IBMアラビア語 - Windows |
x-IBM1097 |
Cp1097 |
IBMイラン(現代ペルシャ語)/ペルシャ語 |
x-IBM1098 |
Cp1098 |
IBMイラン(現代ペルシャ語)/ペルシャ語(PC) |
x-IBM1112 |
Cp1112 |
IBMラトビア、リトアニア |
x-IBM1122 |
Cp1122 |
IBMエストニア |
x-IBM1123 |
Cp1123 |
IBMウクライナ |
x-IBM1124 |
Cp1124 |
IBM AIXウクライナ |
x-IBM1381 |
Cp1381 |
IBM OS/2、DOS中国(中華人民共和国) |
x-IBM1383 |
Cp1383 |
IBM AIX中国(中華人民共和国) |
x-IBM33722 |
Cp33722 |
IBM-eucJP - 日本語(5050のスーパー・セット) |
x-IBM834 |
Cp834 |
IBM EBCDIC DBCS専用韓国語 |
x-IBM856 |
Cp856 |
IBMヘブライ語 |
x-IBM875 |
Cp875 |
IBMギリシャ語 |
x-IBM921 |
Cp921 |
IBMラトビア、リトアニア(AIX、DOS) |
x-IBM922 |
Cp922 |
IBMエストニア(AIX、DOS) |
x-IBM930 |
Cp930 |
UDC 4370文字を含む日本語カタカナ漢字、5026のスーパー・セット |
x-IBM933 |
Cp933 |
UDC 1880文字を含む韓国語、5029のスーパー・セット |
x-IBM935 |
Cp935 |
UDC 1880文字を含む簡体字中国語ホスト、5031のスーパー・セット |
x-IBM937 |
Cp937 |
UDC 6204文字を含む繁体字中国語ホスト、5033のスーパー・セット |
x-IBM939 |
Cp939 |
UDC 4370文字を含む日本語ラテン文字漢字、5035のスーパー・セット |
x-IBM942 |
Cp942 |
IBM OS/2日本語、Cp932のスーパー・セット |
x-IBM942C |
Cp942C |
Cp942の拡張機能 |
x-IBM943 |
Cp943 |
IBM OS/2日本語、Cp932およびShift-JISのスーパー・セット |
x-IBM943C |
Cp943C |
Cp943の拡張機能 |
x-IBM948 |
Cp948 |
OS/2中国語(台湾)、938のスーパー・セット |
x-IBM949 |
Cp949 |
PC韓国語 |
x-IBM949C |
Cp949C |
Cp949の拡張機能 |
x-IBM950 |
Cp950 |
PC中国語(香港、台湾) |
x-IBM964 |
Cp964 |
AIX中国語(台湾) |
x-IBM970 |
Cp970 |
AIX韓国語 |
x-ISCII91 |
ISCII91 |
インド語派ISCII91エンコーディング |
x-ISO2022-CN-CNS |
ISO2022_CN_CNS |
ISO 2022 CN形式のCNS11643、繁体字中国語(Unicodeからの変換のみ) |
x-ISO2022-CN-GB |
ISO2022_CN_GB |
ISO 2022 CN形式のGB2312、簡体字中国語(Unicodeからの変換のみ) |
x-iso-8859-11 |
x-iso-8859-11 |
ラテン/タイ語アルファベット |
x-JIS0208 |
x-JIS0208 |
JIS X 0208 |
x-JISAutoDetect |
JISAutoDetect |
Shift-JIS、EUC-JP、ISO 2022 JPの検出および変換(Unicodeへの変換のみ) |
x-Johab |
x-Johab |
韓国語、Johab文字セット |
x-MacArabic |
MacArabic |
Macintoshアラビア語 |
x-MacCentralEurope |
MacCentralEurope |
Macintoshラテン文字-2 |
x-MacCroatian |
MacCroatian |
Macintoshクロアチア語 |
x-MacCyrillic |
MacCyrillic |
Macintoshキリル文字 |
x-MacDingbat |
MacDingbat |
Macintosh Dingbat |
x-MacGreek |
MacGreek |
Macintoshギリシャ語 |
x-MacHebrew |
MacHebrew |
Macintoshヘブライ語 |
x-MacIceland |
MacIceland |
Macintoshアイスランド語 |
x-MacRoman |
MacRoman |
Macintosh Roman |
x-MacRomania |
MacRomania |
Macintoshルーマニア |
x-MacSymbol |
MacSymbol |
Macintoshシンボル |
x-MacThai |
MacThai |
Macintoshタイ |
x-MacTurkish |
MacTurkish |
Macintoshトルコ語 |
x-MacUkraine |
MacUkraine |
Macintoshウクライナ |
x-MS950-HKSCS |
MS950_HKSCS |
Windows繁体字中国語(香港の拡張付き) |
x-mswin-936 |
MS936 |
Windows簡体字中国語 |
x-PCK |
PCK |
Solaris版のShift_JIS |
x-SJIS_0213 |
x-SJIS_0213 |
Shift_JISX0213 |
x-windows-50220 |
Cp50220 |
Windows Codepage 50220 (7ビット実装) |
x-windows-50221 |
Cp50221 |
Windows Codepage 50221 (7ビット実装) |
x-windows-874 |
MS874 |
Windowsタイ語 |
x-windows-949 |
MS949 |
Windows韓国語 |
x-windows-950 |
MS950 |
Windows繁体字中国語 |
x-windows-iso2022jp |
x-windows-iso2022jp |
拡張ISO-2022-JP (MS932ベース) |