java.io.InputStreamReader、java.io.OutputStreamWriter、java.lang.String、および java.nio.charset パッケージのクラスを使用すると、Unicode とその他のいくつかの文字エンコーディング間の変換を行うことができます。サポートされるエンコーディングは、Java Platform, Standard Edition 7 (Java SE 7) の実装によって異なります。Java Platform, Standard Edition 7 の各実装によるサポートが必要なエンコーディングの一覧は、 java.nio.charset.Charset のクラスの説明を参照してください。
Oracle の Java SE Development Kit 7 (Java SE 7) の全プラットフォーム (Solaris、Linux、Microsoft Windows) 版と Java SE Runtime Environment 7 (JRE 7) の Solaris および Linux 版は、このページに掲載されているすべてのエンコーディングをサポートしています。Oracle の JRE 7 の Microsoft Windows 版は、完全な国際版とヨーロッパ言語版のどちらのバージョンでもインストールすることができます。JRE 7 のインストールプログラムは、ホストオペレーティングシステムがヨーロッパ言語だけをサポートしていることを識別すると、デフォルトでヨーロッパ言語版をインストールします。インストールプログラムがほかの言語の必要性を識別した場合、またはカスタマイズされたインストールでユーザーがヨーロッパ言語以外のサポートを要求した場合は、完全な国際化版がインストールされます。ヨーロッパ言語版では、次の基本エンコーディングセットの表に掲載されているエンコーディングだけがサポートされます。lib/charsets.jar ファイルを含む国際化版では、このページに示すエンコーディングがすべてサポートされています。
次の各表は、Java SE 7 でサポートされているエンコーディングセットを示します。新しい java.nio API で使用される正準名は、多くの場合、java.io API および java.lang API で使用される名前とは異なります。
| 
 | 
 | 説明 | 
|---|---|---|
| IBM00858 | Cp858 | Cp850 の拡張機能でユーロ文字を含む | 
| IBM437 | Cp437 | MS-DOS 米国、オーストラリア、ニュージーランド、南アフリカ | 
| IBM775 | Cp775 | PC バルト諸語 | 
| IBM850 | Cp850 | MS-DOS ラテン文字-1 | 
| IBM852 | Cp852 | MS-DOS ラテン文字-2 | 
| IBM855 | Cp855 | IBM キリル文字 | 
| IBM857 | Cp857 | IBM トルコ語 | 
| IBM862 | Cp862 | PC ヘブライ語 | 
| IBM866 | Cp866 | MS-DOS ロシア語 | 
| ISO-8859-1 | ISO8859_1 | ISO -8859-1、ラテンアルファベット No. 1 | 
| ISO-8859-2 | ISO8859_2 | ラテンアルファベット No. 2 | 
| ISO-8859-4 | ISO8859_4 | ラテンアルファベット No. 4 | 
| ISO-8859-5 | ISO8859_5 | ラテン/キリル文字アルファベット | 
| ISO-8859-7 | ISO8859_7 | ラテン/ギリシャ文字アルファベット (ISO-8859-7:2003) | 
| ISO-8859-9 | ISO8859_9 | ラテンアルファベット No. 5 | 
| ISO-8859-13 | ISO8859_13 | ラテンアルファベット No. 7 | 
| ISO-8859-15 | ISO8859_15 | ラテンアルファベット No. 9 | 
| KOI8-R | KOI8_R | KOI8-R、ロシア語 | 
| KOI8-U | KOI8_U | KOI8-U、ウクライナ語 | 
| US-ASCII | ASCII | American Standard Code for Information Interchange | 
| UTF-8 | UTF8 | 8 ビット Unicode (UCS) Transformation Format | 
| UTF-16 | UTF-16 | 16 ビット Unicode (UCS) Transformation Format、オプションのバイト順マークによって識別されるバイト順 | 
| UTF-16BE | UnicodeBigUnmarked | 16 ビット Unicode (UCS) Transformation Format、ビッグエンディアンバイト順 | 
| UTF-16LE | UnicodeLittleUnmarked | 16 ビット Unicode (UCS) Transformation Format、リトルエンディアンバイト順 | 
| UTF-32 | UTF_32 | 32 ビット Unicode (UCS) Transformation Format、オプションのバイト順マークによって識別されるバイト順 | 
| UTF-32BE | UTF_32BE | 32 ビット Unicode (UCS) Transformation Format、ビッグエンディアンバイト順 | 
| UTF-32LE | UTF_32LE | 32 ビット Unicode (UCS) Transformation Format、リトルエンディアンバイト順 | 
| x-UTF-32BE-BOM | UTF_32BE_BOM | 32 ビット Unicode (UCS) Transformation Format、ビッグエンディアンバイト順、バイト順マーク付き | 
| x-UTF-32LE-BOM | UTF_32LE_BOM | 32 ビット Unicode (UCS) Transformation Format、リトルエンディアンバイト順、バイト順マーク付き | 
| windows-1250 | Cp1250 | Windows 東欧 | 
| windows-1251 | Cp1251 | Windows キリル文字 | 
| windows-1252 | Cp1252 | Windows ラテン文字-1 | 
| windows-1253 | Cp1253 | Windows ギリシャ文字 | 
| windows-1254 | Cp1254 | Windows トルコ語 | 
| windows-1257 | Cp1257 | Windows バルト諸語 | 
| 利用できない | UnicodeBig | 16 ビット Unicode (UCS) Transformation Format、ビッグエンディアンバイト順、バイト順マーク付き | 
| x-IBM737 | Cp737 | PC ギリシャ文字 | 
| x-IBM874 | Cp874 | IBM タイ | 
| x-UTF-16LE-BOM | UnicodeLittle | 16 ビット Unicode (UCS) Transformation Format、リトルエンディアンバイト順、バイト順マーク付き | 
| 
 | 
 | 説明 | 
|---|---|---|
| Big5 | Big5 | Big5、中国語 (繁体字) | 
| Big5-HKSCS | Big5_HKSCS | Big5 (香港の拡張付き)、中国語 (繁体字、2001 改訂を組み込み) | 
| EUC-JP | EUC_JP | JISX 0201、0208、0212、EUC エンコーディング、日本語 | 
| EUC-KR | EUC_KR | KS C 5601、EUC エンコーディング、韓国語 | 
| GB18030 | GB18030 | 中国語 (簡体字)、中華人民共和国標準 | 
| GB2312 | EUC_CN | GB2312、EUC エンコーディング、中国語 (簡体字) | 
| GBK | GBK | GBK、中国語 (簡体字) | 
| IBM-Thai | Cp838 | IBM タイ拡張 SBCS | 
| IBM01140 | Cp1140 | Cp037 の拡張機能でユーロ文字を含む | 
| IBM01141 | Cp1141 | Cp273 の拡張機能でユーロ文字を含む | 
| IBM01142 | Cp1142 | Cp277 の拡張機能でユーロ文字を含む | 
| IBM01143 | Cp1143 | Cp278 の拡張機能でユーロ文字を含む | 
| IBM01144 | Cp1144 | Cp280 の拡張機能でユーロ文字を含む | 
| IBM01145 | Cp1145 | Cp284 の拡張機能でユーロ文字を含む | 
| IBM01146 | Cp1146 | Cp285 の拡張機能でユーロ文字を含む | 
| IBM01147 | Cp1147 | Cp297 の拡張機能でユーロ文字を含む | 
| IBM01148 | Cp1148 | Cp500 の拡張機能でユーロ文字を含む | 
| IBM01149 | Cp1149 | Cp871 の拡張機能でユーロ文字を含む | 
| IBM037 | Cp037 | 米国、カナダ (2 か国語、フランス語)、オランダ、ポルトガル、ブラジル、オーストラリア | 
| IBM1026 | Cp1026 | IBM ラテン文字-5、トルコ | 
| IBM1047 | Cp1047 | ラテン文字-1 (EBCDIC ホスト用) | 
| IBM273 | Cp273 | IBM オーストリア、ドイツ | 
| IBM277 | Cp277 | IBM デンマーク、ノルウェー | 
| IBM278 | Cp278 | IBM フィンランド、スウェーデン | 
| IBM280 | Cp280 | IBM イタリア | 
| IBM284 | Cp284 | IBM カタロニア語/スペイン、スペイン語圏ラテンアメリカ | 
| IBM285 | Cp285 | IBM 英国、アイルランド | 
| IBM297 | Cp297 | IBM フランス | 
| IBM420 | Cp420 | IBM アラビア語 | 
| IBM424 | Cp424 | IBM ヘブライ語 | 
| IBM500 | Cp500 | EBCDIC 500V1 | 
| IBM860 | Cp860 | MS-DOS ポルトガル語 | 
| IBM861 | Cp861 | MS-DOS アイスランド語 | 
| IBM863 | Cp863 | MS-DOS カナダ系フランス語 | 
| IBM864 | Cp864 | PC アラビア語 | 
| IBM865 | Cp865 | MS-DOS 北欧 | 
| IBM868 | Cp868 | MS-DOS パキスタン | 
| IBM869 | Cp869 | IBM 近代ギリシャ語 | 
| IBM870 | Cp870 | IBM 多言語ラテン文字-2 | 
| IBM871 | Cp871 | IBM アイスランド | 
| IBM918 | Cp918 | IBM パキスタン (ウルドゥー語) | 
| ISO-2022-CN | ISO2022CN | ISO 2022 CN 形式の GB2312 および CNS11643、簡体字および繁体字中国語 (Unicode への変換のみ) | 
| ISO-2022-JP | ISO2022JP | ISO 2022 形式の JIS X 0201、0208、日本語 | 
| ISO-2022-KR | ISO2022KR | ISO 2022 KR、韓国語 | 
| ISO-8859-3 | ISO8859_3 | ラテンアルファベット No. 3 | 
| ISO-8859-6 | ISO8859_6 | ラテン/アラビア語アルファベット | 
| ISO-8859-8 | ISO8859_8 | ラテン/ヘブライ語アルファベット | 
| JIS_X0201 | JIS_X0201 | JIS X 0201 | 
| JIS_X0212-1990 | JIS_X0212-1990 | JIS X 0212 | 
| Shift_JIS | SJIS | Shift-JIS、日本語 | 
| TIS-620 | TIS620 | TIS620、タイ | 
| windows-1255 | Cp1255 | Windows ヘブライ語 | 
| windows-1256 | Cp1256 | Windows アラビア語 | 
| windows-1258 | Cp1258 | Windows ベトナム語 | 
| windows-31j | MS932 | Windows 日本語 | 
| x-Big5-Solaris | Big5_Solaris | Big5 (Solaris zh_TW.BIG5 ロケール用の 7 つの追加 Hanzi 表意文字マッピング付き) | 
| x-euc-jp-linux | EUC_JP_LINUX | JISX 0201、0208、EUC エンコーディング、日本語 | 
| x-EUC-TW | EUC_TW | CNS11643 (Plane 1-7,15)、EUC エンコーディング、中国語 (繁体字) | 
| x-eucJP-Open | EUC_JP_Solaris | JISX 0201、0208、0212、EUC エンコーディング、日本語 | 
| x-IBM1006 | Cp1006 | IBM AIX パキスタン (ウルドゥー語) | 
| x-IBM1025 | Cp1025 | IBM 多言語キリル文字: ブルガリア、ボスニア、ヘルツェゴビナ、マケドニア (旧ユーゴスラビアマケドニア共和国) | 
| x-IBM1046 | Cp1046 | IBM アラビア語 - Windows | 
| x-IBM1097 | Cp1097 | IBM イラン (現代ペルシャ語)/ペルシャ語 | 
| x-IBM1098 | Cp1098 | IBM イラン (現代ペルシャ語)/ペルシャ語 (PC) | 
| x-IBM1112 | Cp1112 | IBM ラトビア、リトアニア | 
| x-IBM1122 | Cp1122 | IBM エストニア | 
| x-IBM1123 | Cp1123 | IBM ウクライナ | 
| x-IBM1124 | Cp1124 | IBM AIX ウクライナ | 
| x-IBM1381 | Cp1381 | IBM OS/2、DOS 中国 (中華人民共和国) | 
| x-IBM1383 | Cp1383 | IBM AIX 中国 (中華人民共和国) | 
| x-IBM33722 | Cp33722 | IBM-eucJP - 日本語 (5050 のスーパーセット) | 
| x-IBM834 | Cp834 | IBM EBCDIC DBCS 専用韓国語 | 
| x-IBM856 | Cp856 | IBM ヘブライ語 | 
| x-IBM875 | Cp875 | IBM ギリシャ語 | 
| x-IBM921 | Cp921 | IBM ラトビア、リトアニア (AIX、DOS) | 
| x-IBM922 | Cp922 | IBM エストニア (AIX、DOS) | 
| x-IBM930 | Cp930 | UDC 4370 文字を含む日本語カタカナ漢字、5026 のスーパーセット | 
| x-IBM933 | Cp933 | UDC 1880 文字を含む韓国語、5029 のスーパーセット | 
| x-IBM935 | Cp935 | UDC 1880 文字を含む簡体字中国語ホスト、5031 のスーパーセット | 
| x-IBM937 | Cp937 | UDC 6204 文字を含む繁体字中国語ホスト、5033 のスーパーセット | 
| x-IBM939 | Cp939 | UDC 4370 文字を含む日本語ラテン文字漢字、5035 のスーパーセット | 
| x-IBM942 | Cp942 | IBM OS/2 日本語、Cp932 のスーパーセット | 
| x-IBM942C | Cp942C | Cp942 の拡張機能 | 
| x-IBM943 | Cp943 | IBM OS/2 日本語、Cp932 および Shift-JIS のスーパーセット | 
| x-IBM943C | Cp943C | Cp943 の拡張機能 | 
| x-IBM948 | Cp948 | OS/2 中国語 (台湾)、938 のスーパーセット | 
| x-IBM949 | Cp949 | PC 韓国語 | 
| x-IBM949C | Cp949C | Cp949 の拡張機能 | 
| x-IBM950 | Cp950 | PC 中国語 (香港、台湾) | 
| x-IBM964 | Cp964 | AIX 中国語 (台湾) | 
| x-IBM970 | Cp970 | AIX 韓国語 | 
| x-ISCII91 | ISCII91 | インド語派 ISCII91 エンコーディング | 
| x-ISO2022-CN-CNS | ISO2022_CN_CNS | ISO 2022 CN 形式の CNS11643、繁体字中国語 (Unicode からの変換のみ) | 
| x-ISO2022-CN-GB | ISO2022_CN_GB | ISO 2022 CN 形式の GB2312、簡体字中国語 (Unicode からの変換のみ) | 
| x-iso-8859-11 | x-iso-8859-11 | ラテン/タイ語アルファベット | 
| x-JIS0208 | x-JIS0208 | JIS X 0208 | 
| x-JISAutoDetect | JISAutoDetect | Shift-JIS、EUC-JP、ISO 2022 JP の検出および変換 (Unicode への変換のみ) | 
| x-Johab | x-Johab | 韓国語、Johab 文字セット | 
| x-MacArabic | MacArabic | Macintosh アラビア語 | 
| x-MacCentralEurope | MacCentralEurope | Macintosh ラテン文字-2 | 
| x-MacCroatian | MacCroatian | Macintosh クロアチア語 | 
| x-MacCyrillic | MacCyrillic | Macintosh キリル文字 | 
| x-MacDingbat | MacDingbat | Macintosh Dingbat | 
| x-MacGreek | MacGreek | Macintosh ギリシャ語 | 
| x-MacHebrew | MacHebrew | Macintosh ヘブライ語 | 
| x-MacIceland | MacIceland | Macintosh アイスランド語 | 
| x-MacRoman | MacRoman | Macintosh Roman | 
| x-MacRomania | MacRomania | Macintosh ルーマニア | 
| x-MacSymbol | MacSymbol | Macintosh シンボル | 
| x-MacThai | MacThai | Macintosh タイ | 
| x-MacTurkish | MacTurkish | Macintosh トルコ語 | 
| x-MacUkraine | MacUkraine | Macintosh ウクライナ | 
| x-MS950-HKSCS | MS950_HKSCS | Windows 繁体字中国語 (香港の拡張付き) | 
| x-mswin-936 | MS936 | Windows 簡体字中国語 | 
| x-PCK | PCK | Solaris 版の Shift_JIS | 
| x-SJIS_0213 | x-SJIS_0213 | Shift_JISX0213 | 
| x-windows-50220 | Cp50220 | Windows Codepage 50220 (7 ビット実装) | 
| x-windows-50221 | Cp50221 | Windows Codepage 50221 (7 ビット実装) | 
| x-windows-874 | MS874 | Windows タイ語 | 
| x-windows-949 | MS949 | Windows 韓国語 | 
| x-windows-950 | MS950 | Windows 繁体字中国語 | 
| x-windows-iso2022jp | x-windows-iso2022jp | 拡張 ISO-2022-JP (MS932 ベース) |