SunOS および JFP では、ja ロケールにおける日本語を含む複数バイト言語を表 現する文字コード体系として、日本語 EUC (拡張 UNIX コード) を採用しています。このマニュアルページでは、日本語 EUC と文字集合のマッピングについて説明します。
日本語 EUC と文字集合は、次のように対応しています (ここで SS2 は 0x8e 、SS3 は 0x8f を表します) 。
日本語 EUC | 文字集合 |
0x00 - 0x19 | JIS X 0201-1976 機能キャラクタ集合 |
0x20 | JIS X 0201-1976 間隔文字 |
0x21 - 0x7e | JIS X 0201-1976 ローマ文字用図形キャラクタ集合 |
0x7f | JIS X 0201-1976 抹消文字 |
0x80 - 0x9f | ISO 6429 C1 制御文字 (0x8e, 0x8f を除く) |
SS2 0xa1 - 0xdf | JIS X 0201-1976 片仮名用図形キャラクタ集合 |
(文字未定義領域 E/0 - F/14 は含まない) | |
SS3 0xa1a1 - 0xa1fe | JIS X 0212 (1 区 1 点 - 1 区 94 点) |
SS3 0xa2a1 - 0xa2fe | JIS X 0212 (2 区 1 点 - 2 区 94 点) |
: | : |
: | : |
SS3 0xf3a1 - 0xf3fe | JIS X0212 (83 区 1 点 - 83 区 94 点) |
SS3 0xf4a1 - 0xf4fe | JIS X0212 (84 区 1 点 - 84 区 94 点) |
0xa1a1 - 0xa1fe | JIS X 0208 (1 区 1 点 - 1 区 94 点) |
0xa2a1 - 0xa2fe | JIS X 0208 (2 区 1 点 - 2 区 94 点) |
: | : |
: | : |
0xf3a1 - 0xf3fe | JIS X0208 (83 区 1 点 - 83 区 94 点) |
0xf4a1 - 0xf4fe | JIS X0208 (84 区 1 点 - 84 区 94 点) |
各文字集合は、日本語 EUC の拡張コードセット番号と次のように対応しています。
文字集合 (符号化文字集合) | 日本語 EUC の拡張コードセット番号 |
JIS X 0201 ローマ文字用図形キャラクタ集合 | 0 |
JIS X 0208 | 1 |
JIS X 0201 カタカナ用図形キャラクタ集合 | 2 |
JIS X 0212 | 3 |
日本語 EUC で次の範囲は特別な意味を持ちます。
日本語 EUC | 文字集合の区域 | 意味 |
SS3 0xf3a1 - 0xf4fe | JIS X 0212 83 区 - 84 区 | ベンダー定義文字 |
(JIS X 0212 に含まれない | ||
IBM 拡張文字) | ||
SS3 0xf5a1 - 0xfefe | ユーザー定義文字 1 区 - 10 区 | |
0xada1 - 0xadfe | JIS X 0208 13 区 | ベンダー定義文字 (特殊記号) |
0xf5a1 - 0xfefe | ユーザー定義文字 11 区 - 20 区 |