SunOS および JFP では、ja ロケールにおける日本語を含む複数バイト言語を表現する文字コード体系として、日本語 EUC (拡張 UNIX コード) を採用しています。このマニュアルページでは、日本語 EUC と文字集合のマッピングについて説明します。
日本語 EUC と文字集合は、次のように対応しています (ここで SS2 は 0x8e、SS3 は 0x8f を表します)。
日本語 EUC | 文字集合 |
---|---|
0x00 – 0x19 | JIS X 0201–1976 機能キャラクタ集合 |
0x20 | JIS X 0201–1976 間隔文字 |
0x21 – 0x7e | JIS X 0201–1976 ローマ文字用図形キャラクタ集合 |
0x7f | JIS X 0201–1976 抹消文字 |
0x80 – 0x9f | ISO 6429 C1 制御文字 (0x8e, 0x8f を除く) |
SS2 0xa1 – 0xdf | JIS X 0201–1976 片仮名用図形キャラクタ集合 |
(文字未定義領域 E/0 – F/14 は含まない) | |
SS3 0xa1a1 – 0xa1fe | JIS X 0212–1990 (1 区 1 点 – 1 区 94 点) |
SS3 0xa2a1 – 0xa2fe | JIS X 0212–1990 (2 区 1 点 – 2 区 94 点) |
: | : |
: | : |
SS3 0xf3a1 – 0xf3fe | JIS X 0212–1990 (83 区 1 点 – 83 区 94 点) |
SS3 0xf4a1 – 0xf4fe | JIS X 0212–1990 (84 区 1 点 – 84 区 94 点) |
0xa1a1 – 0xa1fe | JIS X 0208–1990 (1 区 1 点 – 1 区 94 点) |
0xa2a1 – 0xa2fe | JIS X 0208–1990 (2 区 1 点 – 2 区 94 点) |
: | : |
: | : |
0xf3a1 – 0xf3fe | JIS X 0208–1990 (83 区 1 点 – 83 区 94 点) |
0xf4a1 – 0xf4fe | JIS X 0208–1990 (84 区 1 点 – 84 区 94 点) |
各文字集合は、日本語 EUC の拡張コードセット番号と次のように対応しています。
文字集合 (符号化文字集合) | 日本語 EUC の拡張コードセット番号 |
---|---|
JIS X 0201 ローマ文字用図形キャラクタ集合 | 0 |
JIS X 0208–1990 | 1 |
JIS X 0201 カタカナ用図形キャラクタ集合 | 2 |
JIS X 0212–1990 | 3 |
日本語 EUC で次の範囲は特別な意味を持ちます。
日本語 EUC | 文字集合の区域 | 意味 |
---|---|---|
SS3 0xf3a1 – 0xf4fe | JIS X 0212–1990 83 区 – 84 区 | ベンダー定義文字 |
(JIS X 0212–1990 に含まれない IBM 拡張文字) | ||
SS3 0xf5a1 – 0xfefe | ユーザー定義文字 11 区 – 20 区 | |
0xada1 – 0xadfe | JIS X 0208–1990 13 区 | ベンダー定義文字 (特殊記号) |
0xf5a1 – 0xfefe | ユーザー定義文字 1 区 – 10 区 |