日本語 EUC は、EUC (Extended UNIX Code : 拡張 UNIX コード) に、以下の日本語文字集合を割り当てた文字集合およびエンコーディングを提供するものです。ja ロケールで日本語を表現する文字コード体系として使われています。
表 2-1 日本語 EUC の文字集合
文字集合 (符号化文字集合) |
文字コード |
---|---|
JIS X 0201-1976 |
|
機能キャラクタ集合 間隔文字 ローマ文字用図形キャラクタ集合 抹消文字 |
0x00 - 0x19 0x20 0x21 - 0x7e 0x7f |
ISO 6429 C1 制御文字 (0x8e、0x8f を除く) |
0x80 - 0x9f |
JIS X 0201-1976 片仮名用図形キャラクタ集合 (文字未定義領域 E/0 - F/14 は含まない) |
0x8ea1 - 0x8edf |
JIS X 0208-1990 (1 - 84 区) |
0xa1a1 - 0xf4fe |
JIS X 0212-1990 (1 - 84 区) |
0x8fa1a1 - 0x8ff4fe |
ユーザー定義文字 (1 - 20 区) |
0xf5a1 - 0xfefe 0x8ff5a1 - 0x8ffefe |
ただし、JIS で未定義となっている以下の領域には、ベンダー定義文字を割り当てています。
JIS X 0208 13 区 |
特殊記号 |
JIS X 0212 83 区 - 84 区 |
JIS X 0212 に含まれない IBM 拡張文字 |
日本語 EUC の場合、ベンダー定義文字とは、JIS X 0208 13 区文字未定義領域に割り当てられた特殊記号、ならびに JIS X 0212 83 区 - 84 区文字未定義領域に割り当てられた JIS X 0208 と JIS X 0212 のどちらにも含まれない IBM 拡張文字を表します。