日本語 EUC と PCK の文字コード変換規則は『TOG 日本ベンダ協議会』の日本語 EUC・シフト JIS コード変換仕様』に基づいています。変換規則の概要は、図 3–1 を参照してください。
JIS X 0201 で規定されている英数字、記号
変換先でも変換元と同じコードになります。
JIS X 0201 で規定されているカタカナ、記号
変換先でも変換元と同じコードになります。ただし、日本語EUC 側ではEUCコードセット2を示す SS2 (0x8e) が先頭に付加されます。
JIS X 0208 で規定されている文字
それぞれのコードセットで割り当てられている JIS X 0208 の同じ区、点用のコードポイントの間で変換します。
JIS X 0212 で規定されている文字
PCK で IBM 拡張文字として定義されている文字の場合は、次の項目を参照してください。その他の文字については対応する文字がないため、置換文字に変換します。置換文字は「〓」(名称: GETA MARK、PCK の値: 0x819C)
ベンダー定義文字
特殊記号 (13 区記号)
付録 A ベンダー定義文字の変換を参照してください。
IBM 拡張文字
JIS X 0208 または JIS X 0212 で同じ文字が規定されている場合はその文字との間で変換します。どちらにも規定されていない場合は、JIS X 0212 の 83 区、84 区の領域を使って変換します。具体的なコードの対応は、付録 B フォントの移行 を参照してください。
NEC 選定 IBM 拡張文字
PCK から日本語 EUC への変換では、PCK で一度 IBM 拡張文字に変換してから日本語 EUC に変換します。日本語 EUC から PCK への変換では、IBM 拡張文字から NEC 選定 IBM 拡張へは変換されません。
ユーザー定義文字
以下の領域を使って変換し、区番号、点番号の小さいほうから順にコードを割り当てるものとします。
|
PCK |
日本語 EUC |
---|---|---|
ユーザー定義文字 1880 文字 |
0xf040 - 0xf4fc 0xf540 - 0xf9fc |
0xf5a1 - 0xfefe 0x8ff5a1 - 0x8ffefe |