日本語環境ユーザーズガイド

日本語 EUC と PC 漢字コード間の変換規則

日本語 EUC と PCK の文字コード変換規則は『TOG 日本ベンダ協議会』の日本語 EUC・シフト JIS コード変換仕様』に基づいています。変換規則の概要は、図 3–1 を参照してください。

  1. JIS X 0201 で規定されている英数字、記号

    変換先でも変換元と同じコードになります。

  2. JIS X 0201 で規定されているカタカナ、記号

    変換先でも変換元と同じコードになります。ただし、日本語EUC 側ではEUCコードセット2を示す SS2 (0x8e) が先頭に付加されます。

  3. JIS X 0208 で規定されている文字

    それぞれのコードセットで割り当てられている JIS X 0208 の同じ区、点用のコードポイントの間で変換します。

  4. JIS X 0212 で規定されている文字

    PCK で IBM 拡張文字として定義されている文字の場合は、次の項目を参照してください。その他の文字については対応する文字がないため、置換文字に変換します。置換文字は「〓」(名称: GETA MARK、PCK の値: 0x819C)

  5. ベンダー定義文字

    1. 特殊記号 (13 区記号)

      付録 A ベンダー定義文字の変換を参照してください。

    2. IBM 拡張文字

      JIS X 0208 または JIS X 0212 で同じ文字が規定されている場合はその文字との間で変換します。どちらにも規定されていない場合は、JIS X 0212 の 83 区、84 区の領域を使って変換します。具体的なコードの対応は、付録 B フォントの移行 を参照してください。

    3. NEC 選定 IBM 拡張文字

      PCK から日本語 EUC への変換では、PCK で一度 IBM 拡張文字に変換してから日本語 EUC に変換します。日本語 EUC から PCK への変換では、IBM 拡張文字から NEC 選定 IBM 拡張へは変換されません。

  6. ユーザー定義文字

    以下の領域を使って変換し、区番号、点番号の小さいほうから順にコードを割り当てるものとします。

 

PCK 

日本語 EUC 

ユーザー定義文字 

1880 文字 

0xf040 - 0xf4fc 

0xf540 - 0xf9fc 

0xf5a1 - 0xfefe 

0x8ff5a1 - 0x8ffefe