日本語環境ユーザーズガイド

日本語 EUC と PC 漢字コード間の変換規則

日本語 EUC と PCK の文字コード変換規則は『TOG 日本ベンダ協議会』の日本語 EUC・シフト JIS コード変換仕様』に基づいています。変換規則の概要は、図 3–1 を参照してください。

JIS X 0201 で規定されている英数字、記号

変換先でも変換元と同じコードになります。
JIS X 0201 で規定されているカタカナ、記号

変換先でも変換元と同じコードになります。ただし、日本語EUC 側ではEUCコードセット2を示す SS2 (0x8e) が先頭に付加されます。
JIS X 0208 で規定されている文字

それぞれのコードセットで割り当てられている JIS X 0208 の同じ区、点用のコードポイントの間で変換します。
JIS X 0212 で規定されている文字

PCK で IBM 拡張文字として定義されている文字の場合は、次の項目を参照してください。その他の文字については対応する文字がないため、置換文字に変換します。置換文字は「〓」(名称: GETA MARK、PCK の値: 0x819C)
ベンダー定義文字
1. 特殊記号 (13 区記号)
  
  付録 A ベンダー定義文字の変換を参照してください。
2. IBM 拡張文字
  
  JIS X 0208 または JIS X 0212 で同じ文字が規定されている場合はその文字との間で変換します。どちらにも規定されていない場合は、JIS X 0212 の 83 区、84 区の領域を使って変換します。具体的なコードの対応は、付録 B フォントの移行を参照してください。
3. NEC 選定 IBM 拡張文字
  
  PCK から日本語 EUC への変換では、PCK で一度 IBM 拡張文字に変換してから日本語 EUC に変換します。日本語 EUC から PCK への変換では、IBM 拡張文字から NEC 選定 IBM 拡張へは変換されません。
ユーザー定義文字

以下の領域を使って変換し、区番号、点番号の小さいほうから順にコードを割り当てるものとします。

	PCK	日本語 EUC
ユーザー定義文字 1880 文字	0xf040 - 0xf4fc 0xf540 - 0xf9fc	0xf5a1 - 0xfefe 0x8ff5a1 - 0x8ffefe

PCK

日本語 EUC

ユーザー定義文字

1880 文字

0xf040 - 0xf4fc

0xf540 - 0xf9fc

0xf5a1 - 0xfefe

0x8ff5a1 - 0x8ffefe