Solaris 2.6 から、『TOG 日本ベンダ協議会推奨 日本語 EUC・シフト JIS コード変換仕様』に基づく新しいコード変換規則が導入されました。
この変換規則に従うものは次の通りです。
次に変換規則を図示します。
図 A-1 に関する注意事項を次に示します。
PCK と日本語 EUC の間では、共通自由領域にユーザー定義文字および IBM 拡張文字を次のように割り当てるものとします。
|
PKC |
日本語 EUC |
---|---|---|
ユーザー定義文字 1880 文字 |
0xf040 - 0xf4fc 0xf540 - 0xf9fc |
0xf5a1 - 0xfefe 0x8ff5a1 - 0x8ffefe |
IBM 拡張文字 388 文字 |
0xfa40 - 0xfcfc |
JISX0208 JISX0212 0x8ff3a1 - 0x8ff4fe |
ユーザー定義文字は区番号、点番号ともに番号の小さいほうから順にコードを割り当てるものとします。
IBM 拡張文字は JIS X 0208、JIS X 0212 に対応する文字がある場合はその文字に変換し、それ以外の文字は 84 区 94 点 からコードの値が小さいほうへ順に変換します。
この変換では、コードセット 3 の 83 区 1 点 〜 82 点は予約領域です。
JIS X 0212 は、日本語 EUC から PCK への変換で PCK に対応する文字がない場合は、ある特定の文字 (以降「置換文字」とします) に変換します。
NEC 選定 IBM 拡張文字は、PCK から日本語 EUC への変換では、PCK で一度 IBM 拡張文字に変換してから日本語 EUC に変換します。
日本語 EUC から PCK への変換で IBM 拡張文字から NEC 選定 IBM 拡張文字へ変換されません。
変換元の文字コードとしては有効ですが、変換先に対応する文字コードが存在しない場合は、「置換文字」に変換します。
「置換文字」として「〓」を使用します。