日本語 UTF-8 ロケールは、日本語の文字情報は「UI-OSF 日本語環境実装規約 Version 1.1」を、日本語以外の文字情報は Unicode Consortium の UNICODE 2.1 CHARACTER DATABASE をもとに作成されています。日本語の文字情報は、UI-OSF の実装規約をもとにしているため、他の UNIX ベンダーとの互換性は向上しますが、その反面 ja ロケールおよび ja_JP.PCK ロケールとの相違点も生じます。以下に、日本語文字処理に影響する相違点を説明します。
LC_CTYPE次の日本語ロケール専用文字クラスが追加されています。
ascii | paren | jisx0201 |
gaiji | jhankana | jspace |
次の日本語ロケール専用文字クラスはありません。
jalpha | jspecial | jgreek |
jrussian | junit | jsci |
jgen | jpunct |
ja および ja_JP.PCK ロケールでも使用するアプリケーションは、これらの文字クラスは使用しないようにしてください。
LC_COLLATE
JIS X 0208 のほうが JIS X 0212 より先になります。日本語以外の文字は日本語のあとにコード順で並びます。
LC_TIME
以下の日付、および時刻の表示形式が変わります。() 内はstrftime(3C) および date(1) で有効な書式です。
abday (%a)
日 と () が入らない。
mon (%B)
1月 と 1 の前に <space> が入らない。
d_t_fmt (%c)
%Y年%m月%d日 %H時%M分%S秒 と abday (%a) が入らない。
era_d_t_fmt (%Ec)
%EY%m月%d日 %H時%M分%S秒 と abday (%a) が入らない。
alt_digit (%Od などのロケール固有の代替数値記号を使うもの)
代替数値記号は使用しない。