日本語 UTF-8 ロケールは、日本語の文字情報は「UI-OSF 日本語環境実装規約 Version 1.1」を、日本語以外の文字情報は Unicode Consortium の UNICODE 3.0 CHARACTER DATABASE をもとに作成されています。日本語の文字情報は、UI-OSF の実装規約をもとにしているため、他の UNIX ベンダーとの互換性はありますが、Solaris の ja ロケールおよび ja_JP.PCK ロケールとはいくつかの点で異なります。以下に、日本語文字処理に影響する相違点を説明します。
LC_CTYPE
ascii | paren | jisx0201 |
gaiji | jhankana | jspace |
jalpha | jspecial | jgreek |
jrussian | junit | jsci |
jgen | jpunct |
ja ロケールおよび ja_JP.PCK ロケールでも使用するアプリケーションでは、これらの文字クラスは使用しないようにしてください。
LC_COLLATE
JIS X 0208 の方が JIS X 0212 より先になります。日本語以外の文字は日本語の後にコード順で並びます。
LC_TIME
以下の日付および時刻の表示形式が変わります。( ) 内は strftime(3C) および date(1) で有効な書式です。
abday (%a)
日 と ( ) が入らない。
mon (%B)
1月 と 1 の前に <space> が入らない。
d_t_fmt (%c)
%Y年%m月%d日 %H時%M分%S秒 と abday (%a) が入らない。
era_d_t_fmt (%Ec)
%EY%m月%d日 %H時%M分%S秒 と abday (%a) が入らない。
alt_digit (%Od などのロケール固有の代替数値記号を使うもの)
代替数値記号は使用しない。