JFP ユーザーズガイド

UTF-8

UTF-8 は、Unicode のエンコーディングの1つであり、ASCII 部分 (0x00-0x7F) に関しては EUC または PCK と互換性をたもったまま、UCS-2 や UCS-4 の文字を使えるようにしたエンコーディングです。ja_JP.UTF-8 ロケールで文字を表現する文字コード体系として使われています。

表 2-3 UTF-8 の文字集合

文字集合 (符号化文字集合) 

文字コード 

Unicode 2.1 

0x00 - 0xefbfbf (U+0000 - U+FFFF) 

ユーザー定義文字領域は Unicode 2.1 で Private Use area に割り当てられている 0xee8080 - 0xefa3bf (U+E000 - U+F8FF) が該当します。日本語 EUC や PCK で表現できるすべての文字(ベンダー定義文字も含む)も Unicode 2.1 の中に含まれています。


注 -

U+XXXX の XXXX は Unicode 2.1 で表現しているコードを意味します。



注 -

Unicode 2.1 で定義された Surrogate Area (U+D800 - U+DFFF) はサポートされてません。



注 -

Solaris のフォントの制限で、日本語 UTF-8 で Unicode 2.1 で定義されたすべての文字が表示できるわけではありません。