JFP ユーザーズガイド

UTF-8

UTF-8 は、Unicode のエンコーディングの1つであり、ASCII 部分 (0x00-0x7F) に関しては EUC または PCK と互換性を保ったまま、UCS-2 や UCS-4 の文字を使えるようにしたエンコーディングです。ja_JP.UTF-8 ロケールで文字を表現する文字コード体系として使われています。

表 2-3 UTF-8 の文字集合
 文字集合 (符号化文字集合) 文字コード
 Unicode 2.1 0x00 - 0xefbfbf (U+0000 - U+FFFF)

ユーザー定義文字領域は、Unicode 2.1 で Private Use area に割り当てられている 0xee8080 - 0xefa3bf (U+E000 - U+F8FF) に該当します。日本語 EUC や PCK で表現できるすべての文字(ベンダー定義文字も含む)も Unicode 2.1 の中に含まれています。


注 -

U+XXXX の XXXX は Unicode 2.1 で表現しているコードを意味します。



注 -

Unicode 2.1 で定義された Surrogate Area (U+D800 - U+DFFF) はサポートされていません。



注 -

Solaris のフォントに制限があるため、日本語 UTF-8 では、 Unicode 2.1 で定義された一部の文字を表示できません。