文字セットは、文字を認識するためのコンピュータの内部文字コードのマップ方法を決定します。ほとんどの言語は、1 つの文字セット全体を表すにはシングル・バイト文字で十分です。しかし、何千もの文字を使用する言語もあります。そのような言語は、1 つ 1 つの文字を一意に表すのに 2、3、4 バイトを必要とします。
ヘルプ・システムがサポートする文字セットを表 14-1 にリストします。しかし、すべてのプラットフォームに存在するわけではない文字セットもあります。
表 14-1 共通デスクトップ環境文字セット
言語 |
文字セット名 |
説明 |
---|---|---|
|
|
|
西ヨーロッパおよび南北アメリカ |
ISO-8859-1 |
ISO ラテン 1 |
|
HP-ROMAN8 |
HP ローマン |
|
IBM-850 |
PC 多国語 |
|
|
|
中央ヨーロッパ |
ISO-8859-2 |
ISO ラテン 2 |
|
|
|
キリル文字 |
ISO-8859-5 |
ISO ラテン / キリル文字 |
|
|
|
アラビア語 |
ISO-8859-6 |
ISO ラテン / アラビア語 |
|
HP-ARABIC8 |
HP アラビア語 8 |
|
IBM-1046 |
PC アラビア語 |
|
|
|
ヘブライ語 |
ISO-8859-8 |
ISO ラテン / ヘブライ語 |
|
HP-HEBREW8 |
HP ヘブライ語 8 |
|
IBM-856 |
PC ヘブライ語 |
|
|
|
ギリシャ語 |
ISO-8859-7 |
ISO ラテン / ギリシャ語 |
|
HP GREEK8 |
HP ギリシャ語 8 |
|
|
|
トルコ語 |
ISO-8859-9 |
ISO ラテン 5 |
|
HP-TURKISH8 |
HP トルコ語 8 |
|
|
|
日本語 |
EUC-JP |
日本語 EUC (JIS X-0201, JIS X-0208, JIS X-0212) |
|
HP-SJIS |
HP 日本語 シフト JIS |
|
HP-KANA8 |
HP 日本語 カタカナ 8 (JIS X-0201 1976) |
|
IBM-932 |
PC 日本語 シフト JIS |
|
|
|
韓国語 |
EUC-KR |
韓国語 EUC |
|
|
|
中国語 |
EUC-CN |
簡体字 EUC (中華人民共和国) (GB2312) |
|
EUC-TW |
繁体字 EUC (台湾) (CNS 11643.*) |
|
HP-BIG5 |
HP 繁体字 Big5 |
|
HP-CCDC |
HP 繁体字 CCDC |
|
HP-15CN |
HP 繁体字 EUC |
|
|
|
タイ語 |
TIS-620 |
タイ語 |
ヘルプタグ・ファイルを記述する際、どんなヘルプ・テキストにもマルチバイト文字を使用できます。しかし、ヘルプタグのマークアップ自体 (タグ名、エンティティ名、ID など) は、8 ビット文字で入力しなければなりません。