共通デスクトップ環境 プログラマーズ・ガイド (ヘルプ・システム編)

文字セットおよびマルチバイト文字

文字セットは、文字を認識するためのコンピュータの内部文字コードのマップ方法を決定します。ほとんどの言語は、1 つの文字セット全体を表すにはシングル・バイト文字で十分です。しかし、何千もの文字を使用する言語もあります。そのような言語は、1 つ 1 つの文字を一意に表すのに 2、3、4 バイトを必要とします。

ヘルプ・システムがサポートする文字セットを表 14-1 にリストします。しかし、すべてのプラットフォームに存在するわけではない文字セットもあります。

表 14-1 共通デスクトップ環境文字セット

言語 

文字セット名 

説明 

 

 

 

西ヨーロッパおよび南北アメリカ 

ISO-8859-1 

ISO ラテン 1 

 

HP-ROMAN8 

HP ローマン  

 

IBM-850 

PC 多国語 

 

 

 

中央ヨーロッパ 

ISO-8859-2 

ISO ラテン 2  

 

 

 

キリル文字 

ISO-8859-5 

ISO ラテン / キリル文字 

 

 

 

アラビア語 

ISO-8859-6 

ISO ラテン / アラビア語 

 

HP-ARABIC8 

HP アラビア語 8 

 

IBM-1046 

PC アラビア語 

 

 

 

ヘブライ語 

ISO-8859-8 

ISO ラテン / ヘブライ語 

 

HP-HEBREW8 

HP ヘブライ語 8 

 

IBM-856 

PC ヘブライ語 

 

 

 

ギリシャ語 

ISO-8859-7 

ISO ラテン / ギリシャ語 

 

HP GREEK8 

HP ギリシャ語 8 

 

 

 

トルコ語 

ISO-8859-9 

ISO ラテン 5  

 

HP-TURKISH8 

HP トルコ語 8 

 

 

 

日本語 

EUC-JP 

日本語 EUC (JIS X-0201, JIS X-0208, JIS X-0212) 

 

HP-SJIS 

HP 日本語 シフト JIS 

 

HP-KANA8 

HP 日本語 カタカナ 8 (JIS X-0201 1976) 

 

IBM-932 

PC 日本語 シフト JIS 

 

 

 

韓国語 

EUC-KR 

韓国語 EUC 

 

 

 

中国語 

EUC-CN 

簡体字 EUC (中華人民共和国) (GB2312) 

 

EUC-TW 

繁体字 EUC (台湾) (CNS 11643.*) 

 

HP-BIG5 

HP 繁体字 Big5 

 

HP-CCDC 

HP 繁体字 CCDC 

 

HP-15CN 

HP 繁体字 EUC 

 

 

 

タイ語 

TIS-620 

タイ語 

ヘルプタグ・ファイルを記述する際、どんなヘルプ・テキストにもマルチバイト文字を使用できます。しかし、ヘルプタグのマークアップ自体 (タグ名、エンティティ名、ID など) は、8 ビット文字で入力しなければなりません。