cs00 ユーザーズガイド

第 6 章 文字コード変換機能のカスタマイズ

この章では、cs00 の文字コード変換機能をカスタマイズする方法を説明します。

文字コード変換定義用ファイル

cs00 は受け取った文字コードに対して、現在の入力モードに応じた変換を行います。変換は、各変換テーブルファイルの変換規則に基づいて行われます。ローマ字かな変換、文字種の相互変換も、この変換機能を利用して行われます。

cs00 で使用するコード変換定義用ファイル名を変更したい場合は、resources ファイルに以下の設定値を追加してください。

  1. CC_HR ひらがなモード用

  2. CC_KT 全角カタカナモード用

  3. CC_HKT 半角カタカナモード用

  4. CC_EIS 全角英数モード用

  5. CC_HEIS 半角英数モード用


注 -

ファイルの位置は $HOME/.mle/locale/cs00、または /etc/mle/locale/cs00 で固定です。ただし、定義ファイル名に相対パスを含めると、位置を変更できます。かな漢字変換サーバーインタフェースモジュール xci を使用している時のみファイル名を変更できます。


これらのファイルの設定例は以下のとおりです。

*xci*cs00.config.CC_HR: my_hiragana.ccv


注 -

文字コード変換定義用ファイルでは、必ず日本語 EUC を使用してください。


文字コード変換定義用ファイルの書式

コ−ド変換テ−ブル定義用ファイルの書式は次のとおりです。各変換規則は、1 行で構成されています。

< 入力文字列 > < 変換文字列 > < 再評価文字数または s>

再評価文字数は、入力文字列の後ろから再評価する文字数です ( 省略可能 )。再評価文字数には、入力文字列の文字数より小さい値を指定してください。省略した場合は 0 を指定したものとみなします。また、数字のかわりに s を指定した場合は、未決の文字列は変換されません。「未決」とは、入力文字列が複数の規則に一致する可能性がある状態のことをいいます。s を指定した場合は、再評価文字数は指定できません。

次に変換例を示します。

表 6-1 制御文字の指定

記号 

機能 

¥n 

改行 

¥r 

復帰 

¥t 

タブ 

¥f 

改ページ 

¥‾ 

空白 (0x20) 

¥{ 

¥} 

¥# 

¥¥ 

¥ 

¥^ 

¥0 

8 進数 (¥001, ¥012) 

¥1 

8 進数 (¥100, ¥123) 

¥x 

2 桁の 16 進数 (¥x01, ¥xff) 

¥w 

4 桁の 16 進数 (¥w0101, ¥wabcd) 

¥q 

8 桁の 16 進数 (¥q00000101, ¥q8000cdab) 

¥k 

区点コード (¥k0101, ¥k1616)