cs00 ユーザーズガイド

第 6 章 文字コード変換機能のカスタマイズ

この章では、cs00 の文字コード変換機能をカスタマイズする方法を説明します。

文字コード変換定義用ファイル

cs00 は受け取った文字コードに対して、現在の入力モードに応じた変換を行います。変換は、各変換テーブルファイルの変換規則に基づいて行われます。ローマ字かな変換、文字種の相互変換もこの変換機能を用いて行われます。

cs00 で使用するコード変換定義用ファイル名を変更したい [ファイルの位置は、$HOME/.mle/locale/cs00 または、 /etc/mle/locale/cs00 で固定です。定義ファイル名に相対パスを含めることで、位置を変更することは可能です。また、かな漢字変換サーバーインタフェースモジュール xci を使用している時のみファイル名を変更できます。] 場合は、resourcesファイルに以下の設定値を追加してください。

  1. CC_HR ひらがなモード用

  2. CC_KT 全角カタカナモード用

  3. CC_HKT 半角カタカナモード用

  4. CC_EIS 全角英数モード用

  5. CC_HEIS 半角英数モード用

これらのファイルの設定例は以下のとおりです。

*xci*cs00.config.CC_HR: my_hiragana.ccv


注 -

文字コード変換定義用ファイルの内容は、必ず日本語 EUC を使用してください。


文字コード変換定義用ファイルの書式

コ−ド変換テ−ブル定義用ファイルの書式は次のとおりです。各変換規則は、1 行で構成されています。

入力文字列変換文字列 再評価文字数 | s ]

再評価文字数を指定した場合は、入力文字列の後ろから再評価する文字数を表します。この文字数は、入力文字列の文字数より小さい必要があります。省略した場合は 0 を指定したものとみなします。また、数字のかわりに s を指定した場合は、未決の文字列は変換しないことを表します。「未決」とは、入力文字列が複数の規則に一致する可能性がある状態のことをいいます。s を指定した場合には、再評価する文字数を指定することはできません。

次に変換例を示します。

表 6-1 制御文字の指定

記号 

機能 

¥n 

改行 

¥r 

復帰 

¥t 

タブ 

¥f 

改ページ 

¥‾ 

空白 (0x20) 

¥{ 

¥} 

¥# 

¥¥ 

¥ 

¥^ 

¥0 

8 進数 (¥001, ¥012) 

¥1 

8 進数 (¥100, ¥123) 

¥x 

2 桁の 16 進数 (¥x01, ¥xff) 

¥w 

4 桁の 16 進数 (¥w0101, ¥wabcd) 

¥q 

8 桁の 16 進数 (¥q00000101, ¥q8000cdab) 

¥k 

区点コード (¥k0101, ¥k1616)