Wnn6 上級ユーザーおよびシステム管理者ガイド

テキスト形式辞書

テキスト形式辞書は日本語 EUC で記述され、テキストエディタで編集することができます。テキスト形式辞書は、バイナリデータ形式辞書と相互変換できます。

図 1–3 辞書構成

この図では、バイナリデータ形式辞書とテキスト形式辞書が双方向で変換を行うことができることを示しています。

テキスト形式の辞書ファイル名の接尾辞は「.u」 、バイナリデータ形式の辞書ファイル名の接尾辞は 「.dic」 です。

テキスト形式辞書は次の書式で作成します。

 読み 単語 品詞 頻度 コメント  <— 個々の単語について記述します。
 読み 単語 品詞 頻度 コメント
 読み 単語 品詞 頻度 コメント
 読み 単語 品詞 頻度 コメント
 読み 単語 品詞 頻度 コメント
 ・   ・   ・  ・     ・
 ・   ・   ・  ・     ・
 ・   ・   ・  ・     ・ 

「読み」、「単語」、「品詞」、「頻度」、「コメント」は空白文字またはタブ文字で区切ります。

表 1–14 テキスト形式辞書の書式

No 

項目 

 

1  

読み 

単語の読み。  

指定できる文字数は 124* 文字まで。ユーザー辞書はひらがな、「ー」、半角英数字で、システム辞書はひらがな、「ー」で逆順に表現する。 

半角英数字の大文字と小文字は区別しない。ソート時の文字の昇順は「ー」、ひらがな、半角英数字の順になる1

2  

単語 

指定できる文字数は 124* 文字まで。半角文字、全角文字、ユーザー定義文字など、すべての文字表現が可能。 

スペース、改行などの制御文字は「0」 に続く 2 桁の 8 進数で表す。  

「\」 に「0」 以外の文字を続けると、その文字を指す (「\\」 は文字「\」 を指す)  

3  

品詞 

品詞名を入力する  

4  

頻度  

各単語ごとの頻度値  

5  

コメント  

各単語ごとに付けられるコメント。指定できる文字数は 124* 文字まで  

 

 

注 : *「読み」「単語」「コメント」は、合計で 124 文字まで 

ユーザーが新規にユーザー辞書ファイルを作成した場合は、その辞書を Wnn6 が参照するように環境設定ファイル wnnenvrc に記述する必要があります。

"address.dic" を新しく作成した場合、wnnenvrc には次のように記述します。


setdic usr/@USR/address.dic	-	5 0 0 - - 0
					・
					・
( ※ 上記で、usr/@USR/address.dic は、新規に追加する辞書ファイルのパス名です。続いて頻度情報ファイルのパス名を指定しますが、この例のように - を指定すると、辞書ファイル内の頻度値を参照します。)