Wnn6 上級ユーザーおよびシステム管理者ガイド

1.5 テキスト形式辞書

テキスト形式辞書は日本語 EUC コードで記述され、テキストエディタで編集することができます。テキスト形式辞書はバイナリデータ形式辞書と相互に変換することができます。

図 1-3 辞書構成

Graphic

テキスト形式の辞書ファイル名の拡張子は「.u」 、バイナリデータ形式の辞書ファイル名の拡張子は 「.dic」 です。

テキスト形式辞書は次の書式で作成します。

読み	単語	品詞	頻度	コメント	←	個々の単語について記述します。
読み	単語	品詞	頻度	コメント	
読み	単語	品詞	頻度	コメント	
読み	単語	品詞	頻度	コメント	
読み	単語	品詞	頻度	コメント	
 ・    ・    ・    ・	     ・
 ・    ・    ・    ・	     ・
 ・    ・    ・    ・	     ・

「読み」、「単語」、「品詞」、「頻度」、「コメント」は「空白文字」または「タブ文字」で区切ります。

表 1-14 テキスト形式辞書の書式

No 

項目 

1  

読み 

単語の読み。  

252 文字までの長さで、ユーザー辞書はひらがな /「ー」/ 半角英数字で、システム辞書はひらがな /「ー」で逆順に表現する。 

半角英数字は大文字 / 小文字の区別は行わない。ソート時の文字の昇順は「ー」/ ひらがな / 半角英数字の順になる [「読み」「単語」「コメント」はそれぞれあわせて 252 文字です。]

2  

単語 

252 文字までの半角文字、全角文字、ユーザー定義文字などすべての文字表現が可能。 

スペース、改行などの制御文字は「0」 に続く 2 桁の 8 進数で表す。  

「¥」 に「0」 以外の文字を続けるとその文字を指す (「¥¥」 は文字「¥」 を指す)  

3  

品詞 

品詞名を入力する  

4  

頻度  

各単語ごとの頻度値  

5  

コメント  

各単語ごとに付けられるコメント。250 文字まで  

ユーザーが新規にユーザー辞書ファイルを作成した場合は、その辞書を Wnn6 が参照するように環境設定ファイル wnnenvrc に記述する必要があります。

"address.dic" を新しく作成した場合、次のように wnnenvrc に記述します。

・
setdic usr/@USR/address.dic	-	5 0 0 - - 0
・↑
・↑
新規に追加する辞書ファイルの
パス名を設定


↑ 
頻度情報
この場合、辞書ファイル内の頻度値を参照