Wnn6 上級ユーザーおよびシステム管理者ガイド

1.5 テキスト形式辞書

テキスト形式辞書は日本語 EUC コードで記述され、テキストエディタで編集することができます。テキスト形式辞書は、バイナリデータ形式辞書と相互変換できます。

図 1-3 辞書構成

Graphic

テキスト形式の辞書ファイル名の拡張子は「.u」 、バイナリデータ形式の辞書ファイル名の拡張子は 「.dic」 です。

テキスト形式辞書は次の書式で作成します。

読み	単語	品詞	頻度	コメント	<-	個々の単語について記述します。
読み	単語	品詞	頻度	コメント	
読み	単語	品詞	頻度	コメント	
読み	単語	品詞	頻度	コメント	
読み	単語	品詞	頻度	コメント	
 ・    ・    ・    ・	     ・
 ・    ・    ・    ・	     ・
 ・    ・    ・    ・	     ・

「読み」、「単語」、「品詞」、「頻度」、「コメント」は空白文字またはタブ文字で区切ります。

表 1-14 テキスト形式辞書の書式

No 

項目 

 

1  

読み 

単語の読み。  

指定できる文字数は 252 文字まで。ユーザー辞書はひらがな、「ー」、半角英数字で、システム辞書はひらがな、「ー」で逆順に表現する。 

半角英数字の大文字と小文字は区別しない。ソート時の文字の昇順は「ー」、ひらがな、半角英数字の順になる1

2  

単語 

指定できる文字数は 252 文字まで。半角文字、全角文字、ユーザー定義文字など、すべての文字表現が可能。 

スペース、改行などの制御文字は「0」 に続く 2 桁の 8 進数で表す。  

「¥」 に「0」 以外の文字を続けると、その文字を指す (「¥¥」 は文字「¥」 を指す)  

3  

品詞 

品詞名を入力する  

4  

頻度  

各単語ごとの頻度値  

5  

コメント  

各単語ごとに付けられるコメント。指定できる文字数は 252 文字まで  

1. 「読み」「単語」「コメント」はそれぞれあわせて 252 文字です。

ユーザーが新規にユーザー辞書ファイルを作成した場合は、その辞書を Wnn6 が参照するように環境設定ファイル wnnenvrc に記述する必要があります。

"address.dic" を新しく作成した場合、wnnenvrc には次のように記述します。


setdic usr/@USR/address.dic	-	5 0 0 - - 0
					・↑
					・↑
新規に追加する辞書ファイルの
パス名を設定
											 																↑
																												↑
																											頻度情報
																											この場合、辞書ファイル内の頻度値を参照