テキスト形式辞書は日本語 EUC で記述され、テキストエディタで編集することができます。テキスト形式辞書は、バイナリデータ形式辞書と相互変換できます。
テキスト形式の辞書ファイル名の接尾辞は「.u」 、バイナリデータ形式の辞書ファイル名の接尾辞は 「.dic」 です。
テキスト形式辞書は次の書式で作成します。
読み 単語 品詞 頻度 コメント <— 個々の単語について記述します。 読み 単語 品詞 頻度 コメント 読み 単語 品詞 頻度 コメント 読み 単語 品詞 頻度 コメント 読み 単語 品詞 頻度 コメント ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ |
「読み」、「単語」、「品詞」、「頻度」、「コメント」は空白文字またはタブ文字で区切ります。
表 1–14 テキスト形式辞書の書式
No |
項目 |
|
---|---|---|
1 |
読み |
単語の読み。 指定できる文字数は 124* 文字まで。ユーザー辞書はひらがな、「ー」、半角英数字で、システム辞書はひらがな、「ー」で逆順に表現する。 半角英数字の大文字と小文字は区別しない。ソート時の文字の昇順は「ー」、ひらがな、半角英数字の順になる1 |
2 |
単語 |
指定できる文字数は 124* 文字まで。半角文字、全角文字、ユーザー定義文字など、すべての文字表現が可能。 スペース、改行などの制御文字は「0」 に続く 2 桁の 8 進数で表す。 「\」 に「0」 以外の文字を続けると、その文字を指す (「\\」 は文字「\」 を指す) |
3 |
品詞 |
品詞名を入力する |
4 |
頻度 |
各単語ごとの頻度値 |
5 |
コメント |
各単語ごとに付けられるコメント。指定できる文字数は 124* 文字まで |
|
|
注 : *「読み」「単語」「コメント」は、合計で 124 文字まで |
ユーザーが新規にユーザー辞書ファイルを作成した場合は、その辞書を Wnn6 が参照するように環境設定ファイル wnnenvrc に記述する必要があります。
"address.dic" を新しく作成した場合、wnnenvrc には次のように記述します。
setdic usr/@USR/address.dic - 5 0 0 - - 0 ・ ・ |