テキスト形式辞書は日本語 EUC コードで記述され、テキストエディタで編集することができます。テキスト形式辞書は、バイナリデータ形式辞書と相互変換できます。
テキスト形式の辞書ファイル名の拡張子は「.u」 、バイナリデータ形式の辞書ファイル名の拡張子は 「.dic」 です。
テキスト形式辞書は次の書式で作成します。
読み 単語 品詞 頻度 コメント <- 個々の単語について記述します。 読み 単語 品詞 頻度 コメント 読み 単語 品詞 頻度 コメント 読み 単語 品詞 頻度 コメント 読み 単語 品詞 頻度 コメント ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ ・ |
「読み」、「単語」、「品詞」、「頻度」、「コメント」は空白文字またはタブ文字で区切ります。
表 1-14 テキスト形式辞書の書式
No |
項目 |
|
---|---|---|
1 |
読み |
単語の読み。 指定できる文字数は 252 文字まで。ユーザー辞書はひらがな、「ー」、半角英数字で、システム辞書はひらがな、「ー」で逆順に表現する。 半角英数字の大文字と小文字は区別しない。ソート時の文字の昇順は「ー」、ひらがな、半角英数字の順になる1 |
2 |
単語 |
指定できる文字数は 252 文字まで。半角文字、全角文字、ユーザー定義文字など、すべての文字表現が可能。 スペース、改行などの制御文字は「0」 に続く 2 桁の 8 進数で表す。 「¥」 に「0」 以外の文字を続けると、その文字を指す (「¥¥」 は文字「¥」 を指す) |
3 |
品詞 |
品詞名を入力する |
4 |
頻度 |
各単語ごとの頻度値 |
5 |
コメント |
各単語ごとに付けられるコメント。指定できる文字数は 252 文字まで |
1. 「読み」「単語」「コメント」はそれぞれあわせて 252 文字です。
ユーザーが新規にユーザー辞書ファイルを作成した場合は、その辞書を Wnn6 が参照するように環境設定ファイル wnnenvrc に記述する必要があります。
"address.dic" を新しく作成した場合、wnnenvrc には次のように記述します。
setdic usr/@USR/address.dic - 5 0 0 - - 0 ・↑ ・↑ 新規に追加する辞書ファイルの パス名を設定 ↑ ↑ 頻度情報 この場合、辞書ファイル内の頻度値を参照 |