オフライン学習の対象となる辞書、頻度ファイルを読み込む可能性のあるかな漢字変換サーバーと辞書引サーバーをロックします。
ロックされると、かな漢字変換サーバーと辞書引サーバーの機能は以下のように制御されます。
ロックにより動作しなくなる機能
頻度学習
FI 学習
自動学習 (無変換 / 文節切り)
単語登録 / 単語削除
辞書 / 頻度ファイルの読み込み
ユーザー辞書 / ユーザー頻度ファイルの削除
ユーザー学習用ディレクトリ作成
辞書ファイル / 頻度ファイルの作成
コメントの設定 (ファイル / 単語)
ファイルのパスワード設定
辞書への品詞テーブル設定
オフライン学習の終了時には、上記の制御を終了します。
登録語自動反映モジュールを起動し、すべてのユーザー辞書を調査して、複数のユーザーで登録されている単語を、マージ辞書に登録します。
マージ辞書に登録された単語はユーザー辞書から削除されます。この削除によって FI 関係ユーザー辞書が影響を受ける場合は FI 関係ユーザー辞書も更新されます。
登録語自動反映モジュールは、必ずオフライン学習機能から (自動的に) 起動するようにしてください。単独では起動させないでください。
登録語自動反映モジュールは、ユーザー辞書に直接アクセスします。登録語自動反映の機能を使用する場合は、オフライン学習の処理全体をユーザー辞書の存在するシステム上で行わなければなりません。
登録語自動反映機能について、その処理の流れに沿って解説します。
オフライン学習では、ユーザー辞書、頻度ファイル、FI 関係ユーザー辞書、FI 関係頻度ファイルに対して、変換効率の向上、 頻度の飽和防止、ディスク・メモリー容量の削減のための学習処理を行います。
同一単語の過去 2 回の頻度をもとに、表 3-1 に示すパターンに従って頻度を下げます。
表 3-1 頻度下げパターン
パターン |
処理 |
|
---|---|---|
前々回、前回、今回の頻度がすべて同じ 前々回 前回 今回 ●→→→●→→→● |
頻度を下げる |
|
前回の処理で頻度下げが発生 前々回 前回 今回 ●→→→↓ |
頻度を下げる |
|
↓ ●→→→● |
||
上記以外のすべてのパターン |
頻度はそのまま |
頻度が 0 になった単語を、辞書から削除します。
辞書の種類により、次のように対応が異なります。
ユーザー辞書、頻度ファイル
同一単語の、前々回→前回→今回 (現在から 2 回前まで) の頻度がすべて 0 の場合に、単語を削除します。
FI 関係ユーザー辞書、FI 関係頻度ファイル
接続頻度が 0 の場合に、単語に対する FI 関係データを削除します。
Entries ファイルとは、オフライン学習における、環境とその保存ディレクトリの対応関係を定義するもので、システムから自動的に出力されます。
ファイル :
/usr/lib/locale/ja/wnn/offline/Entries |
Entries ファイルは次のような書式で出力されます。
target_directory save_directory target_directory save_directory ・ ・ |
表 3-2 Entries ファイル出力書式の内容
target_directory |
対象となる環境のディレクトリ名を絶対パス名で出力 |
save_directory |
保存ファイルのあるディレクトリ名を出力 上図の offline ディレクトリからの相対パス名で出力 |
次に、Entries ファイルの出力例を示します。
/usr/lib/locale/ja/wnn/ja/dic/usr/user1 user1 /usr/lib/locale/ja/wnn/ja/dic/usr/user2 user2 |
通常、save_directory は target_directory のベース名と同じになります。
既に save_directory 名が存在する場合は、「-」 に続いてシリアルナンバーが付加されます。
以下に save_directory にシリアルナンバーが付加された場合の出力例を示します。
/usr/lib/locale/ja/wnn/ja/dic/usr/userA /home/userA /opt/Wnn6/userA |
userA userA_1 userA_2 |