オフライン学習の対象となる辞書、頻度ファイルを読み込む可能性のあるかな漢字変換サーバーと辞書引きサーバーをロックします。
ロックすると、かな漢字変換サーバーと辞書引きサーバーの機能は以下のように制御されます。
ロックすると使用できなくなる機能:
頻度学習
FI 学習
自動学習 (無変換 / 文節切り)
単語登録 / 単語削除
辞書 / 頻度ファイルの読み込み
ユーザー辞書 / ユーザー頻度ファイルの削除
ユーザー学習用ディレクトリ作成
辞書ファイル / 頻度ファイルの作成
コメントの設定 (ファイル / 単語)
ファイルのパスワード設定
辞書への品詞テーブル設定
オフライン学習の終了時には、かな漢字変換サーバーと辞書引きサーバーに対する上記の制御を解除します。
登録語自動反映モジュールを起動し、すべてのユーザー辞書を調査して、複数のユーザーで登録されている単語をマージ辞書に登録します。
マージ辞書に登録された単語は、ユーザー辞書から削除されます。この削除によって FI 関係ユーザー辞書が影響を受ける場合は、FI 関係ユーザー辞書も更新されます。
登録語自動反映モジュールは、必ずオフライン学習機能から (自動的に) 起動してください。単独では起動しないでください。
登録語自動反映モジュールは、ユーザー辞書に直接アクセスします。登録語自動反映の機能を使用する場合は、オフライン学習の処理全体をユーザー辞書の存在するシステム上で行なってください。
登録語自動反映機能について、その処理の流れに沿って解説します。
オフライン学習では、ユーザー辞書、頻度ファイル、FI 関係ユーザー辞書、FI 関係頻度ファイルに対して、変換効率の向上、 頻度の飽和防止、ディスクやメモリー容量の削減のための学習処理を行います。
同一単語の過去 2 回の頻度をもとに、表 3–1 に示すパターンに従って頻度を下げます。
表 3–1 頻度下げパターン
パターン |
処理 |
|
---|---|---|
前々回、前回、今回の頻度がすべて同じ 前々回--->前回--->今回 |
頻度を下げる |
|
前回の処理で頻度下げが発生 前々回--->↓ 前回--->↓ 今回 |
頻度を下げる |
|
上記以外のすべてのパターン |
頻度はそのまま |
頻度が 0 になった単語を辞書から削除します。
辞書の種類によって対応が異なります。
ユーザー辞書、頻度ファイル
同一単語の前々回->前回->今回 (現在から 2 回前まで) の頻度がすべて 0 の場合に単語を削除します。
FI 関係ユーザー辞書、FI 関係頻度ファイル
接続頻度が 0 の場合に、単語に対する FI 関係データを削除します。
Entries ファイルは、オフライン学習の環境とその保存ディレクトリの対応関係を定義します。このファイルは、システムから自動的に出力されます。
ファイル :
/usr/lib/locale/ja/wnn/offline/Entries |
Entries ファイルは次のような書式で出力されます。
target_directory save_directory target_directory save_directory ・ ・ |
表 3–2 Entries ファイル出力書式の内容
target_directory |
対象となる環境のディレクトリ名を絶対パス名で出力 |
save_directory |
保存ファイルのあるディレクトリ名を出力 上図の offline ディレクトリからの相対パス名で出力 |
次に、Entriesファイルの出力例を示します。
/usr/lib/locale/ja/wnn/ja/dic/usr/user1 user1 /usr/lib/locale/ja/wnn/ja/dic/usr/user2 user2 |
通常、save_directory は target_directory のベース名と同じになります。
すでに save_directory 名が存在する場合は、「_」 に続いてシリアルナンバーが付加されます。
以下に、save_directory にシリアルナンバーが付加された場合の出力例を示します。
/usr/lib/locale/ja/wnn/ja/dic/usr/userA userA /home/userA userA_1 /opt/Wnn6/userA userA_2 |