Wnn6 上級ユーザーおよびシステム管理者ガイド

辞書の構成

Wnn6 のかな漢字変換では、「文節」という変換対象の単位を設定しています。この「文節」は、「自立語」と「付属語」で構成されています。Wnn6 の辞書は、「自立語」向け辞書、「付属語」向け辞書、および、FI 関係辞書に分類されます。「自立語」向けの辞書には、主に、単語の読み、 変換結果の文字列、品詞情報が収められています。「付属語」向けの辞書には、付属語の種類、自立語との接続情報、 付属語間での接続情報が収められています。

自立語向けの辞書は、システム全体で共有するシステム辞書と、特定のユーザーが専有するユーザー辞書に分類されます。システム辞書に対しては、単語の登録や削除といった編集作業を行うことはできません。ユーザー辞書に対しては、その辞書を専有するユーザーは、自由に単語の登録や削除といった編集作業を行うことができます。

Wnn6 のかな漢字変換サーバーは、バイナリデータ形式の辞書を扱います。バイナリデータ形式のユーザー辞書は、テキスト形式の辞書に変換することができます。バイナリデータ形式のシステム辞書は、テキスト形式の辞書に変換することはできません。テキスト形式の辞書は、バイナリデータ形式の辞書に変換することができます。

ユーザーのかな漢字変換操作に関する使用頻度情報は、学習情報として保持されます。システム辞書に対する使用頻度情報は、辞書毎に指定できる、独立した「頻度ファイル」に保存されます。ユーザー辞書に対する使用頻度情報は、対象ユーザー辞書内、または独立した「頻度ファイル」に保存されます。

図 1–1 に、辞書の構成を示します。

図 1–1 辞書構成図

辞書構成図を表示しています。自立語向け辞書と、付属語向け辞書があります。自立語向け辞書には、システム辞書と、ユーザー辞書が含まれています。

図 1–2 に、Wnn6 の辞書ファイルの構成を示します。

図 1–2 Wnn6 の辞書ファイル構成

Wnn6 の辞書ファイルの構成を示しています。

  1. 部首入力用辞書ファイル

    表 1–1 に、部首入力用辞書ファイルの内容を示します。

    表 1–1 部首入力用辞書ファイル一覧

    ファイル名 

    内容 

    bushu.dic

    補助漢字を含んだ部首情報の辞書 

  2. 部首入力用辞書ファイル (補助漢字を使用しない)

    表 1–2 に、部首入力用辞書ファイル (補助漢字を使用しない) の内容を示します。

    表 1–2 部首入力用辞書ファイル (補助漢字なし) 一覧

    ファイル名 

    内容 

    bushu.dic.no_JISX0212

    補助漢字を含まない部首情報の辞書  

  3. 部首入力用付属語情報ファイル

    表 1–3 に、部首入力用付属語情報ファイルの内容を示します。

    表 1–3 部首入力用付属語情報ファイル一覧

    ファイル名 

    内容 

    bushu.fzk

    部首入力用  

  4. システム辞書ファイル

    表 1–4 に、システム辞書ファイルの内容を示します。

    表 1–4 システム辞書ファイル一覧

    ファイル名 

    内容 

    kihon.dic

    基本辞書 

    symbol.dic

    記号辞書  

    symbol_noat.dic

    記号辞書 (@ 入力なし)  

    tankan.dic

    単漢字辞書 (JIS X 0208 第 1 水準)  

    tankan2.dic

    単漢字辞書 (JIS X 0208 第 2 水準)  

    tankan3.dic

    単漢字辞書 (JIS X 0212 補助漢字)  

    tel.dic

    電話番号辞書 (市外局番を住所に変換する) 

    zip.dic

    郵便番号辞書 (郵便番号を住所に変換する) 

    ikeiji.dic

    異形字辞書 (新字体<=⇒旧字体、略字体<=⇒正字体)  

  5. FI 関係システム辞書ファイル

    表 1–5 に、FI 関係システム辞書ファイルの内容を示します

    表 1–5 FI 関係システム辞書ファイル一覧

    ファイル名 

    内容 

    fisd

    FI 関係基本辞書  

  6. 付属語情報ファイル

    表 1–6 に、付属語情報ファイルの内容を示します。

    表 1–6 付属語情報ファイル一覧

    ファイル名 

    内容 

    kougo.fzk

    文語 & 口語用  

  7. ユーザー辞書ファイル

    表 1–7 に、ユーザー辞書ファイルの内容を示します。

    表 1–7 ユーザー辞書ファイル一覧

    ファイル名 

    内容 

    ud

    ユーザー辞書 

  8. FI 関係ユーザー辞書ファイル

    表 1–8 に、FI 関係ユーザー辞書ファイルの内容を示します。

    表 1–8 FI 関係ユーザー辞書ファイル一覧

    ファイル名 

    内容 

    fiud

    FI 関係ユーザー辞書  

  9. 無変換学習辞書ファイル

    表 1–9 に、無変換学習辞書ファイルの内容を示します。

    表 1–9 無変換学習辞書ファイル一覧

    ファイル名 

    内容 

    muhenkan

    無変換学習用 

  10. 文節学習辞書ファイル

    表 1–10 に、文節学習辞書ファイルの内容を示します。

    表 1–10 文節学習辞書ファイル一覧

    ファイル名 

    内容 

    bunsetsu

    文節切り学習用 

  11. ユーザー頻度情報ファイル

    表 1–11 に、ユーザー頻度情報ファイルの内容を示します。

    表 1–11 ユーザー頻度情報ファイル一覧

    ファイル名 

    内容 

    kihon.h

    基本辞書内の単語に対するユーザー頻度情報 

    symbol.h

    記号辞書内の単語に対するユーザー頻度情報  

    symbol_noat.h

    記号辞書 (@ 入力なし) 内の単語に対するユーザー頻度情報  

    tel.h

    電話番号辞書内の単語に対するユーザー頻度情報  

    zip.h

    郵便番号辞書内の単語に対するユーザー頻度情報  

  12. FI 関係ユーザー頻度情報ファイル

    表 1–12 に、FI 関係ユーザー頻度情報ファイルの内容を示します。

    表 1–12 FI 関係ユーザー頻度情報ファイル一覧

    ファイル名  

    内容 

    fisd.h

    FI 関係基本辞書内の単語に対するユーザー頻度情報