名前 | 形式 | 使用条件 | 機能説明 | ファイル | 関連項目
SUNWjc0u
mdicm は、かな漢字変換サーバ ーcs00 で使われるメイン辞書のメンテナンスを行います。また、メイン辞書をメンテナンスする際に必要なユーザー辞書に関する諸機能も用意されています。
command (コマンド) を指定して mdicm を起動すると、 非対話型で機能が実行されます。
command を指定しないで mdicm を起動するとプロンプト mdicm> が表示され、 対話型で機能が実行されます。 この場合、 quit コマンドを使用することによって、 対話モードから終了することができます。 機能についての詳細は、 以下の「コマンドと引数」で説明します。
mdicm の機能は、 コマンドと各コマンドに必要な引数を指定することにより 実現されます。 mdicm には以下のコマンドがあります。
各コマンドの指定方法は次のとおりです。 なお、 以下に示す main_dict はメイン辞書を、 user_dict はユーザー辞書を表します。 また、 単語リストファイルの形式、 単語、 読み、 品詞については、 「ファイル形式」 を参照してください。
main_dict user_dict [ -s start ] [ -e end ] [ -f filename ] [ -k ]
メイン辞書の内容を表示します。指定範囲に登録されている単語を単語リストの形式 に従って編集し、指定ファイルに出力します。各引数の指定方法は以下のとおりです。
start に表示を開始する単語の読みを指定します。 この指定がない場合、先頭の単語から開始します。
end に表示を終了する単語の読みを指定します。 この指定がない場合、最終の単語で終了します。
filename で指定された単語リストのファイルに出力します。 この指定がない場合、標準出力に出力されます。
品詞情報を品詞名称で表示します。 この指定がない場合、品詞記号で表示されます。
以下の例では‘あ’〜‘い’の単語を書き込み可能な /tmp に work というファイル名で出力します。
cd /usr/lib/mle/ja/cs00 mdicm mdicm> mshow cs00_m.dic cs00_u.dic -s あ –e い –f /tmp/work
[ -f filename ] [ -k ]
ユーザー辞書の内容を表示します。指定範囲に登録されている単語を単語リストの形式 に従って編集し、指定ファイルに出力します。各引数の指定方法は以下のとおりです。
start に表示を開始する単語の読みを指定します。 この指定がない場合、先頭の単語から開始します。
end に表示を終了する単語の読みを指定します。 この指定がない場合、最終の単語で終了します。
filename で指定された単語リストのファイルに出力します。 この指定がない場合、標準出力に出力されます。
品詞情報を品詞名称で表示します。 この指定がない場合、品詞記号で表示されます。
[ -m new_main_dict ] [ -u new_user_dict ]
メイン辞書に単語を一括登録します。 各引数の指定方法は以下のとおりです。
登録結果を logfile で指定したログファイルに出力します。この指定がない場合は、ログファイル は作成されません。
新たに作成するメイン辞書を指定します。この指定がない場合は、 現在のディレクトリに newmdic というメイン辞書が作成されます。
新たに作成するユーザー辞書を指定します。この指定がない場合は、 現在のディレクトリに newudic というユーザー辞書が作成されます。
一括登録する単語を記述した単語リストファイルを 指定します。
[ -m new_main_dict ] [ -u new_user_dict ]
メイン辞書から単語を一括削除します。 各引数の指定方法は以下のとおりです。
削除結果を logfile で指定したログファイルに出力します。この指定がない場合は、 ログファイルは作成されません。
新たに作成するメイン辞書を指定します。この指定がない場合は、 現在のディレクトリに newmdic というメイン辞書が作成されます。
新たに作成するユーザー辞書を指定します。この指定がない場合は、 現在のディレクトリに newudic というユーザー辞書が作成されます。
一括削除する単語を記述した単語リストファイルを 指定します。
[ -m new_main_dict ] [ –u new_user_dict ]
メイン辞書に、ユーザー辞書に登録した単語を結合します。 各引数の指定方法は以下のとおりです。
結合結果を logfile で指定したログファイルに出力します。この指定がない場合は、 ログファイルは作成されません。
新たに作成するメイン辞書を指定します。この指定がない場合は、 現在のディレクトリに newmdic というメイン辞書が作成されます。
新たに作成するユーザー辞書を指定します。この指定がない場合は、 現在のディレクトリに newudic というユーザー名が作成されます。
対象となっている辞書に対して結合する辞書ファイルを 指定します。
最初の形式では、 file1 から file6 で指定されたファイルから new_main_dict で指定した新しいメイン辞書を作成します。 また、 file7 で指定された単語リストのファイルから new_user_dict で指定した新しい ユーザー辞書を作成します。 file7 を省略すると空のユーザー辞書が作成されます。 file1 から file7 の説明は以下のとおりです。
拡張子 file1 自立語ファイル (.jir) file2 接続行列ファイル (.set) file3 文節終端ファイル (.bun) file4 活用語尾ファイル (.kat) file5 接尾語ファイル (.sbi) file6 付属語ファイル (.fuz) file7 ユーザー辞書用単語リスト (.usr)
2 番目の形式では、 filename で指定したファイル名に 上記の拡張子をつけたファイルから、 new_main_dict で指定した新しいメイン辞書と new_user_dict で指定した新しい ユーザー辞書を作成します。 この場合、 上記の拡張子をつけたファイル ( filename.jir など ) がすべて同じディレクトリに存在している必要があります。 各ファイル、単語リストの 形式は「ファイル形式」 を参照してください。
最初の形式では、 main_dict で指定した メイン辞書の内容を file1 から file6 に展開します。 また、 同時に user_dict で指定したユーザー辞書の内容を file7 に展開します。
2 番目の形式では、 filename で指定したファイル名に 上記の拡張子をつけたファイルに、 main_dict で指定した メイン辞書および user_dict で指定したユーザー辞書の内容を 現在のディレクトリに展開します。 各ファイル、単語リストの 形式は「ファイル形式」 を参照してください。
対話モードの mdicm を終了します。
品詞記号の一覧を標準出力に出力します。
ヘルプです。コマンド一覧を標準出力に出力します。
各コマンドの入出力で使用される単語リストの形式は以下のとおりです。
“#”で始まる行はコメント行です。
3 つのフィールドで構成されます。 第 1 と第 2 フィールドは、それぞれ読み、単語です。 第 3 フィールドは品詞情報で、品詞記号 を並べて記述します。また、それぞれのフィールドは半角の空白文字かタブで 区切られます。
(例) # # 単語リストのサンプル # あ 編 :MV あ 開 :MV あ 明 :MV あ 合 :WV あいいく 愛育 :N1:SH あいいれな 相いれな :AJ
日本語 EUC コードセット 1 に定義されているひらがな文字を 12 文字使用することができます。 ただし、先文節文節頭 1 文字には 'ゃ' などの拗音 および 'ゐ'、'ゑ'、'を'、'ん' を 使用することはできません。 2 文字目以降はすべてのひらがな文字に 加えて長音 ' –' を使用することができます。 また、'だ'、'ぱ' のような濁音、半濁音は 2 文字として扱います。
日本語 EUC コードセット 1 に定義されている文字を 8 文字使用することができます。
品詞情報は以下のような品詞記号で現されます。
記号 | 品詞 | 備考 |
---|---|---|
:N1 | 名詞1 | 普通名詞 |
:N2 | 名詞2 | 代名詞など |
:M1 | 人名1 | 姓 |
:M2 | 人名2 | 名 |
:T1 | 地名1 | |
:T2 | 地名2 | 都道府県 |
:NM | 数詞 | |
:NN | 助数詞 | 枚、回、年など |
:PR | 接頭語 | |
:SF | 接尾語 | |
:AD | 副詞 | |
:CN | 接続詞 | |
:RT | 連体詞 | |
:AJ | 形容詞 | |
:AV | 形容動詞 | |
:SH | サ変動詞 | |
:ZH | ザ変動詞 | |
:1V | 一段活用動詞 | |
:KV | カ行五段活用動詞 | |
:GV | ガ行五段活用動詞 | |
:SV | サ行五段活用動詞 | |
:TV | タ行五段活用動詞 | |
:NV | ナ行五段活用動詞 | |
:BV | バ行五段活用動詞 | |
:MV | マ行五段活用動詞 | |
:RV | ラ行五段活用動詞 | |
:WV | ワ行五段活用動詞 | |
:UN | 分類不可 | |
:TK | 単漢字 | |
:BS | 文節 |
単語部の自立語の読み、読みの品詞、漢字、漢字の品詞または漢字部の読み、漢字を 1 行単位に記述します。各行には単語部または漢字部の読みと候補を羅列します。
RRR...R XXXXXXXX JJJJJJJ...JJJJ YYYYYYYY
RRR...R:XXXXXXXX KKKKKKKKKKKKKKKKKKKKKK
ビット | 品詞 |
---|---|
0 | reserved |
1 | 名詞 1 |
2 | 人名 (姓) |
3 | 地名 |
4 | 名詞 2 |
5 | 人名 (名) |
6 | 県 / 市 / 区名 |
7 | 数詞 |
8 | 接頭語 |
9 | 接尾語 |
10 | 助数詞 |
11 | reserved |
12 | reserved |
13 | reserved |
14 | 副詞 |
15 | 接続詞 |
16 | 連体詞 |
17 | 形容詞 |
18 | 形容動詞 |
19 | 分類不可 |
20 | サ変動詞 |
21 | ザ変動詞 |
22 | 一段動詞 |
23 | カ行五段動詞 |
24 | ガ行五段動詞 |
25 | サ行五段動詞 |
26 | タ行五段動詞 |
27 | ナ行五段動詞 |
28 | バ行五段動詞 |
29 | マ行五段動詞 |
30 | ラ行五段動詞 |
31 | ワ行五段動詞 |