この章では、Solaris の日本語入力方式の概要と、ATOK12 および Wnn6 の、両日本語入力方式の特徴を説明します。
Solaris 共通デスクトップ環境 (以降「Solaris CDE」とします) 上では、ログイン画面の「オプション」で選択した入力方式を使用して、地域環境に応じた文字を入力することができます。Solaris CDE の日本語環境では、以下の入力方式を使用することができます。
日本語、韓国語、簡体字中国語、繁体字中国語、繁体字中国語 (香港)、タイ語、英語、ヨーロッパ系各種言語、キリル文字、ギリシア語、アラビア語、ヒンディー語、ヘブライ語等の文字を入力することができます。ただし、日本語、韓国語、簡体字中国語、繁体字中国語、繁体字中国語(香港)、およびタイ語の文字を入力するためには、対応する地域環境のパッケージがインストールされている必要があります。地域環境とパッケージの対応に関しては、『国際言語環境ガイド』を参照してください。なお、日本語の入力には ATOK12 が使用されます。
この入力方式は、ja_JP.UTF-8 ロケールで使用できます。
日本語を入力するための入力方式です。
この入力方式は、ja、ja_JP.eucJP、ja_JP.PCK および ja_JP.UTF-8 ロケールで使用できます。
日本語を入力するための入力方式です。Wnn6 には、日本語の入力機能を持たない日本語の表示が可能な端末上で日本語の入力を可能にする uum(1) コマンドが含まれます。
今回のリリースで提供される Wnn6 は、最大 3 つまでのクライアント (htt や uum など、Wnn6 のかな漢字変換サーバーである jserver に直接接続するプログラム) の同時接続をサポートします。
追加のクライアントライセンスは、別途購入することができます。詳細は、本製品のご購入先にお問い合わせください。
この入力方式は、ja、ja_JP.eucJP、ja_JP.PCK および ja_JP.UTF-8 ロケールで使用できます。
入力してきた文章の分野を自動的に判断し、文脈情報に基づいた同音語処理を実現しています。
文脈解析変換をさらに強化し、文章中の指示詞 (これ、それ、あれ、この、その、あの、など) と、それらが指し示す言葉との関係を適切に判断して、同音語を正しく識別します。
「それ」が「授業の問題」を指すことを認識し、「解いた」に正しく変換します。
「その」が「大幅な減税」を指すことを認識し、「政策」に正しく変換します。
「あの」が「姫路城」を指すことを認識し、「城」に正しく変換します。
文章の差異による同音語の違いを的確に判断して変換します。
それぞれの文節が文章の中でどのような係り受け関係になっているかを解析し、高い変換効率を実現しています。
「窓を」が「開けておきました」に、「夜が」が「明けるまでに」に係っているのを正しく認識します。
構文意味解析により、判断しづらい文節の区切りも的確に判断します。
「磨いた」、「訪ねた」の動詞の違いにより、文節の区切りを正しく判断しています。
最先端技術の搭載だけでなく、地味に思われがちな処理も着実に強化して、より一層快適な変換を実現しています。
たとえば、ATOK12 では、数字交じりの文章もより正確に変換できます。
入力・変換する時点で文章をチェックし、正確な文章の表現をサポートする JUST MEDDLER2 を搭載しています。「ら抜き表現の使用」、「文体の統一」、「同一助詞の過剰な連続」、「修飾関係のあいまい性」、「わかりにくい否定表現」、「誤用」、「仮名遣い誤り」、「商標名」、「機種依存文字」をチェックし、メッセージで注意を促します。
一度入力した文字列を短い読みで変換して、効率的に入力することができます。文字列を入力したとき、途中で変換した・しないにかかわらず、意味のまとまりのある候補から選択して入力できます。確定した候補は学習されるので、コンピュータを起動し直しても、引き続き短い読みで変換できます。
文字列を確定したあとに同じ文字列を未確定の状態で入力できます。ATOK12 では、直前に入力した文字列だけでなく、最近確定した文字列も履歴から選択して入力できます。
候補ウィンドウに表示される変換候補を、先頭の文字列または末尾の文字列が同じ単語で並べ替えることができます。人名など変換候補が多い場合に便利な機能です。
文字の種類ごとに、半角・全角のどちらに変換するかを指定できます。入力中の文字や、後変換での表記を統一することもできます。
特定の語句が入力された場合に、メッセージが表示されるように設定しておくことができます。禁止用語や登録商標、常用漢字外などの入力の注意や、置換候補として電子メールの宛先を登録しておくなど、いろいろな応用が可能です。
部首、総画数、読みなどの検索条件をもとに、文字パレットを使いながら視覚的に漢字検索を行います。複数の検索条件を組み合わせて設定することも可能です。
ローマ字入力時のアルファベットの入力ミスや、カナ入力時の濁点・半濁点の入力ミスを自動的に修正し、正しいかな漢字変換を行います。
ローマ字入力時
入力文字列 | 変換後の文字列 |
まっっちゃをのむ | 抹茶を飲む |
ちゅごくりょこう | 中国旅行 |
こうえんおいす | 公園のいす |
カナ入力時
入力文字列 | 変換後の文字列 |
らくか゜き | 落書き |
らつきー | ラッキー |
てがみわだす | 手紙を出す |
複数の辞書をまとめて、まるでひとつの辞書のような感覚で運用することができます。1 個のシステム辞書、1 個のユーザー辞書、そして 4 個までの補助辞書をセットで使うことが可能です。たとえば、補助辞書には医学用辞書や法律用辞書など分野別の辞書を組み込んでおくと便利です。これが 1 つの辞書セットで、辞書セットは最大 10 セットまで設定しておくことができます。
ユーティリティの操作と機能に関してだけでなく、日本語入力・変換など全般にわたる情報をヘルプを使って参照することができます。
Wnn6 には次のような特徴があります。
Wnn6 は、FI (Flexible Intelligence) 変換機能と FI 学習機能により、高水準のかな漢字変換効率を実現しています。
Wnn6 のシステム構成 は、クライアント / サーバー方式を採用しています。これにより、複数のクライアントからサーバー側にある同一の辞書を使用することができるので、どのクライアントからも同一の学習効果を得ることができます。
また、辞書の追加などのメンテナンス作業を効率良く行なったり、効果的なオフライン学習機能をサポートすることができます。
さらに、この方式を使用することにより、サーバーにアクセスできるクライアントを制限することもできます。
辞書操作や環境設定には、GUI のツールが用意されています。 Wnn6 に対して特別な知識がなくても、すべての環境の設定を簡単に行うことができます。
ユーザーの好みに合わせて、キーの割り当てを他の日本語入力システム (cs00, ATOK8 など) に合わせることができます。
辞書は、システム (固定形式) 辞書とユーザー (登録可能形式) 辞書に分類されます。辞書のエントリである変換文字列に対して、各ユーザーが個別の頻度情報を持つことにより、変換効率が向上します。
各辞書の特徴は次のとおりです。
システム辞書は、『岩波国語辞典第四版』をもとにしています。また、次のような独自の語彙が加えられています。
現代語、話しことば
複合語、複合品詞
全国の主要地名、世界の国名、都市名
人名 (姓と名の分離)
最大登録語数
システムからの制限はありません。マシンのディスク容量によります。
登録読み、登録漢字文字数 (253 文字)
登録読み文字種 (全文字種)
登録漢字文字種 (全文字種)
単語登録、単語削除、単語検索などの辞書操作は、辞書ユーティリティを利用して簡単に行うことができます。また、他の日本語入力システム (cs00、ATOK7、ATOK8、 VJE-Delta、EGBRIDGE) で作成された辞書から、Wnn6 の辞書フォーマットへ変換する辞書コンバータもあります。これらを活用することにより、他の日本語入力システムから Wnn6 への移行がスムーズに行えます。
Wnn6 の FI 変換とは、FI 関係辞書 (文節間接続関係辞書) を用いて、変換文字列中の各文節間の接続度合いを調査し、接続度合いの高い候補を優先して変換する機能をいいます。これにより、高いかな漢字変換効率を実現しています。
FI 変換には次の変換機能があります。
表 1–1 Wnn6 の格係り受け変換
が格 |
手が挙がる / 株が騰がる / てんぷらが揚がる |
を格 |
身長を測る / 時間を計る / 暗殺を謀る |
に、には格 |
宿に泊まる / 駅に停まる |
で格 |
汽車で帰る / 貴社で会う |
へ格 |
京へ向かった / 今日へ持ち越した |
より格 |
車より速い / 予定より早い |
から格 |
敵から奪回する / 会から脱会する |
まで格 |
誤解まで招いた / 五階まで昇る |
表 1–2 Wnn6 の所有格変換
かいとう |
⇒ |
会頭の回答 |
かいじょう |
⇒ |
会場の開場 |
表 1–3 Wnn6 の受身変換
|
FI 接続関係 |
変換可能文字列 |
---|---|---|
受身 |
交通を − 規制する |
交通が規制される |
可能 |
テレビを − 見る |
テレビが [を] 見られる |
自発 |
故郷を − 偲ぶ |
故郷が偲ばれる |
尊敬 |
社長が − 読む |
社長が読まれる |
表 1–4 Wnn6 の使役変換
|
FI 接続関係 |
変換可能文字列 |
---|---|---|
使役 |
彼が − 答える |
彼に答えさせる |
表 1–5 Wnn6 の合成語変換
複合語 | ⇒ |
集団 − 登校 |
会社 − 訪問 |
人名 | ⇒ |
福沢 − 諭吉 |
夏目 − 漱石 |
表 1–6 Wnn6 の修飾語変換
形容詞 |
あつい△△△ |
熱い湯 / 厚い本 / 暑い夏 |
形容動詞 |
ていちょうな△△△ ふしんな△△△ |
丁重な挨拶 / 低調な作品 不審な人影 / 不振な成績 |
副詞 |
▲▲▲もる |
ぽたぽた漏る / こんもり盛る |
連体詞 |
▲▲▲きのう |
小さな機能 / 楽しかった昨日 |
表 1–7 Wnn6 の複文変換
▽ |
▼ |
家が建ち |
人が立つ |
FI 変換以外には、次のような変換機能があります。
付属語を含まない候補を優先します。
同音異義語のなかで、直前に使用した単語を必ず先頭の候補に挙げます。次候補は使用した順に 6 個までを提示します。
単漢字だけを使って変換します。
入力文字列が辞書に登録されていない場合、その文字列と表記は異なっても、同じ発音になる別の単語が辞書に登録されていれば、その単語を候補として提示します。
こおり / こうり ⇒ 氷 |
表 1–9 Wnn6 の長音変換
うぃんどう / うぃんどー ⇒ ウィンドウ |
表 1–10 Wnn6 の送りがな基準処理
|
本則 |
送る |
送らない |
---|---|---|---|
おこなう ⇒ |
行う |
行なう |
行う |
表 1–11 Wnn6 の異形字処理
渡辺 <=⇒ 渡邊 |
表 1–12 Wnn6 の郵便番号変換
600 ⇒ 京都府京都市下京区 |
表 1–13 Wnn6 の電話番号変換
075 ⇒ 京都府京都市 |
表 1–14 Wnn6 の英単語日本語変換
COMPUTER ⇒ コンピュータ |
表 1–15 Wnn6 の濁音処理
べんきょうづくえ | ⇒ | 勉強机 |
づくえ | ⇒ × | 机 |
Wnn6 には、FI 変換 (格係り受け変換、所有格変換、受身変換、使役変換、合成語変換、修飾語変換、複文変換) で、現在の FI 関係辞書に登録されていない文節間の関係をユーザーが確定した場合に、新しくユーザーごとの FI 関係辞書に登録する機能があります (FI 学習機能)。
FI 学習機能は、「する / しない / 一時的」の各設定に切り換えることができます。
単語の使用頻度をユーザーごとに管理して、使用頻度の高い単語を変換時に優先的に表示することができます。システム辞書内の単語と、FI 関係システム辞書内の単語を管理します。
学習レベルは、「じわじわ / 基準 / すぐ / 必ず / しない」の学習レベルで切り換えることができます。
辞書に登録されていない「ひらがな / カタカナ / ローマ字」の候補が確定された場合に、自動的に辞書へ登録します。「する / しない / 一時的」の各設定に切り換えることができます。
文節の切り直しを行なって変換文字列を確定した場合に、切り直した前後の文節を学習します。「する / しない / 一時的」の各設定に切り換えることができます。
送りがな基準がある単語は、単語ごとに確定した規則「本則 / 送る / 送らない」を学習して、直前に使用した規則を最優先します。「する / しない」の各設定に切り換えることができます。
接頭語に「お / ご」「御」のどれを使用するか、直後の名詞ごとに学習します。「する / しない」の各設定に切り換えることができます。
単語ごとに確定した文字列の接尾語の規則「カナ / 漢字 (送る) / 漢字 (送らない) 」を学習して、直前に使用した規則を最優先します。「する / しない」の各設定に切り換えることができます。
一般語学習
確定した一般語の情報 「ひらがな / カタカナ / 漢字」 を学習します。「する / しない」の各設定に切り替えることができます。
確定した数字表記の種類「漢数字 / 半角 / 全角 / カンマ付き」を学習し、直前に使用した種類を最優先します。この学習は無効にできません。
複数のユーザー辞書で登録されている同一単語を、共用辞書に反映させます。この機能はシステム管理者が設定します。
変換効率の向上とディスクとメモリー資源の削減を目的に、オフラインで動く機能をいいます。不必要な単語の削除や頻度の再配置を行い、登録語自動反映モジュールを起動させます。この機能はシステム管理者を対象としています。
Wnn6 は、 ユーザーの入力処理を行うクライアント (Wnn6/Htt) と、かな漢字変換を行うサーバー (jserver) からなるクライアント / サーバー方式で構成されています。jserver は、辞書引き専用サーバー (wnnds) と共に使用することができます。
クライアント / サーバー方式により、複数のクライアント (Wnn6/Htt など) からのかな漢字変換要求を、1 台のマシンで動いている jserver で処理することができます。
jserver のかな漢字変換機能を使って日本語入力処理を行うには、ユーザーとのインタフェース部分でアプリケーションプログラムが必要になります。このアプリケーションプログラムがクライアントに相当します。Solaris では、アプリケーションプラグラムとして Wnn6/Htt と uum を提供しています。
Wnn6/Htt は X ウィンドウシステムで動く複数のクライアントに対して、日本語入力環境を提供します。Wnn6/Htt からは、Wnn6 辞書ユーティリティ、Wnn6 設定ユーティリティなどのユーティリティプログラムを起動することもできます。 uum は、漢字端末や X ウィンドウシステムの exterm などの個々のウィンドウ上で動作します。
辞書への単語登録と単語削除は、辞書ユーティリティ wnndictutil で簡単に操作できます。また、辞書コンバータ wnnotow を使って、ATOK8、ATOK7、cs00、VJE-delta、EGBRIDGE のユーザー辞書ファイルを、 Wnn6 でも活用することができます。
Wnn6/Htt から、キーの割り当ての設定や、かな漢字変換実行の環境 (辞書の指定、変換パラメータ値の設定など) のカスタマイズを行うことができます。その他の環境についても、Wnn6 設定ユーティリティ wnnenvutil を使って、カスタマイズを簡単に行うことができます。
Wnn6 のシステム構成の概略図を図 1–2 に示します。