この章では、日本語、インド語、およびタイ語の地域対応に関連する情報について説明します。この章の内容は次のとおりです。
この節では、日本語ロケール固有の情報について説明します。
最新の Solaris 環境では、異なる文字エンコーディングをサポートする 4 種類の日本語ロケールを使用できます。ja と ja_JP.eucJP ロケールは、日本語 EUC に基づきます。ja_JP.eucJP ロケールの仕様は UI-OSF 日本語環境実装規約バージョン 1.1 に、ja ロケールは以前の Solaris リリースで採用されてきた仕様にそれぞれ準拠しています。ja_JP.PCK ロケールは、Shift_JIS として知られている PC-Kanji コードに基づいています。ja_JP.UTF-8 は、UTF-8 に基づいています。
日本語 EUC とその文字セットの対応付けについては、eucJP(5) のマニュアルページを、PC-Kanji コードとその文字セットの対応付けについては、PCK(5) のマニュアルページをそれぞれ参照してください。
JIS X 0201–1976
JIS X 0208–1990
JIS X 0212–1990
JIS X 0213–2000 (Unicode 4.0 で定義されている文字のみ)
JIS X 0212–1990 は ja_JP.PCK ロケールではサポートされていません。JIS X 0213–2000 は ja_JP.UTF-8 ロケールでのみサポートされています。JIS X 0213–2000 で定義されているすべての文字が使用可能であるとは限りません。使用できるのは、Unicode 4.0 文字セットに定義されている文字だけです。
ベンダー定義文字 (VDC) とユーザー定義文字 (UDC) もサポートされています。VDC は、JIS X 0208–1990 または JIS X 0212–1990 の使用しない (予約) コードポイントを占めます。UDC は、VDC に対して割り当てられているコードポイントを除いて、VDC と同じコードポイントを占めます。
日本語フォント形式としては、ビットマップ、TrueType、Type1 の 3 つがサポートされています。日本語 Type1 フォントは印刷用の JIS X 0212 のみです。また、Type1 フォントは、UDC で使用するフォント形式です。
次の表に、日本語ビットマップフォントを示します。
表 4–1 日本語ビットマップフォント
完全なファミリ名 |
サブファミリ |
表記形式 |
ベンダー |
エンコーディング |
---|---|---|---|---|
sun gothic |
R、B |
PCF(12,14,16,20,24) |
|
JIS X 0208–1983、 JIS X 0201–1976 |
sun minchou |
R |
PCF(12,14,16,20,24) |
|
JIS X 0208–1983、 JIS X 0201–1976 |
ricoh hg gothic b |
R |
PCF(10,12,14,16,18,20,24) |
RICOH |
JIS X 0208–1983、JIS X 0201–1976 |
ricoh hg mincho l |
R |
PCF(10,12,14,16,18,20,24) |
RICOH |
JIS X 0208–1983、JIS X 0201–1976 |
ricoh gothic |
R |
PCF(10,12,14,16,18,20,24) |
RICOH |
JIS X 0212–1990、JIS X 0213–2000 |
ricoh mincho |
R |
PCF(10,12,14,16,18,20,24) |
RICOH |
JIS X 0212–1990、JIS X 0213–2000 |
ricoh heiseimin |
R |
PCF(12,14,16,18,20,24) |
RICOH |
JIS X 0212–1990 |
次の表に、日本語 True Type フォントを示します。
表 4–2 日本語 TrueType フォント
完全なファミリ名 |
サブファミリ |
表記形式 |
ベンダー |
エンコーディング |
---|---|---|---|---|
ricoh hg gothic b |
固定幅 |
TrueType |
RICOH |
JIS X 0208–1983、JIS X 0201–1976 |
ricoh hg mincho l |
固定幅 |
TrueType |
RICOH |
JIS X 0208–1983、JIS X 0201–1976 |
ricoh hg gothicb sun |
固定幅、プロポーショナル |
TrueType |
RICOH |
JIS X 0201–1976、JIS X 0208–1983、JIS X 0213–2000 |
ricoh hg minchol sun |
固定幅、プロポーショナル |
TrueType |
RICOH |
JIS X 0201–1976、JIS X 0208–1983、JIS X 0213–2000 |
ricoh heiseimin |
固定幅 |
TrueType |
RICOH |
JIS X 0212–1990 |
最新の Solaris 環境のデフォルト日本語入力方式は ATOK12 です。ATOK12 は、日本語ロケールがインストールされていれば、日本語ロケールとすべての UTF-8 ロケールでこの入力方式が使用できます。その他、Wnn6 日本語入力方式がすべての日本語ロケールで使用できます。入力方式の切り替えはデスクトップメニューから行うことができます。日本語 Solaris 1.x BCP サポートでは、kkcv 日本語入力方式を使用できます。
ATOK12 入力方式によって日本語テキストを入力するには次のようにします。
Control-Space キーを押して入力変換をオンにします。
変換するテキストのかな文字を入力します。
たとえば、漢字変換のかな文字を入力します。
Space キーを押すと、入力したかな文字に対する漢字変換候補が表示されます。
選択する変換候補の番号を入力します。
Return キーを押すと、かな文字全体が漢字混じりのテキストとして確定されます。
または、下矢印キーを押すと、選択した文字のみが確定されます。
Control-Space キーを押して入力変換をオフにします。
日本語ロケールを文字ベース端末 (TTY) で使うには、端末設定を使って、行編集作業を適切に実行する必要があります。
端末が CDE 端末エミュレータ (dtterm) の場合、すべての日本語ロケール (ja、ja_JP.PCK、または ja_JP.UTF-8)で、引数 -defeucw を付けて stty(1) を使用します。たとえば、ja ロケールでは次のように入力します。
% setenv LANG ja % stty defeucw
端末が CDE 端末エミュレータではないが、端末のコードセットが現在のロケールのものと同じである場合は、stty(1) の引数として -defeucw を指定します。
端末のコードセットが現在のロケールと一致しない場合、setterm(1) を使ってコード変換を有効にします。たとえば、ロケール ja を使用しているときに PCK (Shift_JIS コード) が必要になった場合は、次のように入力します。
% setenv LANG ja % setterm -x PCK
詳細については、setterm(3CURSES) のマニュアルページを参照してください。
いくつかの日本語コードセット変換が iconv(1) と iconv(3) でサポートされています。詳細については、iconv_ja(5) のマニュアルページを参照してください。
ユーザー定義文字ユーティリティ sdtudctool は、アウトラインフォント (Type1) とビットマップフォント (PCF) を両方ともサポートします。また、以前のリリースにあった、fontedit、type3creator、fontmanager のような古いユーティリティによって作成された UDC フォントを移行するために、いくつかのユーティリティを利用できます。
次のコンポーネントは、LANGUAGES CD を使用した日本語完全ロケール環境でのみ使用できます。
翻訳されたメッセージ、ヘルプ、マニュアルページ
Wnn6 日本語入力方式
日本語 Solaris 1.x BCP サポート
明朝およびボールドタイプフェースのフォント
印刷用の JIS X 0212 Type1 フォント
日本語固有のダムプリンタおよび postprint サポート
古い日本語ユーティリティ (Kanji(1) など)
UTF-8 ロケールでサポートされているすべてのインド語で、音訳検索に基づく入力方式 (Shabdalipi) および連続表音入力方式が使用できます。この入力方式と仮想キーボードによって、すべての CDE アプリケーションでインド語テキストを入力できます。
次のデータフローは、インド語の入力プロセスの動作を示します。
入力状態領域をクリックして、入力方式の選択メニューを表示します。
メニューから入力方式を選択します。
または、F6 キーを押すと、使用可能な入力方式の中から選択できます。
また、Compose-hi キーシーケンスを入力すると、前に使用した入力方式を選択しません。
F5 キーを押して、使用するインド語スクリプトを選択します。
キーボードベース (インド語 INSCRIPT キーボード) の入力方式の場合 、「インド語キーボード」に示すキーボードイメージを使用します。
音訳検索に基づく入力方式の場合、対象のスクリプトの文字に対応する最初の英語表音同等文字を入力します。
ルックアップウィンドウに表示されるリストから選択します。
連続表音入力方式の場合、英語表音同等文字を連続して入力します。
対象のスクリプトの対応する文字が編集前テキストとして表示され、編集前テキストをそのままにして入力を続けるか、明示的に確定するとその文字が確定されます。連続表音入力方式の場合の英語トークンから UTF-8 コードポイントへのマッピングについては、「連続表音ベース入力方式のマッピング」に示す図を参照してください。
Control-Space キーを押して、英語/ヨーロッパ語入力モードに戻ります。
または、状態領域をクリックし、入力モードの選択ウィンドウから英語/ヨーロッパ語入力モードを選択します。
インド語入力方式で使用可能なキーボードの配列を以下の図に示します。
「連続表音ベース入力方式のマッピング」のイメージは、サポートされる各対象スクリプトにおける英語トークンとその同等コードポイント間のマッピングを示しています。CONSONANT カテゴリは、英語トークンとスクリプトの子音間のマッピングです。VOWEL カテゴリは、英語トークンとスクリプトの母音間のマッピングです。OTHER カテゴリは、子音および母音のプロパティを示さない文字のマッピングです (これらの文字の形は前後の文字によって変化しない)。
CONSONANT、VOWEL、および OTHER のキーワードは、これらの文字が Unicode 規格の一部であることも意味します。セクション SPECIAL CONSONANT、SPECIAL VOWEL、または SPECIAL OTHER は、原則的にそれぞれの文字が子音、母音、またはその他のプロパティを表すが、正式に Unicode 規格の一部であるわけではなく、フォント依存であることを意味します。これらの文字には、Unicode の私用領域 (PUA) のコードポイント値が割り当てられます。Solaris UTF-8 ロケールではサポートされますが、別のプラットフォームではマッピングが機能しない場合もあります。
そのマップファイルは、システムのマップファイルと同じではなく、上記の説明に沿って不必要なキーワードを削除するために少し編集されています。
VOWEL と SPECIAL VOWEL セクションでは、同じ英語トークンに対してコンテキスト依存の独立形と依存形が示されます。「連続表音入力方式の仕組み」を参照してください。
malayalam スクリプトには、特別な ‘CHILLU’ セクションが含まれていますが、実際は SPECIAL OTHER カテゴリです。
対象のインド語スクリプトにおける英語から表音同等文字への既存のマッピングを以下の図に示します。これらの図を参照しながら、使用するスクリプトのすべてのマッピングを覚えてください。ここではマッピングを直感的に示しているので、ほとんどの文字を図で探すことなく入力できます。
これらのマッピングでは、マッピングの一部に含められている 「.」、「|」 などの特殊文字は「\」 文字でエスケープします。エスケープしない場合、「|」 文字は複数のトークンが同じ UTF-8 文字を表すときに区切り文字になります。
図 4–1、図 4–2、および図 4–3 は、子音、母音、およびその他についての、英語と Bengali のマッピングです。
図 4–4、図 4–5、および図 4–6は、子音、母音、およびその他についての、英語と Gujarati のマッピングです。
図 4–7、図 4–8、および図 4–9 は、子音、母音、およびその他についての、英語と Gurmukhi のマッピングです。
図 4–10、図 4–11、および図 4–12 は、子音、母音、およびその他についての、英語と Hindi のマッピングです。
図 4–13、図 4–14、および図 4–15 は、子音、母音、およびその他についての、英語と Kannada のマッピングです。
図 4–16、図 4–17、および 図 4–18 は、子音、母音、およびその他についての、英語と Malayalam のマッピングです。
図 4–19 および 図 4–20 は、子音および母音についての、英語と Tamil のマッピングです。
図 4–21、図 4–22、および図 4–23 は、子音、母音、およびその他についての、英語と Telugu のマッピングです。
各インド語スクリプトでは、「virama」(子音と結合される同等記号) が子音の半分になって文字の形を形成します。子音に対応する複数キーの組み合わせを入力すると、常に子音 + virama の形が出力され、文字が結合されることを表します。
最初の入力時の子音は半分の形ですが、後に母音が続くことによって 1 つの完全な音節になってさまざまに変化します。
2 つの連続した子音はこれから結合される半分の形です。半分の形は、レイアウトエンジンによって 1 つの結合文字に変換されるか、そのままですべての言語で統語的に有効な独立形として残ります。
単語の最初に来る母音または別の母音が続く母音は独立形です。直後に子音が来る母音は依存形です。
いかなるコンテキストでも変化しない文字はその他になります。この文字は子音でも母音でもありません。
文字の一部とはならない数字およびその他の句読点は 1 対 1 でマッピングされます。
これらの原則を使用してパーサーが記述されていて、これにより入力がそれぞれのカテゴリに解析され、言語固有の Unicode のコードポイントが出力されます。連続表音入力方式エンジンはレイアウトおよび描画を処理せず、システムのほかのモジュールが行います。
最新の Solaris 環境は、3 つのタイ語入力レベルおよび 4 つのタイ語キー配列をサポートします。
次のタイ語入力方式がこのリリースでサポートされています。これらの入力方式は、文字シーケンスチェックのためにタイ語 IT 標準で指定されています。
パススルーレベル (入力チェックなし)
基本入力チェックレベル
詳細入力チェックレベル
シーケンスチェックのないパススルーレベルが、前の Solaris リリースと同様にこのリリースでもデフォルトです。
F2 キーを使用して、入力レベルを切り替えることができます。
タイ語の入力方式には 4 つのキー配列がサポートされています。
Kedmanee (TIS820-2531) キー配列。 Kedmanee 配列はコンピュータキーボード用ではなく、タイプライタ用に設計されました。キーの数に制限があるタイプライタキーボードでは、いくつかのタイ語の特殊文字が配列上にありません。コンピュータキーボードとして使用するために、TIS820-2531 は Kedmanee 配列を採用しました。
TIS820-2538 キー配列。この拡張 Kedmanee 配列は TIS820-2531 配列の拡張版であり、元の Kedmanee 配列では使用できなかったいくつかのタイ語特殊文字が含まれています。現在、TIS820-2538 はタイ工業標準研究所が定める唯一のタイ語キー配列規格です。
Pattajoti キー配列。Pattajoti 配列もタイプライタ用に設計されましたが、指をより使いやすいようにキーが配列されています。
設定可能キー配列。タイ語入力方式のためのユーザー定義キーボードです。
タイ語入力方式の補助ウィンドウでは、次の機能とユーティリティがサポートされています。
入力レベルの切り替え補助パレットの入力レベルボタンをクリックして、使用する入力レベル (パススルー、基本、詳細) を選択できます。
タイ語仮想キーボードキーボードボタンをクリックして、タイ語文字の入力に使用するタイ語仮想キーボードを表示します。