国際化対応言語環境の利用ガイド

第 4 章 サポートされるアジアのロケール

この章では、日本語、インド語、およびタイ語の地域対応に関連する情報について説明します。この章の内容は次のとおりです。

日本語の地域対応

この節では、日本語ロケール固有の情報について説明します。

日本語ロケール

最新の Solaris 環境では、異なる文字エンコーディングをサポートする 4 種類の日本語ロケールを使用できます。jaja_JP.eucJP ロケールは、日本語 EUC に基づきます。ja_JP.eucJP ロケールの仕様は UI-OSF 日本語環境実装規約バージョン 1.1 に、ja ロケールは以前の Solaris リリースで採用されてきた仕様にそれぞれ準拠しています。ja_JP.PCK ロケールは、Shift_JIS として知られている PC-Kanji コードに基づいています。ja_JP.UTF-8 は、UTF-8 に基づいています。

日本語 EUC とその文字セットの対応付けについては、eucJP(5) のマニュアルページを、PC-Kanji コードとその文字セットの対応付けについては、PCK(5) のマニュアルページをそれぞれ参照してください。

日本語文字セット

サポートされている日本語文字セットは以下のとおりです。

JIS X 0212–1990 は ja_JP.PCK ロケールではサポートされていません。JIS X 0213–2000 は ja_JP.UTF-8 ロケールでのみサポートされています。JIS X 0213–2000 で定義されているすべての文字が使用可能であるとは限りません。使用できるのは、Unicode 4.0 文字セットに定義されている文字だけです。

ベンダー定義文字 (VDC) とユーザー定義文字 (UDC) もサポートされています。VDC は、JIS X 0208–1990 または JIS X 0212–1990 の使用しない (予約) コードポイントを占めます。UDC は、VDC に対して割り当てられているコードポイントを除いて、VDC と同じコードポイントを占めます。

日本語フォント

日本語フォント形式としては、ビットマップ、TrueType、Type1 の 3 つがサポートされています。日本語 Type1 フォントは印刷用の JIS X 0212 のみです。また、Type1 フォントは、UDC で使用するフォント形式です。

次の表に、日本語ビットマップフォントを示します。

表 4–1 日本語ビットマップフォント

完全なファミリ名 

サブファミリ 

表記形式 

ベンダー 

エンコーディング 

sun gothic

R、B 

PCF(12,14,16,20,24) 

 

JIS X 0208–1983、 

JIS X 0201–1976 

sun minchou

PCF(12,14,16,20,24) 

 

JIS X 0208–1983、 

JIS X 0201–1976 

ricoh hg gothic b

PCF(10,12,14,16,18,20,24) 

RICOH 

JIS X 0208–1983、JIS X 0201–1976 

ricoh hg mincho l

PCF(10,12,14,16,18,20,24) 

RICOH 

JIS X 0208–1983、JIS X 0201–1976 

ricoh gothic

PCF(10,12,14,16,18,20,24) 

RICOH 

JIS X 0212–1990、JIS X 0213–2000 

ricoh mincho

PCF(10,12,14,16,18,20,24) 

RICOH 

JIS X 0212–1990、JIS X 0213–2000 

ricoh heiseimin

PCF(12,14,16,18,20,24) 

RICOH 

JIS X 0212–1990 

次の表に、日本語 True Type フォントを示します。

表 4–2 日本語 TrueType フォント

完全なファミリ名 

サブファミリ 

表記形式 

ベンダー 

エンコーディング 

ricoh hg gothic b

固定幅 

TrueType 

RICOH 

JIS X 0208–1983、JIS X 0201–1976 

ricoh hg mincho l

固定幅 

TrueType 

RICOH 

JIS X 0208–1983、JIS X 0201–1976 

ricoh hg gothicb sun

固定幅、プロポーショナル 

TrueType 

RICOH 

JIS X 0201–1976、JIS X 0208–1983、JIS X 0213–2000 

ricoh hg minchol sun

固定幅、プロポーショナル 

TrueType 

RICOH 

JIS X 0201–1976、JIS X 0208–1983、JIS X 0213–2000 

ricoh heiseimin

固定幅 

TrueType 

RICOH 

JIS X 0212–1990 

日本語入力方式

最新の Solaris 環境のデフォルト日本語入力方式は ATOK12 です。ATOK12 は、日本語ロケールがインストールされていれば、日本語ロケールとすべての UTF-8 ロケールでこの入力方式が使用できます。その他、Wnn6 日本語入力方式がすべての日本語ロケールで使用できます。入力方式の切り替えはデスクトップメニューから行うことができます。日本語 Solaris 1.x BCP サポートでは、kkcv 日本語入力方式を使用できます。

ATOK12 入力方式によって日本語テキストを入力するには次のようにします。

ATOK 入力方式の使用法

  1. Control-Space キーを押して入力変換をオンにします。

  2. 変換するテキストのかな文字を入力します。

    たとえば、漢字変換のかな文字を入力します。

  3. Space キーを押すと、入力したかな文字に対する漢字変換候補が表示されます。

  4. 選択する変換候補の番号を入力します。

  5. Return キーを押すと、かな文字全体が漢字混じりのテキストとして確定されます。

    または、下矢印キーを押すと、選択した文字のみが確定されます。

  6. Control-Space キーを押して入力変換をオフにします。

日本語端末用の端末設定

日本語ロケールを文字ベース端末 (TTY) で使うには、端末設定を使って、行編集作業を適切に実行する必要があります。

日本語 iconv モジュール

いくつかの日本語コードセット変換が iconv(1)iconv(3) でサポートされています。詳細については、iconv_ja(5) のマニュアルページを参照してください。

ユーザー定義文字のサポート

ユーザー定義文字ユーティリティ sdtudctool は、アウトラインフォント (Type1) とビットマップフォント (PCF) を両方ともサポートします。また、以前のリリースにあった、fontedittype3creatorfontmanager のような古いユーティリティによって作成された UDC フォントを移行するために、いくつかのユーティリティを利用できます。

部分ロケールと完全ロケールの違い

次のコンポーネントは、LANGUAGES CD を使用した日本語完全ロケール環境でのみ使用できます。

インド語の地域対応

UTF-8 ロケールでサポートされているすべてのインド語で、音訳検索に基づく入力方式 (Shabdalipi) および連続表音入力方式が使用できます。この入力方式と仮想キーボードによって、すべての CDE アプリケーションでインド語テキストを入力できます。

次のデータフローは、インド語の入力プロセスの動作を示します。インド語入力プロセスのデータフロー

インド語入力方式の使用法

  1. 入力状態領域をクリックして、入力方式の選択メニューを表示します。

  2. メニューから入力方式を選択します。

    または、F6 キーを押すと、使用可能な入力方式の中から選択できます。

    また、Compose-hi キーシーケンスを入力すると、前に使用した入力方式を選択しません。

  3. F5 キーを押して、使用するインド語スクリプトを選択します。

    1. キーボードベース (インド語 INSCRIPT キーボード) の入力方式の場合 、「インド語キーボード」に示すキーボードイメージを使用します。

    2. 音訳検索に基づく入力方式の場合、対象のスクリプトの文字に対応する最初の英語表音同等文字を入力します。

      ルックアップウィンドウに表示されるリストから選択します。

    3. 連続表音入力方式の場合、英語表音同等文字を連続して入力します。

      対象のスクリプトの対応する文字が編集前テキストとして表示され、編集前テキストをそのままにして入力を続けるか、明示的に確定するとその文字が確定されます。連続表音入力方式の場合の英語トークンから UTF-8 コードポイントへのマッピングについては、「連続表音ベース入力方式のマッピング」に示す図を参照してください。

  4. Control-Space キーを押して、英語/ヨーロッパ語入力モードに戻ります。

    または、状態領域をクリックし、入力モードの選択ウィンドウから英語/ヨーロッパ語入力モードを選択します。

インド語キーボード

インド語入力方式で使用可能なキーボードの配列を以下の図に示します。

次の図は Bengali キーボードです。

Bengali キーボードの配列

次の図は Devanagari キーボードです。

Devanagari キーボードの配列

次の図は Gujarati キーボードです。

Gujarati キーボードの配列

次の図は Gurmukhi キーボードです。

Gurmukhi キーボードの配列

次の図は Kannada キーボードです。

Kannada キーボードの配列

次の図は Malayalam キーボードです。

Malayalam キーボードの配列

次の図は Tamil キーボードです。

Tamil キーボードの配列

次の図は Teluga キーボードです。

Teluga キーボードの配列

マッピングについて

「連続表音ベース入力方式のマッピング」のイメージは、サポートされる各対象スクリプトにおける英語トークンとその同等コードポイント間のマッピングを示しています。CONSONANT カテゴリは、英語トークンとスクリプトの子音間のマッピングです。VOWEL カテゴリは、英語トークンとスクリプトの母音間のマッピングです。OTHER カテゴリは、子音および母音のプロパティを示さない文字のマッピングです (これらの文字の形は前後の文字によって変化しない)。

CONSONANT、VOWEL、および OTHER のキーワードは、これらの文字が Unicode 規格の一部であることも意味します。セクション SPECIAL CONSONANT、SPECIAL VOWEL、または SPECIAL OTHER は、原則的にそれぞれの文字が子音、母音、またはその他のプロパティを表すが、正式に Unicode 規格の一部であるわけではなく、フォント依存であることを意味します。これらの文字には、Unicode の私用領域 (PUA) のコードポイント値が割り当てられます。Solaris UTF-8 ロケールではサポートされますが、別のプラットフォームではマッピングが機能しない場合もあります。

そのマップファイルは、システムのマップファイルと同じではなく、上記の説明に沿って不必要なキーワードを削除するために少し編集されています。

VOWEL と SPECIAL VOWEL セクションでは、同じ英語トークンに対してコンテキスト依存の独立形と依存形が示されます。「連続表音入力方式の仕組み」を参照してください。

malayalam スクリプトには、特別な ‘CHILLU’ セクションが含まれていますが、実際は SPECIAL OTHER カテゴリです。

連続表音ベース入力方式のマッピング

対象のインド語スクリプトにおける英語から表音同等文字への既存のマッピングを以下の図に示します。これらの図を参照しながら、使用するスクリプトのすべてのマッピングを覚えてください。ここではマッピングを直感的に示しているので、ほとんどの文字を図で探すことなく入力できます。


注 –

これらのマッピングでは、マッピングの一部に含められている 「.」、「|」 などの特殊文字は「\」 文字でエスケープします。エスケープしない場合、「|」 文字は複数のトークンが同じ UTF-8 文字を表すときに区切り文字になります。


図 4–1図 4–2、および図 4–3 は、子音、母音、およびその他についての、英語と Bengali のマッピングです。

図 4–1 Bengali の子音のマップ

Bengali 子音マップのグラフィック表示

図 4–2 Bengali の母音のマップ

Bengali 母音マップのグラフィック表示

図 4–3 Bengali のその他のマップ

Bengali その他のマップのグラフィック表示

図 4–4図 4–5、および図 4–6は、子音、母音、およびその他についての、英語と Gujarati のマッピングです。

図 4–4 Gujarati の子音のマップ

Gujarati 子音マップのグラフィック表示

図 4–5 Gujarati の母音のマップ

Gujarati 母音マップのグラフィック表示

図 4–6 Gujarati のその他のマップ

Gujarati その他のマップのグラフィック表示

図 4–7図 4–8、および図 4–9 は、子音、母音、およびその他についての、英語と Gurmukhi のマッピングです。

図 4–7 Gurmukhi の子音のマップ

Gurmukhi 子音マップのグラフィック表示

図 4–8 Gurmukhi の母音のマップ

Gurmukhi 母音マップのグラフィック表示

図 4–9 Gurmukhi のその他のマップ

Gurmukhi その他のマップのグラフィック表示

図 4–10図 4–11、および図 4–12 は、子音、母音、およびその他についての、英語と Hindi のマッピングです。

図 4–10 Hindi の子音のマップ

Hindi 子音マップのグラフィック表示

図 4–11 Hindi の母音のマップ

Hindi 母音マップのグラフィック表示

図 4–12 Hindi のその他のマップ

Hindi その他のマップのグラフィック表示

図 4–13図 4–14、および図 4–15 は、子音、母音、およびその他についての、英語と Kannada のマッピングです。

図 4–13 Kannada の子音のマップ

Kannada 子音マップのグラフィック表示

図 4–14 Kannada の母音のマップ

Kannada 母音マップのグラフィック表示

図 4–15 Kannada のその他のマップ

Kannada その他のマップのグラフィック表示

図 4–16図 4–17、および 図 4–18 は、子音、母音、およびその他についての、英語と Malayalam のマッピングです。

図 4–16 Malayalam の子音のマップ

Malayalam 子音マップのグラフィック表示

図 4–17 Malayalam の母音のマップ

Malayalam 母音マップのグラフィック表示

図 4–18 Malayalam のその他のマップ

Malayalam その他のマップのグラフィック表示

図 4–19 および 図 4–20 は、子音および母音についての、英語と Tamil のマッピングです。

図 4–19 Tamil の子音のマップ

Tamil 子音マップのグラフィック表示

図 4–20 Tamil の母音のマップ

Tamil 母音マップのグラフィック表示

図 4–21図 4–22、および図 4–23 は、子音、母音、およびその他についての、英語と Telugu のマッピングです。

図 4–21 Telugu の子音のマップ

Telugu 子音マップのグラフィック表示

図 4–22 Telugu の母音のマップ

Telugu 母音マップのグラフィック表示

図 4–23 Telugu のその他のマップ

Telugu その他のマップのグラフィック表示

連続表音入力方式の仕組み

各インド語スクリプトでは、「virama」(子音と結合される同等記号) が子音の半分になって文字の形を形成します。子音に対応する複数キーの組み合わせを入力すると、常に子音 + virama の形が出力され、文字が結合されることを表します。

最初の入力時の子音は半分の形ですが、後に母音が続くことによって 1 つの完全な音節になってさまざまに変化します。

2 つの連続した子音はこれから結合される半分の形です。半分の形は、レイアウトエンジンによって 1 つの結合文字に変換されるか、そのままですべての言語で統語的に有効な独立形として残ります。

単語の最初に来る母音または別の母音が続く母音は独立形です。直後に子音が来る母音は依存形です。

いかなるコンテキストでも変化しない文字はその他になります。この文字は子音でも母音でもありません。

文字の一部とはならない数字およびその他の句読点は 1 対 1 でマッピングされます。

これらの原則を使用してパーサーが記述されていて、これにより入力がそれぞれのカテゴリに解析され、言語固有の Unicode のコードポイントが出力されます。連続表音入力方式エンジンはレイアウトおよび描画を処理せず、システムのほかのモジュールが行います。

タイ語の地域対応

最新の Solaris 環境は、3 つのタイ語入力レベルおよび 4 つのタイ語キー配列をサポートします。

タイ語入力方式

次のタイ語入力方式がこのリリースでサポートされています。これらの入力方式は、文字シーケンスチェックのためにタイ語 IT 標準で指定されています。

  1. パススルーレベル (入力チェックなし)

  2. 基本入力チェックレベル

  3. 詳細入力チェックレベル

シーケンスチェックのないパススルーレベルが、前の Solaris リリースと同様にこのリリースでもデフォルトです。

F2 キーを使用して、入力レベルを切り替えることができます。

タイ語のキー配列

タイ語の入力方式には 4 つのキー配列がサポートされています。

タイ語入力方式の補助ウィンドウ

タイ語入力方式の補助ウィンドウでは、次の機能とユーティリティがサポートされています。