UTF-8 ロケールでサポートされているすべてのインド語で、音訳検索に基づく入力方式 (Shabdalipi) および連続表音入力方式が使用できます。この入力方式と仮想キーボードによって、すべての CDE アプリケーションでインド語テキストを入力できます。
次のデータフローは、インド語の入力プロセスの動作を示します。
入力状態領域をクリックして、入力方式の選択メニューを表示します。
メニューから入力方式を選択します。
または、F6 キーを押すと、使用可能な入力方式の中から選択できます。
また、Compose-hi キーシーケンスを入力すると、前に使用した入力方式を選択しません。
F5 キーを押して、使用するインド語スクリプトを選択します。
キーボードベース (インド語 INSCRIPT キーボード) の入力方式の場合 、「インド語キーボード」に示すキーボードイメージを使用します。
音訳検索に基づく入力方式の場合、対象のスクリプトの文字に対応する最初の英語表音同等文字を入力します。
ルックアップウィンドウに表示されるリストから選択します。
連続表音入力方式の場合、英語表音同等文字を連続して入力します。
対象のスクリプトの対応する文字が編集前テキストとして表示され、編集前テキストをそのままにして入力を続けるか、明示的に確定するとその文字が確定されます。連続表音入力方式の場合の英語トークンから UTF-8 コードポイントへのマッピングについては、「連続表音ベース入力方式のマッピング」に示す図を参照してください。
Control-Space キーを押して、英語/ヨーロッパ語入力モードに戻ります。
または、状態領域をクリックし、入力モードの選択ウィンドウから英語/ヨーロッパ語入力モードを選択します。
インド語入力方式で使用可能なキーボードの配列を以下の図に示します。
「連続表音ベース入力方式のマッピング」のイメージは、サポートされる各対象スクリプトにおける英語トークンとその同等コードポイント間のマッピングを示しています。CONSONANT カテゴリは、英語トークンとスクリプトの子音間のマッピングです。VOWEL カテゴリは、英語トークンとスクリプトの母音間のマッピングです。OTHER カテゴリは、子音および母音のプロパティを示さない文字のマッピングです (これらの文字の形は前後の文字によって変化しない)。
CONSONANT、VOWEL、および OTHER のキーワードは、これらの文字が Unicode 規格の一部であることも意味します。セクション SPECIAL CONSONANT、SPECIAL VOWEL、または SPECIAL OTHER は、原則的にそれぞれの文字が子音、母音、またはその他のプロパティを表すが、正式に Unicode 規格の一部であるわけではなく、フォント依存であることを意味します。これらの文字には、Unicode の私用領域 (PUA) のコードポイント値が割り当てられます。Solaris UTF-8 ロケールではサポートされますが、別のプラットフォームではマッピングが機能しない場合もあります。
そのマップファイルは、システムのマップファイルと同じではなく、上記の説明に沿って不必要なキーワードを削除するために少し編集されています。
VOWEL と SPECIAL VOWEL セクションでは、同じ英語トークンに対してコンテキスト依存の独立形と依存形が示されます。「連続表音入力方式の仕組み」を参照してください。
malayalam スクリプトには、特別な ‘CHILLU’ セクションが含まれていますが、実際は SPECIAL OTHER カテゴリです。
対象のインド語スクリプトにおける英語から表音同等文字への既存のマッピングを以下の図に示します。これらの図を参照しながら、使用するスクリプトのすべてのマッピングを覚えてください。ここではマッピングを直感的に示しているので、ほとんどの文字を図で探すことなく入力できます。
これらのマッピングでは、マッピングの一部に含められている 「.」、「|」 などの特殊文字は「\」 文字でエスケープします。エスケープしない場合、「|」 文字は複数のトークンが同じ UTF-8 文字を表すときに区切り文字になります。
図 4–1、図 4–2、および図 4–3 は、子音、母音、およびその他についての、英語と Bengali のマッピングです。
図 4–4、図 4–5、および図 4–6は、子音、母音、およびその他についての、英語と Gujarati のマッピングです。
図 4–7、図 4–8、および図 4–9 は、子音、母音、およびその他についての、英語と Gurmukhi のマッピングです。
図 4–10、図 4–11、および図 4–12 は、子音、母音、およびその他についての、英語と Hindi のマッピングです。
図 4–13、図 4–14、および図 4–15 は、子音、母音、およびその他についての、英語と Kannada のマッピングです。
図 4–16、図 4–17、および 図 4–18 は、子音、母音、およびその他についての、英語と Malayalam のマッピングです。
図 4–19 および 図 4–20 は、子音および母音についての、英語と Tamil のマッピングです。
図 4–21、図 4–22、および図 4–23 は、子音、母音、およびその他についての、英語と Telugu のマッピングです。
各インド語スクリプトでは、「virama」(子音と結合される同等記号) が子音の半分になって文字の形を形成します。子音に対応する複数キーの組み合わせを入力すると、常に子音 + virama の形が出力され、文字が結合されることを表します。
最初の入力時の子音は半分の形ですが、後に母音が続くことによって 1 つの完全な音節になってさまざまに変化します。
2 つの連続した子音はこれから結合される半分の形です。半分の形は、レイアウトエンジンによって 1 つの結合文字に変換されるか、そのままですべての言語で統語的に有効な独立形として残ります。
単語の最初に来る母音または別の母音が続く母音は独立形です。直後に子音が来る母音は依存形です。
いかなるコンテキストでも変化しない文字はその他になります。この文字は子音でも母音でもありません。
文字の一部とはならない数字およびその他の句読点は 1 対 1 でマッピングされます。
これらの原則を使用してパーサーが記述されていて、これにより入力がそれぞれのカテゴリに解析され、言語固有の Unicode のコードポイントが出力されます。連続表音入力方式エンジンはレイアウトおよび描画を処理せず、システムのほかのモジュールが行います。