国际语言环境指南

印度语本地化

对于 UTF-8 语言环境中支持的所有印度语语言,基于拼音查找的输入法 (Shabdalipi) 和连续拼音输入法都可用。使用这些输入法和虚拟键盘,可以在所有 CDE 应用程序中输入印度语文本。

以下数据流说明了印度语输入过程的工作方式。印度语输入过程的数据流

如何使用印度语输入法

  1. 单击输入状态区可显示输入法选择菜单。

  2. 从菜单中选择输入法。

    另外,您可以按 F6 键,以便从可用的输入法中进行选择。

    还可以键入 Compose-hi 键序列,选择您以前使用的输入法。

  3. 按 F5 键可选择要使用的印度语脚本。

    1. 对于基于键盘(印度语 INSCRIPT 键盘)的输入法,请使用印度语键盘中显示的键盘图像。

    2. 对于基于拼音查找的输入法,请键入与目标脚本中的字符对应的第一个英文拼音等效字符。

      从显示在查找窗口中的选项列表中进行选择。

    3. 对于连续拼音输入法,请连续键入英文的拼音等效字符。

      目标脚本中的对应字符显示在预编辑区中,当随后进行输入后预编辑文本已明确,或者进行了显式提交时,这些字符将被提交。对于连续拼音输入法中有关英文标记至目标脚本的 UTF-8 代码点之间的映射的图示,请参阅基于连续拼音的输入法的映射中给出的图。

  4. 按 Ctrl-空格键重新切换到英文/欧洲输入模式。

    另外,可在状态栏中单击以便从输入模式选择窗口中选择英文/欧洲输入模式。

印度语键盘

下列图显示可用于印度语输入法的键盘布局。

下图显示了孟加拉语键盘的布局。

孟加拉语键盘布局

下图显示了梵文键盘的布局。

梵文键盘布局

下图显示了古吉拉特语键盘的布局。

古吉拉特语键盘布局

下图显示了果鲁穆奇语键盘的布局。

果鲁穆奇语键盘布局

下图显示了埃纳德语键盘的布局。

埃纳德语键盘布局

下图显示了马拉雅拉姆语键盘的布局。

马拉雅拉姆语键盘布局

下图显示了泰米尔语键盘的布局。

泰米尔语键盘布局

下图显示了泰卢固语键盘的布局。

泰卢固语键盘布局

了解映射

基于连续拼音的输入法的映射中的图像显示了英文标记与其在所支持的各个目标脚本中的等效代码点之间的映射。CONSONANT 类别表示英文标记与脚本的辅音字母之间的映射。VOWEL 类别表示英文标记与脚本的元音字母之间的映射。OTHER 类别包含不具有辅音字母和元音字母(其格式不随两边字符的变化而变化)特性的字符的映射。

关键字 CONSONANT、VOWEL 和 OTHER 还表示这些字符是 Unicode 标准的一部分。SPECIAL CONSONANT、SPECIAL VOWEL 或 SPECIAL OTHER 表示:虽然这些字符原则上显示辅音字母、元音字母或其他字符的特性,但它们未正式包含在 Unicode 标准中且与字体相关。它们是在 Unicode 私有用户区中分配的代码点值。它们在 Solaris UTF-8 语言环境中受到支持,而映射在不同平台上则可能不工作。

这些映射文件与系统中的映射文件不同,而是进行过一些编辑,删除了对本文讨论内容无关紧要的关键字。

在 VOWELS 和 SPECIAL VOWELS 段中,根据上下文,为同一英文标记显示独立格式和相关格式。请参见连续拼音输入法的工作原理

malayalam 脚本包含特殊的 ‘CHILLU’ 段,该段实际上是 SPECIAL OTHER 类别。

基于连续拼音的输入法的映射

下图显示英文至目标印度语脚本中的等效拼音字符的现有映射。使用这些图作为参考,直到您了解所使用脚本的所有映射。此处给出的映射非常直观,所以您应当不需要看图即可输入大多数字符。


注意 –

这些映射中包含诸如 ‘.’ 和 ‘|’ 等特殊字符,作为使用 ‘\’ 字符换码的映射的一部分。如果不进行换码,那么如果多个标记表示同一个 UTF-8 字符,则 ‘|’ 字符将作为分隔符。


图 4–1图 4–2图 4–3 显示辅音字母、元音字母和其他字符的英文至孟加拉语的映射。

图 4–1 孟加拉语辅音字母映射

孟加拉语辅音字母映射的图形表示

图 4–2 孟加拉语元音字母映射

孟加拉语元音字母映射的图形表示

图 4–3 其他孟加拉语字符映射

其他孟加拉语字符映射的图形表示

图 4–4图 4–5图 4–6 显示辅音字母、元音字母和其他字符的英文至古吉拉特语的映射。

图 4–4 古吉拉特语辅音字母映射

古吉拉特语辅音字母映射的图形表示

图 4–5 古吉拉特语元音字母映射

古吉拉特语元音字母映射的图形表示

图 4–6 其他古吉拉特语字符映射

其他古吉拉特语字符映射的图形表示

图 4–7图 4–8图 4–9 显示辅音字母、元音字母和其他字符的英文至果鲁穆奇语的映射。

图 4–7 果鲁穆奇语辅音字母映射

果鲁穆奇语辅音字母映射的图形表示

图 4–8 果鲁穆奇语元音字母映射

果鲁穆奇语元音字母映射的图形表示

图 4–9 其他果鲁穆奇语字符映射

其他果鲁穆奇语字符映射的图形表示

图 4–10图 4–11图 4–12中显示辅音字母、元音字母和其他字符的英文至印度语映射。

图 4–10 印度语辅音字母映射

印度语辅音字母映射的图形表示

图 4–11 印度语元音字母映射

印度语元音字母映射的图形表示

图 4–12 其他印度语字符映射

其他印度语字符映射的图形表示

图 4–13图 4–14图 4–15中给出辅音字母、元音字母和其他字符的英文至埃纳德语的映射。

图 4–13 埃纳德语辅音字母映射

埃纳德语辅音字母映射的图形表示

图 4–14 埃纳德语元音字母映射

埃纳德语元音字母映射的图形表示

图 4–15 其他埃纳德语字符映射

其他埃纳德语字符的图形表示

图 4–16图 4–17图 4–18给出辅音字母、元音字母和其他字符的英文至马拉雅拉姆语的映射。

图 4–16 马拉雅拉姆语辅音字母映射

马拉雅拉姆语辅音字母映射的图形表示

图 4–17 马拉雅拉姆语元音字母映射

马拉雅拉姆语元音字母映射的图形表示

图 4–18 其他马拉雅拉姆语字符映射

其他马拉雅拉姆语字符映射的图形表示

图 4–19图 4–20给出辅音字母和元音字母的英文至 泰米尔语的映射。

图 4–19 泰米尔语辅音字母映射

泰米尔语辅音字母映射的图形表示

图 4–20 泰米尔语元音字母映射

泰米尔语元音字母图的图形表示

图 4–21图 4–22图 4–23给出辅音字母、元音字母和其他字符的英文至 Telugu 的映射。

图 4–21 Telugu 辅音字母映射

Telugu 辅音字母映射的图形表示

图 4–22 Telugu 元音字母映射

Telugu 元音字母图的图形表示

图 4–23 其他 Telugu 字符映射

其他 Telugu 字符映射的图形表示

连续拼音输入法的工作原理

对于每个印度语脚本,一个 ‘virama’ 或等效标记与一个辅音字母组合,成为一个辅音字母的一半形式(或可组合形式)。只要键入与辅音字母对应的多键组合,就会输出辅音字母 + virama 的形式,这表明可以开始组合字符。

先输入的辅音字母将假定其另一半的形式,并且在其后输入元音字母时成为满音节或其变化形式。

两个连续辅音字母仍然是可组合的一半形式。布局引擎可将一半形式转换为单个组合字符,或者保持在句法上对所有语言有效的独立形式。

一个单词的任何起始元音字母或者后面跟有另一元音字母的任何元音字母都为独立形式。后面紧随着辅音字母的元音字母为相关格式。

在任何上下文中都不改变形状的字符称为其他字符。这些字符既不是辅音字母也不是元音字母。

不组成字符的数字和其他标点符号标记被一一映射。

使用以上原则,解析器被编写为将输入解析为不同类别并输出特定于语言的 Unicode 代码点。连续拼音输入法引擎不处理布局或呈现,相关处理由系统中的其他模块完成。