对于 UTF-8 语言环境中支持的所有印度语语言,基于拼音查找的输入法 (Shabdalipi) 和连续拼音输入法都可用。使用这些输入法和虚拟键盘,可以在所有 CDE 应用程序中输入印度语文本。
以下数据流说明了印度语输入过程的工作方式。
单击输入状态区可显示输入法选择菜单。
从菜单中选择输入法。
另外,您可以按 F6 键,以便从可用的输入法中进行选择。
还可以键入 Compose-hi 键序列,选择您以前使用的输入法。
按 F5 键可选择要使用的印度语脚本。
对于基于键盘(印度语 INSCRIPT 键盘)的输入法,请使用印度语键盘中显示的键盘图像。
对于基于拼音查找的输入法,请键入与目标脚本中的字符对应的第一个英文拼音等效字符。
从显示在查找窗口中的选项列表中进行选择。
对于连续拼音输入法,请连续键入英文的拼音等效字符。
目标脚本中的对应字符显示在预编辑区中,当随后进行输入后预编辑文本已明确,或者进行了显式提交时,这些字符将被提交。对于连续拼音输入法中有关英文标记至目标脚本的 UTF-8 代码点之间的映射的图示,请参阅基于连续拼音的输入法的映射中给出的图。
按 Ctrl-空格键重新切换到英文/欧洲输入模式。
另外,可在状态栏中单击以便从输入模式选择窗口中选择英文/欧洲输入模式。
基于连续拼音的输入法的映射中的图像显示了英文标记与其在所支持的各个目标脚本中的等效代码点之间的映射。CONSONANT 类别表示英文标记与脚本的辅音字母之间的映射。VOWEL 类别表示英文标记与脚本的元音字母之间的映射。OTHER 类别包含不具有辅音字母和元音字母(其格式不随两边字符的变化而变化)特性的字符的映射。
关键字 CONSONANT、VOWEL 和 OTHER 还表示这些字符是 Unicode 标准的一部分。SPECIAL CONSONANT、SPECIAL VOWEL 或 SPECIAL OTHER 表示:虽然这些字符原则上显示辅音字母、元音字母或其他字符的特性,但它们未正式包含在 Unicode 标准中且与字体相关。它们是在 Unicode 私有用户区中分配的代码点值。它们在 Solaris UTF-8 语言环境中受到支持,而映射在不同平台上则可能不工作。
这些映射文件与系统中的映射文件不同,而是进行过一些编辑,删除了对本文讨论内容无关紧要的关键字。
在 VOWELS 和 SPECIAL VOWELS 段中,根据上下文,为同一英文标记显示独立格式和相关格式。请参见连续拼音输入法的工作原理。
malayalam 脚本包含特殊的 ‘CHILLU’ 段,该段实际上是 SPECIAL OTHER 类别。
下图显示英文至目标印度语脚本中的等效拼音字符的现有映射。使用这些图作为参考,直到您了解所使用脚本的所有映射。此处给出的映射非常直观,所以您应当不需要看图即可输入大多数字符。
这些映射中包含诸如 ‘.’ 和 ‘|’ 等特殊字符,作为使用 ‘\’ 字符换码的映射的一部分。如果不进行换码,那么如果多个标记表示同一个 UTF-8 字符,则 ‘|’ 字符将作为分隔符。
图 4–1、图 4–2 和图 4–3 显示辅音字母、元音字母和其他字符的英文至孟加拉语的映射。
图 4–4、图 4–5 和图 4–6 显示辅音字母、元音字母和其他字符的英文至古吉拉特语的映射。
图 4–7、图 4–8 和图 4–9 显示辅音字母、元音字母和其他字符的英文至果鲁穆奇语的映射。
图 4–10、图 4–11 和图 4–12中显示辅音字母、元音字母和其他字符的英文至印度语映射。
图 4–13、图 4–14 和图 4–15中给出辅音字母、元音字母和其他字符的英文至埃纳德语的映射。
图 4–16、图 4–17 和图 4–18给出辅音字母、元音字母和其他字符的英文至马拉雅拉姆语的映射。
图 4–19 和图 4–20给出辅音字母和元音字母的英文至 泰米尔语的映射。
图 4–21、图 4–22 和图 4–23给出辅音字母、元音字母和其他字符的英文至 Telugu 的映射。
对于每个印度语脚本,一个 ‘virama’ 或等效标记与一个辅音字母组合,成为一个辅音字母的一半形式(或可组合形式)。只要键入与辅音字母对应的多键组合,就会输出辅音字母 + virama 的形式,这表明可以开始组合字符。
先输入的辅音字母将假定其另一半的形式,并且在其后输入元音字母时成为满音节或其变化形式。
两个连续辅音字母仍然是可组合的一半形式。布局引擎可将一半形式转换为单个组合字符,或者保持在句法上对所有语言有效的独立形式。
一个单词的任何起始元音字母或者后面跟有另一元音字母的任何元音字母都为独立形式。后面紧随着辅音字母的元音字母为相关格式。
在任何上下文中都不改变形状的字符称为其他字符。这些字符既不是辅音字母也不是元音字母。
不组成字符的数字和其他标点符号标记被一一映射。
使用以上原则,解析器被编写为将输入解析为不同类别并输出特定于语言的 Unicode 代码点。连续拼音输入法引擎不处理布局或呈现,相关处理由系统中的其他模块完成。