国际语言环境指南

第 4 章 支持的亚洲语言环境

本章提供有关日语、印度语和泰语的本地化相关信息的信息。本章包含以下部分:

日语本地化

这部分描述日语语言环境特定的信息。

日语语言环境

在当前 Solaris 环境中,可使用四种支持不同字符编码的日语语言环境。jaja_JP.eucJP 语言环境基于日语 EUC。ja_JP.eucJP 语言环境符合 UI-OSF 日语环境实现协议 1.1 版,ja 语言环境符合早期 Solaris 版本中的传统规范。ja_JP.PCK 语言环境基于 PC 日文汉字代码(称为 Shift_JIS),而 ja_JP.UTF-8 基于 UTF-8

有关日语 EUC 和该字符集之间的映射,请参见 eucJP(5) 手册页。有关显示 PC 日文汉字代码和该字符集的映射,请参见 PCK(5) 手册页。

日语字符集

受支持的日语字符集包括:

JIS X 0212–1990 在 ja_JP.PCK 语言环境中不受支持。JIS X 0213–2000 仅在 ja_JP.UTF-8 语言环境中受到支持。并不是在 JIS X 0213–2000 中定义的所有字符都可用。只有在 Unicode 4.0 字符集中定义的那些字符可用。

还支持供应商定义的字符 (VDC) 和用户定义的字符 (UDC)。VDC 占用 JIS X 0208–1990 或 JIS X 0212–1990 的未使用(保留)代码点。UDC 与 VDC 占用相同的代码点,但分配给 VDC 的那些代码点除外。

日语字体

支持三种日语字体格式。位图、TrueType 和 Type1。日语 Type1 字体只包括用于打印的 JIS X 0212。Type1 字体还由 UDC 使用。

下表对日语位图字体进行了描述。

表 4–1 日语位图字体

完整系列名 

子系列 

格式 

供应商 

编码 

sun gothic

R、B 

PCF(12,14,16,20,24) 

 

JIS X 0208–1983、 

JIS X 0201–1976 

sun minchou

PCF(12,14,16,20,24) 

 

JIS X 0208–1983、 

JIS X 0201–1976 

ricoh hg gothic b

PCF(10,12,14,16,18,20,24) 

RICOH 

JIS X 0208–1983, JIS X 0201–1976 

ricoh hg mincho l

PCF(10,12,14,16,18,20,24) 

RICOH 

JIS X 0208–1983, JIS X 0201–1976 

ricoh gothic

PCF(10,12,14,16,18,20,24) 

RICOH 

JIS X 0212–1990, JIS X 0213–2000 

ricoh mincho

PCF(10,12,14,16,18,20,24) 

RICOH 

JIS X 0212–1990, JIS X 0213–2000 

ricoh heiseimin

PCF(12,14,16,18,20,24) 

RICOH 

JIS X 0212–1990 

下表对日语 TrueType 字体进行了描述。

表 4–2 日语 TrueType 字体

完整系列名 

子系列 

格式 

供应商 

编码 

ricoh hg gothic b

固定 

TrueType 

RICOH 

JIS X 0208–1983, JIS X 0201–1976 

ricoh hg mincho l

固定 

TrueType 

RICOH 

JIS X 0208–.1983、JIS X 0201–1976 

ricoh hg gothicb sun

固定、成比例 

TrueType 

RICOH 

JIS X 0201–176、JIS X 0208–1983、JIS X 0213–2000 

ricoh hg minchol sun

固定、成比例 

TrueType 

RICOH 

JIS X 0201–1976、JIS X 0208–1983、JIS X 0213–2000 

ricoh heiseimin

固定 

TrueType 

RICOH 

JIS X 0212–1990 

日语输入系统

ATOK12 是当前 Solaris 环境中的缺省日语输入系统。安装了日语语言环境后,ATOK12 就可用于所有日语语言环境和所有 UTF-8 语言环境。Wnn6 日语输入系统也可用于所有日语语言环境。您可以在桌面菜单中切换输入系统。对于日语 Solaris 1.x BCP 支持,可使用 kkcv 日语输入系统。

以下过程介绍如何使用 ATOK12 输入法输入日语文本。

如何使用 ATOK 输入法

  1. 按 Ctrl-空格键可打开输入转换。

  2. 键入要转换的文本的假名字符。

    例如,可以键入对应日文汉字 henkan 的假名。

  3. 按空格键以显示可用于假名拼写的日文汉字转换候选字。

  4. 键入要选择的转换候选字的编号。

  5. 按“返回”可提交完成的日文汉字假名拼写。

    另外,您可以按向下箭头键,仅提交所选字符。

  6. 按 Ctrl-空格键可关闭输入转换。

日语终端的终端设置

要在基于字符的终端 (TTY) 上使用日语语言环境,必须使用终端设置以便使行编辑正确工作。

日语 iconv 模块

使用 iconv(1)iconv(3) 可支持多个日语代码集转换。有关详细信息,请参见 iconv_ja(5) 手册页。

用户定义的字符支持

用户定义的字符实用程序 sdtudctool 处理轮廓 (Type1) 和位图 (PCF) 字体。某些实用程序也可用于移植由早期发行版中的旧实用程序创建的 UDC 字体,如 fontedittype3creator fontmanager

部分语言环境和完全语言环境之间的差别

下列组件只在带有 Languages CD 的日语完全语言环境中可用:

印度语本地化

对于 UTF-8 语言环境中支持的所有印度语语言,基于拼音查找的输入法 (Shabdalipi) 和连续拼音输入法都可用。使用这些输入法和虚拟键盘,可以在所有 CDE 应用程序中输入印度语文本。

以下数据流说明了印度语输入过程的工作方式。印度语输入过程的数据流

如何使用印度语输入法

  1. 单击输入状态区可显示输入法选择菜单。

  2. 从菜单中选择输入法。

    另外,您可以按 F6 键,以便从可用的输入法中进行选择。

    还可以键入 Compose-hi 键序列,选择您以前使用的输入法。

  3. 按 F5 键可选择要使用的印度语脚本。

    1. 对于基于键盘(印度语 INSCRIPT 键盘)的输入法,请使用印度语键盘中显示的键盘图像。

    2. 对于基于拼音查找的输入法,请键入与目标脚本中的字符对应的第一个英文拼音等效字符。

      从显示在查找窗口中的选项列表中进行选择。

    3. 对于连续拼音输入法,请连续键入英文的拼音等效字符。

      目标脚本中的对应字符显示在预编辑区中,当随后进行输入后预编辑文本已明确,或者进行了显式提交时,这些字符将被提交。对于连续拼音输入法中有关英文标记至目标脚本的 UTF-8 代码点之间的映射的图示,请参阅基于连续拼音的输入法的映射中给出的图。

  4. 按 Ctrl-空格键重新切换到英文/欧洲输入模式。

    另外,可在状态栏中单击以便从输入模式选择窗口中选择英文/欧洲输入模式。

印度语键盘

下列图显示可用于印度语输入法的键盘布局。

下图显示了孟加拉语键盘的布局。

孟加拉语键盘布局

下图显示了梵文键盘的布局。

梵文键盘布局

下图显示了古吉拉特语键盘的布局。

古吉拉特语键盘布局

下图显示了果鲁穆奇语键盘的布局。

果鲁穆奇语键盘布局

下图显示了埃纳德语键盘的布局。

埃纳德语键盘布局

下图显示了马拉雅拉姆语键盘的布局。

马拉雅拉姆语键盘布局

下图显示了泰米尔语键盘的布局。

泰米尔语键盘布局

下图显示了泰卢固语键盘的布局。

泰卢固语键盘布局

了解映射

基于连续拼音的输入法的映射中的图像显示了英文标记与其在所支持的各个目标脚本中的等效代码点之间的映射。CONSONANT 类别表示英文标记与脚本的辅音字母之间的映射。VOWEL 类别表示英文标记与脚本的元音字母之间的映射。OTHER 类别包含不具有辅音字母和元音字母(其格式不随两边字符的变化而变化)特性的字符的映射。

关键字 CONSONANT、VOWEL 和 OTHER 还表示这些字符是 Unicode 标准的一部分。SPECIAL CONSONANT、SPECIAL VOWEL 或 SPECIAL OTHER 表示:虽然这些字符原则上显示辅音字母、元音字母或其他字符的特性,但它们未正式包含在 Unicode 标准中且与字体相关。它们是在 Unicode 私有用户区中分配的代码点值。它们在 Solaris UTF-8 语言环境中受到支持,而映射在不同平台上则可能不工作。

这些映射文件与系统中的映射文件不同,而是进行过一些编辑,删除了对本文讨论内容无关紧要的关键字。

在 VOWELS 和 SPECIAL VOWELS 段中,根据上下文,为同一英文标记显示独立格式和相关格式。请参见连续拼音输入法的工作原理

malayalam 脚本包含特殊的 ‘CHILLU’ 段,该段实际上是 SPECIAL OTHER 类别。

基于连续拼音的输入法的映射

下图显示英文至目标印度语脚本中的等效拼音字符的现有映射。使用这些图作为参考,直到您了解所使用脚本的所有映射。此处给出的映射非常直观,所以您应当不需要看图即可输入大多数字符。


注意 –

这些映射中包含诸如 ‘.’ 和 ‘|’ 等特殊字符,作为使用 ‘\’ 字符换码的映射的一部分。如果不进行换码,那么如果多个标记表示同一个 UTF-8 字符,则 ‘|’ 字符将作为分隔符。


图 4–1图 4–2图 4–3 显示辅音字母、元音字母和其他字符的英文至孟加拉语的映射。

图 4–1 孟加拉语辅音字母映射

孟加拉语辅音字母映射的图形表示

图 4–2 孟加拉语元音字母映射

孟加拉语元音字母映射的图形表示

图 4–3 其他孟加拉语字符映射

其他孟加拉语字符映射的图形表示

图 4–4图 4–5图 4–6 显示辅音字母、元音字母和其他字符的英文至古吉拉特语的映射。

图 4–4 古吉拉特语辅音字母映射

古吉拉特语辅音字母映射的图形表示

图 4–5 古吉拉特语元音字母映射

古吉拉特语元音字母映射的图形表示

图 4–6 其他古吉拉特语字符映射

其他古吉拉特语字符映射的图形表示

图 4–7图 4–8图 4–9 显示辅音字母、元音字母和其他字符的英文至果鲁穆奇语的映射。

图 4–7 果鲁穆奇语辅音字母映射

果鲁穆奇语辅音字母映射的图形表示

图 4–8 果鲁穆奇语元音字母映射

果鲁穆奇语元音字母映射的图形表示

图 4–9 其他果鲁穆奇语字符映射

其他果鲁穆奇语字符映射的图形表示

图 4–10图 4–11图 4–12中显示辅音字母、元音字母和其他字符的英文至印度语映射。

图 4–10 印度语辅音字母映射

印度语辅音字母映射的图形表示

图 4–11 印度语元音字母映射

印度语元音字母映射的图形表示

图 4–12 其他印度语字符映射

其他印度语字符映射的图形表示

图 4–13图 4–14图 4–15中给出辅音字母、元音字母和其他字符的英文至埃纳德语的映射。

图 4–13 埃纳德语辅音字母映射

埃纳德语辅音字母映射的图形表示

图 4–14 埃纳德语元音字母映射

埃纳德语元音字母映射的图形表示

图 4–15 其他埃纳德语字符映射

其他埃纳德语字符的图形表示

图 4–16图 4–17图 4–18给出辅音字母、元音字母和其他字符的英文至马拉雅拉姆语的映射。

图 4–16 马拉雅拉姆语辅音字母映射

马拉雅拉姆语辅音字母映射的图形表示

图 4–17 马拉雅拉姆语元音字母映射

马拉雅拉姆语元音字母映射的图形表示

图 4–18 其他马拉雅拉姆语字符映射

其他马拉雅拉姆语字符映射的图形表示

图 4–19图 4–20给出辅音字母和元音字母的英文至 泰米尔语的映射。

图 4–19 泰米尔语辅音字母映射

泰米尔语辅音字母映射的图形表示

图 4–20 泰米尔语元音字母映射

泰米尔语元音字母图的图形表示

图 4–21图 4–22图 4–23给出辅音字母、元音字母和其他字符的英文至 Telugu 的映射。

图 4–21 Telugu 辅音字母映射

Telugu 辅音字母映射的图形表示

图 4–22 Telugu 元音字母映射

Telugu 元音字母图的图形表示

图 4–23 其他 Telugu 字符映射

其他 Telugu 字符映射的图形表示

连续拼音输入法的工作原理

对于每个印度语脚本,一个 ‘virama’ 或等效标记与一个辅音字母组合,成为一个辅音字母的一半形式(或可组合形式)。只要键入与辅音字母对应的多键组合,就会输出辅音字母 + virama 的形式,这表明可以开始组合字符。

先输入的辅音字母将假定其另一半的形式,并且在其后输入元音字母时成为满音节或其变化形式。

两个连续辅音字母仍然是可组合的一半形式。布局引擎可将一半形式转换为单个组合字符,或者保持在句法上对所有语言有效的独立形式。

一个单词的任何起始元音字母或者后面跟有另一元音字母的任何元音字母都为独立形式。后面紧随着辅音字母的元音字母为相关格式。

在任何上下文中都不改变形状的字符称为其他字符。这些字符既不是辅音字母也不是元音字母。

不组成字符的数字和其他标点符号标记被一一映射。

使用以上原则,解析器被编写为将输入解析为不同类别并输出特定于语言的 Unicode 代码点。连续拼音输入法引擎不处理布局或呈现,相关处理由系统中的其他模块完成。

泰语本地化

当前 Solaris 环境支持三种泰语输入级别和四种泰语键盘布局。

泰语输入法

本发行版中支持下列泰语输入法。Thai IT 标准中指定对这些输入法进行字符序列检查。

  1. 传递级别,不进行任何输入检查

  2. 基本的输入检查级别

  3. 严格的输入检查级别

对传递级别不进行序列检查,该级别是本发行版中的缺省级别,这一点和以前的 Solaris 发行版一样。

您可以使用 F2 功能键在各个输入级别之间切换。

泰语键盘布局

为泰语输入法支持四种不同的键盘布局。

泰语输入法辅助窗口

泰语输入法辅助窗口支持下列功能和实用程序: