本章提供有关日语、印度语和泰语的本地化相关信息的信息。本章包含以下部分:
这部分描述日语语言环境特定的信息。
在当前 Solaris 环境中,可使用四种支持不同字符编码的日语语言环境。ja 和 ja_JP.eucJP 语言环境基于日语 EUC。ja_JP.eucJP 语言环境符合 UI-OSF 日语环境实现协议 1.1 版,ja 语言环境符合早期 Solaris 版本中的传统规范。ja_JP.PCK 语言环境基于 PC 日文汉字代码(称为 Shift_JIS),而 ja_JP.UTF-8 基于 UTF-8。
有关日语 EUC 和该字符集之间的映射,请参见 eucJP(5) 手册页。有关显示 PC 日文汉字代码和该字符集的映射,请参见 PCK(5) 手册页。
JIS X 0201–1976
JIS X 0208–1990
JIS X 0212–1990
JIS X 0213–2000(仅限于 Unicode 4.0 中定义的字符)
JIS X 0212–1990 在 ja_JP.PCK 语言环境中不受支持。JIS X 0213–2000 仅在 ja_JP.UTF-8 语言环境中受到支持。并不是在 JIS X 0213–2000 中定义的所有字符都可用。只有在 Unicode 4.0 字符集中定义的那些字符可用。
还支持供应商定义的字符 (VDC) 和用户定义的字符 (UDC)。VDC 占用 JIS X 0208–1990 或 JIS X 0212–1990 的未使用(保留)代码点。UDC 与 VDC 占用相同的代码点,但分配给 VDC 的那些代码点除外。
支持三种日语字体格式。位图、TrueType 和 Type1。日语 Type1 字体只包括用于打印的 JIS X 0212。Type1 字体还由 UDC 使用。
下表对日语位图字体进行了描述。
表 4–1 日语位图字体
完整系列名 |
子系列 |
格式 |
供应商 |
编码 |
---|---|---|---|---|
sun gothic |
R、B |
PCF(12,14,16,20,24) |
|
JIS X 0208–1983、 JIS X 0201–1976 |
sun minchou |
R |
PCF(12,14,16,20,24) |
|
JIS X 0208–1983、 JIS X 0201–1976 |
ricoh hg gothic b |
R |
PCF(10,12,14,16,18,20,24) |
RICOH |
JIS X 0208–1983, JIS X 0201–1976 |
ricoh hg mincho l |
R |
PCF(10,12,14,16,18,20,24) |
RICOH |
JIS X 0208–1983, JIS X 0201–1976 |
ricoh gothic |
R |
PCF(10,12,14,16,18,20,24) |
RICOH |
JIS X 0212–1990, JIS X 0213–2000 |
ricoh mincho |
R |
PCF(10,12,14,16,18,20,24) |
RICOH |
JIS X 0212–1990, JIS X 0213–2000 |
ricoh heiseimin |
R |
PCF(12,14,16,18,20,24) |
RICOH |
JIS X 0212–1990 |
下表对日语 TrueType 字体进行了描述。
表 4–2 日语 TrueType 字体
完整系列名 |
子系列 |
格式 |
供应商 |
编码 |
---|---|---|---|---|
ricoh hg gothic b |
固定 |
TrueType |
RICOH |
JIS X 0208–1983, JIS X 0201–1976 |
ricoh hg mincho l |
固定 |
TrueType |
RICOH |
JIS X 0208–.1983、JIS X 0201–1976 |
ricoh hg gothicb sun |
固定、成比例 |
TrueType |
RICOH |
JIS X 0201–176、JIS X 0208–1983、JIS X 0213–2000 |
ricoh hg minchol sun |
固定、成比例 |
TrueType |
RICOH |
JIS X 0201–1976、JIS X 0208–1983、JIS X 0213–2000 |
ricoh heiseimin |
固定 |
TrueType |
RICOH |
JIS X 0212–1990 |
ATOK12 是当前 Solaris 环境中的缺省日语输入系统。安装了日语语言环境后,ATOK12 就可用于所有日语语言环境和所有 UTF-8 语言环境。Wnn6 日语输入系统也可用于所有日语语言环境。您可以在桌面菜单中切换输入系统。对于日语 Solaris 1.x BCP 支持,可使用 kkcv 日语输入系统。
以下过程介绍如何使用 ATOK12 输入法输入日语文本。
按 Ctrl-空格键可打开输入转换。
键入要转换的文本的假名字符。
例如,可以键入对应日文汉字 henkan 的假名。
按空格键以显示可用于假名拼写的日文汉字转换候选字。
键入要选择的转换候选字的编号。
按“返回”可提交完成的日文汉字假名拼写。
另外,您可以按向下箭头键,仅提交所选字符。
按 Ctrl-空格键可关闭输入转换。
要在基于字符的终端 (TTY) 上使用日语语言环境,必须使用终端设置以便使行编辑正确工作。
如果您的终端是 CDE 终端仿真器 (dtterm),请在任何日语语言环境(ja、ja_JP.PCK或 ja_JP.UTF-8)中使用带参数 -defeucw的 stty(1)。 例如,在 ja 语言环境中应键入:
% setenv LANG ja % stty defeucw
如果您的终端不是 CDE 终端仿真器,但终端的代码集与当前语言环境的代码集相同,请使用带参数 -defeucw 的 stty(1)。
如果您的终端的代码集与当前语言环境的代码集不匹配,请使用 setterm(1) 以启用代码转换。例如,如果您正在使用 ja 语言环境,但您的终端要求 PCK(Shift_JIS 代码),则应键入:
% setenv LANG ja % setterm -x PCK
有关详细信息,请参见 setterm(3CURSES) 手册页。
使用 iconv(1) 和 iconv(3) 可支持多个日语代码集转换。有关详细信息,请参见 iconv_ja(5) 手册页。
用户定义的字符实用程序 sdtudctool 处理轮廓 (Type1) 和位图 (PCF) 字体。某些实用程序也可用于移植由早期发行版中的旧实用程序创建的 UDC 字体,如 fontedit、type3creator 和 fontmanager。
下列组件只在带有 Languages CD 的日语完全语言环境中可用:
已翻译的信息、帮助和手册页
Wnn6 日语输入系统
日语 Solaris 1.x BCP 支持
Mincho (min*) 字样位图字体
用于打印的 JIS X 0212 Type1 字体
日语特定的哑打印机和 postprint 支持
传统的日语实用程序,如 kanji(1)
对于 UTF-8 语言环境中支持的所有印度语语言,基于拼音查找的输入法 (Shabdalipi) 和连续拼音输入法都可用。使用这些输入法和虚拟键盘,可以在所有 CDE 应用程序中输入印度语文本。
以下数据流说明了印度语输入过程的工作方式。
单击输入状态区可显示输入法选择菜单。
从菜单中选择输入法。
另外,您可以按 F6 键,以便从可用的输入法中进行选择。
还可以键入 Compose-hi 键序列,选择您以前使用的输入法。
按 F5 键可选择要使用的印度语脚本。
对于基于键盘(印度语 INSCRIPT 键盘)的输入法,请使用印度语键盘中显示的键盘图像。
对于基于拼音查找的输入法,请键入与目标脚本中的字符对应的第一个英文拼音等效字符。
从显示在查找窗口中的选项列表中进行选择。
对于连续拼音输入法,请连续键入英文的拼音等效字符。
目标脚本中的对应字符显示在预编辑区中,当随后进行输入后预编辑文本已明确,或者进行了显式提交时,这些字符将被提交。对于连续拼音输入法中有关英文标记至目标脚本的 UTF-8 代码点之间的映射的图示,请参阅基于连续拼音的输入法的映射中给出的图。
按 Ctrl-空格键重新切换到英文/欧洲输入模式。
另外,可在状态栏中单击以便从输入模式选择窗口中选择英文/欧洲输入模式。
基于连续拼音的输入法的映射中的图像显示了英文标记与其在所支持的各个目标脚本中的等效代码点之间的映射。CONSONANT 类别表示英文标记与脚本的辅音字母之间的映射。VOWEL 类别表示英文标记与脚本的元音字母之间的映射。OTHER 类别包含不具有辅音字母和元音字母(其格式不随两边字符的变化而变化)特性的字符的映射。
关键字 CONSONANT、VOWEL 和 OTHER 还表示这些字符是 Unicode 标准的一部分。SPECIAL CONSONANT、SPECIAL VOWEL 或 SPECIAL OTHER 表示:虽然这些字符原则上显示辅音字母、元音字母或其他字符的特性,但它们未正式包含在 Unicode 标准中且与字体相关。它们是在 Unicode 私有用户区中分配的代码点值。它们在 Solaris UTF-8 语言环境中受到支持,而映射在不同平台上则可能不工作。
这些映射文件与系统中的映射文件不同,而是进行过一些编辑,删除了对本文讨论内容无关紧要的关键字。
在 VOWELS 和 SPECIAL VOWELS 段中,根据上下文,为同一英文标记显示独立格式和相关格式。请参见连续拼音输入法的工作原理。
malayalam 脚本包含特殊的 ‘CHILLU’ 段,该段实际上是 SPECIAL OTHER 类别。
下图显示英文至目标印度语脚本中的等效拼音字符的现有映射。使用这些图作为参考,直到您了解所使用脚本的所有映射。此处给出的映射非常直观,所以您应当不需要看图即可输入大多数字符。
这些映射中包含诸如 ‘.’ 和 ‘|’ 等特殊字符,作为使用 ‘\’ 字符换码的映射的一部分。如果不进行换码,那么如果多个标记表示同一个 UTF-8 字符,则 ‘|’ 字符将作为分隔符。
图 4–1、图 4–2 和图 4–3 显示辅音字母、元音字母和其他字符的英文至孟加拉语的映射。
图 4–4、图 4–5 和图 4–6 显示辅音字母、元音字母和其他字符的英文至古吉拉特语的映射。
图 4–7、图 4–8 和图 4–9 显示辅音字母、元音字母和其他字符的英文至果鲁穆奇语的映射。
图 4–10、图 4–11 和图 4–12中显示辅音字母、元音字母和其他字符的英文至印度语映射。
图 4–13、图 4–14 和图 4–15中给出辅音字母、元音字母和其他字符的英文至埃纳德语的映射。
图 4–16、图 4–17 和图 4–18给出辅音字母、元音字母和其他字符的英文至马拉雅拉姆语的映射。
图 4–19 和图 4–20给出辅音字母和元音字母的英文至 泰米尔语的映射。
图 4–21、图 4–22 和图 4–23给出辅音字母、元音字母和其他字符的英文至 Telugu 的映射。
对于每个印度语脚本,一个 ‘virama’ 或等效标记与一个辅音字母组合,成为一个辅音字母的一半形式(或可组合形式)。只要键入与辅音字母对应的多键组合,就会输出辅音字母 + virama 的形式,这表明可以开始组合字符。
先输入的辅音字母将假定其另一半的形式,并且在其后输入元音字母时成为满音节或其变化形式。
两个连续辅音字母仍然是可组合的一半形式。布局引擎可将一半形式转换为单个组合字符,或者保持在句法上对所有语言有效的独立形式。
一个单词的任何起始元音字母或者后面跟有另一元音字母的任何元音字母都为独立形式。后面紧随着辅音字母的元音字母为相关格式。
在任何上下文中都不改变形状的字符称为其他字符。这些字符既不是辅音字母也不是元音字母。
不组成字符的数字和其他标点符号标记被一一映射。
使用以上原则,解析器被编写为将输入解析为不同类别并输出特定于语言的 Unicode 代码点。连续拼音输入法引擎不处理布局或呈现,相关处理由系统中的其他模块完成。
当前 Solaris 环境支持三种泰语输入级别和四种泰语键盘布局。
本发行版中支持下列泰语输入法。Thai IT 标准中指定对这些输入法进行字符序列检查。
传递级别,不进行任何输入检查
基本的输入检查级别
严格的输入检查级别
对传递级别不进行序列检查,该级别是本发行版中的缺省级别,这一点和以前的 Solaris 发行版一样。
您可以使用 F2 功能键在各个输入级别之间切换。
Kedmanee (TIS820-2531) 键盘布局。Kedmanee 布局是为打字机设计的,不是为计算机键盘设计的。打字机键盘的有限键数表明,布局中部分特殊泰语字符不可用。TIS820-2531 已采用 Kedmanee 布局以使用计算机键盘。
TIS820-2538 键盘布局。该增强 Kedmanee 布局是 TIS820-2531 布局的更新版本,包括原来的 Kedmanee 布局中不可用的部分特殊泰语字符。当前,TIS820-2538 是 Thai Industrial Standard Institute 颁发的唯一一个泰语键盘布局标准。
可配置键盘布局。泰语输入法的用户定义键盘布局。
输入级别切换。您可以单击辅助调色板中的输入级别按钮,以选择传递、基本或严格做为输入级别。
泰语虚拟键盘。您可以单击键盘按钮来显示泰语虚拟键盘,以用于输入泰语字符。