简体中文 Solaris 用户指南

第 4 章 输入简体中文文本

本章提供用于输入简体中文文本的过程和其他信息。本章讨论以下主题:

字符输入概述

本章介绍可用于输入以下各类字符的简体中文 Solaris 输入模式。

可以在以下应用程序窗口的输入区中键入上述所有字符:

输入窗口区域

在简体中文 操作系统中,应用程序子窗口包含两个区,用于输入简体中文字符。

在简体中文 操作系统中,应用程序子窗口包含两个区,用于输入简体中文字符。在中文输入模式下,还提供一个查找选项窗口和一个辅助窗口。

使用简体中文输入法

本节提供用于选择和切换不同输入法的过程。

如何选择输入法

  1. 在输入区中,按 Ctrl-空格键可打开简体中文输入法转换。

    将出现一个辅助窗口。

    上文介绍了此图形。
  2. 通过以下操作之一,选择需要的输入法:

    • 在应用程序子窗口的状态区中,使用功能键切换输入法:F2 键对应第一种输入法,F3 键对应第二种输入法,依此类推。


      提示 –

      还可以重复按 Ctrl-Esc 键,直到获得需要的输入法。


    • 使用输入法面板。

      • 单击辅助窗口中的“实用程序”按钮。

        上文介绍了此图形。

        将出现实用程序菜单。

        上文介绍了此图形。
      • 单击实用程序菜单中的输入法选择项。

        出现输入法选择面板。

        上文介绍了此图形。
      • 从输入法选择面板中选择要使用的输入法。

        选择输入法之后,单击“确定”或“应用”激活设置。选择的第一种输入法为缺省输入法。


        注意 –

        当您按 Ctrl-空格键时,会选择缺省输入法。

        如果您更改输入法,可以按 Ctrl-Esc 键返回缺省输入法。


如何访问输入法帮助

帮助页显示在 Netscape NavigatorTM 等缺省浏览器中。

  1. 选择实用程序菜单上的输入法帮助选项,以便在浏览器中显示帮助页。

如何在半角和全角字符模式之间切换

    通过以下操作之一,在半角字符模式和全角字符模式之间切换。

    • 在应用程序子窗口的状态区中,按 Shift-空格键可在半角字符模式和全角字符模式之间切换。

    • 在辅助窗口中,单击“半角/全角”按钮。

    如果辅助窗口中出现以下按钮,则输入法系统处于全角字符模式:

    上文介绍了此图形。

    如果辅助窗口中出现以下按钮,则输入法系统处于半角字符模式:

    上文介绍了此图形。

    当系统处于全角模式时,会提交输入键的全角字符。例如,当您在全角模式下输入 a 时,会提交全角的 a

    上文介绍了此图形。

如何在中文和英文标点符号模式之间切换

    通过以下操作之一,在中文标点符号模式和英文标点符号模式之间切换。

    • 在应用程序子窗口的状态区中,键入 Ctrl-,以便在中文标点符号模式和英文标点符号模式之间切换。

    • 在辅助窗口中,单击中文/英文标点符号按钮。

    以下图标指示输入法系统处于中文标点符号模式:上文介绍了此图形。

    以下图标指示输入法系统处于英文标点符号模式:上文介绍了此图形。

    当在中文标点符号模式下选择标点符号键时,相应的中文标点符号将提交给应用程序。例如,当您处于中文标点符号模式下并选中 $ 符号时,中文的货币符号字符将提交给应用程序。

    上文介绍了此图形。

    标点符号键包括:, ./ <> :;’”\$!^&_-

    下图显示了英文键和中文标点符号之间的对应关系。

    上文介绍了此图形。

设置输入法选项

四个代码表输入选项可用于您选择的输入法。

如何选择输入法选项

  1. 单击实用程序菜单中的输入法选择项。

    将出现输入法选择面板。

  2. 从选择面板中选择一种输入法。

    将出现输入法选项面板。

    上文介绍了此图形。
  3. 选择一个输入法选项。

  4. 单击“确定”或“应用”以激活选择。

输入法实用程序

选择输入法后,您可以使用本节中的信息和过程完成下列操作:

查找表

在查找表中,您可以搜索和选择要输入的中文字。共有三种可用的查找表:

如何激活查找表选择

  1. 在辅助窗口中单击“实用程序”按钮。

  2. 在选择菜单中单击查找项。

    当您激活查找选项时,查找选项窗口中会显示对应于您在预编辑区中键入的字符串的可用字符以供选择。

如何搜索和选择查找选项

  1. 在预编辑区中键入要转换的字符串。

    将出现查找选项窗口。

    可使用下列键搜索对应于您的字符串的可用字符和字根。

    句点 (.)

    向前移至下一页选项

    逗号 (,)

    在选项中向后移动

  2. 键入要选择的查找选项的标签数字或字母。

    您的选项替代预编辑区中的字符串。

虚拟键盘

您可以使用虚拟键盘作为查找实用程序,从而简化某些特殊字符的输入。

简体中文系统支持多种虚拟键盘。

PC 键盘

下图显示 PC 虚拟键盘。

上文介绍了此图形。

希腊语键盘

下图显示希腊语虚拟键盘。

上文介绍了此图形。

俄语键盘

下图显示俄语虚拟键盘。

上文介绍了此图形。

注音键盘

下图显示注音虚拟键盘。

上文介绍了此图形。

中文标点符号键盘

下图显示中文标点符号虚拟键盘。

上文介绍了此图形。

数字符号查找键盘

下图显示数字符号查找虚拟键盘。

上文介绍了此图形。

数学符号查找键盘

下图显示数学符号查找虚拟键盘。

上文介绍了此图形。

特殊符号查找键盘

下图显示特殊符号查找虚拟键盘。

上文介绍了此图形。

表格符号查找键盘

下图显示表格符号查找虚拟键盘。

上文介绍了此图形。

如何选择虚拟键盘

    在辅助窗口中单击“虚拟键盘”按钮。

    将出现活动输入法的虚拟键盘。

用户自定义字符 (UDC)

用户自定义字符 (UDC) 编辑器工具用于绘制和保存新字符。将一个字符添加到一种输入法之后,该字符可显示在应用程序中。

如何激活 UDC 工具

  1. 在实用程序菜单上选择用户自定义字符项以激活 UDC 工具。

    上文介绍了此图形。

    有关用户自定义字符的更多信息,请参见 第 9 章,字体

用于输入文本的输入法和转换模式

本节介绍可用于输入 ASCII/英文、简体中文和其他字符的输入法和转换模式。

zh/zh_CN/zh_CN.EUC 语言环境中,您可以使用以下功能键访问可用输入法:

zh.GBK/zh_CN.GBK 语言环境中,您可以使用以下功能键访问可用输入法:

zh_CN.GB18030/zh.UTF-8/zh_CN.UTF-8 语言环境中,您可以使用以下功能键访问可用输入法:

ASCII 字符输入

应用程序在 ASCII 模式下启动,且应用程序子窗口的状态区为空白区。您可以按 Ctrl-空格键,或者在中文键盘上按中文/英文键将 ASCII 模式切换为打开或关闭。如果关闭 ASCII 输入模式,将出现缺省输入模式的指示器。

上文介绍了此图形。

新全拼和新双拼输入法

本节介绍新全拼和新双拼输入法的功能,并介绍如何在 zh_CN.EUC zh_CN.GBK 语言环境中使用其中某些功能。

拼音在中华人民共和国是常用的输入法。存在多种基于拼音的输入法。在这些输入法中,新全拼和新双拼这两种输入法支持以下功能:

以下各节将详细介绍这些功能。

如何定义短语供以后使用

下面说明如何定义短语 ke lin dun 并保存它供以后使用。

  1. 选择输入法。

    执行如何选择输入法过程中的步骤,选择输入法。

  2. 在输入区键入不包含空格的短语:kelindun

    新全拼和新双拼输入法会自动为您插入空格。

    上文介绍了此图形。
  3. 键入与您要选择的候选字对应的数字。

    上文介绍了此图形。
  4. 为短语的第二和第三部分选择字符。

    上文介绍了此图形。

    新短语被定义并被添加到用户的字典文件中。您下次键入 ke lin dun 时,会看到您定义的短语。

    上文介绍了此图形。

如何选择常用候选字

在新全拼和新双拼输入法中,您选择的候选字被移至列表开头,从而便于重复使用。

  1. 选择输入法。

    执行如何选择输入法过程中的步骤,选择输入法。

  2. 键入 sh yi

    注意五个可用候选字的顺序。

  3. 选择第五个候选字。

    上文介绍了此图形。
  4. 再键入 sh yi

    上文介绍了此图形。

    注意第五个候选字已经移到第一个位置,因为您先前选择了它。常用候选字被放到候选字列表的前面,以便于您进行更快速的选择。

其他输入法功能

新全拼和新双拼输入法还提供对其他有用功能的支持。

键入长拼音字符串

新全拼输入法接受长达 222 个字符的拼音字符串。下图中使用了以下字符串。


>>meiguozhongtongkelindunzhengzaitaolunhaiwanjushiwenti<<
上文介绍了此图形。

结果是以下中文字符串:

上文介绍了此图形。
注意 –

新双拼输入法支持输入多达 30 个字符的字符串。


键入声母

也可以只键入声母。为声母提供了候选字,如下图所示:

上文介绍了此图形。

输入 GBK 汉字

缺省情况下,zh_CN.GBK 语言环境支持 GBK,如下图所示:

上文介绍了此图形。

下图中的第二个中文字符只在 GBK 标准中有定义。

上文介绍了此图形。

单个 GBK 候选字被放在候选字列表的最后。按回车键以滚动到 GBK 区。


提示 –

如果要在下次更快地选择,您可以将 GBK 候选字定义为短语。有关更多信息,请参见如何定义短语供以后使用


缺省情况下在 zh.GBK 语言环境中,新全拼和新双拼都支持 GBK 汉字。然而,由于几个汉字会有相同的声母(拼音的第一部分),如果您只提供声母,新全拼和新双拼不会显示 GBK 候选字。

例如,键入字符串 rong 会显示 GBK 候选字,因为该字符串是一个完整的拼音字符串。然而,如果只键入 r,则不会显示任何 GBK 候选字,因为该字符串只是一个声母字符串。

键盘定义

本节介绍用于新全拼和新双拼输入法的键盘定义。

编辑键

下表显示了编辑键定义。


注意 –

预编辑行是一个普通的 X 文字字段。


表 4–1 编辑键定义

键 

定义 

[a-z] 

拼音字符。 

Home 

移动到预编辑行的开头。 

End 

移动到预编辑行的结尾。 

Left 

将预编辑行中的插入记号移到左边。如果左边的字符为汉字,则显示原来的拼音。 

Right 

将预编辑行中的插入记号移到右边。 

Delete 

删除预编辑行上跟在插入记号后面的拼音字符。 

Backspace 

删除预编辑行上位于插入记号前面的拼音字符。 

翻页键

一个拼音字符串的候选字属于以下组:

有些拼音字符串的候选字可能比较多,不能在同一个窗口中显示出来。在这种情况下,使用在以下表格中所描述的键在可用候选字中滚动查找。

表 4–2 页滚动键定义

键 

定义 

- = 

滚动到上一个/下一个候选字 

[ ] 

滚动到上一个/下一个候选字 

, . 

滚动到上一个/下一个候选字 

Return 

快速在所有候选字中滚动 

选择键

新全拼和新双拼使用数字选择键。

分隔符字符

根据国家拼音标准,支持使用分隔符 ( ') 分隔拼音字符串,以避免歧义。例如,拼音字符串 [jiang] 可解释为 [jiang][ji][ang]。两种拼写都有效。不过,在新全拼中,[jiang] 仅解释为 [jiang]。对于要解释为 [ji][ang] 的字符串,必须使用分隔符并输入 [ji'ang]。新双拼不需要使用分隔符。

字典文件

新全拼和新双拼共享两个字典文件:PyCiku.datUd.Ciku.dat。在 zh_CN.EUCzh_CN.GBK 语言环境中,缺省路径名是 /usr/lib/im/locale/zh_CN/data/PyCiku.dat/usr/lib/im/locale/zh_CN/data/UdCiku.dat

用户通常不能写入这些文件。不过,由于用户能够通过词频调整和用户自定义短语等功能来影响新全拼和新双拼的工作方式,因此应该经常更新字典文件。

用户字典通常位于 ~/.Xlocale/PyCiku.dat~/.Xlocale/UdCiku.dat 中。波浪号 (~) 指示启动 htt 命令的用户的主目录。当您启动新全拼和新双拼输入法时,系统在用户的主目录中查找和读取字典文件。如果未找到字典文件,会使用以下系统缺省路径:

/usr/lib/im/locale/zh_CN/…

新双拼特性

双拼是全拼的一种简略形式。双拼比较快但是比全拼更加难使用。新双拼支持所有新全拼的特性、键盘定义和字典文件。

在中华人民共和国,存在着不同的双拼键盘映射设计。最流行的三种设计是自然码、中文之星和智能 ABC。新双拼输入法支持所有这三种键盘映射。

新双拼键盘映射

以下各表包含自然码、中文之星和智能 ABC 键盘的键盘映射。

表 4–3 自然码键盘映射

键 

定义 

ch 

sh 

zh 

ou 

iao 

uang, iang 

zh 

eng 

ang 

an 

ao 

ai 

ian 

in 

o, uo 

un 

iu 

uan, er 

iong, ong 

ue 

v, ui 

ua, ia 

ie 

uai, ing 

ei 

表 4–4 CStar2.97 键盘映射

键 

定义 

ch 

sh 

zh 

ia, ua 

uan 

ao 

an 

ang 

iang, uang 

ian 

iao 

in 

ie 

iu 

o, uo 

ou 

er, ing 

zh 

ai 

eng 

v, ui 

ei 

uai, ue 

iong, ong 

un 

表 4–5 智能 ABC 键盘映射

键 

定义 

ch 

sh 

zh 

ou 

in, uai 

ua, ia 

zh 

eng 

ang 

an 

ao 

ai 

ue, ui 

un 

o, uo 

uan 

ei 

iu, er 

ong, iong 

uang, iang 

ian 

ie 

ing 

iao 

GBK 码输入法

GBK 码输入法使用了由中文内部码规范所定义的 GBK 码。该方法包含 GB2312-80 中的所有中文字符和符号,以及 GB 13000-1 中的其他 CJK 中文字符。每个中文字符或符号由中文内部码规范所定义的四位十六进制数字内部码所标识。

如何键入 GBK 码文本

该过程介绍如何使用 GBK 码键入中文字符和符号。

  1. 打开终端窗口。

  2. 在终端窗口中,按 Ctrl-空格键打开中文输入转换。

  3. 按 F4 选择 GBK 码输入法。

    状态区会显示 GBK 码输入模式是开启的。

    上文介绍了此图形。
  4. 键入代表要显示字符的四个键中的前三个键。在本示例中,键入字符串 b0a1b0a

    在预编辑区中可看到前三个字母。

    上文介绍了此图形。
  5. 键入第四个键。

    该字符自动替代了预编辑区中的字母。

    上文介绍了此图形。

GB2312 码输入法

GB2312 码输入法使用了由中文内部码规范所定义的 GBK 码。该规范包含 GB2312-80 中的所有中文字符和符号,以及 GB 13000-1 中的其他 CJK 中文字符。每个中文字符或符号由中文内部码规范所定义的四位十六进制数字内部码所标识。

如何键入 GB2312 码文本

该过程介绍如何使用 GB2312 码键入中文字符和符号。

  1. 选择输入法。

    执行如何选择输入法过程中的步骤,选择输入法。

    状态区显示 GB2312 码输入模式是打开的。

    上文介绍了此图形。
  2. 键入代表要显示字符的四个键中的前三个键。在本示例中,键入字符串 b0a1b0a

    在预编辑区中可看到前三个字母。

    上文介绍了此图形。
  3. 键入第四个键。

    该字符自动替代了预编辑区中的字母。

    上文介绍了此图形。

GB18030 码输入法

GB18030 码输入法使用了由中文内部码规范所定义的 GB18030 码。该方法包含 GB2312-80 中的所有中文字符和符号,以及 GB18030 中的其他 CJK 中文字符。每个中文字符或符号由中文内部码规范所定义的四位十六进制或八位十六进制数字内部码所标识。

如何键入GB18030 码文本

该过程介绍如何使用 GB18030 码键入中文字符和符号。

  1. 选择输入法。

    执行如何选择输入法过程中的步骤,选择输入法。

    状态区显示 GB18030 码输入模式是打开的。

    上文介绍了此图形。
  2. 例如,要输入使用代码为 0xb0a1 的 GB18030 中文字符,请按代表要显示字符的四个键中的前三个键。在本示例中,键入字符串 b0a1b0a

    在预编辑区中可看到前三个字母。

    上文介绍了此图形。
  3. 键入第四个键。

    该字符自动替代了预编辑区中的字母。

    上文介绍了此图形。
  4. 要输入代码为 0x82358538 的 GB18030 中文字符,请按代表要显示字符的八个键中的前七个键。在本示例中,键入字符串 823585388235853

    在预编辑区中可看到前七个数字。

    上文介绍了此图形。
  5. 键入最后一个键。

    这个字符自动提交到窗口。

    上文介绍了此图形。

全拼输入法

启用全拼输入法键入每个中文拼音字时,最多需要六次键击操作。全拼将拼音语音映射到单个小写罗马字母。在 zh_CN.EUCzh_CN.GBK 语言环境中,都可以使用全拼输入法键入单个中文字。

如何键入全拼文本

本过程介绍如何使用全拼输入法键入代表全拼音字 fang 的字符。有关创建本过程中使用的查找选项的信息,请参见如何搜索和选择查找选项

  1. 选择输入法。

    执行如何选择输入法过程中的步骤,选择输入法。

  2. 键入四次键击 fang

    上文介绍了此图形。
  3. 键入 1 可在查找选项列表中选择对应的 GBK 汉字。

    在预编辑区中您所选择的汉字取代了全拼音字符串。

    上文介绍了此图形。

英汉输入法

您可以在 zh_CN.EUCzh_CN.GBK 语言环境中使用英汉输入法。使用该方法,您键入映射到中文短语的英文单词,最多可包含 15 次键击。对于每次键击,查找窗口中显示与您的输入匹配的字符。要选择字符,请键入与查找选项对应的数字。有关更多信息,请参见如何搜索和选择查找选项

如何键入英汉文本

以下过程说明如何使用该输入法,输入与英文单词 world 对应的简体中文短语。

  1. 选择输入法。

    执行如何选择输入法过程中的步骤,选择输入法。

  2. 键入五次键击 world

    上文介绍了此图形。
  3. 键入 3 在查找选项列表中选择对应的中文短语。

    在预编辑区中您所选择的字符会取代英文字符串。

    上文介绍了此图形。

如何在英汉查找中使用通配符

您可以使用星号 (*) 或问号 (?) 通配符搜索系统字典。* 代表一个或多个字母。? 仅代表一个字母。

  1. 要搜索所有以 lution 结束的英文单词,请键入 *lution。显示查找选项窗口,如下图所示。

    上文介绍了此图形。
  2. 要搜索所有以 c 打头的三字母英文单词,请键入 c??

    所出现的查找选项窗口如下图所示。

    上文介绍了此图形。

王码五笔输入法

五笔在中国是常用的输入法。五笔输入法的编码规则基于中文字符的字根或笔划形状。

五笔和其他基于笔画的输入法的主要优势之一是重复率非常低。低重复率是基于拼音的输入法所不具备的特性,该特性意味着一个五笔键序列仅代表一两个中文字。由于一个五笔码很少代表多个字,所以您可以更快地输入文本。

五笔是基于 GB18030-2000 字符集标准建立的字形编码系统。几乎所有中文、日语汉字和韩国语汉字都使用 GB18030-2000 标准编码。

本节介绍本发行版中包含的以下特性。

GB18030-2000 字符集支持

GB18030-2000 字符集是中国政府在 2000 年发布的国家编码标准。该标准设置的编码长度为一、二或四个字节。GB18030-2000 包括 6763 个标准简体中文字符、13053 个繁体中文 (Big5) 字符、3000 个在香港使用的字符以及 21003 个 GBK 字符。五笔输入法支持 GB18030-2000 字符集,所以该输入法可轻松使用 GB18030-2000 中包含的较小字符集。请参见轻松的字符集切换

例如,如果您键入字母 gigg 并滚动至页尾,您会发现下图中显示的 GB18030 字符:

上文介绍了此图形。上文介绍了此图形。

轻松的字符集切换

Solaris 王码五笔将 GB18030-2000 字符集分为多个较小的常用中文字符集。

在输入文本时,可使用以下键盘快捷方式在不同字符集之间切换。

由于 GB18030-2000 是一个相对新的标准,五笔中的 GB2312 和 GBK 字符集支持可确保对较早标准的向下兼容性。您可能更愿意在 GB2312 或 GBK 字符集中工作,因为可提高性能和降低重复率。

用于简体中文和繁体中文的新字根机制

新的字根机制是由五笔输入法发明者王永民教授发明的专利技术。王永民教授根据旧的 86 版字根系统开发了该机制。该机制已发展为与简体中文和繁体中文都兼容的新编码系统。86 版五笔的用户使用相同的编码和输入规则,无需其他培训,即可使用多三倍的字符。

三个级别的渐进识别码

五笔的主要特点之一是以最后笔画的字形标识码区分字形相似的字符。根据字符的最后一个字根的形状分配标识码。标识码的用途是帮助用户在三个不同级别掌握五笔输入法。

短语输入和可选的专业词库

五笔支持短语输入。除了单个汉字以外,可以为整个短语分配五笔码。除了 90000 条基本短语外,还有 11 个与词汇表相似的专业词库,分别用于以下行业:

还提供地名库和成语库。

您可以选择包含 3000 到 20000 个条目的词库。在“首选项”对话框中。

例如,如果您选择医药卫生短语库并输入单词 mino,会列出供选择的医学短语。

上文介绍了此图形。

编码帮助功能

Solaris 五笔输入法支持编码提示功能。在您键入时,字符编码出现在“选择重复码”窗口中。该功能可帮助您掌握中文字符的编码方法和对应码。另外,您随时可以使用大写或小写的 Z 键作为通配符。在五笔输入法中,Z 是唯一未映射到字符的键。为帮助您学习使用五笔,您可以按 Z 键向系统查询输入码。

例如,您可以键入 azzd,以搜索其五笔码以字母 A 打头,以字母 D 结尾的的所有字符或短语。

上文介绍了此图形。

容错码

根据您设置的首选项,容错码功能可提高即使在您的输入存在错误时,系统也能提供正确字符的可能性。

单词短语关联

单词短语功能是另一个帮助提高效率的功能。系统提供最有可能在刚刚选择的字符后输入的字符的列表。系统提供可能选项的列表,从中可选择正确字符,而不需要键入代码。还可以在“首选项”对话框中访问该功能。

例如,当您键入字母 iuxx,中文字符“滋”被自动提交到应用程序。字符出现在应用程序窗口之后,会显示新的候选字窗口,其中将列出以该中文字符开头的短语。

上文介绍了此图形。

特性设置

您可以在“特性”对话框中完成以下设置:

下列各图列出“特性”对话框中的设置。

上文介绍了此图形。上文介绍了此图形。上文介绍了此图形。上文介绍了此图形。

码表输入法接口

当前的 Solaris 操作系统提供码表输入法接口,使中国用户能够在系统中添加新的输入法。

创建码表

码表是一个纯文本字典文件,包含映射到输入击键的中文字符、单词和短语的列表。在输入指定击键时,将出现关联的字符、单词和短语供选择。

码表文件包含以下各节:

下例显示一个码表文件。

上文介绍了此图形。

如何创建新的码表输入法

  1. 创建和编辑码表源文件。

    准备码表源文件,以定义字符、单词或短语与输入击键的映射。

  2. 将源码表文件转换为二进制格式。

    使用 txt2bin 实用程序,将码表文本文件转换为二进制文件。

    # /usr/lib/im/locale/zh_CN/common/txt2bin \
    source_codetable_file binary_codetable_file
    


    注意 –

    您可以在以下目录中找到 txt2binbin2txt 实用程序:/usr/lib/im/locale/zh_CN/common/


  3. 将码表添加到输入法规范文件 /usr/lib/im/locale/zh_CN/sysime.cfg 中。

    例如,如果您的新码表二进制文件被称为 newim.data,请将 newim 条目添加到输入法规范文件 sysime.cfg

  4. 以超级用户的身份输入以下命令,重新启动 htt 输入法服务器。

    # /etc/init.d/IIim stop
    # /etc/init.d/IIim start

    当您登录到系统时,即可使用新的输入法。