本章有选择地描述使用简体中文 Solaris 操作环境的两个本地化应用软件时所需的特性。本章还提供了编码转换实用程序的列表。
这些实用程序 (和调用它们的指令) 包括:
mailx (/usr/SUNWale/bin/mailx)
talk (/usr/SUNWale/bin/talk)
在 .mailrc 文件中的 <systemitem class="EnvironVar">encoding</systemitem> 变量不影响邮寄程序的行为,但它设置 mailx 的功能。要以非 7 位 ASCII 的格式送出电子邮件,例如 (8 位) 简体中文字符格式,必须使用 /usr/SUNWale/bin/mailx。在
.mailrc 文件中的 <systemitem class="EnvironVar">encoding</systemitem> 变量定义了 mailx 的编码格式。
国际传输惯例要求标题信息仅采用 ASCII 字符所表示。所以简体中文字符不能用于邮寄程序或 mailx 的标题 (包括主题行)。
/bin/mailx 应用程序还没被本地化因而无法接收或发送简体中文字符。
要结合使用简体中文字符和 talk 实用程序,必须使用 /usr/SUNWale/bin/talk 应用程序,因为 /bin/talk 实用程序没被本地化。
简体中文 Solaris 软件提供了这一 BDF 字体生成程序:
xtobdf - 将 X 服务器里的字体转换成 BDF 里的字体
Sdtconvtool 是一个基于图形用户界面在不同字符集之间完成文件转换的工具,它的功能与 iconv 相同。
要获得系统上可用的转换选项列表,请从“文件”下拉式菜单选择"可用的转换"。
当您从列表上选择一个转换后,源和目标代码集的字段就会自动填充。此转换选项与通过 iconv 而获得的选项相同。
转换工具可以从应用程序管理器界面启动。
iconv 命令将一个文件里的字符或字符串从一个代码集转换到另一个代码集,并将其结果写到系统的标准输出装置。简体中文 Solaris 软件提供了可用于 iconv 命令的特殊过滤器。
如果一个特定字符的转换并不存在,该字符将被转换成目标代码集中的下划线 "_" 符号。指令支持以下选项:
-f 从......代码 - 输入代码集符号。
-t 到......代码 - 输出代码集符号。
简体中文 Solaris 软件支持以下代码集转换模块。
表 6-1 简体中文 iconv 代码转换模块 (zh 语言环境)
代码 |
符号 |
目标代码 |
符号 |
---|---|---|---|
GB2312-80 |
zh_CN.euc |
ISO 2022-7 |
zh_CN.iso2022-7 |
ISO 2022-7 |
zh_CN.iso2022-7 |
GB2312-80 |
zh_CN.euc |
GB2312-80 |
zh_CN.euc |
ISO 2022-CN |
zh_CN.iso2022-CN |
ISO-2022-CN |
zh_CN.iso2022-CN |
GB2312-80 |
zh_CN.euc |
UTF-8 |
UTF-8 |
GB2312-80 |
zh_CN.euc |
GB2312-80 |
zh_CN.euc |
UTF-8 |
UTF-8 |
GB2312-80 |
zh_CN.euc |
BIG5 |
zh_TW-big5 |
BIG5 |
zh_TW.big5 |
GB2312-80 |
zh_CN.euc |
HZ-GB-2312 |
HZ-GB-2312 |
GB2312-80 |
zh_CN.euc |
GB2312-80 |
zh_CN.euc |
HZ-GB-2312 |
zh_CN.euc |
表 6-2 简体中文 iconv 代码转换模块 ( zh.GBK 语言环境)
代码 |
符号 |
目标代码 |
符号 |
---|---|---|---|
UTF-8 |
UTF-8 |
GBK |
zh_CN.gbk |
GBK |
zh_CN.gbk |
UTF-8 |
UTF-8 |
GBK |
zh_CN.gbk |
ISO-2022-CN |
zh_CN.iso2022-CN |
ISO-2022-CN |
zh_CN.iso2022-CN |
GBK |
zh_CN.gbk |
GBK |
zh_CN.gbk |
BIG5 |
zh_TW-big5 |
BIG5 |
zh_TW-big5 |
GBK |
zh_CN.gbk |
HZ-GB-2312 |
HZ-GB-2312 |
GBK |
zh_CN.gbk |
GBK |
zh_CN.gbk |
HZ-GB-2312 |
zh_CN.gbk |
HZ-GB-2312 |
HZ-GB-2312 |
UTF-8 |
UTF-8 |
UTF-8 |
UTF-8 |
HZ-GB-2312 |
HZ-GB-2312 |
以下的 iconv 代码转换模块存放于 /usr/lib/iconv:
对于 zh 语言环境:
zh_CN.euc%zh_TW-big5.so
zh_TW-big5%zh_CN.euc.so
对于 zh.GBK 语言环境:
UTF-8%zh_CN.gbk.so
zh_CN.gbk%UTF-8.so
zh.CN.gbk%zh_CN.iso2022-CN.so
zh_CN.iso2022-CN%zh_CN.gbk.so
zh_CN.gbk%zh_TW-big5.so
zh_TW-big5%zh_CN.gbk.so
在以下实例,一个 EUC 邮件文件被转换成 ISO 2022-CN:
system% iconv -f zh_CN.euc -t zh_CN.iso2022-CN mail.euc > mail.iso2022-CN |
有关进一步的信息,可参见 iconv (3) 和 iconv_zh (5) 的手册页。这些实用程序可用于打印过程的文件转换。详细信息,请参见《简体中文 Solaris 系统管理员指南》。