本章中的下列各节介绍在简体中文 Solaris 操作系统中使用的实用程序和应用程序。
.mailrc 中的 encoding
变量不影响邮件程序 (Mailer) 的行为,但它确实设置 mailx 功能。要以非 7 位 ASCII 的格式发送电子邮件,例如(8 位)简体中文字符,则必须使用 /usr/SUNWale/bin/mailx。.mailrc 文件中的 encoding
变量设置 mailx 的编码格式。
国际传输惯例要求标题信息仅使用 ASCII 字符。因此,对于 Mailer 或 mailx,在标题(包括“主题”行)中不应使用简体中文字符。
/bin/mailx 应用程序还没有本地化,因此无法发送或接收简体中文字符。
要在 talk 中使用简体中文字符,应具备 /usr/SUNWale/bin/talk 应用程序,因为 /bin/talk 未本地化。
简体中文 Solaris 软件提供下面的 BDF 字体生成器:
xtobdf — 将 X 服务器中的字体转换成 BDF 中的字体
使用 sdtconvtool 图形用户界面实用程序可以在各种代码集之间进行文件转换。sdtconvtool 的功能与 iconv 类似。
下图展示了 stdconvtool 面板。
选择要转换的文件的代码集。
滚动下拉列表并选择要转换的文件的代码集。
输入要转换的文件路径。
可以手动在“源文件路径”区域中输入路径,也可以使用“浏览”按钮查找并选择文件。
选择转换的目标文件的代码集。
选择目标代码集。
输入目标文件的路径。
可以手动在“目标文件路径”区域中输入路径,也可以使用“浏览”按钮查找并选择文件。
单击“开始转换”按钮。
iconv 命令将文件中的字符或字符序列从一个代码集转换到另一个代码集。然后,此命令将结果写入标准输出中。简体中文 Solaris 软件包含了用于 iconv 命令的特殊过滤器。
如果某个特定字符的转换不存在,该字符将被转换成目标代码集中的下划线 _ 符号。指令支持以下选项:
-f from-code—输入代码集的符号
-t to-code—输出代码集的符号
下表列出简体中文 Solaris 软件支持的代码集转换模块。有关更多信息,请参见 Solaris 10 Reference Manual Collection iconv(1)。
表 5–1 简体中文 iconv 代码转换模块(zh 语言环境)
代码 |
符号 |
目标代码 |
符号 |
---|---|---|---|
ISO2022–CN |
zh_CN.iso2022–CN |
UTF–8 |
UTF–8 |
UTF–8 |
UTF–8 |
ISO2022-CN |
zh_CN.iso2022–CN |
zh.GBK |
zh_CN.gbk |
ISO2022-CN |
zh_CN.iso2022–CN |
zh.GBK |
zh_CN.gbk |
UTF–8 |
UTF–8 |
GB2312-80 |
zh_CN.euc |
ISO 2022-7 |
zh_CN.iso2022-7 |
ISO 2022-7 |
zh_CN.iso2022-7 |
GB2312-80 |
zh_CN.euc |
GB2312-80 |
zh_CN.euc |
ISO 2022-CN |
zh_CN.iso2022-CN |
ISO-2022-CN |
zh_CN.iso2022-CN |
GB2312-80 |
zh_CN.euc |
UTF-8 |
UTF-8 |
GB2312-80 |
zh_CN.euc |
GB2312-80 |
zh_CN.euc |
UTF-8 |
UTF-8 |
GB2312-80 |
zh_CN.euc |
BIG5 |
zh_TW-big5 |
BIG5 |
zh_TW.big5 |
GB2312-80 |
zh_CN.euc |
HZ-GB-2312 |
HZ-GB-2312 |
GB2312–80 |
zh_CN.euc |
GB2312–80 |
zh_CN.euc |
HZ-GB-2312 |
zh_CN.euc |
表 5–2 简体中文 iconv 代码转换模块( zh.GBK 语言环境)
代码 |
符号 |
目标代码 |
符号 |
---|---|---|---|
UTF-8 |
UTF-8 |
GBK |
zh_CN.gbk |
GBK |
zh_CN.gbk |
UTF-8 |
UTF-8 |
GBK |
zh_CN.gbk |
BIG5P |
zh_TW-big5p |
GBK |
zh_CN.gbk |
BIG5HK |
zh_TW-big5hk |
GBK |
zh_CN.gbk |
ISO-2022-CN |
zh_CN.iso2022-CN |
ISO2022-CN |
zh_CN.iso2022-CN |
GBK |
zh_CN.gbk |
GBK |
zh_CN.gbk |
BIG5 |
zh_TW-big5 |
BIG5 |
zh_TW-big5 |
GBK |
zh_CN.gbk |
BIG5P |
zh_TW-big5p |
GBK |
zh_CN.gbk |
BIG5HK |
zh_TW-big5hk |
GBK |
zh_CN.gbk |
HZ-GB-2312 |
HZ-GB-2312 |
GBK |
zh_CN.gbk |
GBK |
zh_CN.gbk |
HZ-GB-2312 |
zh_CN.gbk |
HZ-GB-2312 |
HZ-GB-2312 |
UTF-8 |
UTF-8 |
UTF-8 |
UTF-8 |
HZ-GB-2312 |
HZ-GB-2312 |
表 5–3 简体中文 iconv 代码转换模块(zh_CN.GB18030 语言环境)
代码 |
符号 |
目标代码 |
符号 |
---|---|---|---|
UTF-8 |
UTF-8 |
GB18030-2000 |
zh_CN.gb18030 |
GB18030-2000 |
zh_CN.gb18030 |
UTF-8 |
UTF-8 |
GB18030-2000 |
zh_CN.gb18030 |
BIG5HK |
zh_HK-big5hk |
GB18030-2000 |
zh_CN.gb18030 |
BIG5P |
zh_TW-big5p |
BIG5HK |
zh_HK-big5hk |
GB18030-2000 |
zh_CN.gb18030 |
BIG5P |
zh_TW-big5p |
GB18030-2000 |
zh_CN.gb18030 |
下列 iconv 代码转换模块位于 /usr/lib/iconv 中:
对于 zh 语言环境:
zh_CN.euc%zh_TW-big5.so
zh_TW-big5%zh_CN.euc.so
对于 zh.GBK 语言环境:
UTF-8%zh_CN.gbk.so
zh_CN.gbk%UTF-8.so
zh.CN.gbk%zh_CN.iso2022-CN.so
zh_CN.iso2022-CN%zh_CN.gbk.so
zh_CN.gbk%zh_TW-big5.so
zh_TW-big5%zh_CN.gbk.so
在以下示例中,一个 EUC 邮件文件被转换成 ISO 2022-CN:
system% iconv -f zh_CN.euc -t zh_CN.iso2022-CN mail.euc > mail.iso2022-CN |
有关详细信息,请参见 iconv(3C) 和 iconv_zh(5) 手册页。这些实用程序可用于转换文件以进行打印。