iconv 命令将一个文件里的字符或字符串从一个代码集转换到另一个代码集,并将其结果写到系统的标准输出装置。简体中文 Solaris 软件提供了可用于 iconv 命令的特殊过滤器。
如果一个特定字符的转换并不存在,该字符将被转换成目标代码集中的下划线 "_" 符号。指令支持以下选项:
-f 从......代码 - 输入代码集符号。
-t 到......代码 - 输出代码集符号。
简体中文 Solaris 软件支持以下代码集转换模块。
表 6-1 简体中文 iconv 代码转换模块 (zh 语言环境)
代码 |
符号 |
目标代码 |
符号 |
---|---|---|---|
GB2312-80 |
zh_CN.euc |
ISO 2022-7 |
zh_CN.iso2022-7 |
ISO 2022-7 |
zh_CN.iso2022-7 |
GB2312-80 |
zh_CN.euc |
GB2312-80 |
zh_CN.euc |
ISO 2022-CN |
zh_CN.iso2022-CN |
ISO-2022-CN |
zh_CN.iso2022-CN |
GB2312-80 |
zh_CN.euc |
UTF-8 |
UTF-8 |
GB2312-80 |
zh_CN.euc |
GB2312-80 |
zh_CN.euc |
UTF-8 |
UTF-8 |
GB2312-80 |
zh_CN.euc |
BIG5 |
zh_TW-big5 |
BIG5 |
zh_TW.big5 |
GB2312-80 |
zh_CN.euc |
HZ-GB-2312 |
HZ-GB-2312 |
GB2312-80 |
zh_CN.euc |
GB2312-80 |
zh_CN.euc |
HZ-GB-2312 |
zh_CN.euc |
表 6-2 简体中文 iconv 代码转换模块 ( zh.GBK 语言环境)
代码 |
符号 |
目标代码 |
符号 |
---|---|---|---|
UTF-8 |
UTF-8 |
GBK |
zh_CN.gbk |
GBK |
zh_CN.gbk |
UTF-8 |
UTF-8 |
GBK |
zh_CN.gbk |
ISO-2022-CN |
zh_CN.iso2022-CN |
ISO-2022-CN |
zh_CN.iso2022-CN |
GBK |
zh_CN.gbk |
GBK |
zh_CN.gbk |
BIG5 |
zh_TW-big5 |
BIG5 |
zh_TW-big5 |
GBK |
zh_CN.gbk |
HZ-GB-2312 |
HZ-GB-2312 |
GBK |
zh_CN.gbk |
GBK |
zh_CN.gbk |
HZ-GB-2312 |
zh_CN.gbk |
HZ-GB-2312 |
HZ-GB-2312 |
UTF-8 |
UTF-8 |
UTF-8 |
UTF-8 |
HZ-GB-2312 |
HZ-GB-2312 |
以下的 iconv 代码转换模块存放于 /usr/lib/iconv:
对于 zh 语言环境:
zh_CN.euc%zh_TW-big5.so
zh_TW-big5%zh_CN.euc.so
对于 zh.GBK 语言环境:
UTF-8%zh_CN.gbk.so
zh_CN.gbk%UTF-8.so
zh.CN.gbk%zh_CN.iso2022-CN.so
zh_CN.iso2022-CN%zh_CN.gbk.so
zh_CN.gbk%zh_TW-big5.so
zh_TW-big5%zh_CN.gbk.so
在以下实例,一个 EUC 邮件文件被转换成 ISO 2022-CN:
system% iconv -f zh_CN.euc -t zh_CN.iso2022-CN mail.euc > mail.iso2022-CN |
有关进一步的信息,可参见 iconv (3) 和 iconv_zh (5) 的手册页。这些实用程序可用于打印过程的文件转换。详细信息,请参见《简体中文 Solaris 系统管理员指南》。