Java Enterprise System
是一个完全支持 Unicode 的多语言系统,它支持
Unicode UTF-8 编码的语言。 Java Enterprise System
还提供代码集转换,以支持旧语言编码。
登录屏幕上的语言选择菜单只显示支持的 Unicode UTF-8 语言名称,而不是语言环境名称。 为了支持向 Unicode 的迁移,Java Enterprise System
提供了使用非 UTF-8 语言环境的旧语言环境,系统管理员可以将其作为一个选项添加到登录选择菜单中。
登录屏幕的语言选择菜单中显示的语言列表是由下面的文件配置的: /etc/X11/gdm/locale.alias
在此文件中,每个支持的旧语言环境单列一行,并在行首用 # 字符将其标记为注释。 例如,日语支持以下面的方式列出:
普通行 |
注释行 |
---|---|
Japanese ja_JP.UTF-8 |
#Japanese ja_JP.eucJP |
要将 ja_JP.eucJP 显示为语言选择菜单中的一个选项,请用文本编辑器打开 locale.alias 文件,然后删除该行行首的 # 字符。
有多种方法可以导入和导出受移植到 Unicode 多语言计算影响的数据。
系统管理员必须为 FAT 和 VFAT 类型的文件系统配置安装选项 codepage 和 iocharset,这些文件系统类型通常用于 Microsoft Windows 的软盘、zip 驱动器和可移动硬盘。 例如,如果您要从繁体中文版 Windows 导入,则必须按下表所示进行设置,以便能够正确地浏览繁体中文文件名。
安装选项 |
繁体中文设置 |
---|---|
codepage |
950 |
iocharset |
big5 |
/dev/fd0h1440 |
/media/fd0h1440 |
vfat noauto,iocharset=big5,codepage=950 |
/dev/sda1 |
/media/iee1394disk |
vfat noauto,iocharset=big5,codepage=950 |
系统管理员必须配置安装选项 codepage 和 iocharset,以便装入使用 CIFS 共享的远程 Microsoft Windows 文件系统或通过 SMB 从其他系统导出的文件系统。 例如,如果您导入繁体中文版 Windows 上以 big5 编码的旧式文件,必须将 iocharset 参数设置为 big5,并且必须将 codepage 设置为 950,才能正确浏览繁体中文文件名。 /etc/fstab 条目的样例如下所示:
server:/data /data smbfs iocharset=big5,codepage=950,username=foo,password=bar |
Java Enterprise System
可以使用 SMB 访问 UNIX 和
Linux 系统上的远程系统。 执行导出的服务器端需要运行 samba 或类似功能才能导出远程文件系统。 如果旧数据是以旧编码形式存储的,则客户端可以指定文件系统编码。
系统会自动进行文件名的代码集转换。
Microsoft Office
文件以 Unicode 进行编码。 StarSuite
应用程序可以毫无问题地阅读和编写 Unicode 编码文件。
使用 HTML 编辑器(例如 Mozilla Composer
)编写的 HTML
文件或 Web 浏览器保存的 HTML 文件,通常包含 charset 编码标记。 在导出或导入之后,您可以根据
HTML 文件中的编码标记使用 Mozilla Navigator
Web 浏览器浏览此类 HTML
文件,或者使用 Mozilla Composer
编辑这些文件。
某些 HTML 文件可能显示乱码。 此问题通常是由下列原因造成的:
charset 编码标记不正确。
charset 编码标记丢失。
要在 HTML 文件中查找 charset 编码标记,请执行下列操作:
使用 Mozilla
打开文件。
按 Ctrli 或单击视图,打开视图菜单。
单击页面信息。
charset 信息位于常规选项卡的底部,例如: Content-Type text/html; charset=us-ascii
如果字符串 charset=us-ascii 与文件的实际编码不符,文件就会显示为乱码。 要编辑 HTML 文件的编码,请执行下列操作:
使用 Mozilla Composer
打开文件。
打开文件菜单。
选择另存为字符集。
选择正确的编码。 Mozilla Compose
会根据需要自动转换编码和 charset 标记。
现在的电子邮件都是用 MIME charset 标记进行标记的。 Java
Desktop System
、Evolution
的电子邮件程序都接受
MIME charset 标记。 您不需要执行任何编码转换操作。
纯文本文件没有 charset 标记。 如果文件不是 UTF-8 编码,则需要进行编码转换。 例如,要将繁体中文 big5 编码的纯文本文件转换为 UTF-8,请执行下面的命令: iconv -f big5 -t UTF-8 inputfilename > outputfilename