Java Desktop System 发行版 3 管理指南

导入/导出数据

迁移到 Unicode 多语言计算会影响许多导入和导出数据的方法。

可拆卸介质

系统管理员必须为 FAT 和 VFAT 文件系统类型配置安装选项 codepageiocharset,这些文件系统类型通常用于 Microsoft Windows 上的软盘、zip 驱动器和可移除硬盘。例如,如果您要从繁体中文版 Windows 导入,则必须按下表所示进行设置,以便能够正确地浏览繁体中文文件名。

装载选项 

繁体中文设置 

codepage

950 

iocharset

big5 

“繁体中文”样例的 /etc/fstab 的样例条目如下所示:

/dev/fd0h1440

/media/fd0h1440

vfat noauto,iocharset=big5,codepage=950

/dev/sda1

/media/iee1394disk

vfat noauto,iocharset=big5,codepage=950

使用 SMB 安装远程 Microsoft Windows 文件系统

系统管理员必须配置安装选项 codepageiocharset 才能安装通过 CIFS 共享的远程 Microsoft Windows 文件系统,或者通过服务器消息块 (SMB) 从其他系统导出的文件系统。例如,如果要导入繁体中文版 Windows 上用 big5 编码的传统文件,则必须将 iocharset 参数设置为 big5,并且必须将 codepage 设置为 950,才能正确浏览繁体中文文件名。/etc/fstab 条目的样例如下所示:

server:/data /data smbfs iocharset=big5,codepage=950,username=foo,password=bar

使用 SMB 安装远程 UNIX 文件系统

Java Desktop System 可以使用 SMB 远程访问 UNIX 和 Linux 系统上的文件系统。导出服务器必须运行 SMB 或等效应用程序才能导出远程文件系统。如果旧数据是以旧编码形式存储的,则客户端可以指定文件系统编码。系统会自动执行文件名的代码集转换。

Microsoft Office 文件

Microsoft Office 文件以 Unicode 进行编码。StarSuite 应用程序可以读写 Unicode 编码的文件。

HTML 文件

在 HTML 编辑器(例如 Mozilla Composer)中创建的 HTML 文件或通过 Web 浏览器保存的 HTML 文件通常包含一个 charset 编码标记。在导出或导入之后,您可以根据 HTML 文件中的编码标记使用 Mozilla Navigator Web 浏览器浏览此类 HTML 文件,或者使用 Mozilla Composer 编辑这些文件。

修复 HTML 文件的问题

某些 HTML 文件可能会显示乱码字符。此问题通常是由下列原因造成的:

要在 HTML 文件中查找 charset 编码标记,请执行以下步骤:

  1. Mozilla 中打开该文件。

  2. 选择“查看”->“页面信息”。

charset 信息位于常规选项卡的底部,例如:Content-Type text/html; charset=us-ascii

如果字符串 charset=us-ascii 与文件的实际编码不符,说明该文件可能已损坏。要编辑 HTML 文件的编码,请执行以下步骤:

  1. Mozilla Composer 中打开该文件。

  2. 选择“文件”->“另存为字符集”。

  3. 选择正确的编码。Mozilla Compose 会根据需要自动转换编码和 charset 标记。

另存为可移植格式的电子邮件

多数电子邮件消息都是用 MIME charset 标记进行标记的。Java Desktop System 的电子邮件应用程序电子邮件和日历支持 MIME charset 标记。您不需要执行任何编码转换操作。

纯文本文件

纯文本文件不包含 charset 标记。如果文件不是 UTF-8 编码,则需要进行编码转换。例如,要将繁体中文 big5 编码的纯文本文件转换为 UTF-8,请执行下面的命令:iconv -f big5 -t UTF-8 inputfilename > outputfilename