Java Desktop System 发行版 2 发行说明

1.8.2 导入/导出数据

有多种方法可以导入和导出受移植到 Unicode 多语言计算影响的数据。

1.8.2.1 可拆卸介质

在 Microsoft Windows 上,FAT 和 VFAT 文件系统类型通常用于软盘、压缩驱动器和可移动硬盘。系统管理员必须为这些文件类型配置装载选项 codepage iocharset。例如,如果您要从繁体中文版 Windows 导入,则必须按下表所示进行设置,以便能够正确地浏览繁体中文文件名。

装载选项 

繁体中文设置 

codepage

950 

iocharset

big5 

“繁体中文”样例的 /etc/fstab 的样例条目如下所示:

/dev/fd0h1440

/media/fd0h1440

vfat noauto,iocharset=big5,codepage=950

/dev/sda1

/media/iee1394disk

vfat noauto,iocharset=big5,codepage=950

1.8.2.2 使用 Samba 装入远程 Microsoft Windows 文件系统

系统管理员必须配置装载选项 codepageiocharset,才能装载使用 CIFS 共享的远程 Microsoft Windows 文件系统,或者是通过 SMB 从其他系统导出的文件系统。例如,如果您要导入在繁体中文版的 Windows 上用 big5 编码的旧文件,则必须将 iocharset 参数设置为 big5,并且必须将 codepage 设置为 950,才能正确浏览繁体中文文件名。/etc/fstab 条目的样例如下所示:

server:/data /data smbfs iocharset=big5,codepage=950,username=foo,password=bar

1.8.2.3 使用 Samba 装入远程 UNIX 文件系统

Java Desktop System 可使用 SMB 远程访问 UNIX 和 Linux 系统上的文件系统。导出服务器必须运行 Samba 或等效程序才能导出远程文件系统。如果旧数据是以旧编码形式存储的,则客户端可以指定文件系统编码。系统会自动进行文件名的代码集转换。

1.8.2.4 Microsoft Office 文件

Microsoft Office 文件以 Unicode 进行编码。StarSuite 应用程序可以毫无问题地阅读和编写 Unicode 编码文件。

1.8.2.5 HTML 文件

使用 HTML 编辑器(如 Mozilla Composer)编写的 HTML 文件(或者是使用 Web 浏览器保存的 HTML 文件)通常包含一个 charset 编码标记。您可以根据 HTML 文件中的编码标记使用 Mozilla Navigator Web 浏览器浏览此类 HTML 文件,或者使用 Mozilla Composer 编辑这些文件。

1.8.2.6 修复损坏的 HTML 文件

某些 HTML 文件可能显示乱码。此问题通常是由下列原因造成的:

要在 HTML 文件中查找 charset 编码标记,请执行以下操作:

  1. 使用 Mozilla 打开文件。

  2. 按 Ctrli 或单击视图,打开视图菜单。

  3. 单击页面信息。

charset 信息位于“常规”选项卡的底部,例如:Content-Type text/html; charset=us-ascii

如果字符串 charset=us-ascii 与文件的实际编码不匹配,则该文件可能已损坏。要编辑 HTML 文件的编码,请执行下列操作:

  1. 使用 Mozilla Composer 打开文件。

  2. 打开“文件”菜单。

  3. 选择“另存为字符集”。

  4. 选择正确的编码。Mozilla Compose 会根据需要自动转换编码和 charset 标记。

1.8.2.7 另存为可移植格式的电子邮件

现在的电子邮件都是用 MIME charset 标记进行标记的。Java Desktop System 的电子邮件程序 Evolution 可用 MIME charset 标记进行标记。您不需要执行任何编码转换操作。

1.8.2.8 纯文本文件

纯文本文件不包含 charset 标记。如果文件不是 UTF-8 编码,则需要进行编码转换。例如,要将使用繁体中文 big5 进行编码的纯文本文件转换为 UTF-8 编码的文件,请执行以下命令:iconv -f big5 -t UTF-8 inputfilename > outputfilename