Java Desktop System 发行版 2 发行说明

导入/导出数据

有多种方法可以导入和导出受移植到 Unicode 多语言计算影响的数据。

可拆卸介质

系统管理员必须为 FAT 和 VFAT 类型的文件系统配置安装选项 codepageiocharset,这些文件系统类型通常用于 Microsoft Windows 的软盘、zip 驱动器和可移动硬盘。 例如,如果您要从繁体中文版 Windows 导入,则必须按下表所示进行设置,以便能够正确地浏览繁体中文文件名。

安装选项 

繁体中文设置 

codepage

950 

iocharset

big5 

针对此繁体中文实例的 /etc/fstab 样例如下所示:

/dev/fd0h1440

/media/fd0h1440

vfat noauto,iocharset=big5,codepage=950

/dev/sda1

/media/iee1394disk

vfat noauto,iocharset=big5,codepage=950

使用 Samba 装入远程 Microsoft Windows 文件系统

系统管理员必须配置安装选项 codepageiocharset,以便装入使用 CIFS 共享的远程 Microsoft Windows 文件系统或通过 SMB 从其他系统导出的文件系统。 例如,如果您导入繁体中文版 Windows 上以 big5 编码的旧式文件,必须将 iocharset 参数设置为 big5,并且必须将 codepage 设置为 950,才能正确浏览繁体中文文件名。 /etc/fstab 条目的样例如下所示:

server:/data /data smbfs iocharset=big5,codepage=950,username=foo,password=bar

使用 Samba 装入远程 UNIX 文件系统

Java Enterprise System 可以使用 SMB 访问 UNIX 和 Linux 系统上的远程系统。 执行导出的服务器端需要运行 samba 或类似功能才能导出远程文件系统。 如果旧数据是以旧编码形式存储的,则客户端可以指定文件系统编码。 系统会自动进行文件名的代码集转换。

Microsoft Office 文件

Microsoft Office 文件以 Unicode 进行编码。 StarSuite 应用程序可以毫无问题地阅读和编写 Unicode 编码文件。

HTML 文件

使用 HTML 编辑器(例如 Mozilla Composer)编写的 HTML 文件或 Web 浏览器保存的 HTML 文件,通常包含 charset 编码标记。 在导出或导入之后,您可以根据 HTML 文件中的编码标记使用 Mozilla Navigator Web 浏览器浏览此类 HTML 文件,或者使用 Mozilla Composer 编辑这些文件。

修复损坏的 HTML 文件

某些 HTML 文件可能显示乱码。 此问题通常是由下列原因造成的:

要在 HTML 文件中查找 charset 编码标记,请执行下列操作:

  1. 使用 Mozilla 打开文件。

  2. 按 Ctrli 或单击视图,打开视图菜单。

  3. 单击页面信息。

charset 信息位于常规选项卡的底部,例如: Content-Type text/html; charset=us-ascii

如果字符串 charset=us-ascii 与文件的实际编码不符,文件就会显示为乱码。 要编辑 HTML 文件的编码,请执行下列操作:

  1. 使用 Mozilla Composer 打开文件。

  2. 打开文件菜单。

  3. 选择另存为字符集。

  4. 选择正确的编码。 Mozilla Compose 会根据需要自动转换编码和 charset 标记。

另存为可移植格式的电子邮件

现在的电子邮件都是用 MIME charset 标记进行标记的。 Java Desktop SystemEvolution 的电子邮件程序都接受 MIME charset 标记。 您不需要执行任何编码转换操作。

纯文本文件

纯文本文件没有 charset 标记。 如果文件不是 UTF-8 编码,则需要进行编码转换。 例如,要将繁体中文 big5 编码的纯文本文件转换为 UTF-8,请执行下面的命令: iconv -f big5 -t UTF-8 inputfilename > outputfilename