Java Desktop System Release 2 ご使用にあたって

Unicode 多言語コンピューティングへの移行

Java Desktop System は、Unicode UTF-8 エンコーディングの言語をサポートする、Unicode 完全対応の多言語システムです。 Java Desktop System は、UTF-8 以外の従来の言語のエンコーディングをサポートするための、コードセット変換も提供します。

従来の言語オプション

ログイン画面の言語選択メニューには、ロケール名の代わりに、サポートされる Unicode UTF-8 言語名のみが表示されます。 Java Desktop System は、Unicode への移行をサポートするために、従来のロケールを提供しています。システム管理者は、ログイン選択メニューに UTF-8 以外の従来のロケールをオプションとして追加することができます。

ログイン画面の言語選択メニューに表示される言語は、次のファイルで設定されます。 /etc/X11/gdm/locale.alias

サポートされる従来のロケールは、先頭に # 文字が付いたコメント行でこのファイル内にリストされます。たとえば、日本語サポートは次のようにリストされます。

通常の行	コメント行
Japanese ja_JP.UTF-8	#Japanese ja_JP.eucJP

言語選択メニューのオプションとして ja_JP.eucJP を表示するには、locale.alias ファイルをテキストエディタで開いて、行頭の # 文字を削除します。

データのインポートとエクスポート

Unicode 多言語コンピューティングへの移行によって影響を受けるデータは、様々な方法でインポートおよびエクスポートできます。

リムーバブルメディア

システム管理者は、FAT および VFAT ファイルシステムタイプ用のマウントオプション (codepage および iocharset) を設定する必要があります。この種のファイルシステムタイプは、通常、Microsoft Windows のフロッピーディスク、zip ドライブ、リムーバブルハードディスクに使用されます。ただし、日本語ロケールでログインしたときは mount コマンドが自動的に iocharset および codepage を設定するため、特にユーザーが意識する必要はありません。

Samba を使用してリモートの Microsoft Windows ファイルシステムをマウントする

CIFS を使用して共有されるリモートの Microsoft Windows ファイルシステムや、SMB によって別のシステムからエクスポートされたファイルシステムにマウントするには、システム管理者がマウントオプションの codepage と iocharset を設定する必要があります。たとえば、日本語 Microsoft Windows で使用されているファイルシステムをマウントするには以下のように設定します。

# mount -t smbfs -o username=foo,password=bar,codepage=cp932,iocharset=utf8 //server_name/share_name /mount_point

Samba を使用してリモートの UNIX ファイルシステムをマウントする

Java Desktop System は、SMB を使用して、UNIX および Linux システム上の遠隔ファイルシステムにアクセスできます。エクスポートを行うサーバー側は、samba または同等のものを実行して、リモートファイルシステムをエクスポートする必要があります。従来のデータが従来のエンコーディングで格納されている場合には、クライアント側でファイルシステムのエンコーディングを指定することができます。ファイル名のコードセット変換は、自動的に行われます。

Microsoft Office ファイル

Microsoft Office ファイルは、Unicode でエンコードされています。 StarSuite アプリケーションは、Unicode でエンコードされたファイルを問題なく読み取りおよび書き込みできます。

HTML ファイル

Mozilla Composer などの HTML エディタを使用して作成した HTML ファイルや、Web ブラウザによって保存された HTML ファイルには、通常、charset エンコーディングタグが含まれています。エクスポートまたはインポートしたあとの HTML ファイルは、 HTML ファイル内のエンコーディングタグに基づいて、Mozilla Navigator Web ブラウザで表示したり、Mozilla Composer を使用してファイルを編集することができます。

壊れた HTML ファイルの修正

HTML ファイルは文字化けする場合があります。この問題は、概ね次の理由によります。

charset エンコーディングタグが正しくない。
charset エンコーディングタグがない。

HTML ファイルの charset エンコーディングタグを見つけるには、次の手順を実行します。

Mozilla を使用してファイルを開きます。
Ctrli を押すか「表示」をクリックして、「表示」メニューを開きます。
「Page Info」をクリックします。

charset 情報は、「一般」タブの下に次のように表示されます。 Content-Type text/html; charset=us-ascii

文字列 charset=us-ascii が、ファイルの実際のエンコーディングと一致しない場合、そのファイルは壊れているように見えることがあります。 HTML ファイルのエンコーディングを編集するには、次の手順を実行します。

Mozilla Composer でファイルを開きます。
「ファイル」メニューを開きます。
「Save As Charset」を選択します。
正しいエンコーディングを選びます。 Mozilla Composer は、自動的にエンコーディングと charset タグを適切に変換します。

汎用形式で保存された電子メール

現在使用されている電子メールは、MIME charset タグでタグ付けされています。 Java Desktop System のメールアプリケーションである Evolution は、MIME charset タグを認識します。したがって、エンコーディング変換を実行する必要はありません。

プレーンテキストファイル

プレーンテキストファイルには、charset タグがありません。ファイルが UTF-8 エンコーディングでない場合、エンコーディング変換を行う必要があります。たとえば、繁体字中国語の big5 でエンコードされているプレーンテキストを UTF-8 に変換するには、次のコマンドを実行します。

iconv -f big5 -t UTF-8 inputfilename > outputfilename

また、テキストエディタ (gedit) で変換する文字エンコーディングの設定を行なって、ファイルを読み込むときに文字のエンコーディングが自動的に変換されるようにすることもできます。