Java Desktop System は、Unicode UTF-8 エンコーディングの言語をサポートする、Unicode 完全対応の多言語システムです。Java Desktop System は、UTF-8 以外の従来の言語のエンコーディングをサポートするための、コードセット変換も提供します。
Java Desktop System は、基底オペレーティングシステムの一部として、すべてのロケールの既定デスクトップとしてインストールされます。ただし、Sun では Java Desktop System 内の次のロケールを対象に、完全なグローバルサポートを提供します。
de_DE.UTF-8
fr_FR.UTF-8
es_ES.UTF-8
sv_SE.UTF-8
it_IT.UTF-8
ja_JP.UTF-8
ko_KR.UTF-8
zh_CN.UTF-8
zh_CN.GB18030
zh_TW.UTF-8
zh_TW.BIG5
Unicode 多言語コンピューティングへの移行によって影響を受けるデータは、様々な方法でインポートおよびエクスポートできます。
ファイルシステムタイプの FAT と VFAT は、Microsoft Windows に搭載したフロッピーディスク、zip ドライブ、リムーバブルハードディスクに主に使用されます。システム管理者は、マウントオプションの codepage と iocharset をこれらのファイルシステムタイプに設定する必要があります。たとえば、繁体字中国語版 Microsoft Windows からインポートする場合、繁体字中国語のファイル名を正しく表示するには、次の表のように設定する必要があります。
マウントオプション |
繁体字中国語の設定 |
---|---|
codepage |
950 |
iocharset |
big5 |
繁体字中国語の例を示す /etc/fstab のエントリは、以下のとおりです。
/dev/fd0h1440 |
/media/fd0h1440 |
vfat noauto,iocharset=big5,codepage=950 |
/dev/sda1 |
/media/iee1394disk |
vfat noauto,iocharset=big5,codepage=950 |
CIFS を使用して共有されるリモートの Microsoft Windows ファイルシステムや、SMB によって別のシステムからエクスポートされたファイルシステムにマウントするには、システム管理者がマウントオプションの codepage と iocharset を設定する必要があります。繁体字中国語版 Microsoft Windows で big5 にエンコードした従来のファイルをインポートした場合に、繁体字中国語のファイル名を正しく表示するには、iocharset パラメータを big5 に設定し、codepage を 950 に設定する必要があります。以下に /etc/fstab エントリの例を示します。
server:/data /data smbfs iocharset=big5,codepage=950,username=foo,password=bar |
Java Desktop System は、SMB を使用して UNIX および Linux システム上のファイルシステムにリモートアクセスできます。リモートファイルシステムをエクスポートするには、エクスポートサーバーが Samba またはそれに相当するプログラムを実行している必要があります。従来のデータが従来のエンコーディングで格納されている場合には、クライアント側でファイルシステムのエンコーディングを指定することができます。ファイル名のコードセット変換は、自動的に行われます。
Microsoft Office
ファイルは、Unicode でエンコードされています。StarSuite
アプリケーションは、Unicode でエンコードされたファイルを問題なく読み取りおよび書き込みできます。
Mozilla Composer
などの HTML エディタを使用して作成した HTML ファイルや、Web ブラウザによって保存された HTML ファイルには、通常、charset エンコーディングタグが含まれています。HTML ファイルは、HTML ファイル内のエンコーディングタグに基づいて、Mozilla Navigator
Web ブラウザで表示したり、Mozilla Composer
を使用してファイルを編集することができます。
HTML ファイルは文字化けする場合があります。この問題は、概ね次の理由によります。
charset エンコーディングタグが正しくない。
charset エンコーディングタグがない。
HTML ファイルの charset エンコーディングタグを見つけるには、次の手順を実行します。
Mozilla
を使用してファイルを開きます。
Ctrli を押すか「表示」をクリックして、「表示」メニューを開きます。
「ページ情報」をクリックします。
charset 情報は、「 一般」タブの下に次のように表示されます。Content-Type text/html; charset=us-ascii
文字列 charset=us-ascii が、ファイルの実際のエンコーディングと一致しない場合、そのファイルは壊れているように見えることがあります。HTML ファイルのエンコーディングを編集するには、次の手順を実行します。
Mozilla Composer
でファイルを開きます。
「ファイル」メニューを開きます。
「Save As Charset」を選択します。
正しいエンコーディングを選びます。Mozilla Composer
は、自動的にエンコーディングと charset タグを適切に変換します。
現在使用されている電子メールは、MIME charset タグでタグ付けされています。Java Desktop System のメールアプリケーションである Evolution
は、MIME charset タグを認識します。したがって、エンコーディングを変換する必要はありません。
プレーンテキストファイルには、charset タグがありません。ファイルが UTF-8 エンコーディングでない場合、エンコーディング変換を行う必要があります。たとえば、繁体字中国語の big5 でエンコードされているプレーンテキストを UTF-8 に変換するには、次のコマンドを実行します。iconv -f big5 -t UTF-8 inputfilename > outputfilename