Oracle® Solaris 11.2 国際化対応言語環境の利用ガイド

印刷ビューの終了

更新: 2014 年 7 月
 
 

ASCII 以外のファイル名を含むアーカイブ

状況は改善しているとはいえ、特定のアーカイブ形式の多数の実装における ASCII 以外のファイル名のサポートにはかなりの違いがあるため、ファイル名に ASCII 以外の文字があるファイルをアーカイブすると問題が発生することがあります。

UNIX および Unix 系のシステムの最新の tar 実装は、POSIX.1-2001 に規定された POSIX 形式をサポートしているため、ASCII 以外のファイル名は問題なく処理されます。MS Windows プラットフォームでは、多数のアーカイブユーティリティーが現在のコードページを使用してファイル名を格納するため、そのようなアーカイブから抽出されたファイルの名前は文字化けする可能性があります。

その場合、コードページがわかっているときは、convmv(1) ツールを使用して修復できます。

$ convmv -f cp437 -t utf8 my_extracted_filename 

Zip ファイルでは、元の仕様により、ファイル名とファイルのコメントのエンコーディングが IBM437 に設定されます。2007 年に PKWare は、UTF-8 も許容するように仕様を拡張しました。その一方で、さまざまな zip 実装が、現在のコードページをファイル名のエンコーディングとして使用する方針を採用しました (通常は MS Windows プラットフォーム上)。

Oracle Solaris 10 および Oracle Solaris 11 で使用される Info-ZIP の Zip 3.0 は、ファイル名を UTF-8 で格納するため、圧縮と圧縮解除のユーティリティーが両方ともこのバージョンの場合は、アーカイブの中身が破壊されることはありません。

ファイル名を格納するために UTF-8 以外のエンコーディングを使用した zip アーカイブが Oracle Solaris で抽出されると、ファイル名が文字化けすることがあります。コードページがわかっている場合は、convmv(1) ツールを使用して修復できます。

	$ convmv -f cp437 -t utf8 my-unzipped-filename