遷移至統一碼多語運算影響了多種匯入與匯出資料的方式。
FAT 與 VFAT 檔案系統類型通常使用於 Microsoft Windows 上的磁片、Zip 磁片與可移除式硬碟。系統管理員必須配置這些檔案系統類型的 codepage 與 iocharset 掛載選項。例如:如果從繁體中文的 Windows 匯入,則設定必須如下表所示,才能正確地瀏覽繁體中文的檔案名稱。
掛載選項 |
繁體中文設定 |
---|---|
codepage |
950 |
iocharset |
big5 |
/dev/fd0h1440 |
/media/fd0h1440 |
vfat noauto,iocharset=big5,codepage=950 |
/dev/sda1 |
/media/iee1394disk |
vfat noauto,iocharset=big5,codepage=950 |
系統管理員必須設定 codepage 與 iocharset 掛載選項,才能使用 CIFS 掛載遠端 Microsoft Windows 檔案共用或使用 SMB 從其他系統匯出的檔案系統。例如:如果從使用 big5 編碼的繁體中文 Windows 匯入舊檔案,則 iocharset 變數必須設定為 big5 而 codepage 必須設定為 950,才能正確地瀏覽繁體中文的檔案名稱。/etc/fstab 輸入的範例如下:
server:/data /data smbfs iocharset=big5,codepage=950,username=foo,password=bar |
Java Desktop System 可以使用 SMB 遠端存取在 UNIX 與 Linux 系統上的檔案系統。匯出伺服器必須執行 Samba 或同級的系統才能匯出檔案系統。使用老舊編碼儲存的老舊資料,用戶端可以指定其檔案系統的編碼。檔案名稱的程式碼集轉換會自動執行。
Microsoft Office
檔案是使用統一碼編碼。StarSuite
應用程式對於讀取與寫入統一碼編碼的檔案,沒有任何問題。
使用 HTML 編輯程式撰寫的 HTML 檔案,例如:Mozilla Composer
,或以 Web 瀏覽器儲存的 HTML 檔案,通常會包括 charset 的編碼標記。您可以使用 Mozilla Navigator
網路瀏覽器瀏覽 HTML 檔案,或使用 Mozilla Composer
依據 HTML 檔案中的編碼標記編輯檔案。
某些 HTML 檔案可以能會顯示損壞的字元。這個問題一般來說都是由於下列原因:
Charset 編碼標記不正確。
缺少 Charset 編碼標記。
如需瞭解 charset 編碼標記在 HTML 檔案中的位置,請執行下列動作:
使用 Mozilla
開啟檔案。
按下 [Ctrli] + [I] 或按一下 [檢視] 開啟 [檢視] 功能表。
然後,按一下 [頁面資訊]。
Charset 資訊會出現在 [一般] 索引標籤,例如:類型:text/html;編碼:us-ascii
如果 [編碼:us-ascii] 字串不符合實際的檔案編碼,則檔案可能就會出現損壞。如需編輯 HTML 檔案的編碼,請執行下列動作:
使用 Mozilla Composer
開啟檔案。
開啟 [檔案] 功能表。
選取 [儲存和變更 Character Encoding] 。
選取正確的編碼。Mozilla Composer
會自動轉化合適的編碼與 Charset 標記。
現在的電子郵件是使用 MIME charset 標記。Java Desktop System 的郵件應用程式 Evolution
採用 MIME charset 標記。並不需要執行任何編碼轉換。
純文字檔案並沒有 charset 標記。如果檔案不是使用 UTF-8 編碼,則必須轉換編碼。例如,若要將編碼為 big5 的繁體中文純文字檔轉為 UTF-8 編碼,則需執行下列指令:iconv -f big5 -t UTF-8 inputfilename > outputfilename