遷移至統一碼多語運算影響了多種匯入與匯出資料的方式。
系統管理員必須設定系統類型為 FAT 與 VFAT 的掛載選項之 codepage 與 iocharset,FAT 與 VFAT 通常用於軟碟機、Zip 磁碟機與 Microsoft Windows 上的可移除的硬碟。 例如:如果從繁體中文的 Windows 匯入,則設定必須如下表所示,才能正確地瀏覽繁體中文的檔案名稱。
掛載選項 |
繁體中文設定 |
---|---|
codepage |
950 |
iocharset |
big5 |
如需繁體中文的 /etc/fstab 範例輸入,請參考下列輸入:
/dev/fd0h1440 |
/media/fd0h1440 |
vfat noauto,iocharset=big5,codepage=950 |
/dev/sda1 |
/media/iee1394disk |
vfat noauto,iocharset=big5,codepage=950 |
系統管理員必須設定掛載選項 codepage 與 iocharset,以使用 CIFS 掛載遠端 Microsoft Windows 檔案共用或使用 SMB 從其他系統匯出的檔案系統。 例如:如果從使用 big5 編碼的繁體中文 Windows 匯入舊檔案,則 iocharset 變數必須設定為 big5 而 codepage 必須設定為 950,才能正確地瀏覽繁體中文的檔案名稱。 /etc/fstab 輸入的範例如下:
server:/data /data smbfs iocharset=big5,codepage=950,username=foo,password=bar |
Java Desktop System
可以使用 SMB 存取 UNIX 與 Linux
系統上的遠端檔案系統。 伺服器端執行匯出時,必須執行 Samba 或對等程式才能匯出遠端檔案系統。 使用老舊編碼儲存的老舊資料,用戶端可以指定其檔案系統的編碼。
檔案名稱的程式碼集轉換會自動執行。
Microsoft Office
檔案是使用統一碼編碼。 StarSuite
應用程式對於讀取與寫入統一碼編碼的檔案,沒有任何問題。
使用 HTML 編輯程式撰寫的 HTML 檔案,例如:Mozilla Composer
,或以
Web 瀏覽器儲存的 HTML 檔案,通常會包括 charset 的編碼標記。 匯出或匯入後,可以使用 Mozilla Navigator
Web 瀏覽器瀏覽 HTML 檔案,或使用 Mozilla
Composer
依據 HTML 檔案中的編碼標記編輯檔案。
某些 HTML 檔案可以能會顯示損壞的字元。 這個問題一般來說都是由於下列原因:
Charset 編碼標記不正確。
缺少 Charset 編碼標記。
如需瞭解 charset 編碼標記在 HTML 檔案中的位置,請執行下列動作:
使用 Mozilla
開啟檔案。
按下 Ctrli + i 或按一下「檢視」開啟「檢視」功能表。
按一下「頁面資訊」。
Charset 資訊會出現在「一般」索引標籤,例如: Content-Type text/html; charset=us-ascii
如果 charset=us-ascii 字串不符合實際的檔案編碼,則檔案可能就會出現損壞。 如需編輯 HTML 檔案的編碼,請執行下列動作:
使用 Mozilla Composer
開啟檔案。
開啟「檔案」功能表。
選取「Save As Charset」(Charset 另存新檔)。
選取正確的編碼。 Mozilla Compose
自動轉化合適的編碼與 Charset 標記。
現在的電子郵件是使用 MIME charset 標記。 Java Desktop
System
的郵件應用程式 Evolution
採用 MIME charset 標記。 並不需要執行任何編碼轉換。
純文字檔案沒有 charset 標記。 如果檔案不是使用 UTF-8 編碼,則不需要轉換編碼。 例如:如需將編碼為 big5 的繁體中文純文字檔轉為 UTF-8 編碼,則需執行下列指令: iconv -f big5 -t UTF-8 inputfilename > outputfilename