Sono disponibili diversi metodi per l'importazione e l'esportazione di dati che sono interessati dalla migrazione al sistema di elaborazione multilingue Unicode.
L'amministratore di sistema deve configurare le opzioni di attivazione codepage e iocharset per i tipi di file system FAT e VFAT che sono usati in genere per le unità a dischetti, le unità zip e gli hard disk rimovibili in Microsoft Windows. Ad esempio, se si effettua un'importazione da un sistema Windows che utilizza il cinese tradizionale, per poter visualizzare correttamente i nomi dei file in cinese le impostazioni devono essere quelle indicate nella tabella seguente.
Opzione di attivazione |
Impostazione per il cinese tradizionale |
---|---|
codepage |
950 |
iocharset |
big5 |
Le voci di /etc/fstab per il cinese tradizionale devono essere le seguenti:
/dev/fd0h1440 |
/media/fd0h1440 |
vfat noauto, iocharset=big5, codepage=950 |
/dev/sda1 |
/media/iee1394disk |
vfat noauto, iocharset=big5, codepage=950 |
Per attivare un file system remoto di Microsoft Windows condiviso tramite CIFS o un file system esportato da un altro sistema tramite SMB, l'amministratore di sistema deve configurare le opzioni di attivazione codepage e iocharset. Ad esempio, se vengono importati file codificati con big5 da un sistema Windows in cinese tradizionale, il parametro iocharset deve essere impostato su big5 e il parametro codepage deve essere impostato su 950 per poter visualizzare correttamente i nomi dei file. Qui di seguito è riportata una voce di esempio di /etc/fstab:
server:/data /data smbfs iocharset=big5,codepage=950,username=foo,password=bar |
Java Enterprise System
è in grado di accedere a un file system remoto di un sistema UNIX o Linux usando SMB. Il server che effettua l'esportazione deve eseguire Samba o un'applicazione equivalente per poter esportare il file system. Il client può specificare la codifica per il file system se i dati sono memorizzati con una vecchia codifica. La conversione del set di codici dei nomi dei file viene eseguita automaticamente.
I file di Microsoft Office
utilizzano la codifica Unicode. Le applicazioni StarOffice
possono leggere e scrivere i file con codifica Unicode senza problemi.
I file HTML creati usando un editor HTML come Mozilla Composer
o i file HTML salvati da un browser Web, contengono in genere un tag charset che indica la codifica. Dopo l'esportazione o l'importazione, è possibile visualizzare questi file con il browser Web Mozilla Navigator
o modificarli con Mozilla Composer
, in base alla codifica indicata dal tag presente nel file HTML.
Alcuni file HTML possono visualizzare sullo schermo caratteri errati. Il problema in genere è dovuto a una delle seguenti cause:
Il tag charset che indica la codifica è errato.
Il tag charset che indica la codifica non è presente.
Per individuare il tag charset che indica la codifica nel file HTML, procedere come segue:
Aprire il file con Mozilla
.
Premere Ctrl + I o fare clic su Visualizza per aprire il menu Visualizza.
Fare clic su Info pagina.
L'indicazione del set di caratteri è riportata in fondo alla scheda Generale, ad esempio: Content-Type text/html; charset=us-ascii
Se la stringa charset=us-ascii non corrisponde all'effettiva codifica utilizzata dal file, è possibile che questo venga visualizzato erroneamente. Per modificare la codifica del file HTML, procedere come segue:
Aprire il file con Mozilla Composer
.
Aprire il menu File.
Selezionare Salva come set di caratteri.
Scegliere la codifica appropriata. Mozilla Composer
converte automaticamente la codifica e il tag charset.
I messaggi di posta elettronica sono in genere contrassegnati con il tag MIME charset. L'applicazione di posta di Java Desktop System
, Evolution
, interpreta correttamente i tag charset MIME. Non è richiesta alcuna conversione della codifica.
I normali file di testo non contengono il tag charset. Se i file non sono in formato UTF-8, è richiesta una conversione della codifica. Ad esempio, per convertire in UTF-8 un normale file di testo che utilizza la codifica big5 del cinese tradizionale, eseguire il seguente comando: iconv -f big5 -t UTF-8 file_origine > file_destinazione