Det finns flera sätt att importera och exportera data som påverkas av flyttningen till flerspråkig Unicode-miljö.
Systemadministratören måste konfigurera monteringsalternativen codepage och iocharset för filsystemstypen FAT och VFAT som oftast används för disketter, zip-enheter och flyttbara hårddiskar på Microsoft Windows. Om du t.ex. importerar från Windows för traditionell kinesiska, måste inställningarna vara som visas i följande tabell om filnamnen på traditionell kinesiska ska visas korrekt.
Monteringsalternativ |
Inställning för traditionell kinesiska |
---|---|
codepage |
950 |
iocharset |
big5 |
Här följer exempelposter för filen /etc/fstab för traditionell kinesiska:
/dev/fd0h1440 |
/media/fd0h1440 |
vfat noauto,iocharset=big5,codepage=950 |
/dev/sda1 |
/media/iee1394disk |
vfat noauto,iocharset=big5,codepage=950 |
En systemadministratör måste konfigurera monteringsalternativen codepage och iocharset för att montera ett Microsoft Windows-fjärrfilsystem som delas med CIFS, eller ett filsystem som exporterats från ett annat system med SMB. Om du t.ex. importerar gamla filer som kodats i big5 på Windows för traditionell kinesiska, måste parametern iocharset anges till big5 och codepage till 950 om filnamnen på traditionell kinesiska ska visas korrekt. Här följer ett exempel på en /etc/fstab-post:
server:/data /data smbfs iocharset=big5,codepage=950,username=foo,password=bar |
Java Enterprise System
kan använda fjärrfilsystem på UNIX och Linux med SMB. Serversidan som gör exporten måste köra samba eller motsvarande för att kunna exportera fjärrfilsystemet. På klientsidan kan du ange filsystemskodning om gamla data lagras i de gamla kodningarna. Koduppsättningskonverteringen av filnamnet sker automatiskt.
Microsoft Office
-filer kodas med Unicode. StarOffice
-program kan utan problem läsa och skriva Unicode-kodade filer.
HTML-filer som skapats med HTML-redigerare, t.ex. Mozilla Composer
, eller som sparats i en webbläsare, innehåller oftast ett charset-kodningsmärke. När du har exporterat eller importerat kan du läsa sådana HTML-filer i webbläsaren Mozilla Navigator
eller redigera filerna i Mozilla Composer
, enligt kodningsmärket i HTML-filen.
Det kan hända att en del HTML-filer visas med skräptecken. Problemet beror oftast på något av följande:
charset-kodningsmärket är felaktigt.
charset-kodningsmärket saknas.
Gör så här om du vill hitta charset-kodningsmärket i HTML-filen:
Öppna filen i Mozilla
.
Tryck på Ctrl + I eller klicka på Visa för att öppna Visa-menyn.
Klicka på Sidinformation.
charset-informationen är längst ned på fliken Allmänt, t.ex.: Content-Type text/html; charset=us-ascii
Om strängen charset=us-ascii inte matchar filens faktiska kodning, verkar filen vara skadad. Gör så här om du vill redigera HTML-filens kodning:
Öppna filen i Mozilla Composer
.
Öppna Arkiv-menyn.
Välj Spara som teckenuppsättning.
Välj den korrekta kodningen. Mozilla Compose
konverterar automatiskt kodningen och charset-märket.
Modern e-post märks med MIME charset-märket.. E-postprogrammet i Java Desktop System
, Evolution
, accepterar MIME charset-märken. Du behöver inte utföra någon kodningskonvertering.
Oformaterade textfiler har inget charset-märke. Om filerna inte sparas med UTF-8-kodning, behövs kodningskonvertering. Om du t.ex. vill konvertera en oformaterad textfil som kodats på traditionell kinesiska från big5 till UTF-8, kör du följande kommando: iconv -f big5 -t UTF-8 inputfilename > outputfilename