Importera och exportera data (Tilläggsinformation för Java Desktop System, version 2)

Tilläggsinformation för Java Desktop System, version 2

Importera och exportera data

Det finns flera sätt att importera och exportera data som påverkas av flyttningen till flerspråkig Unicode-miljö.

Flyttbara media

Systemadministratören måste konfigurera monteringsalternativen codepage och iocharset för filsystemstypen FAT och VFAT som oftast används för disketter, zip-enheter och flyttbara hårddiskar på Microsoft Windows. Om du t.ex. importerar från Windows för traditionell kinesiska, måste inställningarna vara som visas i följande tabell om filnamnen på traditionell kinesiska ska visas korrekt.

Monteringsalternativ	Inställning för traditionell kinesiska
`codepage`	950
`iocharset`	big5

Här följer exempelposter för filen /etc/fstab för traditionell kinesiska:

`/dev/fd0h1440`	`/media/fd0h1440`	`vfat noauto,iocharset=big5,codepage=950`
`/dev/sda1`	`/media/iee1394disk`	`vfat noauto,iocharset=big5,codepage=950`

Montera ett Microsoft Windows-fjärrfilsystem med hjälp av Samba

En systemadministratör måste konfigurera monteringsalternativen codepage och iocharset för att montera ett Microsoft Windows-fjärrfilsystem som delas med CIFS, eller ett filsystem som exporterats från ett annat system med SMB. Om du t.ex. importerar gamla filer som kodats i big5 på Windows för traditionell kinesiska, måste parametern iocharset anges till big5 och codepage till 950 om filnamnen på traditionell kinesiska ska visas korrekt. Här följer ett exempel på en /etc/fstab-post:

server:/data /data smbfs iocharset=big5,codepage=950,username=foo,password=bar

Montera ett UNIX-fjärrfilsystem med Samba

Java Enterprise System kan använda fjärrfilsystem på UNIX och Linux med SMB. Serversidan som gör exporten måste köra samba eller motsvarande för att kunna exportera fjärrfilsystemet. På klientsidan kan du ange filsystemskodning om gamla data lagras i de gamla kodningarna. Koduppsättningskonverteringen av filnamnet sker automatiskt.

Microsoft Office-filer

Microsoft Office-filer kodas med Unicode. StarOffice-program kan utan problem läsa och skriva Unicode-kodade filer.

HTML-filer

HTML-filer som skapats med HTML-redigerare, t.ex. Mozilla Composer, eller som sparats i en webbläsare, innehåller oftast ett charset-kodningsmärke. När du har exporterat eller importerat kan du läsa sådana HTML-filer i webbläsaren Mozilla Navigator eller redigera filerna i Mozilla Composer, enligt kodningsmärket i HTML-filen.

Laga skadade HTML-filer

Det kan hända att en del HTML-filer visas med skräptecken. Problemet beror oftast på något av följande:

charset-kodningsmärket är felaktigt.
charset-kodningsmärket saknas.

Gör så här om du vill hitta charset-kodningsmärket i HTML-filen:

Öppna filen i Mozilla.
Tryck på Ctrl + I eller klicka på Visa för att öppna Visa-menyn.
Klicka på Sidinformation.

charset-informationen är längst ned på fliken Allmänt, t.ex.: Content-Type text/html; charset=us-ascii

Om strängen charset=us-ascii inte matchar filens faktiska kodning, verkar filen vara skadad. Gör så här om du vill redigera HTML-filens kodning:

Öppna filen i Mozilla Composer.
Öppna Arkiv-menyn.
Välj Spara som teckenuppsättning.
Välj den korrekta kodningen. Mozilla Compose konverterar automatiskt kodningen och charset-märket.

Spara e-post i flyttbart format

Modern e-post märks med MIME charset-märket.. E-postprogrammet i Java Desktop System, Evolution, accepterar MIME charset-märken. Du behöver inte utföra någon kodningskonvertering.

Oformaterade textfiler

Oformaterade textfiler har inget charset-märke. Om filerna inte sparas med UTF-8-kodning, behövs kodningskonvertering. Om du t.ex. vill konvertera en oformaterad textfil som kodats på traditionell kinesiska från big5 till UTF-8, kör du följande kommando: iconv -f big5 -t UTF-8 inputfilename > outputfilename