Java Desktop System ist ein Unicode-fähiges, mehrsprachiges System und unterstützt Sprachen mit Unicode UTF-8-Kodierung. Das Java Desktop System bietet auch Kodierungskonvertierung zur Unterstützung von Legacy-Kodierungen (nicht-UTF-8). Dieser Abschnitt beschreibt Probleme, die bei der Migration zum mehrsprachigen Unicode-Computing auftreten können.
Die Migration zum mehrsprachigen Unicode-Computing wirkt sich auf eine Reihe von Verfahren zum Importieren und Exportieren von Daten aus.
Microsoft Office
-Dateien sind in Unicode kodiert. StarOffice
-Anwendungen können Unicode-kodierte Dateien lesen und schreiben.
Mit HTML-Editoren wie Mozilla Composer
erstellte HTML-Dateien oder mit einem Webbrowser gespeicherte HTML-Dateien enthalten normalerweise ein charset-Tag. Nach dem Export bzw. Import können Sie solche HTML-Dateien mit dem Webbrowser Mozilla Navigator
anzeigen oder mit Mozilla Composer
bearbeiten, je nach Charset-Tag in der HTML-Datei.
Manche HTML-Dateien werden möglicherweise mit unverständlichen Zeichen angezeigt. Dies ist normalerweise auf folgende Ursachen zurückzuführen:
Das charset-Tag ist fehlerhaft.
Das charset-Tag fehlt.
Suchen Sie das charset-Tag in der HTML-Datei folgendermaßen:
Öffnen Sie die Datei mit Mozilla
.
Drücken Sie Strg+I oder klicken Sie auf Ansicht, um das Menü Ansicht zu öffnen.
Klicken Sie auf Seiteninfo.
Die charset-Informationen finden Sie unten auf der Registerkarte Allgemein. Beispiel: Content-Type text/html; charset=us-ascii
Wenn die Zeichenfolge charset=us-ascii nicht mit der tatsächlichen Kodierung der Datei übereinstimmt, wird die Datei nicht richtig angezeigt. Gehen Sie wie folgt vor, um die Kodierung der HTML-Datei zu bearbeiten:
Öffnen Sie die Datei mit Mozilla Composer
.
Öffnen Sie das Menü Datei.
Wählen Sie Als Zeichensatz speichern.
Wählen Sie die richtige Kodierung. Mozilla Composer
konvertiert die Kodierung und das charset-Tag automatisch.
E-Mails werden heutzutage mit dem MIME-Tag charset versehen. Die Anwendung E-Mail und Kalender akzeptiert die MIME-Tags charset. Eine Konvertierung der Kodierung ist also nicht erforderlich.
Nur-Text-Dateien enthalten kein charset-Tag. Wenn die Dateien nicht mit UTF-8 kodiert wurden, ist eine Konvertierung der Kodierung erforderlich. Führen Sie z. B. folgenden Befehl aus, um eine mit big5 in traditionellem Chinesisch kodierte Nur-Text-Datei in UTF-8 zu konvertieren:
iconv -f big5 -t UTF-8 inputfilename > outputfilename
Für die Kodierungskonvertierung können Sie auch die Dateisystem-Prüfung
verwenden.
Sie können mit dem Texteditor
automatisch Zeichenkodierungstext lesen und schreiben, oder indem Sie beim Öffnen oder Speichern einer Datei explizit eine Kodierung angeben.
Zum Starten von Texteditor
klicken Sie auf Starten und wählen dann Anwendungen -> Zubehör -> Texteditor.
Wenn Datei- und Verzeichnisnamen Multibyte-Zeichen verwenden, die nicht UTF-8-kodiert sind, muss eine Kodierungskonvertierung erfolgen. Sie können mit der Dateisystem-Prüfung
Datei- und Verzeichnisnamen sowie den Inhalt von Nur-Text-Dateien aus Legacy-Zeichenkodierungen in UTF-8-Kodierung konvertieren. Weitere Informationen finden Sie in der Online-Hilfe der Dateisystem-Prüfung
.
Zum Starten der Dateisystem-Prüfung
klicken Sie auf Starten und wählen dann Anwendungen -> Dienstprogramme -> Dateisystem-Prüfung.
Wenn Sie unter Microsoft Windows über SMB unter Verwendung des Dateimanagers
auf Nicht-UTF-8-Datei- oder Verzeichnisnamen zugreifen, können Sie ohne Kodierungskonvertierung auf die Nicht-UTF-8-Datei- oder Verzeichnisnamen zugreifen.
Für Anwendungen, die nicht für die Migration zu Unicode UTF-8 bereit sind, können Sie in einem Frontpanel ein Startprogramm erstellen, mit dem die Anwendung mit Legacy-Ländereinstellungen gestartet wird. Sie können die Anwendungen auch direkt von der Befehlszeile starten. Führen Sie zum Erstellen eines Startprogramms für eine Anwendung folgende Schritte durch:
Klicken Sie mit der rechten Maustaste auf das Panel, in dem das Startprogramm platziert werden soll.
Wählen Sie Zum Panel hinzufügen -> Startprogramm.
Verwenden Sie folgendes Format, um den Eintrag im Dialogfeld Startprogramm erstellen im Feld Befehl einzugeben:
env LANG=Ländereinstellung LC_ALL=Ländereinstellung Anwendungsname
Wenn Sie beispielsweise eine Anwendung namens motif-app aus dem Pfad /usr/dt/bin mit der Ländereinstellung Chinese Big5 starten möchten, geben Sie im Dialogfeld Startprogramm erstellen im Feld Befehl folgenden Text ein:
env LANG=zh_TW.BIG5 LC_ALL=zh_TW.BIG5 /usr/dt/bin/motif-app
Möglicherweise müssen Sie auch den entsprechenden LD_LIBRARY_PATH für die Anwendung angeben.
Klicken Sie auf OK, um das Startprogramm im Panel zu erstellen.
Wenn CLI-Anwendungen (Command Line Interface = Befehlszeilenschnittstelle) ausgeführt werden müssen, die für eine bestimmte Legacy-Ländereinstellung spezifisch sind, öffnen Sie zuerst mit der Legacy-Ländereinstellung ein Terminal
fenster und führen dann die CLI-Anwendungen in demselben Terminal
fenster aus. Um ein Terminal
fenster mit einer Legacy-Ländereinstellung zu öffnen, geben Sie folgenden Befehl ein:
env LANG=Ländereinstellung LC_ALL=Ländereinstellung gnome-terminal --disable-factory.
Statt ein neues Terminal
fenster mit einer Legacy-Ländereinstellung zu öffnen, können Sie die Ländereinstellung im aktuellen Terminal
fenster von UTF-8 auf eine Legacy-Ländereinstellung umstellen, indem Sie die Kodierung im Menü Zeichenkodierung festlegen des Terminal
fensters ändern. Sie müssen dann auch die Umgebungsvariablen LANG und LANG auf die aktuelle Shell setzen.