Java Desktop System es un sistema multilingüe habilitado completamente para Unicode que admite idiomas con codificación Unicode UTF-8. Java Desktop System también proporciona conversión de conjuntos de códigos para admitir las codificaciones heredadas de idiomas.
Java Desktop System está instalado como escritorio predeterminado en los entornos nacionales, como parte del sistema operativo subyacente. Sin embargo, Sun Microsystems proporciona asistencia completa de globalización para los siguientes entornos nacionales en Java Desktop System:
de_DE.UTF-8
fr_FR.UTF-8
es_ES.UTF-8
sv_SE.UTF-8
it_IT.UTF-8
ja_JP.UTF-8
ko_KR.UTF-8
zh_CN.UTF-8
zh_CN.GB18030
zh_TW.UTF-8
zh_TW.BIG5
Hay varios métodos de importación y exportación de datos afectados por la migración a la computación multilingüe Unicode.
Los tipos de archivos de sistema FAT y VFAT se usan normalmente para disquetes, unidades zip y discos extraíbles en Microsoft Windows. El administrador del sistema debe configurar las opciones de montaje codepage y iocharset para estos tipos de archivos de sistema. Por ejemplo, si importa datos de Windows en chino tradicional, la configuración debe ser como se muestra en la tabla siguiente para explorar correctamente los nombres de archivos en chino tradicional.
Opción de montaje |
Configuración para el chino tradicional |
---|---|
codepage |
950 |
iocharset |
big5 |
Algunas entradas de ejemplo para /etc/fstab en chino tradicional son:
/dev/fd0h1440 |
/media/fd0h1440 |
vfat noauto,iocharset=big5,codepage=950 |
/dev/sda1 |
/media/iee1394disk |
vfat noauto,iocharset=big5,codepage=950 |
Un administrador del sistema debe configurar las opciones de montaje codepage y iocharset para montar un sistema de archivos remoto de Microsoft Windows mediante CIFS o un sistema de archivos exportado desde otro sistema mediante SMB. Por ejemplo, si importa los archivos heredados codificados con big5 en Windows para chino tradicional, el parámetro iocharset se debe configurar como big5 y codepage se debe configurar como 950 para explorar correctamente los nombres de archivos en chino tradicional. Entrada de muestra de /etc/fstab:
server:/data /data smbfs iocharset=big5,codepage=950,username=foo,password=bar |
Java Desktop System puede acceder remotamente a un sistema de archivos en los sistemas UNIX y Linux utilizando SMB. El servidor de exportación debe ejecutar Samba o un equivalente para exportar el sistema de archivos remoto. El lado del cliente puede especificar la codificación del sistema de archivos si los datos heredados se almacenan en codificaciones heredadas. La conversión del conjunto de caracteres del nombre del archivo se efectúa automáticamente.
Los archivos de Microsoft Office
se codifican con Unicode. Las aplicaciones de StarOffice
pueden leer y escribir archivos codificados con Unicode sin problemas.
Los archivos HTML creados con editores de HTML, como Mozilla Composer
, o los archivos HTML guardados por un navegador web contienen normalmente una etiqueta de codificación charset. Puede explorar dichos archivos HTML con el navegador web Mozilla Navigator
o editar los arcihvos con Mozilla Composer
, de acuerdo con la etiqueta de codificación del archivo HTML.
Es posible que algunos archivos HTML aparezcan con caracteres confusos. Este problema se debe normalmente a las razones siguientes:
La etiqueta de codificación charset es incorrecta.
Falta la etiqueta de codificación charset.
Para encontrar la etiqueta de codificación charset en el archivo HTML, lleve a cabo las siguientes acciones:
Abra el archivo con Mozilla
.
Pulse Control+i o haga clic en Ver para abrir el menú Ver.
Haga clic en Información de la página.
La informción sobre charset se encuentra en la parte inferior de la ficha General, por ejemplo: Content-Type text/html; charset=us-ascii
Si la cadena charset=us-ascii no coincide con la codificación real del archivo, es posible que el archivo aparezca como deteriorado. Para editar las codificaciones del archivo HTML:
Abra el archivo con Mozilla Composer
.
Abra el menú Archivo.
Seleccione Guardar como conjunto de caracteres.
Seleccione la codificación correcta. Mozilla Composer
convierte automáticamente la codificación y la etiqueta charset de modo adecuado.
Los correos electrónicos modernos se etiquetan mediante MIME charset. La aplicación de correo electrónico de Java Desktop System, Evolution
, acepta las etiquetas MIME charset. No necesita ejecutar ninguna conversión de codificaciones.
Los archivos de texto sin formato no tienen etiqueta charset. Si los archivos no están codificados con UTF-8, es necesaria la conversión de la codificación. Por ejemplo, si desea convertir un archivo de texto sin formato en chino tradicional big5 para UTF-8, ejecute el comando siguiente: iconv -f big5 -t UTF-8 inputfilename > outputfilename