Java Desktop System Versión 2: Notas sobre la versión

1.8.2 Importación y exportación de datos

Hay varios métodos de importación y exportación de datos afectados por la migración a la computación multilingüe Unicode.

1.8.2.1 Medios extraíbles

Los tipos de archivos de sistema FAT y VFAT se usan normalmente para disquetes, unidades zip y discos extraíbles en Microsoft Windows. El administrador del sistema debe configurar las opciones de montaje codepage y iocharset para estos tipos de archivos de sistema. Por ejemplo, si importa datos de Windows en chino tradicional, la configuración debe ser como se muestra en la tabla siguiente para explorar correctamente los nombres de archivos en chino tradicional.

Opción de montaje 

Configuración para el chino tradicional 

codepage

950 

iocharset

big5 

Algunas entradas de ejemplo para /etc/fstab en chino tradicional son:

/dev/fd0h1440

/media/fd0h1440

vfat noauto,iocharset=big5,codepage=950

/dev/sda1

/media/iee1394disk

vfat noauto,iocharset=big5,codepage=950

1.8.2.2 Montaje de un sistema de archivos remoto de Microsoft Windows mediante Samba

Un administrador del sistema debe configurar las opciones de montaje codepage y iocharset para montar un sistema de archivos remoto de Microsoft Windows mediante CIFS o un sistema de archivos exportado desde otro sistema mediante SMB. Por ejemplo, si importa los archivos heredados codificados con big5 en Windows para chino tradicional, el parámetro iocharset se debe configurar como big5 y codepage se debe configurar como 950 para explorar correctamente los nombres de archivos en chino tradicional. Entrada de muestra de /etc/fstab:

server:/data /data smbfs iocharset=big5,codepage=950,username=foo,password=bar

1.8.2.3 Montaje de un sistema de archivos UNIX remoto con Samba

Java Desktop System puede acceder remotamente a un sistema de archivos en los sistemas UNIX y Linux utilizando SMB. El servidor de exportación debe ejecutar Samba o un equivalente para exportar el sistema de archivos remoto. El lado del cliente puede especificar la codificación del sistema de archivos si los datos heredados se almacenan en codificaciones heredadas. La conversión del conjunto de caracteres del nombre del archivo se efectúa automáticamente.

1.8.2.4 Archivos de Microsoft Office

Los archivos de Microsoft Office se codifican con Unicode. Las aplicaciones de StarOffice pueden leer y escribir archivos codificados con Unicode sin problemas.

1.8.2.5 Archivos HTML

Los archivos HTML creados con editores de HTML, como Mozilla Composer , o los archivos HTML guardados por un navegador web contienen normalmente una etiqueta de codificación charset. Puede explorar dichos archivos HTML con el navegador web Mozilla Navigator o editar los arcihvos con Mozilla Composer, de acuerdo con la etiqueta de codificación del archivo HTML.

1.8.2.6 Reparación de archivos HTML dañados

Es posible que algunos archivos HTML aparezcan con caracteres confusos. Este problema se debe normalmente a las razones siguientes:

Para encontrar la etiqueta de codificación charset en el archivo HTML, lleve a cabo las siguientes acciones:

  1. Abra el archivo con Mozilla.

  2. Pulse Control+i o haga clic en Ver para abrir el menú Ver.

  3. Haga clic en Información de la página.

La informción sobre charset se encuentra en la parte inferior de la ficha General, por ejemplo: Content-Type text/html; charset=us-ascii

Si la cadena charset=us-ascii no coincide con la codificación real del archivo, es posible que el archivo aparezca como deteriorado. Para editar las codificaciones del archivo HTML:

  1. Abra el archivo con Mozilla Composer.

  2. Abra el menú Archivo.

  3. Seleccione Guardar como conjunto de caracteres.

  4. Seleccione la codificación correcta. Mozilla Composer convierte automáticamente la codificación y la etiqueta charset de modo adecuado.

1.8.2.7 Correos electrónicos guardados como formato portable

Los correos electrónicos modernos se etiquetan mediante MIME charset. La aplicación de correo electrónico de Java Desktop System, Evolution, acepta las etiquetas MIME charset. No necesita ejecutar ninguna conversión de codificaciones.

1.8.2.8 Archivos de texto sin formato

Los archivos de texto sin formato no tienen etiqueta charset. Si los archivos no están codificados con UTF-8, es necesaria la conversión de la codificación. Por ejemplo, si desea convertir un archivo de texto sin formato en chino tradicional big5 para UTF-8, ejecute el comando siguiente: iconv -f big5 -t UTF-8 inputfilename > outputfilename