Java Desktop System Versión 2: Notas sobre la versión

Importación y exportación de datos

Hay varios métodos de importación y exportación de datos afectados por la migración a la computación multilingüe Unicode.

Soportes extraíbles

El administrador del sistema debe configurar las opciones de montaje codepage y iocharset para los sistemas de archivos FAT y VFAT que se usan normalmente en los disquetes, unidades zip y discos duros extraíbles en Microsoft Windows. Por ejemplo, si importa datos de Windows en chino tradicional, la configuración debe ser como se muestra en la tabla siguiente para explorar correctamente los nombres de archivos en chino tradicional.

Opción de montaje 

Configuración para el chino tradicional 

codepage

950 

iocharset

big5 

Entradas de muestra de /etc/fstab para el ejemplo del chino tradicional:

/dev/fd0h1440

/media/fd0h1440

vfat noauto,iocharset=big5,codepage=950

/dev/sda1

/media/iee1394disk

vfat noauto,iocharset=big5,codepage=950

Montaje de un sistema de archivos remoto de Microsoft Windows mediante Samba

Un administrador del sistema debe configurar las opciones de montaje codepage y iocharset para montar un sistema de archivos remoto de Microsoft Windows mediante CIFS o un sistema de archivos exportado desde otro sistema mediante SMB. Por ejemplo, si importa los archivos heredados codificados con big5 en Windows para chino tradicional, el parámetro iocharset se debe configurar como big5 y codepage se debe configurar como 950 para explorar correctamente los nombres de archivos en chino tradicional. Entrada de muestra de /etc/fstab:

server:/data /data smbfs iocharset=big5,codepage=950,username=foo,password=bar

Montaje de un sistema de archivos UNIX remoto con Samba

Java Enterprise System puede acceder a sistemas de archivos remotos en los sistemas UNIX y Linux mediante SMB. El lado del servidor que efectúa la exportación necesita ejecutar samba o un equivalente para exportar el sistema de archivos remoto. El lado del cliente puede especificar la codificación del sistema de archivos si los datos heredados se almacenan en codificaciones heredadas. La conversión del conjunto de caracteres del nombre del archivo se efectúa automáticamente.

Archivos de Microsoft Office

Los archivos de Microsoft Office se codifican con Unicode. Las aplicaciones de StarOffice pueden leer y escribir archivos codificados con Unicode sin problemas.

Archivos HTML

Los archivos HTML creados con editores de HTML, como Mozilla Composer, o los archivos HTML guardados por un navegador web contienen normalmente una etiqueta de codificación charset. Después de efectuar la exportación o la importación, puede explorar dichos archivos HTML con el navegador web Mozilla Navigator o editar los archivos con Mozilla Composer, de acuerdo con la etiqueta de codificación del archivo HTML.

Reparación de archivos HTML dañados

Es posible que algunos archivos HTML aparezcan con caracteres confusos. Este problema se debe normalmente a las razones siguientes:

Si desea encontrar la etiqueta de codificación de charset en el archivo HTML:

  1. Abra el archivo con Mozilla.

  2. Pulse Control+i o haga clic en Ver para abrir el menú Ver.

  3. Haga clic en Información de la página.

La información sobre charset se encuentra en la parte inferior de la ficha General, por ejemplo: Content-Type text/html; charset=us-ascii

Si la cadena charset=us-ascii no coincide con la codificación real del archivo, es posible que éste aparezca dañado. Para editar las codificaciones del archivo HTML:

  1. Abra el archivo con Mozilla Composer.

  2. Abra el menú Archivo.

  3. Seleccione Guardar como conjunto de caracteres.

  4. Seleccione la codificación correcta. Mozilla Composer convierte automaticamente la codificación y la etiqueta charset de modo adecuado.

Correos electrónicos guardados como formato portable

Los correos electrónicos modernos se etiquetan mediante MIME charset. La aplicacion de correo electrónico de Java Desktop System, Evolution, acepta las etiquetas charset. No necesita ejecutar ninguna conversión de codificaciones.

Archivos de texto sin formato

Los archivos de texto sin formato no tienen una etiqueta charset. Si los archivos no están codificados con UTF-8, es necesaria la conversión de la codificación. Por ejemplo, si desea convertir un archivo de texto sin formato en chino tradicional big5 para UTF-8, ejecute la orden siguiente: iconv -f big5 -t UTF-8 inputfilename > outputfilename