Guía de entornos de idiomas internacionales para Oracle® Solaris 11.2

Salir de la Vista de impresión

Actualización: Julio de 2014
 
 

Componentes internacionales para Unicode

Oracle Solaris 11 agrega las bibliotecas C/C++ International Components for Unicode (ICU) a las interfaces disponibles. ICU es un conjunto de bibliotecas bien establecido y ampliamente usado que proporciona compatibilidad con Unicode y globalización para las aplicaciones de software. ICU es portátil y brinda a las aplicaciones los mismos resultados en todas las plataformas y entre software C/C++ y Java.

Algunos de los servicios que proporciona ICU incluyen:

  • Conversión de página de código: permite convertir datos de texto a Unicode y desde Unicode, y casi cualquier otro juego de caracteres o codificación.

  • Intercalación: permite comparar cadenas según todas las convenciones y estándares de un idioma, región o país en particular.

  • Formato: se proporciona el formato de los números, las fechas, las horas y las monedas de acuerdo con la configuración regional elegida.

  • Cálculos de hora: se proporcionan varios tipos de calendarios y un conjunto completo de API de cálculo de zona horaria.

  • Compatibilidad con Unicode: ICU realiza un seguimiento detenido del estándar Unicode, proporciona acceso fácil a todas las propiedades de los caracteres Unicode, la normalización Unicode, el uso de mayúsculas y otras operaciones fundamentales según lo especificado por el estándar Unicode.

  • Expresiones regulares: las expresiones regulares de ICU admiten completamente Unicode y, al mismo tiempo, proporcionan un rendimiento muy competitivo.

  • Texto bidireccional (Bidi): proporciona compatibilidad para tratar texto que contiene datos de izquierda a derecha y datos de derecha a izquierda.

  • Límites de texto: permite ubicar la posición de las palabras, oraciones y párrafos dentro de un rango de texto o identificar las ubicaciones donde sería adecuado utilizar el retorno automático de líneas al mostrar el texto.

ICU en Oracle Solaris 11 se divide en dos paquetes: library/icu únicamente contiene las bibliotecas, mientras que developer/icu proporciona los archivos de encabezado y varias utilidades, como uconv(1).

Para obtener más información, consulte el sitio web del proyecto en http://site.icu-project.org. Las páginas del comando man libicui18n(3LIB), libicuio(3LIB), libicudata(3LIB), libicule(3LIB), libiculx(3LIB), libicutu(3LIB) y libicuuc(3LIB) documentan cómo usar las bibliotecas en Oracle Solaris.

Utilidad uconv

Además de iconv(1), el comando uconv(1) que es parte del conjunto de herramientas de componentes internacionales para Unicode (ICU) también puede utilizarse para convertir texto de una codificación a otra. uconv admite 229 codificaciones junto con más de 1000 alias.

La herramienta es parte del paquete developer/icu, que no se instala de manera predeterminada. Para instalarlo, ejecute el siguiente comando:

# pkg install developer/icu

Para convertir un texto de la codificación cp-1252 a UTF-8, escriba:

$ uconv -f cp1252 -t UTF-8 -o file_in_utf8.txt file_in_cp1252_encoding.txt

Otra característica de uconv es la transliteración, es decir, la conversión de letras de una secuencia de comandos a otra sin traducir las palabras subyacentes. El siguiente ejemplo convierte un texto de griego a caracteres latinos:

$ echo “????λ????????”| uconv -x Greek-Latin -f utf-8 -t utf-8
Solaris

Para obtener más información acerca de las funciones de esta herramienta, consulte la página del comando man uconv(1).