Oracle® Solaris 11.2의 국제 언어 환경 설명서

인쇄 보기 종료

업데이트 날짜: 2014년 7월
 
 

ICU(International Components for Unicode)

Oracle Solaris 11에서는 사용 가능한 인터페이스에 ICU(International Components for Unicode) C/C++ 라이브러리를 추가했습니다. ICU는 소프트웨어 응용 프로그램에 유니코드 및 전역화 지원을 제공하는 라이브러리 세트로 광범위하게 사용됩니다. ICU는 이식 가능하며 모든 플랫폼의 응용 프로그램 및 C/C++와 Java 소프트웨어 간의 응용 프로그램에 동일한 결과를 제공합니다.

ICU에서 제공하는 몇 가지 서비스는 다음과 같습니다.

  • 코드 페이지 변환 - 유니코드와 거의 모든 기타 문자 세트 또는 인코딩 간에 텍스트 데이터를 변환합니다.

  • 조합 - 특정 언어, 지역 또는 국가의 규약 및 표준에 따라 문자열을 비교합니다.

  • 형식 지정 - 선택된 로켈에 따라 숫자, 날짜, 시간 및 통화의 형식을 지정합니다.

  • 시간 계산 - 여러 유형의 달력과 철저한 시간대 계산 API 세트가 제공됩니다.

  • 유니코드 지원 - ICU는 유니코드 표준을 면밀히 추적하여 유니코드 표준에 지정된 여러 유니코드 문자 등록 정보, 유니코드 정규화, 대소문자 변환 및 기타 기본적인 작동에 모두 쉽게 액세스할 수 있도록 합니다.

  • 정규 표현식 - ICU 정규 표현식은 매우 뛰어난 성능을 제공하면서 유니코드를 완전히 지원합니다.

  • Bidi(양방향 텍스트) - 왼쪽에서 오른쪽으로 작성된 데이터와 오른쪽에서 왼쪽으로 작성된 데이터의 조합이 포함된 텍스트를 처리할 수 있도록 지원합니다.

  • 텍스트 경계 - 일정 텍스트 범위에서 단어, 문장 및 단락의 위치를 찾거나 텍스트를 표시할 때 줄바꿈에 적합한 위치를 식별합니다.

Oracle Solaris 11의 ICU는 2개의 패키지로 분할되어 있습니다. library/icu에는 라이브러리만 포함되어 있는 반면, developer/icu는 헤더 파일과 uconv (1) 등의 여러 유틸리티가 포함되어 있습니다.

자세한 내용은 프로젝트 웹 사이트(http://site.icu-project.org)를 참조하십시오. libicui18n(3LIB), libicuio(3LIB), libicudata(3LIB), libicule(3LIB), libiculx(3LIB), libicutu(3LIB), libicuuc(3LIB) 매뉴얼 페이지에서 Oracle Solaris의 라이브러리를 사용하는 방법을 확인할 수 있습니다.

uconv 유틸리티

iconv(1) 이외에 ICU(International Components for Unicode) 도구 세트에 포함된 uconv(1) 명령을 사용하여 인코딩 간에 텍스트를 변환할 수도 있습니다. uconv는 1000개가 넘는 별칭과 함께 229개의 인코딩을 지원합니다.

이 도구는 기본적으로 설치되지 않는 developer/icu 패키지의 일부입니다. 이 도구를 설치하려면 다음 명령을 실행하십시오.

# pkg install developer/icu

cp-1252 인코딩에서 UTF-8로 텍스트를 변환하려면 다음을 입력하십시오.

$ uconv -f cp1252 -t UTF-8 -o file_in_utf8.txt file_in_cp1252_encoding.txt

uconv에는 기본 단어를 변환하지 않고 스크립트 간에 문자를 변환하는 음역이라는 기능도 있습니다. 다음 예에서는 그리스어 텍스트를 라틴 문자로 변환합니다.

$ echo “Σολαρις”| uconv -x Greek-Latin -f utf-8 -t utf-8
Solaris

이 도구 기능에 대한 자세한 내용은 uconv(1) 매뉴얼 페이지를 참조하십시오.