Oracle® Solaris 11.2의 국제 언어 환경 설명서

인쇄 보기 종료

업데이트 날짜: 2014년 7월
 
 

유니코드 개요

유니코드는 컴퓨터 처리를 위한 텍스트 표현에 사용되는 범용 문자 인코딩 표준입니다. 유니코드는 일관성 있는 방식으로 다국어 텍스트를 인코딩할 수 있도록 하며 국제 텍스트 파일 교환을 원활하게 처리합니다.

다국어 텍스트 코드화 표준은 ISO/IEC 10646입니다. ISO/IEC 10646 및 유니코드 표준에 모두 동일한 문자와 인코딩 지점이 포함되어 있기는 하지만 유니코드 표준이 문자 및 문자 사용에 대한 추가 정보를 제공합니다.

Oracle Solaris 11은 유니코드 표준 버전 6.0 및 ISO/IEC 10646:2011에 대해 시스템 레벨의 지원을 제공합니다.

각 유니코드 문자는 0과 1,114,111 사이의 정수인 코드점에 매핑됩니다. 유니코드 코드점은 U+nnnn 형식의 표기법을 사용하거나 코드점을 기술하는 텍스트 문자열로 표시됩니다. 여기서 nnnn은 코드점의 16진수입니다. 예를 들어, 소문자 "a"는 U+0061 또는 텍스트 문자열 "LATIN SMALL LETTER A"로 표시할 수 있습니다.

코드점은 여러 문자 인코딩 체계를 사용하여 인코딩할 수 있습니다. Oracle Solaris 유니코드 로켈에서는 UTF-8 형식이 사용됩니다. UTF-8은 ASCII 문자 코드 값을 그대로 보존하는 유니코드 가변 길이 인코딩 형식입니다. UTF-8 Overview를 참조하십시오.

유니코드 표준 및 ISO/IEC 10646과 다양한 표현 형식에 대한 자세한 내용은 다음 자료를 참조하십시오.