한국어 Solaris 사용 설명서

지원되는 문자 세트

선택하는 로켈에 따라 입력에 사용할 수 있는 문자가 달라집니다. 예를 들어 ko_KR.EUC 로켈을 선택하면 KS X 1001 코드 세트의 문자를 입력할 수 있습니다. ko_KR.UTF–8 로켈에서 조합 원칙에 따라 조합된 11,172개의 한국어 문자를 모두 입력할 수 있습니다. ko_KR.EUC 로켈 및 ko_KR.UTF–8 로켈의 문자를 정의하는 인코딩 표준은 다음에서 간단히 설명합니다.

표 4–1 문자 코드 표준

ko_KR.EUC (ko) 로켈

완성 코드 

한글, 한자 및 기타 문자에 대하여 2바이트 코드는 KS C 5601-1987이라고 하는 한국 산업 표준 KS X 1001에 지정되었습니다. 한국어 Solaris 소프트웨어에서 KS X 1001 문자는 EUC 코드 세트입니다. 

ko_KR.UTF-8 (ko.UTF-8) 로켈

 

조합 또는 팩 코드 

이 2바이트 코드는 시작 비트와 그 뒤의 5비트 필드 다섯 개로 구성됩니다. 세 개의 필드에는 각각 한글 문자용 코드 또는 첫 자음과 이에 이어 모음 및 마지막 자음(있는 경우)이 포함됩니다. 2바이트 코드는 한국 산업 표준 KS C 5601-1992–3에 지정되어 있습니다. 

ko.UTF-8

한국어 범용 복수 8진 코드 문자 세트(UCS) 전송 형식. ko.UTF-8은 KS C 5601의 모든 문자 및 조합의 11,172개 문자 모두뿐 아니라 한국어와 관련된 유니코드 3.2 문자 및 글꼴을 지원합니다. ko.UTF-8은 유니코드의 다음 서브 세트를 지원합니다.

  • 기본 Latin 및 Latin-i (190 문자) – BMP(Basic Multilingual Plane)의 00행

  • 기호 문자 – 20행에서 27행, KS C 5601에서 정의된 상자(줄) 그리기 문자를 포함하는 BMP의 32행

  • KS C 5601에 정의된 숫자(20문자) – 21행 및 BMP의 FF행

  • KS C 5601에 정의된 로마어, 그리스어, 일본어 및 키릴어 영문자(362문자) – 02행, 04행, 30행 및 BMP의 FF행

  • 자모(한글) 문자(94문자) – BMP의 31행

  • 미리 조합된 한글 음절(11,172문자) – BMP의 AC 행에서 D7행까지

  • KS C 5601에서 정의된 한자 문자(4,888문자) – BMPdml 4E행에서 9F행 및 F9행에서 FA행