한국어 Solaris 사용 설명서

언어 지원

Solaris 운영 체제에서는 내재된 국제화 기능을 모든 지역화된 제품에 구축했습니다. 이 지역화 특성은 로켈 및 그와 관련된 범주를 정의하는 국제화 및 지역화에 대한 ANSI C 권장 사항을 지원합니다.

로켈 속성

로켈에는 문화적으로 특정한 언어 정보 및 고유 지역에 대한 규약이 포함되어 있습니다. Solaris 운영 체제의 각 프로세스에는 다음의 로켈 속성 세트가 있습니다.

한국어 로켈

1995년 12월 한국어 정부는 ISO 10646-1/유니코드 2.0을 기반으로 한 표준 한국어 코드 세트인 KS X 1005–1을 발표했습니다.

ISO-10646 문자 세트는 두 가지 공통 문자 세트를 사용합니다:

IBM PC 기반 운영 체제에서는 ISO-10646 문자 집합을 직접 사용할 수 없습니다. 예를 들어 한국어 Solaris 운영 체제의 커넬 및 기타 많은 모듈은 특정 바이트 값을 문자열의 null 문자(0x00)와 같은 제어 명령으로 해석합니다. ISO-10646 문자 세트는 첫 번째 또는 두 번째 바이트에서 어떤 비트 조합으로든 코드화할 수 있습니다. ISO-10646 문자는 이러한 제한을 갖고 있는 Solaris 시스템에서 자유롭게 전송할 수 없습니다.

이전 경로를 확립하기 위하여 ISO-10646 문자 세트는 C0 제어 (0x00..0x1F), C1 제어 (0x80..0x9F), 공백 (0x20) 및 DEL (0x7F)을 사용하지 않고 ISO-10646 문자를 인코드하는 UCS 변환 형식(UTF)을 정의합니다.

ko_KR.UTF-8 로켈은 KS X 1005–1인 한국어 표준 코드 세트를 지원합니다. 이 로켈은 이전 KS X 1005 코드 세트, 11,172 한국어 문자 모두 및 확장 ASCII 코드 세트를 지원합니다. 범용 UTF/UCS를 사용할 수 있을 때까지 ko_KR.UTF-8 로켈이 한국어 문자 및 글꼴과 관련된 ISO-10646 코드 하위 집합을 지원합니다. ISO-10646 표준에는 세계의 모든 문자가 포함됩니다. 이 릴리스에서 제공되는 입력기와 글꼴을 사용하여 원하는 언어의 문자를 입력, 표시 및 인쇄할 수 있습니다.

ko_KR.EUC 로켈에서 EUC 스키마는 KS X 1001을 인코드하는 데 사용됩니다. ko_KR.UTF-8 로켈은 KS X 1005–1/유니코드 3.2 코드 세트를 지원하며, 이는 KS X 1001의 상위 집합입니다. 이 두 가지 로켈은 사용자가 보기에 동일해 보이지만 내부 문자 인코딩이 다릅니다.

한국어 Solaris 운영 체제에서는 다음 표의 로켈을 동시에 지원합니다. 이 두 로켈은 최종 사용자에게 동일해 보이지만, 내부 문자의 문자 인코딩 방식은 다릅니다.

표 1–1 한국어 로켈

로켈 

설명 

ko_KR.EUC (ko)

한국어 EUC (KS X) 

ko_KR.UTF-8 (ko.UTF-8)

한국어 UTF-8 (Unicode 3.2) 

한국어 코드 세트

각 한국어 로켈용으로 지원되는 코드 세트는 다음 표의 목록과 같습니다.

표 1–2 한국어 코드 세트

로켈 

코드 세트 

ko_KR.EUC (ko)

KS X 1001 

ko_KR.UTF-8 (ko.UTF-8)

KS X 1005–1/유니코드 3.2 

한국어 입력기 및 글꼴

한국어 Solaris 운영 체제에서는 ISO-10646 표준에서 다루는 모든 문자용 입력기와 글꼴이 제공됩니다. 이들 입력기와 글꼴을 사용하여 원하는 언어의 문자를 입력, 표시 및 인쇄할 수 있습니다.

ko_KR.EUC (ko)ko_KR.UTF-8 (ko.UTF-8) 로켈용으로 사용할 수 있는 한국어 입력기는 다음의 기능을 지원합니다.

ko_KR.EUC (ko)ko_KR.UTF-8 (ko.UTF-8) 로켈에서 지원되는 확장 가능한 비트맵 글꼴의 전체 목록은 제 10 장, 글꼴을 참조하십시오.


주 –

한글 또는 표준 Sun 키보드를 사용하여 한국어 텍스트를 입력할 수 있습니다.


로켈 범주

한국어 Solaris 운영 체제에서 한국어 및 영어 로켈용으로 ANSI C가 정의한 다음의 일반 및 특정 범주를 사용할 수 있습니다.

예를 들어 한국어 로켈과 영어/ASCII 로켈에는 모두 문화적 형식에 따른 시간 및 날짜 표시뿐 아니라 시간 및 날짜용 실제 한국어 또는 영어/ASCII 문자 표시를 정의하는 LC_TIME 범주가 있습니다.

로켈 수정기

로켈 수정기를 사용하여 로켈을 구분하는 작업을 수정할 수 있습니다. 로켈 명령의 출력은 다음과 같습니다.


system % locale
LANG=ko_KR.EUC
LC_CTYPE="ko_KR.EUC"
LC_NUMERIC="ko_KR.EUC"
LC_TIME="ko_KR.EUC"
LC_COLLATE="ko_KR.EUC"
LC_MONETARY="ko_KR.EUC"
LC_MESSAGES="ko_KR.EUC"
LC_ALL=ko_KR.EUC

system % cat data_file
cat data_file의 출력

data_filesort하는 경우 정렬 결과는 다음과 같습니다.


system % sort data_file
sort data_file의 출력

이 경우 텍스트는 현재 로켈인 ko (ko_KR.EUC)에 정의된 대로 각 문자의 코드 점 값에 따라 정렬됩니다. 이 결과가 원하는 결과가 아닐 수 있습니다.

Solaris 운영 체제에서는 로켈 수정기가 제공됩니다. 보이는 것과 같이 현재 로켈을 ko에서 ko_KR.EUC@dict으로 변경하여 sort의 작동을 수정할 수 있습니다.


system % env LANG=ko_KR.EUC@dict sort data_file
로켈 수정기를 사용한 sort data_file의 결과