국제 언어 환경 설명서

한국어 지역화

1995년 12월, 한국 정부는 ISO 10646-1/유니 코드 2.0을 바탕으로 한 표준 한국어 코드 세트인, KS X 1005–1을 발표했습니다.

ISO-10646 문자 세트는 두 가지 공통 문자 세트를 사용합니다:

ISO-10646 문자 세트는 IBM PC 기반 운영 체제에서 직접 사용할 수 없습니다. 예를 들어, Solaris 운영 환경의 커널과 기타 많은 모듈들은 특정 바이트 값들을 문자열의 널 문자 (0x00)와 같은 제어 명령으로 해석합니다. ISO-10646 문자 세트는 첫 번째 또는 두 번째 바이트에서 어떤 비트 조합으로든 코드화할 수 있습니다. ISO-10646 문자는 이러한 제한을 갖고 있는 Solaris 시스템에서 자유롭게 전송할 수 없습니다.

이전 경로를 확립하기 위해 ISO-10646 문자 세트는 C0 제어문자(0x00..0x1F), C1 제어문자(0x80..0x9F), 공백문자(0x20), DEL(0x7F)을 사용하지 않고서 이 ISO-10646 문자들을 다시 코드화하는 UCS 변환 형식(UTF)을 정의합니다.

ko.UTF-8은 한국어 표준 코드 세트인 KS X 1005–1을 지원하는 Solaris 로켈입니다. 이 로켈은 이전 KS X 1005 및 모두 11,172 개 한국어 문자를 지원합니다. 한국어 UTF-8은 한국어 관련 ISO-10646 문자 및 글꼴을 지원합니다. ISO-10646은 전 세계 모든 문자들을 다루기 때문에 어떤 언어든 문자에 관계 없이 입력 및 출력을 할 수 있도록 다양한 입력 방식와 글꼴들이 제공됩니다. 범용 UTF/UCS를 사용할 수 있게 되기 전까지는 한국어 UTF-8이 이전 한국어 표준 코드 세트 및 확장된 ASCII뿐 아니라 한국어 문자와 관련된 ISO-10646 코드 일부를 지원합니다.

ko 로켈에서는 EUC 체계를 사용해 KS X 1001을 코드화합니다. ko.UTF-8 로켈은 KS X 1001의 수퍼 세트인 KS X 1005–1/유니 코드 2.0 코드 세트를 지원합니다. 이 두 가지 로켈은 최종 사용자가 보기에는 동일한 것으로 보이지만 내부 문자 코드화는 서로 다릅니다. 한국어 Solaris 제품은 다음 입력 방식를 지원합니다:

ko 로켈의 경우

ko.UTF-8 로켈의 경우

다음 표는 ko 로켈용 한국어 비트맵 글꼴을 보여줍니다.

표 4–16 ko 로켈용 Solaris 9 한국어 비트맵 글꼴

전체 패밀리 이름 

하위 패밀리 

형식 

코드화 

 고딕 R/B PCF (12,14,16,18,20,24) KS X 1001
 그래픽 R/B PCF (12,14,16,18,20,24) KS X 1001
 해서 R/B PCF (12,14,16,18,20,24) KS X 1001
 고딕 R/B PCF (12,14,16,18,20,24) KS X 1001
 명조 R/B PCF (12,14,16,18,20,24)  KS X 1001
 필기 R/B PCF (12,14,16,18,20,24) KS X 1001
 둥근 고딕 R/B PCF (12,14,16,18,20,24)  KS X 1001

다음 표는 ko.UTF-8 로켈용 한국어 비트맵 글꼴을 보여줍니다.

표 4–17 ko.UTF-8 로켈용 Solaris 9 한국어 비트맵 글꼴

전체 패밀리 이름 

하위 패밀리 

형식 

코드화 

 고딕 R/B PCF (12,14,16,18,20,24)KS X 1001 (조합)
 그래픽 R/B PCF (12,14,16,18,20,24)KS X 1001 (조합)
 해서 R/B PCF (12,14,16,18,20,24)KS X 1001 (조합)
 고딕 R/B PCF (12,14,16,18,20,24)KS X 1001 (조합)
 명조 R/B PCF (12,14,16,18,20,24) KS X 1001 (조합)
 필기 R/B PCF (12,14,16,18,20,24)KS X 1001 (조합)

다음 표는 ko/ko.UTF-8 로켈용 한국어 트루 타입 글꼴을 보여줍니다.

표 4–18 ko/ko.UTF-8 로켈용 Solaris 9 한국어 트루 타입 글꼴

전체 패밀리 이름 

하위 패밀리 

형식 

판매자 

코드화 

고딕 

트루 타입 

한양 

유니 코드 

명조 

트루 타입 

한양 

유니 코드 

해서 

트루 타입 

한양 

유니 코드 

둥근 고딕 

트루 타입 

한양 

유니 코드 

다음 표는 한국어 iconv를 보여줍니다.

표 4–19 한국어 iconv

코드 

기호 

대상 코드 

기호 

IBM CP933cp933

UTF-8 (유니코드 2.0)

ko_KR-UTF-8
ISO646646

KS X 1001

5601
ISO2022-KRiso2022-7

KS X 1001

ko_KR-euc
ISO2022-KRiso2022-7

UTF-8 (유니코드 2.0)

ko_KR-UTF-8
KS X 10015601

UTF-8

UTF-8
KS X 1001EUC-KR

UTF-8

UTF-8
KS X 1001KSC5601

UTF-8

UTF-8
KS X 1001ko_KR-euc

UTF-8 (유니코드 2.0)

ko_KR-UTF-8
KS X 1001ko_KR-euc

ISO2022-KR

ko_KR-iso2022-7
KS X 1001ko_KR-euc

KS X 1001

ko_KR-johap
KS X 1001ko_KR-euc

KS X 1001

ko_KR-johap92
KS X 1001ko_KR-euc

KS X 1001

ko_KR-nbyte
KS X 1001ko-KR-nbyte

KS X 1001

ko_KR-euc
KS X 1001ko-KR-johap

UTF-8 (유니코드 2.0)

ko_KR-UTF-8
KS X 1001ko-KR-johap

KS X 1001

ko_KR-euc
KS X 1001ko-KR-johap92

UTF-8 (유니코드 2.0)

ko_KR-UTF-8
KS X 1001ko-KR-johap92

KS X 1001

ko_KR-euc
UTF-8 UTF-8

KS X 1001

5601
UTF-8 UTF-8

KS X 1001

EUC-KR
UTF-8 UTF-8

KS X 1001

KSC5601
UTF-8 ko-KR-UTF-8

IBM CP 933

cp 933
UTF-8 ko-KR-UTF-8

KS X 1001

ko_KR-euc
UTF-8 ko-KR-UTF-8

ISO2022-KR

ko_KR-iso2022-7
UTF-8 ko-KR-UTF-8

KS X 1001

ko_KR-johap
UTF-8 ko-KR-UTF-8

KS X 1001

ko_KR-johap92