1995년 12월, 한국 정부는 ISO 10646-1/유니 코드 2.0을 바탕으로 한 표준 한국어 코드 세트인, KS X 1005–1을 발표했습니다.
ISO-10646 문자 세트는 두 가지 공통 문자 세트를 사용합니다:
UCS-2. 범용 문자 세트 (2바이트 형식)
UCS-4. 범용 문자 세트 (4바이트 형식)
ISO-10646 문자 세트는 IBM PC 기반 운영 체제에서 직접 사용할 수 없습니다. 예를 들어, Solaris 운영 환경의 커널과 기타 많은 모듈들은 특정 바이트 값들을 문자열의 널 문자 (0x00)와 같은 제어 명령으로 해석합니다. ISO-10646 문자 세트는 첫 번째 또는 두 번째 바이트에서 어떤 비트 조합으로든 코드화할 수 있습니다. ISO-10646 문자는 이러한 제한을 갖고 있는 Solaris 시스템에서 자유롭게 전송할 수 없습니다.
이전 경로를 확립하기 위해 ISO-10646 문자 세트는 C0 제어문자(0x00..0x1F), C1 제어문자(0x80..0x9F), 공백문자(0x20), DEL(0x7F)을 사용하지 않고서 이 ISO-10646 문자들을 다시 코드화하는 UCS 변환 형식(UTF)을 정의합니다.
ko.UTF-8은 한국어 표준 코드 세트인 KS X 1005–1을 지원하는 Solaris 로켈입니다. 이 로켈은 이전 KS X 1005 및 모두 11,172 개 한국어 문자를 지원합니다. 한국어 UTF-8은 한국어 관련 ISO-10646 문자 및 글꼴을 지원합니다. ISO-10646은 전 세계 모든 문자들을 다루기 때문에 어떤 언어든 문자에 관계 없이 입력 및 출력을 할 수 있도록 다양한 입력 방식와 글꼴들이 제공됩니다. 범용 UTF/UCS를 사용할 수 있게 되기 전까지는 한국어 UTF-8이 이전 한국어 표준 코드 세트 및 확장된 ASCII뿐 아니라 한국어 문자와 관련된 ISO-10646 코드 일부를 지원합니다.
ko 로켈에서는 EUC 체계를 사용해 KS X 1001을 코드화합니다. ko.UTF-8 로켈은 KS X 1001의 수퍼 세트인 KS X 1005–1/유니 코드 2.0 코드 세트를 지원합니다. 이 두 가지 로켈은 최종 사용자가 보기에는 동일한 것으로 보이지만 내부 문자 코드화는 서로 다릅니다. 한국어 Solaris 제품은 다음 입력 방식를 지원합니다:
ko 로켈의 경우
한글 2–벌식 (자음과 모음 각 한 세트)
한글-한자 변환
특수 문자
16진수 코드
ko.UTF-8 로켈의 경우
한글 2–벌식 (자음과 모음 각 한 세트)
한글-한자 변환
특수 문자
16진수 코드
다음 표는 ko 로켈용 한국어 비트맵 글꼴을 보여줍니다.
표 4–16 ko 로켈용 Solaris 9 한국어 비트맵 글꼴
전체 패밀리 이름 |
하위 패밀리 |
형식 |
코드화 |
---|---|---|---|
고딕 | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
그래픽 | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
해서 | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
고딕 | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
명조 | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
필기 | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
둥근 고딕 | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
다음 표는 ko.UTF-8 로켈용 한국어 비트맵 글꼴을 보여줍니다.
표 4–17 ko.UTF-8 로켈용 Solaris 9 한국어 비트맵 글꼴
전체 패밀리 이름 |
하위 패밀리 |
형식 |
코드화 |
---|---|---|---|
고딕 | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (조합) |
그래픽 | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (조합) |
해서 | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (조합) |
고딕 | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (조합) |
명조 | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (조합) |
필기 | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (조합) |
다음 표는 ko/ko.UTF-8 로켈용 한국어 트루 타입 글꼴을 보여줍니다.
표 4–18 ko/ko.UTF-8 로켈용 Solaris 9 한국어 트루 타입 글꼴
전체 패밀리 이름 |
하위 패밀리 |
형식 |
판매자 |
코드화 |
---|---|---|---|---|
고딕 |
R |
트루 타입 |
한양 |
유니 코드 |
명조 |
R |
트루 타입 |
한양 |
유니 코드 |
해서 |
R |
트루 타입 |
한양 |
유니 코드 |
둥근 고딕 |
R |
트루 타입 |
한양 |
유니 코드 |
다음 표는 한국어 iconv를 보여줍니다.
표 4–19 한국어 iconv
코드 |
기호 |
대상 코드 |
기호 |
---|---|---|---|
IBM CP933 | cp933 |
UTF-8 (유니코드 2.0) | ko_KR-UTF-8 |
ISO646 | 646 |
KS X 1001 | 5601 |
ISO2022-KR | iso2022-7 |
KS X 1001 | ko_KR-euc |
ISO2022-KR | iso2022-7 |
UTF-8 (유니코드 2.0) | ko_KR-UTF-8 |
KS X 1001 | 5601 |
UTF-8 | UTF-8 |
KS X 1001 | EUC-KR |
UTF-8 | UTF-8 |
KS X 1001 | KSC5601 |
UTF-8 | UTF-8 |
KS X 1001 | ko_KR-euc |
UTF-8 (유니코드 2.0) | ko_KR-UTF-8 |
KS X 1001 | ko_KR-euc |
ISO2022-KR | ko_KR-iso2022-7 |
KS X 1001 | ko_KR-euc |
KS X 1001 | ko_KR-johap |
KS X 1001 | ko_KR-euc |
KS X 1001 | ko_KR-johap92 |
KS X 1001 | ko_KR-euc |
KS X 1001 | ko_KR-nbyte |
KS X 1001 | ko-KR-nbyte |
KS X 1001 | ko_KR-euc |
KS X 1001 | ko-KR-johap |
UTF-8 (유니코드 2.0) | ko_KR-UTF-8 |
KS X 1001 | ko-KR-johap |
KS X 1001 | ko_KR-euc |
KS X 1001 | ko-KR-johap92 |
UTF-8 (유니코드 2.0) | ko_KR-UTF-8 |
KS X 1001 | ko-KR-johap92 |
KS X 1001 | ko_KR-euc |
UTF-8 | UTF-8 |
KS X 1001 | 5601 |
UTF-8 | UTF-8 |
KS X 1001 | EUC-KR |
UTF-8 | UTF-8 |
KS X 1001 | KSC5601 |
UTF-8 | ko-KR-UTF-8 |
IBM CP 933 | cp 933 |
UTF-8 | ko-KR-UTF-8 |
KS X 1001 | ko_KR-euc |
UTF-8 | ko-KR-UTF-8 |
ISO2022-KR | ko_KR-iso2022-7 |
UTF-8 | ko-KR-UTF-8 |
KS X 1001 | ko_KR-johap |
UTF-8 | ko-KR-UTF-8 |
KS X 1001 | ko_KR-johap92 |