1995 年 12 月,韩国政府公布了标准朝鲜语代码集 KS X 1005–1,它基于 ISO 10646-1/Unicode 2.0。
ISO-10646 字符集使用了两种通用字符集:
UCS-2。通用字符集(双字节形式)
UCS-4。通用字符集(四字节形式)
ISO-10646 字符集不能直接在基于 IBM PC 的操作系统上使用。例如,Solaris 操作环境的内核和许多其它模块将某些字节值翻译为控制指令,如所有字符串中的空字符 (0x00)。ISO-10646 字符集可以使用第一个或随后字节中的任何位组合进行编码。在存在这些限制的情况下,ISO-10646 字符不能在 Solaris 系统中自由传输。
为了建立迁移路径,ISO-10646 字符集定义了 UCS 变换格式 (UTF),它无须使用 C0 控制 (0x00..0x1F)、C1 控制 (0x80..0x9F)、空格 (0x20) 和 DEL (0x7F) 即可对 ISO-10646 字符进行重新编码。
ko.UTF-8 是一个用以支持朝鲜语标准代码集 KS X 1005–1 的 Solaris 语言环境。该语言环境支持以前的 KS X 1005 中的所有字符和全部 11172 个朝鲜语字符。朝鲜语 UTF-8 支持与朝鲜语相关的 ISO-10646 字符和字体。由于 ISO-10646 包括了世界上的所有字符,因而提供了所有的各式各样的输入法和字体,以便您可以输入和输出任何语言的任何字符。在可以使用通用的 UTF/UCS 之前,朝鲜语 UTF-8 支持与朝鲜语字符以及以前的朝鲜语标准代码集中的所有其它字符有关的 ISO-10646 代码子集,并支持扩展 ASCII。
在 ko 语言环境中,EUC 方案用于对 KS X 1001 进行编码。 ko.UTF-8 语言环境支持 KS X 1005–1/Unicode 3.1 代码集,它是 KS X 1001 的超集。 这两种语言环境在最终用户看来是一样的,但它们的内部字符编码并不相同。朝鲜语 Solaris 产品支持下列输入法:
对于 ko 语言环境:
朝鲜语文字 2–BeolSik(一个辅音集和一个元音集)
朝鲜语文字/朝鲜语汉字转换
特殊字符
十六进制代码
对于 ko.UTF-8 语言环境:
朝鲜语文字 2–BeolSik(一个辅音集和一个元音集)
朝鲜语文字/朝鲜语汉字转换
特殊字符
十六进制代码
下表显示 ko 语言环境的朝鲜语位图字体。
表 4–16 ko 语言环境的 Solaris 9 朝鲜语位图字体
完整系列名 |
子系列 |
格式 |
编码 |
---|---|---|---|
Gothic | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
Graphic | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
Haeso | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
Kodig | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
Myeongijo | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
Pilki | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
Round gothic | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
下表显示 ko.UTF-8 语言环境的朝鲜语位图字体。
表 4–17 ko.UTF-8 语言环境的 Solaris 9 朝鲜语位图字体
完整系列名 |
子系列 |
格式 |
编码 |
---|---|---|---|
Gothic | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (Johap) |
Graphic | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (Johap) |
Haeso | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (Johap) |
Kodig | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (Johap) |
Myeongijo | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (Johap) |
Pilki | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (Johap) |
下表显示 ko/ko.UTF-8 语言环境的朝鲜语 TrueType 字体。
表 4–18 ko/ko.UTF-8 语言环境的 Solaris 9 朝鲜语 TrueType 字体
完整系列名 |
子系列 |
格式 |
供应商 |
编码 |
---|---|---|---|---|
Kodig/Gothic |
R |
TrueType |
Hanyang |
Unicode |
Myeongijo |
R |
TrueType |
Hanyang |
Unicode |
Haeso |
R |
TrueType |
Hanyang |
Unicode |
Round gothic |
R |
TrueType |
Hanyang |
Unicode |
下表显示朝鲜语 iconv。
表 4–19 朝鲜语 iconv
代码 |
符号 |
目标代码 |
符号 |
---|---|---|---|
IBM CP933 | cp933 |
UTF-8 (Unicode 2.0) | ko_KR-UTF-8 |
ISO646 | 646 |
KS X 1001 | 5601 |
ISO2022-KR | iso2022-7 |
KS X 1001 | ko_KR-euc |
ISO2022-KR | iso2022-7 |
UTF-8 (Unicode 2.0) | ko_KR-UTF-8 |
KS X 1001 | 5601 |
UTF-8 | UTF-8 |
KS X 1001 | EUC-KR |
UTF-8 | UTF-8 |
KS X 1001 | KSC5601 |
UTF-8 | UTF-8 |
KS X 1001 | ko_KR-euc |
UTF-8 (Unicode 2.0) | ko_KR-UTF-8 |
KS X 1001 | ko_KR-euc |
ISO2022-KR | ko_KR-iso2022-7 |
KS X 1001 | ko_KR-euc |
KS X 1001 | ko_KR-johap |
KS X 1001 | ko_KR-euc |
KS X 1001 | ko_KR-johap92 |
KS X 1001 | ko_KR-euc |
KS X 1001 | ko_KR-nbyte |
KS X 1001 | ko-KR-nbyte |
KS X 1001 | ko_KR-euc |
KS X 1001 | ko-KR-johap |
UTF-8 (Unicode 2.0) | ko_KR-UTF-8 |
KS X 1001 | ko-KR-johap |
KS X 1001 | ko_KR-euc |
KS X 1001 | ko-KR-johap92 |
UTF-8 (Unicode 2.0) | ko_KR-UTF-8 |
KS X 1001 | ko-KR-johap92 |
KS X 1001 | ko_KR-euc |
UTF-8 | UTF-8 |
KS X 1001 | 5601 |
UTF-8 | UTF-8 |
KS X 1001 | EUC-KR |
UTF-8 | UTF-8 |
KS X 1001 | KSC5601 |
UTF-8 | ko-KR-UTF-8 |
IBM CP 933 | cp 933 |
UTF-8 | ko-KR-UTF-8 |
KS X 1001 | ko_KR-euc |
UTF-8 | ko-KR-UTF-8 |
ISO2022-KR | ko_KR-iso2022-7 |
UTF-8 | ko-KR-UTF-8 |
KS X 1001 | ko_KR-johap |
UTF-8 | ko-KR-UTF-8 |
KS X 1001 | ko_KR-johap92 |