国际语言环境指南

朝鲜语本地化

1995 年 12 月,韩国政府公布了标准朝鲜语代码集 KS X 1005–1,它基于 ISO 10646-1/Unicode 2.0。

ISO-10646 字符集使用了两种通用字符集:

ISO-10646 字符集不能直接在基于 IBM PC 的操作系统上使用。例如,Solaris 操作环境的内核和许多其它模块将某些字节值翻译为控制指令,如所有字符串中的空字符 (0x00)。ISO-10646 字符集可以使用第一个或随后字节中的任何位组合进行编码。在存在这些限制的情况下,ISO-10646 字符不能在 Solaris 系统中自由传输。

为了建立迁移路径,ISO-10646 字符集定义了 UCS 变换格式 (UTF),它无须使用 C0 控制 (0x00..0x1F)、C1 控制 (0x80..0x9F)、空格 (0x20) 和 DEL (0x7F) 即可对 ISO-10646 字符进行重新编码。

ko.UTF-8 是一个用以支持朝鲜语标准代码集 KS X 1005–1 的 Solaris 语言环境。该语言环境支持以前的 KS X 1005 中的所有字符和全部 11172 个朝鲜语字符。朝鲜语 UTF-8 支持与朝鲜语相关的 ISO-10646 字符和字体。由于 ISO-10646 包括了世界上的所有字符,因而提供了所有的各式各样的输入法和字体,以便您可以输入和输出任何语言的任何字符。在可以使用通用的 UTF/UCS 之前,朝鲜语 UTF-8 支持与朝鲜语字符以及以前的朝鲜语标准代码集中的所有其它字符有关的 ISO-10646 代码子集,并支持扩展 ASCII。

ko 语言环境中,EUC 方案用于对 KS X 1001 进行编码。 ko.UTF-8 语言环境支持 KS X 1005–1/Unicode 3.1 代码集,它是 KS X 1001 的超集。 这两种语言环境在最终用户看来是一样的,但它们的内部字符编码并不相同。朝鲜语 Solaris 产品支持下列输入法:

对于 ko 语言环境:

对于 ko.UTF-8 语言环境:

下表显示 ko 语言环境的朝鲜语位图字体。

表 4–16 ko 语言环境的 Solaris 9 朝鲜语位图字体

完整系列名 

子系列 

格式 

编码 

 Gothic R/B PCF (12,14,16,18,20,24) KS X 1001
 Graphic R/B PCF (12,14,16,18,20,24) KS X 1001
 Haeso R/B PCF (12,14,16,18,20,24) KS X 1001
 Kodig R/B PCF (12,14,16,18,20,24) KS X 1001
 Myeongijo R/B PCF (12,14,16,18,20,24)  KS X 1001
 Pilki R/B PCF (12,14,16,18,20,24) KS X 1001
 Round gothic R/B PCF (12,14,16,18,20,24)  KS X 1001

下表显示 ko.UTF-8 语言环境的朝鲜语位图字体。

表 4–17 ko.UTF-8 语言环境的 Solaris 9 朝鲜语位图字体

完整系列名 

子系列 

格式 

编码 

 Gothic R/B PCF (12,14,16,18,20,24)KS X 1001 (Johap)
 Graphic R/B PCF (12,14,16,18,20,24)KS X 1001 (Johap)
 Haeso R/B PCF (12,14,16,18,20,24)KS X 1001 (Johap)
 Kodig R/B PCF (12,14,16,18,20,24)KS X 1001 (Johap)
 Myeongijo R/B PCF (12,14,16,18,20,24) KS X 1001 (Johap)
 Pilki R/B PCF (12,14,16,18,20,24)KS X 1001 (Johap)

下表显示 ko/ko.UTF-8 语言环境的朝鲜语 TrueType 字体。

表 4–18 ko/ko.UTF-8 语言环境的 Solaris 9 朝鲜语 TrueType 字体

完整系列名 

子系列 

格式 

供应商  

编码  

Kodig/Gothic 

TrueType 

Hanyang 

Unicode 

Myeongijo 

TrueType 

Hanyang 

Unicode  

Haeso 

TrueType 

Hanyang 

Unicode  

Round gothic 

TrueType 

Hanyang 

Unicode 

下表显示朝鲜语 iconv

表 4–19 朝鲜语 iconv

代码 

符号 

目标代码 

符号 

IBM CP933cp933

UTF-8 (Unicode 2.0)

ko_KR-UTF-8
ISO646646

KS X 1001

5601
ISO2022-KRiso2022-7

KS X 1001

ko_KR-euc
ISO2022-KRiso2022-7

UTF-8 (Unicode 2.0)

ko_KR-UTF-8
KS X 10015601

UTF-8

UTF-8
KS X 1001EUC-KR

UTF-8

UTF-8
KS X 1001KSC5601

UTF-8

UTF-8
KS X 1001ko_KR-euc

UTF-8 (Unicode 2.0)

ko_KR-UTF-8
KS X 1001ko_KR-euc

ISO2022-KR

ko_KR-iso2022-7
KS X 1001ko_KR-euc

KS X 1001

ko_KR-johap
KS X 1001ko_KR-euc

KS X 1001

ko_KR-johap92
KS X 1001ko_KR-euc

KS X 1001

ko_KR-nbyte
KS X 1001ko-KR-nbyte

KS X 1001

ko_KR-euc
KS X 1001ko-KR-johap

UTF-8 (Unicode 2.0)

ko_KR-UTF-8
KS X 1001ko-KR-johap

KS X 1001

ko_KR-euc
KS X 1001ko-KR-johap92

UTF-8 (Unicode 2.0)

ko_KR-UTF-8
KS X 1001ko-KR-johap92

KS X 1001

ko_KR-euc
UTF-8 UTF-8

KS X 1001

5601
UTF-8 UTF-8

KS X 1001

EUC-KR
UTF-8 UTF-8

KS X 1001

KSC5601
UTF-8 ko-KR-UTF-8

IBM CP 933

cp 933
UTF-8 ko-KR-UTF-8

KS X 1001

ko_KR-euc
UTF-8 ko-KR-UTF-8

ISO2022-KR

ko_KR-iso2022-7
UTF-8 ko-KR-UTF-8

KS X 1001

ko_KR-johap
UTF-8 ko-KR-UTF-8

KS X 1001

ko_KR-johap92