國際語言環境指南

韓文本土化

韓國政府在 1995 年 12 月 頒布了標準韓文字碼集 KS X 1005–1,它是以 ISO 10646-1/Unicode 2.0 為基礎的字碼集。

該 ISO-10646 字元集使用兩種通用字元集:

該 ISO-10646 字元集不能直接用在以 IBM PC 為基礎的作業系統上。例如,kernel 和 Solaris 作業環境中的其他模組會將某些位元值解譯成控制指令,例如任何字串中的空字元 (0x00)。可以利用第一個或之後的位元組合進行 ISO-10646 字元集的編碼。在這些限制因素下,ISO-10646 字元便無法任意地在 Solaris 系統中傳送。

為了轉換路徑的建立,ISO-10646 字元集會定義 UCS 變換格式 (UTF),它不要 C0 控制 (0x00..0x1F)、C1 控制 (0x80..0x9F)、空間 (0x20),和 DEL (0x7F) 就可以重新編碼 ISO-10646 字元。

ko.UTF-8 為可支援 KS X 1005–1 (韓文標準字碼集) 的 Solaris 語言環境。此語言環境可支援上一個 KS X 1005 中的所有字元和所有 11,172 韓文字元。韓文 UTF-8 支援韓語相關的 ISO-10646 字元與字型。由於 ISO-10646 涵蓋世界上的所有字元,並提供各種輸入法和字型,所以您可以輸入和輸出任何語言的字元。在能夠使用通用 UTF/UCS 之前,韓文UTF-8 可支援與韓文字元和上一個韓文標準字碼集中的字元,以及擴充的 ASCII 相關的ISO-10646 字碼子集。

ko 語言環境中, EUC 機制是用來進行 KS X 1001 的編碼。該ko.UTF-8語言環境支援 KS X 1005–1/Unicode 2.0 字碼集,其為 KS X 1001 的超集合。這兩個語言環境外觀與一般使用者相同,但內部字元編碼並不相同。韓文 Solaris 產品支援下列輸入法:

針對ko語言環境:

針對ko.UTF-8語言環境:

下表顯示 ko 語言環境的韓文點陣圖字型。

表 4–16 ko語言環境的 Solaris 9 韓文點陣圖字型

完整家族名稱 

子家族 

格式  

編碼 

 哥德語  R/B  PCF (12,14,16,18,20,24)  KS X 1001
 圖形  R/B  PCF (12,14,16,18,20,24)  KS X 1001
 Haeso   R/B  PCF (12,14,16,18,20,24)  KS X 1001
 Kodig   R/B  PCF (12,14,16,18,20,24)  KS X 1001
 Myeongijo  R/B  PCF (12,14,16,18,20,24)  KS X 1001
 Pilki   R/B PCF (12,14,16,18,20,24) KS X 1001
 圓形哥德式 R/B  PCF (12,14,16,18,20,24)  KS X 1001

下表顯示了 ko.UTF-8 語言環境的韓文點陣圖字型。

表 4–17 ko.UTF-8 語言環境的 Solaris 韓文點陣圖字型

完整家族名稱 

子家族 

格式  

編碼 

 哥德語  R/B  PCF (12,14,16,18,20,24) KS X 1001 (Johap)
 圖形  R/B  PCF (12,14,16,18,20,24) KS X 1001 (Johap)
 Haeso   R/B PCF (12,14,16,18,20,24)KS X 1001 (Johap)
 Kodig  R/B PCF (12,14,16,18,20,24)KS X 1001 (Johap)
 Myeongijo R/B PCF (12,14,16,18,20,24) KS X 1001 (Johap)
 Pilki  R/B PCF (12,14,16,18,20,24)KS X 1001 (Johap)

下表顯示了 ko/ko.UTF-8 語言環境的韓文 TrueType 字型。

表 4–18 ko/ko.UTF-8語言環境的 Solaris 9 韓文 TrueType 字型

完整家族名稱 

子家族 

格式 

供應商 

編碼 

Kodig/Gothic 

TrueType 

Hanyang 

Unicode 

Myeongijo  

R  

TrueType 

Hanyang  

Unicode  

Haeso  

R  

TrueType  

Hanyang 

Unicode  

圓形哥德式 

R  

TrueType  

Hanyang  

Unicode  

下列表格顯示韓文iconv

表 4–19 韓文iconv

字碼 

符號 

目標碼  

符號 

IBM CP933cp933

UTF-8(Unicode 2.0)

ko_KR-UTF-8
ISO646646

KS X 1001

5601
ISO2022-KR iso2022-7

KS X 1001

ko_KR-euc
ISO2022-KR iso2022-7

UTF-8 (Unicode 2.0)

ko_KR-UTF-8
KS X 1001 5601

UTF-8

UTF-8
KS X 1001 EUC-KR

UTF-8

UTF-8
KS X 1001 KSC5601

UTF-8

UTF-8
KS X 1001 ko_KR-euc

UTF-8 (Unicode 2.0)

ko_KR-UTF-8
KS X 1001 ko_KR-euc

ISO2022-KR

ko_KR-iso2022-7
KS X 1001 ko_KR-euc

KS X 1001

ko_KR-johap
KS X 1001 ko_KR-euc

KS X 1001

ko_KR-johap92
KS X 1001 ko_KR-euc

KS X 1001

ko_KR-nbyte
KS X 1001 ko-KR-nbyte

KS X 1001

ko_KR-euc
KS X 1001 ko-KR-johap

UTF-8 (Unicode 2.0)

ko_KR-UTF-8
KS X 1001 ko-KR-johap

KS X 1001

ko_KR-euc
KS X 1001 ko-KR-johap92

UTF-8 (Unicode 2.0)

ko_KR-UTF-8
KS X 1001 ko-KR-johap92

KS X 1001

ko_KR-euc
UTF-8 UTF-8

KS X 1001

5601
UTF-8 UTF-8

KS X 1001

EUC-KR
UTF-8 UTF-8

KS X 1001

KSC5601
UTF-8 ko-KR-UTF-8

IBM CP 933

cp 933
UTF-8 ko-KR-UTF-8

KS X 1001

ko_KR-euc
UTF-8 ko-KR-UTF-8

ISO2022-KR

ko_KR-iso2022-7
UTF-8 ko-KR-UTF-8

KS X 1001

ko_KR-johap
UTF-8 ko-KR-UTF-8

KS X 1001

ko_KR-johap92