韓國政府在 1995 年 12 月 頒布了標準韓文字碼集 KS X 1005–1,它是以 ISO 10646-1/Unicode 2.0 為基礎的字碼集。
該 ISO-10646 字元集使用兩種通用字元集:
UCS-2。通用字元集(雙位元組格式)
UCS-4。通用字元集(四位元組格式)
該 ISO-10646 字元集不能直接用在以 IBM PC 為基礎的作業系統上。例如,kernel 和 Solaris 作業環境中的其他模組會將某些位元值解譯成控制指令,例如任何字串中的空字元 (0x00)。可以利用第一個或之後的位元組合進行 ISO-10646 字元集的編碼。在這些限制因素下,ISO-10646 字元便無法任意地在 Solaris 系統中傳送。
為了轉換路徑的建立,ISO-10646 字元集會定義 UCS 變換格式 (UTF),它不要 C0 控制 (0x00..0x1F)、C1 控制 (0x80..0x9F)、空間 (0x20),和 DEL (0x7F) 就可以重新編碼 ISO-10646 字元。
ko.UTF-8 為可支援 KS X 1005–1 (韓文標準字碼集) 的 Solaris 語言環境。此語言環境可支援上一個 KS X 1005 中的所有字元和所有 11,172 韓文字元。韓文 UTF-8 支援韓語相關的 ISO-10646 字元與字型。由於 ISO-10646 涵蓋世界上的所有字元,並提供各種輸入法和字型,所以您可以輸入和輸出任何語言的字元。在能夠使用通用 UTF/UCS 之前,韓文UTF-8 可支援與韓文字元和上一個韓文標準字碼集中的字元,以及擴充的 ASCII 相關的ISO-10646 字碼子集。
在 ko 語言環境中, EUC 機制是用來進行 KS X 1001 的編碼。該ko.UTF-8語言環境支援 KS X 1005–1/Unicode 2.0 字碼集,其為 KS X 1001 的超集合。這兩個語言環境外觀與一般使用者相同,但內部字元編碼並不相同。韓文 Solaris 產品支援下列輸入法:
針對ko語言環境:
Hangul 2–BeolSik(一組子音與一組母音)
Hangul-Hanja 轉換
特殊字元
十六進制字碼
針對ko.UTF-8語言環境:
Hangul 2–BeolSik (一組子音和一組母音)
Hangul-Hanja 轉換
特殊字元
十六進制碼
下表顯示 ko 語言環境的韓文點陣圖字型。
表 4–16 ko語言環境的 Solaris 9 韓文點陣圖字型
完整家族名稱 |
子家族 |
格式 |
編碼 |
---|---|---|---|
哥德語 | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
圖形 | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
Haeso | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
Kodig | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
Myeongijo | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
Pilki | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
圓形哥德式 | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
下表顯示了 ko.UTF-8 語言環境的韓文點陣圖字型。
表 4–17 ko.UTF-8 語言環境的 Solaris 韓文點陣圖字型
完整家族名稱 |
子家族 |
格式 |
編碼 |
---|---|---|---|
哥德語 | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (Johap) |
圖形 | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (Johap) |
Haeso | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (Johap) |
Kodig | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (Johap) |
Myeongijo | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (Johap) |
Pilki | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (Johap) |
下表顯示了 ko/ko.UTF-8 語言環境的韓文 TrueType 字型。
表 4–18 ko/ko.UTF-8語言環境的 Solaris 9 韓文 TrueType 字型
完整家族名稱 |
子家族 |
格式 |
供應商 |
編碼 |
---|---|---|---|---|
Kodig/Gothic |
R |
TrueType |
Hanyang |
Unicode |
Myeongijo |
R |
TrueType |
Hanyang |
Unicode |
Haeso |
R |
TrueType |
Hanyang |
Unicode |
圓形哥德式 |
R |
TrueType |
Hanyang |
Unicode |
下列表格顯示韓文iconv。
表 4–19 韓文iconv
字碼 |
符號 |
目標碼 |
符號 |
---|---|---|---|
IBM CP933 | cp933 |
UTF-8(Unicode 2.0) | ko_KR-UTF-8 |
ISO646 | 646 |
KS X 1001 | 5601 |
ISO2022-KR | iso2022-7 |
KS X 1001 | ko_KR-euc |
ISO2022-KR | iso2022-7 |
UTF-8 (Unicode 2.0) | ko_KR-UTF-8 |
KS X 1001 | 5601 |
UTF-8 | UTF-8 |
KS X 1001 | EUC-KR |
UTF-8 | UTF-8 |
KS X 1001 | KSC5601 |
UTF-8 | UTF-8 |
KS X 1001 | ko_KR-euc |
UTF-8 (Unicode 2.0) | ko_KR-UTF-8 |
KS X 1001 | ko_KR-euc |
ISO2022-KR | ko_KR-iso2022-7 |
KS X 1001 | ko_KR-euc |
KS X 1001 | ko_KR-johap |
KS X 1001 | ko_KR-euc |
KS X 1001 | ko_KR-johap92 |
KS X 1001 | ko_KR-euc |
KS X 1001 | ko_KR-nbyte |
KS X 1001 | ko-KR-nbyte |
KS X 1001 | ko_KR-euc |
KS X 1001 | ko-KR-johap |
UTF-8 (Unicode 2.0) | ko_KR-UTF-8 |
KS X 1001 | ko-KR-johap |
KS X 1001 | ko_KR-euc |
KS X 1001 | ko-KR-johap92 |
UTF-8 (Unicode 2.0) | ko_KR-UTF-8 |
KS X 1001 | ko-KR-johap92 |
KS X 1001 | ko_KR-euc |
UTF-8 | UTF-8 |
KS X 1001 | 5601 |
UTF-8 | UTF-8 |
KS X 1001 | EUC-KR |
UTF-8 | UTF-8 |
KS X 1001 | KSC5601 |
UTF-8 | ko-KR-UTF-8 |
IBM CP 933 | cp 933 |
UTF-8 | ko-KR-UTF-8 |
KS X 1001 | ko_KR-euc |
UTF-8 | ko-KR-UTF-8 |
ISO2022-KR | ko_KR-iso2022-7 |
UTF-8 | ko-KR-UTF-8 |
KS X 1001 | ko_KR-johap |
UTF-8 | ko-KR-UTF-8 |
KS X 1001 | ko_KR-johap92 |