1995 年 12 月に韓国政府は、標準韓国語コードセットの KS C 5700 を発表しました。このコードセットは、ISO 10646-1/Unicode 2.0 に基づいています。
この ISO-10646 文字セットは、2 種類の (USC-2) を使います。それぞれの文字を表示するための、2 バイト形式の汎用文字セットまたは 4(USC-4) バイトです。
ISO-10646 文字セットは、直接 IBM-PC ベースのオペレーティングシステムで使用することはできません。たとえば、Solaris 環境のカーネルおよびその他の多くのモジュールは、文字列内の null 文字 (0x00) など、特定のバイトを制御命令として解釈します。ISO-10646 文字セットは、最初のバイトまたは後続のバイトで、任意のビットの組み合わせでエンコードできます。ISO-10646 文字は、上記の制限のため、Solaris システムで自由に転送することはできません。移行を容易にするために、ISO-10646 文字を、C0 制御文字 (0x00..0x1F)、C1 制御文字 (0x80..0x9F)、空白 (0x20)、DEL (0x7F) を使用せずに再コード化する、UCS Transformation Format (UTF) を定義しています。
ko.UTF-8 は、韓国語標準コードセット KSC-5700 をサポートする Solaris のロケールです。このロケールは、以前の KSC-5601 のすべての文字を含む 11,172 の韓国語の文字をサポートします。韓国語の UTF-8 は、韓国語関連の ISO-10646 文字およびフォントのみサポートします。ISO-10646 は世界中のすべての文字に対応しているので、すべての言語のすべての文字を入力および出力するために、さまざまな入力メソッドやフォントがすべて提供されています。Universal UTF/UCS が普及するまでは、韓国語 UTF-8 は韓国語の文字に関連する ISO-10646 コードのサブセットと、以前の韓国語標準コードセットおよび拡張 ASCII のすべての文字をサポートします。
ko ロケールでは、EUC を使って KSC 5601-1987 をエンコードします。ko.UTF-8 ロケールは、KSC 5601-1987 のスーパーセットである、KSC 5700-1995/Unicode 2.0 コードセットをサポートしています。これら 2 つのロケールは、エンドユーザーには同じように見えますが、内部の文字エンコーディングが異なっています。Solaris (韓国語版) は次の入力メソッドをサポートしています。
ko ロケール用
ハングル 2-BeolSik (子音と母音の各 1 セット)
ハングル - ハンジャ変換
特殊文字
16 進コード
ko.UTF-8 ロケール用
ハングル 2-BeolSik (子音と母音の各 1 セット)
ハングル - ハンジャ変換
特殊文字
16 進コード
完全なファミリ名 | サブファミリ | 形式 | ベンダー | エンコーディング |
---|---|---|---|---|
Gothic | R | CID/Type 1 | Hanyang | Adobe-Korean |
Graphic | R | CID/Type 1 | Hanyang | Adobe-Korean |
Haeso | R | CID/Type 1 | Hanyang | Adobe-Korean |
Kodig | R | CID/Type 1 | Hanyang | Adobe-Korean |
Myeongijo | R | CID/Type 1 | Hanyang | Adobe-Korean |
Pilki | R | CID/Type 1 | Hanyang | Adobe-Korean |
Roundgothic | R | CID/Type 1 | Hanyang | Adobe-Korean |
表 3-31 ko ロケールの Solaris 8 (韓国語版) ビットマップフォント
完全なファミリ名 | サブファミリ | 形式 | エンコーディング |
---|---|---|---|
Gothic | R/B | PCF (12,14,16,18,20,24) | KSC 5601-1987 |
Graphic | R/B | PCF (12,14,16,18,20,24) | KSC 5601-1987 |
Haeso | R/B | PCF (12,14,16,18,20,24) | KSC 5601-1987 |
Kodig | R/B | PCF (12,14,16,18,20,24) | KSC 5601-1987 |
Myeongijo | R/B | PCF (12,14,16,18,20,24) | KSC 5601-1987 |
Pilki | R/B | PCF (12,14,16,18,20,24) | KSC 5601-1987 |
Roundgothic | R/B | PCF (12,14,16,18,20,24) | KSC 5601-1987 |
表 3-32 ko.UTF-8 ロケールの Solaris 8 (韓国語版) CID/Type 1 フォント
完全なファミリ名 | サブファミリ | 形式 | ベンダー | エンコーディング |
---|---|---|---|---|
Gothic | R | CID/Type 1 | Hanyang | Adobe-Korean |
Graphic | R | CID/Type 1 | Hanyang | Adobe-Korean |
Haeso | R | CID/Type 1 | Hanyang | Adobe-Korean |
Kodig | R | CID/Type 1 | Hanyang | Adobe-Korean |
Myeongijo | R | CID/Type 1 | Hanyang | Adobe-Korean |
Pilki | R | CID/Type 1 | Hanyang | Adobe-Korean |
表 3-33 ko.UTF-8 ロケールの Solaris 8 (韓国語版) ビットマップフォント
完全なファミリ名 | サブファミリ | 形式 | エンコーディング |
---|---|---|---|
Gothic | R/B | PCF (12,14,16,18,20,24) | KSC 5601-1992 (Johap) |
Graphic | R/B | PCF (12,14,16,18,20,24) | KSC 5601-1992 (Johap) |
Haeso | R/B | PCF (12,14,16,18,20,24) | KSC 5601-1992 (Johap) |
Kodig | R/B | PCF (12,14,16,18,20,24) | KSC 5601-1992 (Johap) |
Myeongijo | R/B | PCF (12,14,16,18,20,24) | KSC 5601-1992 (Johap) |
Pilki | R/B | PCF (12,14,16,18,20,24) | KSC 5601-1992 (Johap) |
表 3-34 ko/ko.UTF-8 ロケール用の Solaris 8 韓国語 TrueType フォント
全ファミリ名 |
サブファミリ |
形式 |
ベンダー |
コード化 |
---|---|---|---|---|
Kodig/Gothic |
R |
True Type |
Hanyang |
Unicode |
Myeongjo |
R |
True Type |
Hanyang |
Unicode |
Haeso |
R |
True Type |
Hanyang |
Unicode |
RoundGothic |
R |
True Type |
Hanyang |
Unicode |
表 3-35 韓国語 ICONV
コード | シンボル | ターゲットコード | シンボル |
---|---|---|---|
KSC 5601-1987 | 1506 | UTF-8 | UTF-8 |
ISO 646 | 646 | KSC 5601-1987 | 5601 |
KSC 5601-1987 | EUC-KR | UTF-8 | UTF-8 |
KSC 5601-1987 | KSC5601 | UTF-8 | UTF-8 |
UTF-8 | UTF-8 | KSC 5601-1987 | 5601 |
UTF-8 | UTF-8 | KSC 5601-1987 | EUC-KR |
UTF-8 | UTF-8 | KSC 5601-1987 | KSC 5601 |
UTF-8 | ko-KR-UTF-8 | IBM CP 933 | cp 933 |
UTF-8 | ko-KR-UTF-8 | KSC 5601-1987 | ko_KR-euc |
UTF-8 | ko-KR-UTF-8 | ISO2022-KR | ko_KR-iso2022-7 |
UTF-8 | ko-KR-UTF-8 | KSC 5601-1987 - Johap | ko_KR-johap |
UTF-8 | ko-KR-UTF-8 | KSC5601-1992 - Johap | ko_KR-johap92 |
IBM CP933 | cp933 | UTF-8 | ko_KR-UTF-8 |
KSC 5601-1987 | ko_KR-euc | UTF-8 | ko_KR-UTF-8 |
KSC 5601-1987 | ko_KR-euc | ISO 2022-KR | ko_KR-iso2022-7 |
KSC 5601-1987 | ko_KR-euc | KSC 5601-1987 - Johap | ko_KR-johap |
KSC 5601-1987 | ko_KR-euc | KSC 5601-1992 - Johap | ko_KR-johap92 |
KSC 5601-1987 | ko_KR-euc | KSC 5601-1992-Annex:4 | ko_KR-nbyte |
ISO 2022-KR | iso2022-7 | UTF-8 | ko_KR-UTF-8 |
ISO 2022-KR | iso2022-7 | KSC 5601-1987 | ko_KR-euc |
KSC 5601-1987 - Johap | ko-KR-johap | UTF-8 | ko_KR-UTF-8 |
KSC 5601-1987 - Johap | ko-KR-johap | KSC 5601-1987 | ko_KR-euc |
KSC 5601-1992 - Johap | ko-KR-johap92 | UTF-8 | ko_KR-UTF-8 |
KSC 5601-1992 - Johap | ko-KR-johap92 | KSC 5601-1987 | ko_KR-euc |
KSC 5601-1992 - Annex:4 | ko-KR-nbyte | KSC 5601-1987 | ko_KR-euc |