1995 年 12 月に韓国政府は、標準韓国語コードセットの KS X 1005–1 を発表しました。このコードセットは、ISO 10646-1/Unicode 2.0 に基づいています。
ISO-10646 文字セットでは、次の 2 つのユニバーサル文字セットが使用されています。
UCS-2 – ユニバーサル文字セット (2 バイト形式)
UCS-4 – ユニバーサル文字セット (4 バイト形式)
ISO-10646 文字セットは、直接 IBM-PC ベースのオペレーティングシステムで使用することはできません。たとえば、Solaris 環境のカーネルおよびその他の多くのモジュールは、文字列内の null 文字 (0x00) など、特定のバイトを制御命令として解釈します。ISO-10646 文字セットは、最初のバイトまたは後続のバイトで、任意のビットの組み合わせでエンコードできます。ISO-10646 文字は、上記の制限のため、Solaris システムで自由に転送することはできません。
移行を容易にするために、ISO-10646 文字を、C0 制御文字 (0x00..0x1F)、C1 制御文字 (0x80..0x9F)、空白 (0x20)、DEL (0x7F) を使用せずに再コード化する、UCS Transformation Format (UTF) を定義しています。
ko.UTF-8 は、韓国語標準コードセット KS X 1005–1 をサポートする Solaris のロケールです。このロケールは、以前の KS X 1005 のすべての文字を含む 11,172 の韓国語の文字をサポートします。韓国語の UTF-8 は、韓国語関連の ISO-10646 文字およびフォントをサポートします。ISO-10646 は世界中の文字に対応しているので、あらゆる言語のすべての文字を入力および出力するために、さまざまな入力方式やフォントが提供されています。Universal UTF/UCS が普及するまでは、韓国語 UTF-8 は韓国語の文字に関連する ISO-10646 コードのサブセットと、以前の韓国語標準コードセットおよび拡張 ASCII のすべての文字をサポートします。
ko ロケールでは、EUC を使って KS X 1001 をエンコードします。ko.UTF-8 ロケールは、KS X 1001 のスーパーセットである KS X 1005–1/Unicode 2.0 コードセットをサポートします。これら 2 つのロケールは、エンドユーザーには同じように見えますが、内部の文字エンコーディングが異なっています。Solaris は次の入力方式をサポートします。
ko ロケール用
ハングル 2-BeolSik (子音と母音の各 1 セット)
ハングル - ハンジャ変換
特殊文字
16 進コード
ko.UTF-8 ロケール用
ハングル 2-BeolSik (子音と母音の各 1 セット)
ハングル - ハンジャ変換
特殊文字
16 進コード
次の表に、ko ロケールの韓国語ビットマップフォントを示します。
表 4–16 ko ロケールの Solaris 9 (韓国語版) ビットマップフォント
完全なファミリ名 |
サブファミリ |
形式 |
エンコーディング |
---|---|---|---|
Gothic | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
Graphic | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
Haeso | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
Kodig | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
Myeongijo | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
Pilki | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
Round gothic | R/B | PCF (12,14,16,18,20,24) | KS X 1001 |
次の表に、 ko.UTF-8 ロケールの韓国語ビットマップフォントを示します。
表 4–17 ko.UTF-8 ロケールの Solaris 9 (韓国語版) ビットマップフォント
完全なファミリ名 |
サブファミリ |
形式 |
エンコーディング |
---|---|---|---|
Gothic | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (Johap) |
Graphic | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (Johap) |
Haeso | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (Johap) |
Kodig | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (Johap) |
Myeongijo | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (Johap) |
Pilki | R/B | PCF (12,14,16,18,20,24) | KS X 1001 (Johap) |
次の表に、 ko/ko.UTF-8 ロケールの韓国語 TrueType フォントを示します。
表 4–18 ko/ko.UTF-8 ロケール用の Solaris 9 韓国語 TrueType フォント
完全なファミリ名 |
サブファミリ |
表記形式 |
ベンダー |
エンコーディング |
---|---|---|---|---|
Kodig/Gothic |
R |
TrueType |
Hanyang |
Unicode |
Myeongijo |
R |
TrueType |
Hanyang |
Unicode |
Haeso |
R |
TrueType |
Hanyang |
Unicode |
Round gothic |
R |
TrueType |
Hanyang |
Unicode |
次の表に韓国語の iconv を示します。
表 4–19 韓国語 iconv
コード |
シンボル |
ターゲットコード |
シンボル |
---|---|---|---|
IBM CP933 | cp933 |
UTF-8 (Unicode 2.0) | ko_KR-UTF-8 |
ISO646 | 646 |
KS X 1001 | 5601 |
ISO2022-KR | iso2022-7 |
KS X 1001 | ko_KR-euc |
ISO2022-KR | iso2022-7 |
UTF-8 (Unicode 2.0) | ko_KR-UTF-8 |
KS X 1001 | 5601 |
UTF-8 | UTF-8 |
KS X 1001 | EUC-KR |
UTF-8 | UTF-8 |
KS X 1001 | KSC5601 |
UTF-8 | UTF-8 |
KS X 1001 | ko_KR-euc |
UTF-8 (Unicode 2.0) | ko_KR-UTF-8 |
KS X 1001 | ko_KR-euc |
ISO2022-KR | ko_KR-iso2022-7 |
KS X 1001 | ko_KR-euc |
KS X 1001 | ko_KR-johap |
KS X 1001 | ko_KR-euc |
KS X 1001 | ko_KR-johap92 |
KS X 1001 | ko_KR-euc |
KS X 1001 | ko_KR-nbyte |
KS X 1001 | ko-KR-nbyte |
KS X 1001 | ko_KR-euc |
KS X 1001 | ko-KR-johap |
UTF-8 (Unicode 2.0) | ko_KR-UTF-8 |
KS X 1001 | ko-KR-johap |
KS X 1001 | ko_KR-euc |
KS X 1001 | ko-KR-johap92 |
UTF-8 (Unicode 2.0) | ko_KR-UTF-8 |
KS X 1001 | ko-KR-johap92 |
KS X 1001 | ko_KR-euc |
UTF-8 | UTF-8 |
KS X 1001 | 5601 |
UTF-8 | UTF-8 |
KS X 1001 | EUC-KR |
UTF-8 | UTF-8 |
KS X 1001 | KSC5601 |
UTF-8 | ko-KR-UTF-8 |
IBM CP 933 | cp 933 |
UTF-8 | ko-KR-UTF-8 |
KS X 1001 | ko_KR-euc |
UTF-8 | ko-KR-UTF-8 |
ISO2022-KR | ko_KR-iso2022-7 |
UTF-8 | ko-KR-UTF-8 |
KS X 1001 | ko_KR-johap |
UTF-8 | ko-KR-UTF-8 |
KS X 1001 | ko_KR-johap92 |