国際化対応言語環境の利用ガイド

韓国語の地域対応

1995 年 12 月に韓国政府は、標準韓国語コードセットの KS C 5700 を発表しました。このコードセットは、ISO 10646-1/Unicode 2.0 に基づいています。

この ISO-10646 文字セットは、2 種類の (USC-2) を使います。それぞれの文字を表示するための、2 バイト形式の汎用文字セットまたは 4(USC-4) バイトです。

ISO-10646 文字セットは、直接 IBM-PC ベースのオペレーティングシステムで使用することはできません。たとえば、Solaris 環境のカーネルおよびその他の多くのモジュールは、文字列内の null 文字 (0x00) など、特定のバイトを制御命令として解釈します。ISO-10646 文字セットは、最初のバイトまたは後続のバイトで、任意のビットの組み合わせでエンコードできます。ISO-10646 文字は、上記の制限のため、Solaris システムで自由に転送することはできません。移行を容易にするために、ISO-10646 文字を、C0 制御文字 (0x00..0x1F)、C1 制御文字 (0x80..0x9F)、空白 (0x20)、DEL (0x7F) を使用せずに再コード化する、UCS Transformation Format (UTF) を定義しています。

ko.UTF-8 は、韓国語標準コードセット KSC-5700 をサポートする Solaris のロケールです。このロケールは、以前の KSC-5601 のすべての文字を含む 11,172 の韓国語の文字をサポートします。韓国語の UTF-8 は、韓国語関連の ISO-10646 文字およびフォントのみサポートします。ISO-10646 は世界中のすべての文字に対応しているので、すべての言語のすべての文字を入力および出力するために、さまざまな入力メソッドやフォントがすべて提供されています。Universal UTF/UCS が普及するまでは、韓国語 UTF-8 は韓国語の文字に関連する ISO-10646 コードのサブセットと、以前の韓国語標準コードセットおよび拡張 ASCII のすべての文字をサポートします。

ko ロケールでは、EUC を使って KSC 5601-1987 をエンコードします。ko.UTF-8 ロケールは、KSC 5601-1987 のスーパーセットである、KSC 5700-1995/Unicode 2.0 コードセットをサポートしています。これら 2 つのロケールは、エンドユーザーには同じように見えますが、内部の文字エンコーディングが異なっています。Solaris (韓国語版) は次の入力メソッドをサポートしています。

ko ロケール用

ko.UTF-8 ロケール用

表 3-30 ko ロケールの Solaris 8 (韓国語版) CID/Type 1 フォント
 完全なファミリ名 サブファミリ 形式 ベンダー エンコーディング
 Gothic R CID/Type 1 Hanyang Adobe-Korean
 Graphic R CID/Type 1 Hanyang Adobe-Korean
 Haeso R CID/Type 1 Hanyang Adobe-Korean
 Kodig R CID/Type 1 Hanyang Adobe-Korean
 Myeongijo R CID/Type 1 Hanyang Adobe-Korean
 Pilki R CID/Type 1 Hanyang Adobe-Korean
 Roundgothic R CID/Type 1 Hanyang Adobe-Korean

表 3-31 ko ロケールの Solaris 8 (韓国語版) ビットマップフォント
 完全なファミリ名 サブファミリ 形式 エンコーディング
 Gothic R/B PCF (12,14,16,18,20,24) KSC 5601-1987
 Graphic R/B PCF (12,14,16,18,20,24) KSC 5601-1987
 Haeso R/B PCF (12,14,16,18,20,24) KSC 5601-1987
 Kodig R/B PCF (12,14,16,18,20,24) KSC 5601-1987
 Myeongijo R/B PCF (12,14,16,18,20,24) KSC 5601-1987
 Pilki R/B PCF (12,14,16,18,20,24) KSC 5601-1987
 Roundgothic R/B PCF (12,14,16,18,20,24) KSC 5601-1987

表 3-32 ko.UTF-8 ロケールの Solaris 8 (韓国語版) CID/Type 1 フォント
 完全なファミリ名 サブファミリ 形式 ベンダー エンコーディング
 Gothic R CID/Type 1 Hanyang Adobe-Korean
 Graphic R CID/Type 1 Hanyang Adobe-Korean
 Haeso R CID/Type 1 Hanyang Adobe-Korean
 Kodig R CID/Type 1 Hanyang Adobe-Korean
 Myeongijo R CID/Type 1 Hanyang Adobe-Korean
 Pilki R CID/Type 1 Hanyang Adobe-Korean

表 3-33 ko.UTF-8 ロケールの Solaris 8 (韓国語版) ビットマップフォント
 完全なファミリ名 サブファミリ 形式 エンコーディング
 Gothic R/B PCF (12,14,16,18,20,24) KSC 5601-1992 (Johap)
 Graphic R/B PCF (12,14,16,18,20,24) KSC 5601-1992 (Johap)
 Haeso R/B PCF (12,14,16,18,20,24) KSC 5601-1992 (Johap)
 Kodig R/B PCF (12,14,16,18,20,24) KSC 5601-1992 (Johap)
 Myeongijo R/B PCF (12,14,16,18,20,24) KSC 5601-1992 (Johap)
 Pilki R/B PCF (12,14,16,18,20,24) KSC 5601-1992 (Johap)

表 3-34 ko/ko.UTF-8 ロケール用の Solaris 8 韓国語 TrueType フォント

全ファミリ名 

サブファミリ 

形式 

ベンダー 

コード化 

Kodig/Gothic 

True Type 

Hanyang 

Unicode 

Myeongjo 

True Type 

Hanyang 

Unicode 

Haeso 

True Type 

Hanyang 

Unicode 

RoundGothic 

True Type 

Hanyang 

Unicode 

表 3-35 韓国語 ICONV
 コード シンボル ターゲットコード シンボル
 KSC 5601-1987 1506 UTF-8 UTF-8
 ISO 646 646 KSC 5601-1987 5601
 KSC 5601-1987 EUC-KR UTF-8 UTF-8
 KSC 5601-1987 KSC5601 UTF-8 UTF-8
 UTF-8 UTF-8 KSC 5601-1987 5601
 UTF-8 UTF-8 KSC 5601-1987 EUC-KR
 UTF-8 UTF-8 KSC 5601-1987 KSC 5601
 UTF-8 ko-KR-UTF-8 IBM CP 933 cp 933
 UTF-8 ko-KR-UTF-8 KSC 5601-1987 ko_KR-euc
 UTF-8 ko-KR-UTF-8 ISO2022-KR ko_KR-iso2022-7
 UTF-8 ko-KR-UTF-8 KSC 5601-1987 - Johap ko_KR-johap
 UTF-8 ko-KR-UTF-8 KSC5601-1992 - Johap ko_KR-johap92
 IBM CP933 cp933 UTF-8 ko_KR-UTF-8
 KSC 5601-1987 ko_KR-euc UTF-8 ko_KR-UTF-8
 KSC 5601-1987 ko_KR-euc ISO 2022-KR ko_KR-iso2022-7
 KSC 5601-1987 ko_KR-euc KSC 5601-1987 - Johap ko_KR-johap
 KSC 5601-1987 ko_KR-euc KSC 5601-1992 - Johap ko_KR-johap92
 KSC 5601-1987 ko_KR-euc KSC 5601-1992-Annex:4 ko_KR-nbyte
 ISO 2022-KR iso2022-7 UTF-8 ko_KR-UTF-8
 ISO 2022-KR iso2022-7 KSC 5601-1987 ko_KR-euc
 KSC 5601-1987 - Johap ko-KR-johap UTF-8 ko_KR-UTF-8
 KSC 5601-1987 - Johap ko-KR-johap KSC 5601-1987 ko_KR-euc
 KSC 5601-1992 - Johap ko-KR-johap92 UTF-8 ko_KR-UTF-8
 KSC 5601-1992 - Johap ko-KR-johap92 KSC 5601-1987 ko_KR-euc
 KSC 5601-1992 - Annex:4 ko-KR-nbyte KSC 5601-1987 ko_KR-euc