国際化対応言語環境の利用ガイド

第 4 章 サポートされるアジアのロケール

この章では、サポートされるアジアのロケールについて説明します。

サポートされるアジアのロケール

次の表に、サポートされるアジアのロケールの要約を示します。

表 4–1 アジア向けロケールの要約

言語 

ロケール名 

説明 

サポート文字集合 

韓国語 

ko

ko.UTF-8

韓国語 (EUC) 

韓国語 (UTF-8)  

KS X 1001 

KS X 1005–1 

 

 

 

 

簡体字中国語 

zh_CN.EUC

zh_CN.GBK

zh_CN.GB18030

zh_CN.UTF-8

簡体字中国語 (EUC)  

簡体字中国語 (GBK)  

簡体字中国語 (GB18030–2000) 

簡体字中国語 (UTF-8)  

GB 2312-1980 

GBK 

GB18030–2000 

Unicode 3.1 

 

 

 

 

繁体字中国語 

zh_TW.EUC

zh_TW.UTF-8

zh_TW.BIG5

zh_HK.BIG5HK

zh_HK.UTF—8

繁体字中国語 (EUC)  

繁体字中国語 (UTF-8)  

繁体字中国語 (BIG5) 

繁体字中国語 (BIG5+HKSCS) 

繁体字中国語 (UTF-8)  

CNS 11643 –1992 

Unicode 3.1 

BIG5  

BIG5+HKSCS 

Unicode 3.1  

日本語 

ja

ja_JP.eucJP

ja_JP.PCK

ja_JP.UTF-8

日本語 (EUC) 

日本語 (EUC) 

日本語 (PCK) 

日本語 (UTF-8) 

JIS [JIS X 0201-1976, JIS X 0208-1990 および JIS X 0212-1990]

JIS1

JIS [ JIS X 0201–1976 および JIS X 0208–1990]

Unicode3.1 

タイ 

th_TH.TIS620

th_TH.UTF-8

th_TH.ISO8859-11

タイ語 (TIS620.2533) 

タイ語 (UTF-8) 

Thai(ISO8859-11)

TIS620.2533 

Unicode 3.1 

ISO8859-11

ヒンディー語 

hi_IN.UTF-8

ヒンディー語 (UTF-8)  

Unicode 3.1 

簡体字中国語と繁体字中国語の入力方式補助ウィンドウのサポート

このウィンドウは、すべての中国語ユーザーが使用できる拡張可能な使いやすい入力方式管理ツールです。新しい入力方式補助ウィンドウでは、次の新しい機能とユーティリティがサポートされます。

詳細については、『Simplified Chinese User's Guide』と『Traditional Chinese User's Guide』を参照してください。

入力方式補助ウィンドウでは、すべての UTF-8 ロケールと次の中国語ロケールがサポートされます。

2 種類の入力方式がサポートされています。

補助ウィンドウサポートのインタフェースモデルは、次の図で表されます。

図 4–1 補助ウィンドウサポートのインタフェースモデル

Graphic

タイ語の地域対応

タイ語の文字シーケンスチェック方式のレベルは、タイの IT 標準に従って次の 3 つがあります。

  1. パススルーレベル (入力チェックなし)

  2. 基本入力チェックレベル

  3. 詳細入力チェックレベル

Solaris 9 リリースのデフォルトの入力チェックレベルはパススルーレベルです。 したがって、シーケンスチェックは行われません。これは、それ以前の Solaris リリースと同じレベルです。F2 機能キーを使用して、これらのレベルを切り替えることができます。

パススルー -> 基本 -> 詳細 -> パススルー

タイ語入力方式の補助ウィンドウ

タイ語入力方式補助ウィンドウでは、次の新しい機能とユーティリティがサポートされます。

特定のタイ語入力レベルおよび入力チェックレベルを選択するには、補助ウィンドウの入力レベルボタンをクリックします。タイ語仮想キーボードを表示するには、キーボードボタンをクリックします。タイ語仮想キーボードではタイ文字を入力します。

簡体字中国語の地域対応

Solaris 9 環境の簡体字中国語ロケールには、zhzh.GBKzh_CN.GB18030zh.UTF-8 があります。 zh ロケールでは、EUC スキーマを使って、GB2312-80 を符号化します。zh.GBK ロケールは、BG2312-80 のスーパーセットである GBK コードセットをサポートします。

zh_CN.GB18030 ロケールは、新しい GB18030–2000 コードセットをサポートします。

簡体字中国語は主に、中華人民共和国およびシンガポールで使用されています。

zh ロケールには次の入力方式がサポートされています。

zh_CN.GB18030 ロケールには次の入力方式がサポートされています。

zh.GBK および zh.UTF-8 ロケールには次の入力方式がサポートされています。

中国語入力方式の補助ウィンドウは、どの中国語ロケールでも使用できる拡張可能な使い易い入力方式ユーザーインタフェースです。詳細については、簡体字中国語と繁体字中国語の入力方式補助ウィンドウのサポートを参照してください。

中国語用の補助ウィンドウについては、『Simplified Chinese User's Guide』と『Traditional Chinese User's Guide』を参照してください。

次の表に、zh ロケールの TrueType フォントを示します。

表 4–2 zh_CN.EUC ロケールの TrueType フォント

完全なファミリ名 

サブファミリ 

形式 

ベンダー 

エンコーディング 

 Fangsong R TrueType Hanyi GB2312.1980
 Hei R TrueType Monotype GB2312.1980
 Kai R TrueType Monotype GB2312.1980
 Song R TrueType Monotype GB2312.1980

次の表に、zh ロケールのビットマップフォントを示します。

表 4–3 zh_CN.EUC ロケールのビットマップフォント

全ファミリ名 

サブファミリ 

形式 

エンコーディング 

 Song B PCF (14,16) GB2312.1980
 Song R PCF (12,14,16,20,24) GB2312.1980

次の表に、zh_CN.GBK ロケールの TrueType フォントを示します。

表 4–4 zh_CN.GBK ロケールの TrueType フォント

全ファミリ名 

サブファミリ 

形式 

ベンダー 

エンコーディング 

 Fangsong R TrueType Zhongyi  GBK
 Hei R TrueType Zhongyi GBK
 Kai R TrueType Zhongyi GBK
 Song R TrueType Zhongyi GBK

次の表に、zh_CN.GBK ロケールのビットマップフォントを示します。

表 4–5 zh_CN.GBK ロケールのビットマップフォント

全ファミリ名 

サブファミリ 

形式 

エンコーディング 

 Song R PCF (12,14,16,20,24) GBK

次の表に、zh_CN.GB18030 ロケールの TrueType フォントを示します。

表 4–6 zh_CN.GB18030 ロケールの TrueType フォント

ファミリ名 

サブファミリ 

形式 

ベンダー 

エンコーディング 

FangSong 

TrueType 

FangZheng 

GB18030–2000 

Song 

TrueType 

FangZheng 

GB18030–2000 

Hei 

TrueType 

FangZheng 

GB18030–2000 

Kai 

TrueType 

FangZheng 

GB18030–2000 

次の表に、zh_CN.GB18030 ロケールビットマップフォントを示します。

表 4–7 zh_CN.GB18030 ロケールのビットマップフォント

ファミリ名 

サブファミリ 

形式 

エンコーディング 

Song 

PCF(12,14,16,20,24) 

GB18030–2000 

次の表に、簡体字中国語でサポートされるコードセットの変換を示します。

表 4–8 簡体字中国語のコードセットの変換

コード 

シンボル 

ターゲットコード 

シンボル 

GB2312-80

zh_CN.euc

ISO 2022-7

zh_CN.iso2022-7

GB2312-80

zh_CN.euc

ISO 2022-CN

zh_CN.iso2022-CN

GB2312-80

zh_CN.euc

UTF-8

UTF-8

GB18030

zh_CN.gb18030

UTF-8

UTF-8

HZ-GB-2312

HZ-GB-2312

GB2312–80

zh_CN.euc

HZ-GB-2312

HZ-GB-2312

GBK

zh_CN.gbk

HZ-GB-2312

HZ-GB-2312

UTF-8

UTF-8

ISO2022-7

zh_CN.iso2022-7

GB2312-80

zh_CN.euc

ISO2022-CN

zh_CN.iso2022-CN

GB2312-80

zh_CN.euc

ISO2022-CN

zh_CN.iso2022-CN

UTF-8

UTF-8

ISO2022-CN

zh_CN.iso2022-CN

zh.GBK

zh_CN.gbk

UTF-8

UTF-8

GB2312-80

zh_CN.euc

UTF-8

UTF-8

GB18030

zh_CN.gb18030

UTF-8

UTF-8

ISO2022-CN

zh_CN.iso2022-CN

UTF-8

UTF-8

zh.GBK

zh_CN.gbk

zh.GBK

zh_CN.gbk

ISO2022-CN

zh_CN.iso2022-CN

zh.GBK

zh_CN.gbk

UTF-8

UTF-8

繁体字中国語の地域対応

Solaris 9 製品の繁体字中国語には、次の 5 つのロケールがあります。

繁体字中国語は主に、台湾と香港で使用されています。次の入力方式は zh_TW.EUCzh_TW.BIG5zh_TW.UTF-8 ロケールでサポートされます。

次の入力方式は zh_HK.BIG5HKzh_HK.UTF-8 ロケールでサポートされます。

次の表に、zh_TW ロケールの繁体字中国語 TrueType フォントを示します。

表 4–9 zh_TW ロケールの繁体字中国語 TrueType フォント

完全なファミリ名 

サブファミリ 

形式 

ベンダー 

エンコーディング 

 Hei R TrueType Hanyi CNS11643.1992
 Kai R TrueType Hanyi CNS11643.1992
 Ming R TrueType Hanyi CNS11643.1992

次の表に、 zh_TW ロケールの繁体字中国語ビットマップフォントを示します。

表 4–10 zh_TW ロケールの繁体字中国語ビットマップフォント

全ファミリ名 

サブファミリ 

形式 

エンコーディング 

 Ming R PCF (12,14,16,20,24) CNS11643.1992

次の表に、zh_HK.BIG5HK ロケールの TrueType フォントを示します。

表 4–11 zh_HK.BIG5HK ロケールの TrueType フォント

完全なファミリ名 

サブファミリ 

形式 

ベンダー 

エンコーディング 

Ming 

TrueType 

FangZheng 

Big5–HKSCS 

Hei 

TrueType 

FangZheng 

Big5–HKSCS 

Kai 

TrueType 

FangZheng 

Big5–HKSCS 

次の表に、zh_HK.BIG5HK ロケールのビットマップフォントを示します。

表 4–12 zh_HK.BIG5HK ロケールのビットマップフォント

ファミリ名 

サブファミリ 

形式 

エンコーディング 

Ming 

PCF(12,14,16,20,24) 

Big5–HKSCS 

次の表に、繁体字中国語でサポートされるコードセットの変換を示します。

表 4–13 繁体字中国語のコードセットの変換

コード 

シンボル 

ターゲットコード 

シンボル 

BIG5

zh_TW-big5

CNS 11643

zh_TW-euc

BIG5

zh_TW-big5

ISO2022–CN

zh_TW-iso2022–CN-EXT

BIG5

zh_TW-big5

UTF-8

UTF-8

BIG5+HKSCS

zh_HK.big5hk

UTF-8

UTF-8

CNS 11643

zh_TW-euc

BIG5

zh_TW-big5

CNS 11643

zh_TW-euc

UTF-8

UTF-8

CNS 11643

zh_TW-euc

ISO2022-7

zh_TW-iso2022-7

CNS 11643

zh_TW-euc

ISO2022-CN-EXT

zh_TW-iso2022-CN-EXT

CNS 11643

zh_TW-euc

UTF-8

UTF-8

ISO2022-7

zh_TW-iso2022-7

CNS 11643

zh_TW-euc

ISO2022-7

zh_TW-iso2022-7

UTF-8

UTF-8

ISO2022-CN

zh_TW-iso2022-CN-EXT

BIG5

zh_TW-big5

ISO2022-CN-EXT

zh_TW-iso2022-CN-EXT

CNS 11643

zh_TW-euc

UTF-8

UTF-8

BIG5

zh_TW-big5

UTF-8

UTF-8

BIG5+HKSCS

zh_HK.big5hk

UTF-8

UTF-8

CNS 11643

zh_TW-euc

UTF-8

UTF-8

ISO 2022-7

zh_TW-iso2022-7

日本語の地域対応

この節では、日本語ロケール固有の情報について説明します。

日本語ロケール

Solaris 9 環境では、異なる文字エンコーディングをサポートする 4 種類の日本語ロケールを使用できます。jaja_JP.eucJP ロケールは日本語 EUC に基づいています。 ja_JP.eucJP ロケールの仕様は UI-OSF 日本語環境実装規約バージョン 1.1 に、ja ロケールは以前の Solaris リリースで採用されてきた仕様にそれぞれ準拠しています。ja_JP.PCK ロケールは、Shift_JIS として知られている PC-Kanji コードに基づいています。ja_JP.UTF-8 は、UTF-8 に基づいています。

日本語 EUC とその文字集合間の対応付けについては、eucJP(5) のマニュアルページを、PC-Kanji コードとその文字集合間の対応付けについては、PCK(5) のマニュアルページをそれぞれ参照してください。

日本語文字集合

サポートされている日本語文字集合は以下の通りです。

JIS X 0212–1990 は ja_JP.PCK ロケールではサポートされていません。JIS X 0213–2000 は ja_JP.UTF-8 ロケールでのみサポートされています。JIS X 0213–2000 で定義されているすべての文字が使用可能であるとは限りません。使用できるのは、Unicode 3.1 文字集合に定義されている文字だけです。

日本語フォント

ビットマップおよび TrueType 形式の日本語フォントがあり、ベンダー定義文字も含まれています。また、印刷用に TrueType 1 形式の JIS X 0212 フォントもあります。

次の表に、日本語ビットマップフォントを示します。

表 4–14 日本語ビットマップフォント

完全なファミリ名 

サブファミリ 

形式 

ベンダー 

エンコーディング 

sun gothic

R、B 

PCF(12,14,16,20,24) 

 

JIS X 0208–1983、 

JIS X 0201–1976 

sun minchou

PCF(12,14,16,20,24) 

 

JIS X 0208–1983、 

JIS X 0201–1976 

ricoh hg gothic b

PCF(10,12,14,16,18,20,24) 

RICOH 

JIS X 0208–1983、JIS X 0201–1976 

ricoh hg mincho l

PCF(10,12,14,16,18,20,24) 

RICOH 

JIS X 0208–1983、JIS X 0201–1976 

ricoh gothic

PCF(10,12,14,16,18,20,24) 

RICOH  

JIS X 0212–1990、JIS X 0213–2000 

ricoh mincho

PCF(10,12,14,16,18,20,24) 

RICOH  

JIS X 0212–1990、JIS X 0213–2000 

ricoh heiseimin

PCF(12,14,16,18,20,24) 

RICOH 

JIS X 0212–1990 

次の表に、日本語 True Type フォントを示します。

表 4–15 日本語 TrueType フォント

全ファミリ名 

サブファミリ 

形式 

ベンダー 

エンコーディング 

ricoh hg gothic b

固定幅 

TrueType 

RICOH 

JIS X 0208–1983、JIS X 0201–1976 

ricoh hg mincho l

固定幅 

TrueType 

RICOH 

JIS X 0208–1983、JIS X 0201–1976 

ricoh gothic

固定幅、プロポーショナル 

TrueType 

RICOH 

JIS X 0201–1976、JIS X 0208–1983、JIS X 0213–2000 

ricoh mincho

固定幅、プロポーショナル 

TrueType 

RICOH 

JIS X 0201–1976、JIS X 0208–1983、JIS X 0213–2000 

ricoh heiseimin

固定幅 

TrueType 

RICOH 

JIS X 0212–1990  

日本語入力方式

Solaris 9 環境のデフォルト入力方式は ATOK12 です。日本語ロケールがインストールされていれば、日本語ロケールとすべての UTF-8 ロケールでこの入力方式が使用できます。その他、Wnn6 日本語入力方式がすべての日本語ロケールで使用できます。入力方式の切り替えはワークスペースメニューから行うことができます。日本語 Solaris 1.x 互換モードでは、kkcv 日本語入力方式が使用できます。

たとえば、ATOK12 を使って日本語を入力するには次のようにします。

  1. Control + Space キーを押して変換モードをオンにします。

  2. かな文字のテキストを入力します (たとえば、kanjihenkan)。

  3. Space キーを押して漢字に変換します。

    別の漢字を表示する場合は、スペースキーを押して変換候補テーブルを表示し、選択したい番号を入力します。

  4. テキスト全体を漢字文字のテキストとして確定するには、Return キーを押します。

    変換中の文字だけを確定する場合は、下矢印キーを押します。

  5. Control + Space キーを押して変換モードをオフにします。

日本語端末用の端末設定

日本語ロケールを文字ベース端末 (TTY) で使うには、端末設定を使って、行編集作業を適切に実行する必要があります。

日本語 iconv モジュール

いくつかの日本語コードセット変換が iconv(1)iconv(3) でサポートされています。詳細については、iconv_ja(5) のマニュアルページを参照してください。

ユーザー定義文字のサポート

ユーザー定義文字ユーティリティ sdtudctool は、アウトラインフォント (Type1) とビットマップフォント (PCF) を両方ともサポートします。 また、以前のリリースにあった、fontedittype3creatorfontmanager のような古いユーティリティによって作成された UDC フォントを移行するために、いくつかのユーティリティを利用できます。

部分ロケールと完全ロケールの違い

次のコンポーネントは、LANGUAGES CD を使用した日本語完全ロケール環境でのみ使用できます。

韓国語の地域対応

1995 年 12 月に韓国政府は、標準韓国語コードセットの KS X 1005–1 を発表しました。このコードセットは、ISO 10646-1/Unicode 2.0 に基づいています。

ISO-10646 文字セットでは、次の 2 つのユニバーサル文字セットが使用されています。

ISO-10646 文字セットは、直接 IBM-PC ベースのオペレーティングシステムで使用することはできません。たとえば、Solaris 環境のカーネルおよびその他の多くのモジュールは、文字列内の null 文字 (0x00) など、特定のバイトを制御命令として解釈します。ISO-10646 文字セットは、最初のバイトまたは後続のバイトで、任意のビットの組み合わせでエンコードできます。ISO-10646 文字は、上記の制限のため、Solaris システムで自由に転送することはできません。

移行を容易にするために、ISO-10646 文字を、C0 制御文字 (0x00..0x1F)、C1 制御文字 (0x80..0x9F)、空白 (0x20)、DEL (0x7F) を使用せずに再コード化する、UCS Transformation Format (UTF) を定義しています。

ko.UTF-8 は、韓国語標準コードセット KS X 1005–1 をサポートする Solaris のロケールです。このロケールは、以前の KS X 1005 のすべての文字を含む 11,172 の韓国語の文字をサポートします。韓国語の UTF-8 は、韓国語関連の ISO-10646 文字およびフォントをサポートします。ISO-10646 は世界中の文字に対応しているので、あらゆる言語のすべての文字を入力および出力するために、さまざまな入力方式やフォントが提供されています。Universal UTF/UCS が普及するまでは、韓国語 UTF-8 は韓国語の文字に関連する ISO-10646 コードのサブセットと、以前の韓国語標準コードセットおよび拡張 ASCII のすべての文字をサポートします。

ko ロケールでは、EUC を使って KS X 1001 をエンコードします。ko.UTF-8 ロケールは、KS X 1001 のスーパーセットである KS X 1005–1/Unicode 2.0 コードセットをサポートします。これら 2 つのロケールは、エンドユーザーには同じように見えますが、内部の文字エンコーディングが異なっています。Solaris は次の入力方式をサポートします。

ko ロケール用

ko.UTF-8 ロケール用

次の表に、ko ロケールの韓国語ビットマップフォントを示します。

表 4–16 ko ロケールの Solaris 9 (韓国語版) ビットマップフォント

完全なファミリ名 

サブファミリ 

形式 

エンコーディング 

 Gothic  R/B PCF (12,14,16,18,20,24) KS X 1001
 Graphic  R/B PCF (12,14,16,18,20,24) KS X 1001
 Haeso  R/B PCF (12,14,16,18,20,24) KS X 1001
 Kodig  R/B PCF (12,14,16,18,20,24) KS X 1001
 Myeongijo R/B PCF (12,14,16,18,20,24) KS X 1001
 Pilki  R/B PCF (12,14,16,18,20,24) KS X 1001
 Round gothic R/B PCF (12,14,16,18,20,24) KS X 1001

次の表に、 ko.UTF-8 ロケールの韓国語ビットマップフォントを示します。

表 4–17 ko.UTF-8 ロケールの Solaris 9 (韓国語版) ビットマップフォント

完全なファミリ名 

サブファミリ 

形式 

エンコーディング 

 Gothic  R/B PCF (12,14,16,18,20,24)KS X 1001 (Johap)
 Graphic  R/B PCF (12,14,16,18,20,24)KS X 1001 (Johap)
 Haeso  R/B PCF (12,14,16,18,20,24)KS X 1001 (Johap)
 Kodig  R/B PCF (12,14,16,18,20,24)KS X 1001 (Johap)
 Myeongijo R/B PCF (12,14,16,18,20,24)KS X 1001 (Johap)
 Pilki  R/B PCF (12,14,16,18,20,24)KS X 1001 (Johap)

次の表に、 ko/ko.UTF-8 ロケールの韓国語 TrueType フォントを示します。

表 4–18 ko/ko.UTF-8 ロケール用の Solaris 9 韓国語 TrueType フォント

完全なファミリ名 

サブファミリ 

表記形式 

ベンダー 

エンコーディング 

Kodig/Gothic 

TrueType 

Hanyang 

Unicode 

Myeongijo 

TrueType 

Hanyang 

Unicode  

Haeso 

TrueType 

Hanyang 

Unicode  

Round gothic 

TrueType 

Hanyang 

Unicode 

次の表に韓国語の iconv を示します。

表 4–19 韓国語 iconv

コード 

シンボル 

ターゲットコード 

シンボル 

IBM CP933cp933

UTF-8 (Unicode 2.0)

ko_KR-UTF-8
ISO646646

KS X 1001

5601
ISO2022-KRiso2022-7

KS X 1001

ko_KR-euc
ISO2022-KRiso2022-7

UTF-8 (Unicode 2.0)

ko_KR-UTF-8
KS X 10015601

UTF-8

UTF-8
KS X 1001EUC-KR

UTF-8

UTF-8
KS X 1001KSC5601

UTF-8

UTF-8
KS X 1001ko_KR-euc

UTF-8 (Unicode 2.0)

ko_KR-UTF-8
KS X 1001ko_KR-euc

ISO2022-KR

ko_KR-iso2022-7
KS X 1001ko_KR-euc

KS X 1001

ko_KR-johap
KS X 1001ko_KR-euc

KS X 1001

ko_KR-johap92
KS X 1001ko_KR-euc

KS X 1001

ko_KR-nbyte
KS X 1001ko-KR-nbyte

KS X 1001

ko_KR-euc
KS X 1001ko-KR-johap

UTF-8 (Unicode 2.0)

ko_KR-UTF-8
KS X 1001ko-KR-johap

KS X 1001

ko_KR-euc
KS X 1001ko-KR-johap92

UTF-8 (Unicode 2.0)

ko_KR-UTF-8
KS X 1001ko-KR-johap92

KS X 1001

ko_KR-euc
UTF-8 UTF-8

KS X 1001

5601
UTF-8 UTF-8

KS X 1001

EUC-KR
UTF-8 UTF-8

KS X 1001

KSC5601
UTF-8 ko-KR-UTF-8

IBM CP 933

cp 933
UTF-8 ko-KR-UTF-8

KS X 1001

ko_KR-euc
UTF-8 ko-KR-UTF-8

ISO2022-KR

ko_KR-iso2022-7
UTF-8 ko-KR-UTF-8

KS X 1001

ko_KR-johap
UTF-8 ko-KR-UTF-8

KS X 1001

ko_KR-johap92