プログラミングの国際化

アジアロケールの概要

表 3-5 は、これらのアジア向け製品でサポートされているアジアロケールを示しています。

表 3-5 アジアロケールの概要

CD セット 

ロケール名 

説明 

サポートされる文字セット 

Korean 

ko UTF-8 

韓国語 (UTF-8 ロケール) 

KS C 5601-1992  

KS C 5700-1995 

 

 

 

 

Simplified Chinese 

zh GBK 

中国語簡体字 (GBK) 

中国語簡体字 (GBK) 

GB 2312-1980 

GBK 

 

 

 

 

Traditional Chinese 

zh_TW zh_TW.BIG5 

中国語繁体字 (EUC)  

中国語繁体字 (BIG5) 

CNS 11643 1992 

BIG5 

 

 

 

 

Japanese 

ja  

ja_JP.PCK 

ja_JP.UTF-8 

日本語 EUC 

日本語 PCK [ja_JP.PCK は JIS X 0212-1990 をサポートしません。]

日本語 UTF-8 

JIS x 0201-1976  

JIS x 0208-1990  

JIS x 0212-1990 

VDC [VDC (Vendor Defined Character) は JIS X 0208-1990 または JIS X 0212-1990 の未使用 (予約) のコードポイントに割り当てられます。]

UDC [UDC (User Defined Character) は、JIS X 0208-1990 または JIS X 0212-1990 で未使用 (予約) かつ VDC で未使用のコードポイントに割り当てられます。]

Solaris 7 製品での韓国語

1995 年 12 月、韓国政府は、ISO-10646-1/Unicode 2.0 に基づく標準韓国語コードセット KSC-5700 を発表しました。標準コードセットは、ISO-2022 に基づいていた KSC 5601 に代わるものです。

ISO-10646 文字セットは、2 バイト (UCS-2: Universal Character Set の 2 バイト形式) または 4 バイト (UCS-4) を使用して各文字を表します。

ISO-10646 文字セットは、直接 IBM-PC ベースのオペレーティングシステムで使用することはできません。たとえば、Solaris 環境のカーネルおよびその他の多くのモジュールは、文字列内の null 文字 (0x00) など、特定のバイトを制御命令として解釈します。ISO-10646 文字セットは、最初のバイトまたは後続のバイトで、任意のビットの組み合わせでエンコードできます。ISO-10646 文字は、上記の制限のため、Solaris システムで自由に転送することはできません。移行を容易にするために、ISO-10646 文字を、C0 制御文字 (0x00..0x1F)、C1 制御文字 (0x80..0x9F)、空白 (0x20)、DEL (0x7F) を使用せずに再コード化する、UCS Transformation Format (UTF) を定義しています。

ko.UTF-8 は、韓国語標準コードセット KSC-5700 をサポートする Solaris のロケールです。このロケールは、以前の KSC-5601 のすべての文字を含む 11,172 の韓国語の文字をサポートします。韓国語の UTF-8 は、韓国語関連の ISO-10646 文字およびフォントのみサポートします。ISO-10646 は世界中のすべての文字に対応しているので、すべての言語のすべての文字を入力および出力するために、さまざまな入力メソッドやフォントがすべて提供されています。Universal UTF/UCS が普及するまでは、韓国語 UTF-8 は韓国語の文字に関連する ISO-10646 コードのサブセットと、以前の韓国語標準コードセットおよび拡張 ASCII のすべての文字をサポートします。

表 3-6 に韓国語コードセットのリストを示します。

表 3-6 韓国語の koko.UTF-8 でサポートされるコードセットの変換

コード 

シンボル 

ターゲットコード 

シンボル 

UTF-8

ko_KR-UTF-8 

Wansung 

ko_KR-euc 

UTF-8

ko_KR-UTF-8 

Johap 

ko_KR-johap92 

UTF-8

ko_KR-UTF-8 

Packed 

ko_KR-johap 

UTF-8

ko_KR-UTF-8 

ISO-2022-KR 

ko_KR-iso2022-7 

Wansung

ko_KR-euc 

UTF-8 

ko_KR-UTF-8 

Johap

ko_KR-johap92 

UTF-8 

ko_KR-UTF-8 

Packed

ko_KR-johap 

UTF-8 

ko_KR-UTF-8 

ISO-2022-KR

ko_KR-iso2022-7 

UTF-8 

ko_KR-UTF-8 

Wansung

ko_KR-euc 

Johap 

ko_KR-johap92 

Wansung

ko_KR-euc 

Packed 

ko_KR-johap 

Wansung

ko_KR-euc 

N-Byte 

ko_KR-nbyte 

Wansung

ko_KR-euc 

ISO-2022-KR 

ko_KR-iso2022-7 

Johap

ko_KR-johap92 

Wansung 

ko_KR-euc 

Packed

ko_KR-johap 

Wansung 

ko_KR-euc 

N-Byte

ko_KR-nbyte  

Wansung 

ko_KR-euc 

ISO-2022-KR

ko_KR-iso2022-7 

Wansung 

ko_KR-euc 

中国語: 簡体字および繁体字

Solaris 7 環境には、zh および zh.GBK という、2 つの中国語簡体字用ロケールがあります。zh ロケールでは、EUC スキーマを使って GB2312-80 をエンコードします。zh.GBK ロケールは、BG2312-80 のスーパーセットである GBK コードセットをサポートします。

中国語簡体字は主に、中華人民共和国およびシンガポールで使用されています。

zh ロケールには次の入力メソッドがサポートされています。

zh.GBK ロケールには次の入力メソッドがサポートされています。

表 3-7 に、zh ロケールの TrueType フォントを示します。

表 3-7 zh ロケールの Solaris 7 TrueType フォント
 完全なファミリ名 サブファミリ 形式 ベンダー エンコーディング
 Fangsong R TrueType Hanyi GB2312.1980
 Hei R TrueType Monotype GB2312.1980
 Kai R TrueType Monotype GB2312.1980
 Song R TrueType Monotype GB2312.1980

表 3-8 に、zh ロケールのビットマップフォントを示します。

表 3-8 zh ロケールの Solaris 7 ビットマップフォント
 完全なファミリ名 サブファミリ 形式 エンコーディング
 Song B PCF (14,16) GB2312.1980
 Song R PCF (12,14,16,20,24) GB2312.1980

表 3-9 に、zh.GBK ロケールの TrueType フォントを示します。

表 3-9 zh.GBK ロケールの TrueType フォント
 完全なファミリ名 サブファミリ 形式 ベンダー エンコーディング
 Fansong R TrueType Zhongyi GBK
 Hei R TrueType Zhongyi GBK
 Kai R TrueType Zhongyi GBK
 Song R TrueType Zhongyi GBK

表 3-10 に、zh.GBK ロケールのビットマップフォントを示します。

表 3-10 zh.GBK ロケールのビットマップフォント
 完全なファミリ名 サブファミリ 形式 エンコーディング
 Song R PCF (12,14,16,20,24) GBK

表 3-11 に、中国語簡体字でサポートされるコードセットの変換を示します。

表 3-11 中国語簡体字のコードセットの変換

コード 

シンボル 

ターゲットコード 

シンボル 

GB2312-80

zh_CN.euc 

ISO 2022-7 

zh_CN.iso2022-7 

ISO 2022-7

zh_CN.iso2022-7 

GB2312-80 

zh_CN.euc 

GB2312-80

zh_CN.euc 

ISO 2022-CN 

zh_CN.iso2022-CN 

ISO-2022-CN

zh_CN.iso2022-CN 

GB2312-80 

zh_CN.euc 

UTF-8

UTF-8 

GB2312-80 

zh_CN.euc 

GB2312-80

zh_CN.euc 

UTF-8 

UTF-8 

zh.GBK

zh_CN.gbk 

ISO2022-CN 

zh_CN.iso2022-CN 

ISO2022-CN

 zh_CN.iso2022-CN zh.GBK zh_CN.gbk

zh.GBK

zh_CN.gbk 

Big-5 

zh_TW-Big5 

Big-5

zh_TW-Big5 

zh.GBK 

zh_CN.gbk 

GB2312-80

zh_CN.euc 

Big-5 

zh_TW-Big5 

Big-5

 zh_TW-Big5

GB2312-80 

zh_CN.euc 

UTF-8

UTF-8 

 zh.GBK

zh_CN.gbk 

zh.GBK

zh_CN.gbk 

UTF-8 

UTF-8 

UTF-8

UTF-8 

ISO2022-CN 

zh_CN.iso2022-CN 

ISO2022-CN

zh_CN.iso2022-CN 

UTF-8 

UTF-8 

Solaris 7 製品には、zh_TW および zh_TW.BIG5 という、2 つの中国語繁体字用ロケールがあります。zh_TW ロケールでは、EUC スキーマを使って CNS11643.1992 コードセットをエンコードします。zh_TW.BIG5 ロケールは Big-5 コードセットをサポートします。

中国語繁体字は主に、台湾と香港で使用されています。

中国語繁体字は次の入力メソッドをサポートします。

表 3-12 zh_TW ロケールの中国語繁体字 TrueType フォント
 完全なファミリ名 サブファミリ 形式 ベンダー エンコーディング
 Hei R Truetype Hanyi CNS11643.1992
 Kai R Truetype Hanyi CNS11643.1992
 Ming R Truetype Hanyi CNS11643.1992

表 3-13 に、zh_TW ロケールの中国語繁体字ビットマップフォントを示します。

表 3-13 zh_TW ロケールの中国語繁体字ビットマップフォント
 完全なファミリ名 サブファミリ 形式 エンコーディング
 Ming R PCF (12,14,16,20,24) CNS11643.1992

表 3-14 に、zh_TW.BIG5 ロケールの中国語繁体字 TrueType フォントを示します。

表 3-14 zh_TW.BIG5 ロケールの中国語繁体字 TrueType フォント
 完全なファミリ名 サブファミリ 形式 ベンダー エンコーディング
 Hei R TrueType Hanyi Big5
 Kai R TrueType Hanyi Big5
 Ming R TrueType Hanyi Big5

表 3-15 に、zh_TW.BIG5 ロケールの中国語繁体字ビットマップフォントを示します。

表 3-15 zh_TW.BIG5 ロケールの中国語繁体字ビットマップフォント
 完全なファミリ名 サブファミリ 形式 エンコーディング
 Ming R PCF (12,14,16,20,24) Big5

表 3-16 に、中国語繁体字でサポートされるコードセットの変換を示します。

表 3-16 中国語繁体字のコードセットの変換

コード 

シンボル 

ターゲットコード 

シンボル 

CNS 11643

zh_TW-euc 

Big-5  

zh_TW-Big5 

CNS 11643

zh_TW-euc 

ISO 2022-7 

zh_TW-iso2022-7 

Big-5

zh_TW-Big5 

CNS 11643 

zh_TW-euc 

Big-5

zh_TW-Big5 

ISO 2022-7 

zh_TW-iso2022-7 

ISO 2022-7

zh_TW-iso2022-7 

CNS 11643 

zh_TW-euc 

ISO 2022-7

zh_TW-iso2022-7 

Big-5 

zh_TW-Big5 

CNS 11643

zh_TW-eu 

ISO 2022-CN-EXT 

zh_TW-iso2022-CN-EXT 

ISO 2022-CN-EXT

zh_TW-iso2022-CN-EXT 

CNS 11643 

zh_TW-euc 

Big-5

zh_TW-Big5 

ISO 2022-CN 

zh_TW-iso2022-CN 

ISO 2022-CN

zh_TW-iso2022-CN 

Big-5 

zh_TW-Big5 

UTF-8

UTF-8 

CNS 11643 

zh_TW-euc 

CNS 11643

zh_TW-euc 

UTF-8 

UTF-8 

UTF-8

UTF-8 

Big-5 

zh_TW-Big5 

Big-5

zh_TW-Big5 

UTF-8 

UTF-8 

UTF-8

UTF-8 

ISO 2022-7 

zh_TW-iso2022-7 

ISO 2022-7

zh_TW-iso2022-7 

UTF-8 

UTF-8 

ISO 2022-CN-EXT

zh_TW-iso2022-CN-EX 

Big-5 

zh_TW-Big5 

Big-5

zh_TW-Big5 

ISO 2022-CN-EXT 

zh_TW-iso2022-CN-EXT 

日本語入力システム

Solaris 7 (日本語版) には 3 つの日本語入力システムが同梱されています。これらの日本語入力システムは jaja_JP.PCK および ja_JP.UTF-8 の各ロケールで使用できます。ただし、保守ユーティリティによっては PCK コードセットがサポートされていない場合もあります。

表 3-17 に、日本語入力システムを示します。

表 3-17 日本語入力システム

タイプ 

説明 

Wnn6

Wnn6 には、かな漢字変換サーバー (jserver)xjsi.so と呼ばれる htt (X Input Method Server) 用インタフェースモジュール、ユーティリティ、および辞書が含まれています。Wnn6 はデフォルトの日本語入力システムです。

Wnn6 は、JIS X 0201-1976、JIS X 0208-1990 および JIS X 0212-1990 の各文字セットをサポートします。 

ATOK8

ATOK8 は、atok8 X Input Method Server、ユーティリティ、および辞書で構成されます。ATOK は日本の PC 市場で普及している日本語入力システムです。ATOK7 は、Solaris 2.1 以降、ATOK8 を同梱したバージョン 2.5.1 がリリースされるまでのバージョンに同梱されています。

ATOK8 は、JIS X 0201-1976 および JIS X 0208-1990 の各文字セットをサポートします。

cs00

cs00 はかな漢字変換サーバー (cs00)、xci.so と呼ばれる htt (X Input Method Server) 用インタフェースモジュール、ユーティリティ、辞書で構成されます。cs00 は Solaris 2.1 以降の日本語版にバンドルされてきました。

cs00 は、JIS X 0201-1976、JIS X 0208-1990、および JIS X 0212-1990 の各文字セットをサポートします。

表 3-18 に、日本語 TrueType フォントを示します。

表 3-18 日本語 TrueType フォント

完全なファミリ名 

サブファミリ 

形式 

ベンダー 

エンコーディング 

hg gothic b

TrueType 

株式会社リコー (以降RICOHとします) 

JISX0208.1983, JISX0201.1976 

hg mincho l

TrueType 

RICOH 

JISX0208.1983, JISX0201.1976 

heiseimin

TrueType 

RICOH 

JISX0212.1990 

表 3-19 に、日本語ビットマップフォントを示します。

表 3-19 日本語ビットマップフォント

完全なファミリ名 

サブファミリ 

形式 

ベンダー 

エンコーディング 

gothic

R, B 

PCF(12,14,16,20,24) 

 

JISX0208.1983, 

JISX0201.1976 

minchou

PCF(12,14,16,20,24) 

 

JISX0208.1983, 

JISX0201.1976 

hg gothic b

PCF(12,14,16,18,20,24) 

RICOH 

JISX0208.1983, JISX0201.1976 

hg mincho l

PCF(12,14,16,18,20,2) 

RICOH 

JISX0208.1983, JISX0201.1976 

heiseimin

PCF(12,14,16,18,20,24) 

RICOH 

JISX0212.1990 

日本語ロケール

Solaris 7 (日本語版) は 2 つのロケールをサポートしています。ja ロケールは日本語 EUC に基づいています。ja_JP.PCK ロケールは PCK (SHIFT JIS) に基づいています。また、ja_JP.UTF-8 ロケールは UTF-8 に基づいています。

日本語のメッセージおよびマニュアルページ

Solaris 7 (日本語版) では、メッセージおよびマニュアルページの一部が日本語に翻訳されています。

iconv 用日本語文字コードコンバータ

次の表では、iconv(1) および iconv(3) でサポートされている変換を示します。詳細については、iconv_ja(5) のマニュアルページを参照してください。

表 3-20 に、iconv の変換サポートを示します。

表 3-20 iconv の変換サポート

ソースコード 

ターゲットコード 

eucJP

PCK

eucJP

JIS7

eucJP

SJIS

eucJP

UTF-8

eucJP

jis

eucJP

ibmj

SJIS

eucJP

SJIS

ISO-2022-JP

SJIS

UTF-8

SJIS

jis

SJIS

ibmj

PCK

eucJP

PCK

UTF-8

PCK

ISO-2022-JP

PCK

jis

PCK

ibmj

ISO-2022-JP

eucJP

ISO-2022-JP

PCK

ISO-2022-JP

SJIS

UTF-8

eucJP

UTF-8

SJIS

UTF-8

PCK

JIS7

eucJP

jis

eucJP

jis

PCK

jis

SJIS

ibmj

eucJP

ibmj

PCK

UTF-8

ISO-2022-JP

ISO-2022-JP

UTF-8

eucJP

UTF-8-Java

UTF-8-Java

eucJP

PCK

UTF-8-Java

UTF-8-Java

PCK

eucJP

ISO-2022-JP.RFC1468

PCK

ISO-2022-JP.RFC1468

UTF-8

ISO-2022-JP.RFC1468

eucJP

ibmj-EBCDIK

ibmj-EBCDIK

eucJP

PCK

ibmj-EBCDIK

ibmj-EBCDIK

PCK

TTY STREAMS 用日本語文字コードコンバータ

端末、ロケールによって符号化方式が異なる場合があります。TTY STREAMS モジュールは端末とロケールの間の符号化方式の変換を行います。適切な STREAMS モジュールを使うことにより、日本語ロケールと日本語端末の符号化方式が異なる場合でもログインすることができます。通常、setterm(1) はユーザーー環境に合わせて適切にこれらのモジュールやコマンドを設定します。tty(1) は STREAMS モジュールの動作を制御します。

日本語固有のプリンタサポート

Solaris 7 (日本語版) は、次の日本語固有のプリンタをサポートしています。

JLE バイナリ互換パッケージ

Solaris 7 (日本語版) パッケージは、英語版と同様に、Solaris 1.x (日本語版) バイナリ互換パッケージを用意しています。

ユーザー定義文字 (UDC) サポート

Solaris 2.6 のリリース以降、studctool のサポートが追加され、ユーザ定義文字を利用できるようになりました。studctool では、アウトラインフォント (Type 1) とビットマップフォント (PCF) の両方が取り扱われます。さらに fontedittype3creatorfontmanager など、旧リリースに同梱のユーティリティで作成された UDC フォントを変換するために各種ユーティリティが提供されています。