国際化対応言語環境の利用ガイド

第 5 章 UTF-8 ロケールサポートの概要

この章では、UTF-8 ロケールサポートの概要について説明します。この章の内容は次のとおりです。

Unicode の概要

Unicode は、コンピュータ処理用のテキスト表現に使用される汎用文字コード化規格です。Unicode は、国際規格 ISO/IEC 10646-1:2000 および ISO/IEC 10646–2:2001 と完全な互換性があり、ISO/IEC 10646 とまったく同じ文字とエンコーディングポイントを含んでいます。この Unicode 規格によって、文字とその使い方に関する追加情報が提供されます。また、Unicode に準拠した実装は、ISO/IEC 10646 にも準拠します。

Unicode では、多言語のプレーンテキストのエンコーディングが一貫性をもち、国際的なテキストファイルの交換が容易になります。多言語のテキストを取り扱うコンピュータユーザー、オフィスワーカー、言語学者、研究員、科学者などにとっては、Unicode 規格によって仕事が非常に単純化されることがわかります。また、数学記号やその他の技術文字を常に使用する数学者と技術者にとっても、Unicode 規格は価値があります。

Unicode では、17 個の 16 ビットプレーンによって最大 1,114,112 のコードポイントがサポートされます。したがって、各プレーンでは、65,536 のコードポイントがサポートされます。

Unicode がサポートする 100 万以上のコードポイントのうち、バージョン 4.0 では、現在、プレーン 0、1、2、14 を使って 96,382 文字が定義されています。プレーン 15 と16 は、ユーザー定義文字用に予約されています。プレーン 15 と 16 では、合わせて 131,068 ユーザー定義文字がサポートされます。

Unicode は、次の文字エンコーディングスキーマの 1 つを使ってエンコードされます。

UTF-8 は、ASCII 文字コードの値を透過的に保存する可変長の Unicode エンコーディング形式です。Solaris Unicode ロケールのファイルコードには、この形式が使用されています。

UTF-16 は 16 ビットの Unicode エンコーディング形式です。UTF-16 では、最大で 65,535 文字が 1 つの 16 ビット値としてエンコードされます。65,535 から 1,114,111 の文字は 2 つの 16 ビット値としてエンコードされます (サロゲート)。

UTF-32 は、一般に 32 ビットのコンテナまたはデータタイプとして表される固定長 21 ビットの Unicode エンコーディング形式です。この形式は、Solaris Unicode ロケールの中でプロセスコード (ワイド文字コード) として使用されます。

Unicode 規格や ISO/IEC 10646、およびその表現形式については、次の資料を参照してください。

Unicode ロケール: en_US.UTF-8 サポート

Unicode/UTF-8 ロケールは Unicode 4.0 をサポートします。en_US.UTF-8 ロケールは、UTF-8 をコードセットとして使用することによってマルチスクリプト処理をサポートします。このロケールは、複数のスクリプトでテキストを入出力できます。これは、Solaris OS で最初にこの機能を持ったロケールです。他の UTF-8 ロケールの機能も en_us.UTF-8 の機能と似ています。en_US.UTF-8 に関する以下の説明はこれらのロケールにも当てはまります。


注 –

UTF-8 は、1992 年の X/Open-Uniform Joint Internationalization Working Group (XoJIG) によって公式化され、1996 年に ISO と IEC によって ISO/IEC 10646-1:1993 の修正第 2 条として承認された Unicode/ISO/IEC 10646-1 のファイルシステム安全汎用文字セット変換形式です。この規格は、Unicode Consortium、ISO (国際標準化機構)、IEC (国際電気標準会議) によって、Unicode 4.0 および ISO/IEC 10646-1 として採用されました。


Solaris 環境の Unicode ロケールは、Unicode 4.0 や ISO/IEC 10646-1 および 10646-2 に定義されているすべてのコードポイント値の処理をサポートしています。サポートされるスクリプトには、全ヨーロッパやアジアのスクリプトだけでなく、アラビア語、ヘブライ語、ヒンディー語、タイ語などの複雑なテキストレイアウトのスクリプトも含まれます。


注 –

一部の Unicode ロケール、特にアジアロケールは、追加の漢字および Hanzi グリフを含みます。


使用できるフォントに制限があるため、最新の Solaris には次の文字セットの文字グリフのみ含まれています。

対応するグリフが en_US.UTF-8 ロケールに含まれていない文字をユーザーが表示させると、ロケールが、代わりに no-glyph というグリフを以下の例のように表示します。

この図については、前の本文中で説明しています。

インストール時にこのロケールをシステムのデフォルトロケールとして選択することができます。

同じレベルの en_US.UTF-8 ロケールのサポートが、64 ビットと 32 ビットの Solaris システムの両方に用意されています。


注 –

Motif および Solaris CDE のデスクトップアプリケーションとライブラリは、en_US.UTF-8 ロケールをサポートしています。ただし、 XView™ と OLIT ライブラリでは en_US.UTF-8 ロケールをサポートしていません。


デスクトップ入力方式について

CDE では、Xm ツールキットを使用する国際化アプリケーションで、各ロケールの文字の入力を行う機能を提供しています。XmText[Field] ウィジェットは各ロケールの入力方式のインタフェースとなります。いくつかの言語環境において、テキストは右から左、上から下などの方向に書かれるため、入力方式が国際化されています。同じアプリケーションで、複数のフォントを使用する異なる入力方式の使用が可能です。

プリエディット領域は確定前の文字列が表示されます。テキストの作成は、次の 4 つのモードで行うことができます。

OffTheSpot モードでは、場所はメインウィンドウの下のステータス領域の右側です。OverTheSpot モードでは、プリエディット領域はカーソル位置です。Root モードではプリエディットおよびステータス領域はクライアントのウィンドウと分けられます。

詳細については、VendorShell(3X) マニュアルページの XmNpreeditType リソースの項を参照してください。


注 –

最新の Solaris 環境には、簡体/繁体字中国語、日本語、韓国語用の、アジア固有の入力方式があります。これらの方式は、Unicode ロケールに対する現在のマルチスクリプト入力方式の他に提供されるものです。


「入力方式の選択」 では、選択された入力方式、それらの使用方法、それらの切り替え替方法について説明します。

スクリプトの選択と入力方式

Solaris Unicode ロケールは複数のスクリプトをサポートしています。それぞれの Unicode ロケールには、次の 14 の入力方式が含まれています。

入力方式の選択

特定の入力モードに切り替えるには、Compose キーの組み合わせを使用するか、入力モード選択ウィンドウを使用します。入力モード選択ウィンドウを表示するには、アプリケーションウィンドウ左下隅のステータス領域でクリックします。次の図のような入力モード選択ウィンドウが表示されます。

図 5–1 入力モード選択ウィンドウ

この図については、前の本文中で説明しています。

入力モードの切り替えキーシーケンス

現在の入力モードを新しい入力モードに切り替えるには、表 5–1 に示すキーシーケンスを使用します。ただし、アジアの入力方式を使用している場合は、Control-Space キーを押して英語/ヨーロッパ入力モードに戻る必要があります。英語/ヨーロッパ言語入力モードに戻った後は、該当するキーシーケンスを使って任意の入力モードに自由に切り替えることができます。

たとえば、英語/ヨーロッパ言語入力モードをキリル語入力モードに切り替える場合は、次のキーシーケンスを使用します。

  1. Compose キーを押します。

  2. C キーを押して離します。

  3. C キーを押します。

表 5–1 入力モードの切り替えキーシーケンス

キーシーケンス 

入力モード 

Control-Space 

英語/ヨーロッパ言語 

Compose c c 

キリル文字 

Compose g g 

ギリシャ語 

Compose a r 

アラビア語 

Compose h h 

ヘブライ語 

Compose t t 

タイ語 

Compose h i 

インド語 

Compose i n 

インド語 

Compose j a 

日本語 

Compose k o 

韓国語 

Compose s c 

簡体字中国語 

Compose t c 

繁体字中国語 

Compose h k 

繁体字中国語 (香港) 

Compose u o 

Unicode 8 進数コード入力モード 

Compose u h 

Unicode 16 進数コード入力モード 

Compose l l 

表検索入力モード 

英語/ヨーロッパ言語入力モード

英語/ヨーロッパ言語入力モードでは、英語のアルファベットだけでなく、ヨーロッパの言語で使用される発音符号(á、è、î、õ、ü など) や特殊文字(¡、§、¿) なども使用できます。

この入力モードはすべてのアプリケーションのデフォルトのモードです。入力モードは、GUI アプリケーションウィンドウの左下隅に表示されます。

Latin-1、Latin-2、Latin-4、Latin-5、Latin-9 の発音符号付きの文字や特殊文字を入力するには、次の例のように Compose シーケンスを入力する必要があります。

Ä を表示するには、次のようにします。

  1. Compose キーを押してから離します。

  2. Shift-A キーを押します。Shift-A を離します。

  3. キーを押してから離します。

¿ を表示するには、次のようにします。

  1. Compose キーを押してから離します。

  2. ? キーを押してから離します。

  3. ? キーを押してから離します。

キーボードに Compose キーがない場合は、Control-Shift キーを押すことによって Compose キーをエミュレートできます。

ユーロの通貨記号 (Unicode の U+20AC) を入力するには、次のいずれかのシーケンスを使用します。

上の入力シーケンスでは、両方のキーを同時に押す必要があります。キーボードに AltGraph キーがない場合は、代わりに Compose e = あるいは Compose c = などのユーロ記号の入力シーケンスが使用できます。

次の表に、Solaris OS で Latin-1、Latin-2、Latin-3、Latin-4、Latin-5、Latin-9 の文字の入力によく使用される Compose シーケンスを示します。

次の表に、Latin-1 の一般的な Compose シーケンスを示します。

表 5–2 Latin-1 の一般的な Compose キーシーケンス

Compose の次に押すキー

その次に押すキー 

結果 

Space 

Space 

スペース 

上付きの 1 

2

上付きの 2 

3

上付きの 3 

!

逆感嘆符 

o

通貨記号 (¤) 

!

パラグラフ記号 (¶) 

u

ミュー (u) 

"

アキュートアクセント記号 (´) 

, (コンマ)

セディーユ (Ç) 

 

"

ウムラウト(¨) 

^

長音記号 (¯) 

o

度 (°) 

x

乗算記号 (×) 

-

プラスマイナス (±) 

-

ソフトハイフン (–) 

:

除算記号 (÷) 

女性序数識別 (ª) 

男性序数識別 (º) 

, (コンマ) 

否定記号 (¬) 

中点 (·) 

分数 (½) 

分数 (¼) 

分数 (¾) 

左二重引用符 («) 

右二重引用符 (») 

逆疑問符 (¿) 

` (逆引用符) 

グレーブアクセント付き A (À) 

' (単一引用符) 

アキュートアクセント付き A (Á) 

オングストローム付き A (Å) 

 

ウムラウト付き A (Ä) 

サーカムフレクトアクセント付き A (Â) 

チルド付き A (Ã) 

AE リゲチャ (Æ) 

, (コンマ) 

セディーユ付き C (Ç) 

著作権表示記号 (©) 

キャピタルエズ (ð) 

` (逆引用符) 

グレーブアクセント付き E (È) 

アキュートアクセント付き E (É) 

 

ウムラウト付き E (Ë) 

サーカムフレクトアクセント付き E (Ê) 

` (逆引用符) 

グレーブアクセント付き I (Ì) 

'

アキュートアクセント付き I (Í) 

"

ウムラウト付き I (Ï) 

^

サーカムフレクトアクセント付き I (Î) 

-

ポンド記号 (£) 

~

チルド付き N (Ñ) 

` (逆引用符)

グレーブアクセント付き O (Ò) 

'

アキュートアクセント付き O (Ó) 

/

斜線付き O (Ø) 

"

ウムラウト付きO (Ö) 

^

サーカムフレクトアクセント付き O (Ô) 

~

チルド付き O (Õ) 

O

登録商標 (®) 

H

アイスランド語ソーン (þ) 

` (逆引用符)

グレーブアクセント付き U (Ù) 

アキュートアクセント付き U (Ú) 

 

ウムラウト付きU (Ü) 

サーカムフレクトアクセント付き U (Û) 

アキュートアクセント付き Y (ý) 

円記号 (¥) 

` (逆引用符) 

グレーブアクセント付き a (à) 

アキュートアクセント付き a (á) 

オングストローム付き a (å) 

 

ウムラウト付きa (ä) 

チルド付き a (ã) 

サーカムフレクトアクセント付き a (â) 

ae リゲチャ (æ) 

, (コンマ) 

セディーユ付き c (ç) 

セント記号 (¢) 

著作権表示記号 (©) 

エズ (ð) 

` (逆引用符) 

グレーブアクセント付き e (è) 

アキュートアクセント付き e (é) 

 

ウムラウト付き e (ë) 

サーカムフレクトアクセント付き e (ê) 

` (逆引用符) 

グレーブアクセント付き i (ì) 

アキュートアクセント付き i (í) 

 

ウムラウト付き i (ï) 

サーカムフレクトアクセント付き i (î) 

チルド付き n (ñ) 

` (逆引用符) 

グレーブアクセント付き o (ò) 

アキュートアクセント付き o (ó) 

斜線付き o (ø) 

 

ウムラウト付き o (ö) 

サーカムフレクトアクセント付き o (ô) 

チルド付き o (õ) 

ドイツ語の二重 s (シャープ S) (ß) 

ソーン (þ) 

` (逆引用符) 

グレーブアクセント付き u (ù) 

アキュートアクセント付き u (ú) 

 

ウムラウト付き u (ü) 

サーカムフレクトアクセント付き u (û) 

アキュートアクセント付き y (y) 

 

ウムラウト付き y (ÿ) 

破断線 (¦) 

次の表に、Latin-2 の一般的な Compose キーシーケンスを示します。

表 5–3 Latin-2 の一般的な Compose キーシーケンス

Compose の次に押すキー

その次に押すキー 

結果 

k

k

kra 

A

_

長音記号付き A 

E

_

長音記号付き E 

E

.

ドット付き E 

G

,

セディーユ付き G 

I

_

長音記号付き I 

I

~

チルド付き I 

I

a

ogonek 付き I 

K

,

セディーユ付き K 

L

,

セディーユ付き L 

N

,

セディーユ付き N 

O

_

長音記号付き O 

R

,

セディーユ付き R 

T

|

ストローク付き T 

U

~

チルド付き U 

U

a

ogonek 付き U 

U

_

長音記号付き U 

N

N

エング 

a

_

長音記号付き a 

e

_

長音記号付き e 

e

.

ドット付き e 

g

,

セディーユ付き g 

i

_

長音記号付き i 

i

~

チルド付き i 

i

a

ogonek 付き i 

k

,

セディーユ付き k 

l

,

セディーユ付き l 

n

,

セディーユ付き n 

o

_

長音記号付き o 

r

,

セディーユ付き r 

t

|

ストローク付き t 

u

~

チルド付き u 

u

a

ogonek 付き u 

u

_

長音記号付き u 

n

n

エング 

   

次の表に、Latin-3 の一般的な Compose キーシーケンスを示します。

表 5–4 Latin-3 の一般的な Compose キーシーケンス

Compose の次に押すキー

その次に押すキー 

結果 

C

>

サーカムフレクトアクセント付き C 

C

.

ドット付き C 

G

>

サーカムフレクトアクセント付き G 

G

.

ドット付き G 

H

>

サーカムフレクトアクセント付き H 

J

>

サーカムフレクトアクセント付き j 

S

>

サーカムフレクトアクセント付き S 

U

u

短音記号付き U 

c

>

サーカムフレクトアクセント付き c 

c

.

ドット付き c 

g

>

サーカムフレクトアクセント付き g 

g

.

ドット付き g 

h

>

サーカムフレクトアクセント付き h 

j

>

サーカムフレクトアクセント付き j 

s

>

サーカムフレクトアクセント付き s 

u

u

短音記号付き u 

次の表に、Latin-4 の一般的な Compose キーシーケンスを示します。

表 5–5 Latin-4 の一般的な Compose キーシーケンス

Compose の次に押すキー

その次に押すキー 

結果 

kra 

長音記号付き A 

長音記号付き E 

ドット付き E 

セディーユ付き G 

長音記号付き I 

チルド付き I 

ogonek 付き I 

セディーユ付き K 

セディーユ付き L 

セディーユ付き N 

長音記号付き O 

セディーユ付き R 

ストローク付き T 

チルド付き U 

ogonek 付き U 

長音記号付き U 

エング 

長音記号付き a 

長音記号付き e 

ドット付き e 

セディーユ付き g 

長音記号付き i 

チルド付き i 

ogonek 付き i 

セディーユ付き k 

セディーユ付き l 

セディーユ付き n 

長音記号付き o 

セディーユ付き r 

ストローク付き t 

チルド付き u 

ogonek 付き u 

長音記号付き u 

エング 

   

次の表に、Latin-5 の一般的な Compose キーシーケンスを示します。

表 5–6 Latin-5 の一般的な Compose キーシーケンス

Compose の次に押すキー

その次に押すキー 

結果 

短音記号付き G 

ドット付き I 

短音記号付き g 

ドット付き i 

次の表に、Latin-9 の一般的な Compose キーシーケンスを示します。

表 5–7 Latin-9 の一般的な Compose キーシーケンス

Compose の次に押すキー

その次に押すキー 

結果 

oe の合字 

OE の合字 

“ 

ウムラウト付き Y 

アクセントデッドキーがあるキーボードを使用しているときは、以下の Compose キーシーケンスを使用します。dead_acute などのキー名は、/usr/openwin/include/X11/keysymdef.h に見られる、X_dead_acute などの X11 登録 keysym 名に由来します。SunFA_Circum などのキー名は、/usr/openwin/include/X11/Sunkeysym.h に見られる、 SunXK_FA_Circum などの Sun により定義された X11 keysym 名に由来します。

表 5–8 アクセントデッドキーに基づく Compose キーシーケンス

その次に押すキー 

その次に押すキー 

結果 

dead_grave 

Space 

グレーブアクセント記号 

dead_acute 

アポストロフィ 

アキュートアクセント記号 

dead_acute 

Space 

アポストロフィ 

dead_diaeresis 

二重引用符 

ウムラウト 

dead_diaeresis 

Space 

ウムラウト 

dead_circumflex 

Space 

サーカムフレクトアクセント記号 

dead_circumflex 

スラッシュ 

垂直線 

dead_circumflex 

度記号 

dead_circumflex 

上付きの 1 

dead_circumflex 

上付きの 2 

dead_circumflex 

上付きの 3 

dead_circumflex 

ピリオド 

中点 

dead_circumflex 

感嘆符 

破断線 

dead_circumflex 

マイナス 

長音記号 

dead_circumflex 

アンダースコア 

長音記号 

dead_cedilla 

コンマ 

セディーユ 

dead_cedilla 

マイナス 

否定記号 

dead_tilde 

Space 

チルド 

dead_grave 

グレーブアクセント付き A 

dead_acute 

アキュートアクセント付き A 

dead_circumflex 

サーカムフレクトアクセント付き A 

dead_tilde 

チルド付き A 

dead_diaeresis 

ウムラウト付き A 

dead_grave 

グレーブアクセント付き a 

dead_acute 

アキュートアクセント付き a 

dead_circumflex 

サーカムフレクトアクセント付き a 

dead_tilde 

チルド付き a 

dead_diaeresis 

ウムラウト付き a 

dead_cedilla 

セディーユ付き C 

dead_cedilla 

セディーユ付き c 

dead_grave 

グレーブアクセント付き E 

dead_acute 

アキュートアクセント付き E 

dead_circumflex 

サーカムフレクトアクセント付き E 

dead_diaeresis 

ウムラウト付き E 

dead_grave 

グレーブアクセント付き e 

dead_acute 

アキュートアクセント付き e 

dead_circumflex 

サーカムフレクトアクセント付き e 

dead_diaeresis 

ウムラウト付き e 

dead_grave 

グレーブアクセント付き I 

dead_acute 

アキュートアクセント付き I 

dead_circumflex 

サーカムフレクトアクセント付き I 

dead_diaeresis 

ウムラウト付き I 

dead_grave 

グレーブアクセント付き i 

dead_acute 

アキュートアクセント付き i 

dead_circumflex 

サーカムフレクトアクセント付き i 

dead_diaeresis 

ウムラウト付き i 

dead_tilde 

チルド付き N 

dead_tilde 

チルド付き n 

dead_grave 

グレーブアクセント付き O 

dead_acute 

アキュートアクセント付き O 

dead_circumflex 

サーカムフレクトアクセント付き O 

dead_tilde 

チルド付き O 

dead_diaeresis 

ウムラウト付き O 

dead_grave 

グレーブアクセント付き o 

dead_acute 

アキュートアクセント付き o 

dead_circumflex 

サーカムフレクトアクセント付き o 

dead_tilde 

チルド付き o 

dead_diaeresis 

ウムラウト付き o 

dead_cedilla 

セディーユ付き S 

dead_cedilla 

セディーユ付き s 

dead_grave 

グレーブアクセント付き U 

dead_acute 

アキュートアクセント付き U 

dead_circumflex 

サーカムフレクトアクセント付き U 

dead_diaeresis 

ウムラウト付き U 

dead_grave 

グレーブアクセント付き u 

dead_acute 

アキュートアクセント付き u 

dead_circumflex 

サーカムフレクトアクセント付き u 

dead_diaeresis 

ウムラウト付き u 

dead_acute 

アキュートアクセント付き Y 

dead_acute 

アキュートアクセント付き y 

dead_diaeresis 

ウムラウト付き y 

SunFA_Grave 

Space 

グレーブアクセント 

SunFA_Grave 

グレーブアクセント付き A 

SunFA_Grave 

グレーブアクセント付き a 

SunFA_Grave 

グレーブアクセント付き E 

SunFA_Grave 

グレーブアクセント付き e 

SunFA_Grave 

グレーブアクセント付き I 

SunFA_Grave 

グレーブアクセント付き i 

SunFA_Grave 

グレーブアクセント付き O 

SunFA_Grave 

グレーブアクセント付き o 

SunFA_Grave 

グレーブアクセント付き U 

SunFA_Grave 

グレーブアクセント付き u 

SunFA_Acute 

アポストロフィ 

アキュートアクセント記号 

SunFA_Acute 

Space 

アポストロフィ 

SunFA_Acute 

アキュートアクセント付き A 

SunFA_Acute 

アキュートアクセント付き a 

SunFA_Acute 

アキュートアクセント付き C 

SunFA_Acute 

アキュートアクセント付き c 

SunFA_Acute 

アキュートアクセント付き E 

SunFA_Acute 

アキュートアクセント付き e 

SunFA_Acute 

アキュートアクセント付き I 

SunFA_Acute 

アキュートアクセント付き i 

SunFA_Acute 

アキュートアクセント付き L 

SunFA_Acute 

アキュートアクセント付き l 

SunFA_Acute 

アキュートアクセント付き N 

SunFA_Acute 

アキュートアクセント付き n 

SunFA_Acute 

アキュートアクセント付き O 

SunFA_Acute 

アキュートアクセント付き o 

SunFA_Acute 

アキュートアクセント付き R 

SunFA_Acute 

アキュートアクセント付き r 

SunFA_Acute 

アキュートアクセント付き S 

SunFA_Acute 

アキュートアクセント付き s 

SunFA_Acute 

アキュートアクセント付き U 

SunFA_Acute 

アキュートアクセント付き u 

SunFA_Acute 

アキュートアクセント付き Y 

SunFA_Acute 

アキュートアクセント付き y 

SunFA_Acute 

アキュートアクセント付き Z 

SunFA_Acute 

アキュートアクセント付き z 

SunFA_Cedilla 

コンマ 

セディーユ 

SunFA_Cedilla 

マイナス 

否定 

SunFA_Cedilla 

セディーユ付き C 

SunFA_Cedilla 

セディーユ付き c 

SunFA_Cedilla 

セディーユ付き G 

SunFA_Cedilla 

セディーユ付き g 

SunFA_Cedilla 

セディーユ付き K 

SunFA_Cedilla 

セディーユ付き k 

SunFA_Cedilla 

セディーユ付き L 

SunFA_Cedilla 

セディーユ付き l 

SunFA_Cedilla 

セディーユ付き N 

SunFA_Cedilla 

セディーユ付き n 

SunFA_Cedilla 

セディーユ付き R 

SunFA_Cedilla 

セディーユ付き r 

SunFA_Cedilla 

セディーユ付き S 

SunFA_Cedilla 

セディーユ付き s 

SunFA_Cedilla 

セディーユ付き T 

SunFA_Cedilla 

セディーユ付き t 

SunFA_Circum 

Space 

サーカムフレクトアクセント記号 

SunFA_Circum 

度記号 

SunFA_Circum 

上付きの 1 

SunFA_Circum 

上付きの 2 

SunFA_Circum 

上付きの 3 

SunFA_Circum 

感嘆符 

破断線 

SunFA_Circum 

マイナス 

長音記号 

SunFA_Circum 

アンダースコア 

長音記号 

SunFA_Circum 

ピリオド 

中点 

SunFA_Circum 

スラッシュ 

垂直線 

SunFA_Circum 

サーカムフレクトアクセント付き A 

SunFA_Circum 

サーカムフレクトアクセント付き a 

SunFA_Circum 

サーカムフレクトアクセント付き C 

SunFA_Circum 

サーカムフレクトアクセント付き c 

SunFA_Circum 

サーカムフレクトアクセント付き E 

SunFA_Circum 

サーカムフレクトアクセント付き e 

SunFA_Circum 

サーカムフレクトアクセント付き G 

SunFA_Circum 

サーカムフレクトアクセント付き g 

SunFA_Circum 

サーカムフレクトアクセント付き H 

SunFA_Circum 

サーカムフレクトアクセント付き h 

SunFA_Circum 

サーカムフレクトアクセント付き I 

SunFA_Circum 

サーカムフレクトアクセント付き i 

SunFA_Circum 

サーカムフレクトアクセント付き J 

SunFA_Circum 

サーカムフレクトアクセント付き j 

SunFA_Circum 

サーカムフレクトアクセント付き O 

SunFA_Circum 

サーカムフレクトアクセント付き o 

SunFA_Circum 

サーカムフレクトアクセント付き S 

SunFA_Circum 

サーカムフレクトアクセント付き s 

SunFA_Circum 

サーカムフレクトアクセント付き U 

SunFA_Circum 

サーカムフレクトアクセント付き u 

SunFA_Diaeresis 

二重引用符 

ウムラウト 

SunFA_Diaeresis 

Space 

ウムラウト 

SunFA_Diaeresis 

ウムラウト付き A 

SunFA_Diaeresis 

ウムラウト付き a 

SunFA_Diaeresis 

ウムラウト付き E 

SunFA_Diaeresis 

ウムラウト付き e 

SunFA_Diaeresis 

ウムラウト付き I 

SunFA_Diaeresis 

ウムラウト付き i 

SunFA_Diaeresis 

ウムラウト付き O 

SunFA_Diaeresis 

ウムラウト付き o 

SunFA_Diaeresis 

ウムラウト付き U 

SunFA_Diaeresis 

ウムラウト付き u 

SunFA_Diaeresis 

ウムラウト付き y 

SunFA_Diaeresis 

ウムラウト付き Y 

SunFA_Tilde 

Space 

チルド 

SunFA_Tilde 

チルド付き A 

SunFA_Tilde 

チルド付き a 

SunFA_Tilde 

チルド付き N 

SunFA_Tilde 

チルド付き n 

SunFA_Tilde 

チルド付き O 

SunFA_Tilde 

チルド付き o 

アラビア語入力モード

アラビア語入力モードを選択するには、Compose a r を押すか、入力モード選択ウィンドウで「アラビア語 (Arabic) 」を選択します。入力モード選択ウィンドウの表示方法については、「入力方式の選択」 を参照してください。

次の図にアラビア語キーボードの配列を示します。

図 5–2 アラビア語 キーボード

この図については、前の本文中で説明しています。

キリル文字入力モード

キリル文字入力モードを選択するには、Compose c c を押すか、入力選択モードウィンドウで「キリル文字 (Cyrillic)」を選択します。入力モード選択ウィンドウの表示方法については、「入力方式の選択」 を参照してください。

次の図にキリル文字 (ロシア語) キーボードの配列を示します。

図 5–3 キリル文字 (ロシア語) キーボード

この図については、前の本文中で説明しています。

キリル文字入力モードでは、英語やヨーロッパ言語のテキストを入力することはできません。英語/ヨーロッパ言語入力モードに戻るには、Control-Space キーを押すか、入力モード選択ウィンドウのステータス領域をクリックし、「英語/ヨーロッパ言語 (English/European)」入力モードを選択します。詳細については「入力方式の選択」 を参照してください。

また、対応する入力モード切り替えキーシーケンスを入力することで、他の入力モードに切り替えることもできます。

ギリシャ語入力モード

ギリシャ語入力モードを選択するには、Compose g g を押すか、入力モード選択ウィンドウで「ギリシャ語 (Greek)」を選択します。入力モード選択ウィンドウの表示方法については、「入力方式の選択」 を参照してください。

ギリシャ語入力モードでは、英語やヨーロッパ言語のテキストを入力することはできません。英語/ヨーロッパ言語入力モードに戻るには、Control-Space キーを押すか、入力モード選択ウィンドウのステータス領域をクリックし、「英語/ヨーロッパ言語 (English/European)」入力モードを選択します。次の図にギリシャ語キーボード (ヨーロッパキーボード) の配列を示します。

図 5–4 ギリシャ語キーボード (ヨーロッパキーボード)

この図については、前の本文中で説明しています。

次の図にギリシャ語キーボード (UNIX キーボード) を示します。

図 5–5 ギリシャ語キーボード (UNIX キーボード)

この図については、前の本文中で説明しています。

以下の Compose キーシーケンスがギリシャ語入力モードでサポートされています。Compose キーシーケンスのいくつかは、アクセントデッドキーで始まります。「ordfemenine」は女性序数識別 (feminine ordinal indicator) キーの略語です。

表 5–9 ギリシャ語入力モードの Compose キーシーケンス

その次に押すキー 

その次に押すキー 

結果 

セミコロン 

tonos 付きギリシャ語アルファ (小文字) 

セミコロン 

tonos 付きギリシャ語エプシロン (小文字) 

セミコロン 

tonos 付きギリシャ語エータ (小文字) 

セミコロン 

tonos 付きギリシャ語イオータ (小文字) 

セミコロン 

tonos 付きギリシャ語オミクロン (小文字) 

セミコロン 

tonos 付きギリシャ語ユプシロン (小文字) 

セミコロン 

tonos 付きギリシャ語オメガ (小文字) 

セミコロン 

tonos 付きギリシャ語アルファ (大文字) 

セミコロン 

tonos 付きギリシャ語エプシロン (大文字) 

セミコロン 

tonos 付きギリシャ語エータ (大文字) 

セミコロン 

tonos 付きギリシャ語イオータ (大文字) 

セミコロン 

tonos 付きギリシャ語オミクロン (大文字) 

セミコロン 

tonos 付きギリシャ語ユプシロン (大文字) 

セミコロン 

tonos 付きギリシャ語オメガ (大文字) 

dead_acute 

ギリシャ語アルファ (小文字) 

tonos 付きギリシャ語アルファ (小文字) 

dead_acute 

ギリシャ語エプシロン (小文字) 

tonos 付きギリシャ語エプシロン (小文字) 

dead_acute 

ギリシャ語イータ (小文字) 

tonos 付きギリシャ語イータ (小文字) 

dead_acute 

ギリシャ語イオータ (小文字) 

tonos 付きギリシャ語イオータ (小文字) 

dead_acute 

ギリシャ語オミクロン (小文字) 

tonos 付きギリシャ語オミクロン (小文字) 

dead_acute 

ギリシャ語ユプシロン (小文字) 

tonos 付きギリシャ語ユプシロン (小文字) 

dead_acute 

ギリシャ語オメガ (小文字) 

tonos 付きギリシャ語オメガ (小文字) 

dead_acute 

ギリシャ語アルファ (大文字) 

tonos 付きギリシャ語アルファ (大文字) 

dead_acute 

ギリシャ語エプシロン (大文字) 

tonos 付きギリシャ語エプシロン (大文字) 

dead_acute 

ギリシャ語イータ (大文字) 

tonos 付きギリシャ語イータ (大文字) 

dead_acute 

ギリシャ語イオータ (大文字) 

tonos 付きギリシャ語イオータ (大文字) 

dead_acute 

ギリシャ語オミクロン (大文字) 

tonos 付きギリシャ語オミクロン (大文字) 

dead_acute 

ギリシャ語ユプシロン (大文字) 

tonos 付きギリシャ語ユプシロン (大文字) 

dead_acute 

ギリシャ語オメガ (大文字) 

tonos 付きギリシャ語オメガ (大文字) 

dead_acute 

tonos 付きギリシャ語アルファ (小文字) 

dead_acute 

tonos 付きギリシャ語エプシロン (小文字) 

dead_acute 

tonos 付きギリシャ語エータ (小文字) 

dead_acute 

tonos 付きギリシャ語イオータ (小文字) 

dead_acute 

tonos 付きギリシャ語オミクロン (小文字) 

dead_acute 

tonos 付きギリシャ語ユプシロン (小文字) 

dead_acute 

tonos 付きギリシャ語オメガ (小文字) 

dead_acute 

tonos 付きギリシャ語アルファ (大文字) 

dead_acute 

tonos 付きギリシャ語エプシロン (大文字) 

dead_acute 

tonos 付きギリシャ語エータ (大文字) 

dead_acute 

tonos 付きギリシャ語イオータ (大文字) 

dead_acute 

tonos 付きギリシャ語オミクロン (大文字) 

dead_acute 

tonos 付きギリシャ語ユプシロン (大文字) 

dead_acute 

tonos 付きギリシャ語オメガ (大文字) 

コロン 

dialytika 付きギリシャ語イオータ (小文字) 

コロン 

dialytika 付きギリシャ語ユプシロン (小文字) 

コロン 

dialytika 付きギリシャ語イオータ (大文字) 

コロン 

dialytika 付きギリシャ語ユプシロン (大文字) 

dead_diaeresis 

dialytika 付きギリシャ語イオータ (小文字) 

dead_diaeresis 

dialytika 付きギリシャ語ユプシロン (小文字) 

dead_diaeresis 

dialytika 付きギリシャ語イオータ (大文字) 

dead_diaeresis 

dialytika 付きギリシャ語ユプシロン (大文字) 

dead_diaeresis 

ギリシャ語イオータ (小文字) 

dialytika 付きギリシャ語イオータ (小文字) 

dead_diaeresis 

ギリシャ語ユプシロン (小文字) 

dialytika 付きギリシャ語ユプシロン (小文字) 

dead_diaeresis 

ギリシャ語イオータ (大文字) 

dialytika 付きギリシャ語イオータ (大文字) 

dead_diaeresis 

ギリシャ語ユプシロン (大文字) 

dialytika 付きギリシャ語ユプシロン (大文字) 

セミコロン 

セミコロン 

ギリシャ語 tonos 

コロン 

コロン 

ウムラウト/dialytika 

ordfeminine 

プラス 

ordfeminine 

セクション記号 

ordfeminine 

上付きの 2 

ordfeminine 

上付きの 3 

ordfeminine 

破断線 

ordfeminine 

著作権表示記号 

ordfeminine 

否定記号 

ordfeminine 

ソフトハイフン 

ordfeminine 

度記号 

ordfeminine 

ハイフン 

分数 2 分の 1 

ordfeminine 

バックスラッシュ 

ポンド記号 

ordfeminine 

左中括弧 

修飾文字の逆コンマ 

ordfeminine 

右中括弧 

修飾文字のアポストロフィ 

ordfeminine 

左角括弧 

左向き二重引用符 

ordfeminine 

右角括弧 

右向き二重引用符 

SunFA_Acute 

tonos 付きギリシャ語アルファ (小文字) 

SunFA_Acute 

tonos 付きギリシャ語エプシロン (小文字) 

SunFA_Acute 

tonos 付きギリシャ語イータ (小文字) 

SunFA_Acute 

tonos 付きギリシャ語イオータ (小文字) 

SunFA_Acute 

tonos 付きギリシャ語オミクロン (小文字) 

SunFA_Acute 

tonos 付きギリシャ語ユプシロン (小文字) 

SunFA_Acute 

tonos 付きギリシャ語オメガ (小文字) 

SunFA_Acute 

tonos 付きギリシャ語アルファ (大文字) 

SunFA_Acute 

tonos 付きギリシャ語エプシロン (大文字) 

SunFA_Acute 

tonos 付きギリシャ語イータ (大文字) 

SunFA_Acute 

tonos 付きギリシャ語オミクロン (大文字) 

SunFA_Acute 

tonos 付きギリシャ語イオータ (大文字) 

SunFA_Acute 

tonos 付きギリシャ語ユプシロン (大文字) 

SunFA_Acute 

tonos 付きギリシャ語オメガ (大文字) 

SunFA_Acute 

ギリシャ語アルファ (小文字) 

tonos 付きギリシャ語アルファ (小文字) 

SunFA_Acute 

ギリシャ語エプシロン (小文字) 

tonos 付きギリシャ語エプシロン (小文字) 

SunFA_Acute 

ギリシャ語イータ (小文字) 

tonos 付きギリシャ語イータ (小文字) 

SunFA_Acute 

ギリシャ語イオータ (小文字) 

tonos 付きギリシャ語イオータ (小文字) 

SunFA_Acute 

ギリシャ語オメガ (小文字) 

tonos 付きギリシャ語オメガ (小文字) 

SunFA_Acute 

ギリシャ語オミクロン (小文字) 

tonos 付きギリシャ語オミクロン (小文字) 

SunFA_Acute 

ギリシャ語ユプシロン (小文字) 

tonos 付きギリシャ語ユプシロン (小文字) 

SunFA_Acute 

ギリシャ語アルファ (大文字) 

tonos 付きギリシャ語アルファ (大文字) 

SunFA_Acute 

ギリシャ語エプシロン (大文字) 

tonos 付きギリシャ語エプシロン (大文字) 

SunFA_Acute 

ギリシャ語イータ (大文字) 

tonos 付きギリシャ語イータ (大文字) 

SunFA_Acute 

ギリシャ語イオータ (大文字) 

tonos 付きギリシャ語イオータ (大文字) 

SunFA_Acute 

ギリシャ語オミクロン (大文字) 

tonos 付きギリシャ語オミクロン (大文字) 

SunFA_Acute 

ギリシャ語ユプシロン (大文字) 

tonos 付きギリシャ語ユプシロン (大文字) 

SunFA_Acute 

ギリシャ語オメガ (大文字) 

tonos 付きギリシャ語オメガ (大文字) 

SunFA_Diaeresis 

dialytika 付きギリシャ語イオータ (小文字) 

SunFA_Diaeresis 

dialytika 付きギリシャ語ユプシロン (小文字) 

SunFA_Diaeresis 

dialytika 付きギリシャ語イオータ (大文字) 

SunFA_Diaeresis 

dialytika 付きギリシャ語ユプシロン (大文字) 

SunFA_Diaeresis 

ギリシャ語イオータ (小文字) 

dialytika 付きギリシャ語イオータ (小文字) 

SunFA_Diaeresis 

ギリシャ語ユプシロン (小文字) 

dialytika 付きギリシャ語ユプシロン (小文字) 

SunFA_Diaeresis 

ギリシャ語イオータ (大文字) 

dialytika 付きギリシャ語イオータ (大文字) 

SunFA_Diaeresis 

ギリシャ語ユプシロン (大文字) 

dialytika 付きギリシャ語ユプシロン (大文字) 

表 5–10 3 つのキーを使用するギリシャ語入力モードの Compose キーシーケンス

その次に押すキー 

その次に押すキー 

その次に押すキー 

結果 

セミコロン 

コロン 

dialytika と tonos 付きギリシャ語ユプシロン (小文字) 

コロン 

セミコロン 

dialytika と tonos 付きギリシャ語ユプシロン (小文字) 

セミコロン 

コロン 

dialytika と tonos 付きギリシャ語イオータ (小文字) 

コロン 

セミコロン 

dialytika と tonos 付きギリシャ語イオータ (小文字) 

dead_acute 

dead_diaeresis 

dialytika と tonos 付きギリシャ語ユプシロン (小文字) 

dead_diaeresis 

dead_acute 

dialytika と tonos 付きギリシャ語ユプシロン (小文字) 

dead_acute 

dead_diaeresis 

dialytika と tonos 付きギリシャ語イオータ (小文字) 

dead_diaeresis 

dead_acute 

dialytika と tonos 付きギリシャ語イオータ (小文字) 

dead_acute 

dead_diaeresis 

ギリシャ語ユプシロン (小文字) 

dialytika と tonos 付きギリシャ語ユプシロン (小文字) 

dead_diaeresis 

dead_acute 

ギリシャ語ユプシロン (小文字) 

dialytika と tonos 付きギリシャ語ユプシロン (小文字) 

dead_acute 

dead_diaeresis 

ギリシャ語イオータ (小文字) 

dialytika と tonos 付きギリシャ語イオータ (小文字) 

dead_diaeresis 

dead_acute 

ギリシャ語イオータ (小文字) 

dialytika と tonos 付きギリシャ語イオータ (小文字) 

SunFA_Acute 

SunFA_Diaeresis 

dialytika と tonos 付きギリシャ語イオータ (小文字) 

SunFA_Diaeresis 

SunFA_Acute 

dialytika と tonos 付きギリシャ語イオータ (小文字) 

SunFA_Acute 

SunFA_Diaeresis 

dialytika と tonos 付きギリシャ語ユプシロン (小文字) 

SunFA_Diaeresis 

SunFA_Acute 

dialytika と tonos 付きギリシャ語ユプシロン (小文字) 

SunFA_Acute 

SunFA_Diaeresis 

ギリシャ語イオータ (小文字) 

dialytika と tonos 付きギリシャ語イオータ (小文字) 

SunFA_Diaeresis 

SunFA_Acute 

ギリシャ語イオータ (小文字) 

dialytika と tonos 付きギリシャ語イオータ (小文字) 

SunFA_Acute 

SunFA_Diaeresis 

ギリシャ語ユプシロン (小文字) 

dialytika と tonos 付きギリシャ語ユプシロン (小文字) 

SunFA_Diaeresis 

SunFA_Acute 

ギリシャ語ユプシロン (小文字) 

dialytika と tonos 付きギリシャ語ユプシロン (小文字) 

表 5–11 4 つのキーを使用するギリシャ語入力モードの Compose キーシーケンス

その次に押すキー 

その次に押すキー 

その次に押すキー 

その次に押すキー 

結果 

セミコロン 

コロン 

コロン 

セミコロン 

セミコロン 

コロン 

コロン 

セミコロン 

ギリシャ語 dialytika、tonos 

ギリシャ語 dialytika、tonos 

ヘブライ語入力モード

ヘブライ語入力モードを選択するには、Compose h h を押すか、入力モード選択ウィンドウで「ヘブライ語 (Hebrew)」を選択します。入力モード選択ウィンドウの表示方法については、「入力方式の選択」 を参照してください。

次の図にヘブライ語キーボードの配列を示します。

図 5–6 ヘブライ語キーボード

この図については、前の本文中で説明しています。

日本語入力モード

日本語入力モードを選択するには、Compose j a を押すか、入力モード選択ウィンドウで「日本語 (Japanese)」を選択します。入力モード選択ウィンドウの表示方法については、「入力方式の選択」 を参照してください。

日本製の日本語入力方式を使用するには、システムに日本語ロケールをインストールし、システムを再起動する必要があります。日本語ロケールをインストールした後は、すべての UTF-8 ロケールで ATOK12 を使用できます。Wnn6 は、ja_JP.UTF-8 を除き、UTF-8 ロケールでは使用できません。

図 5–7 日本語キーボード

この図については、前の本文中で説明しています。

韓国語入力モード

韓国語入力モードを選択するには、Compose k o を押すか、入力モード選択ウィンドウで「韓国語 (Korean)」を選択します。入力モード選択ウィンドウの表示方法については、「入力方式の選択」 を参照してください。

韓国製の韓国語入力システムを使うには、システムに Ko.UTF-8 ロケールをインストールする必要があります。韓国語入力システムの使い方の詳細については、『Korean Solaris User's Guide』を参照してください。

図 5–8 韓国語キーボード

この図については、前の本文中で説明しています。

簡体字中国語入力モード

簡体字中国語入力モードを選択するには、Compose s c を押すか、入力モード選択ウィンドウで「簡体字中国語 (S-Chinese)」を選択します。「入力方式の選択」 を参照してください。

中国製の簡体字中国語入力システムを使用するには、システムに zh.UTF-8 ロケールをインストールする必要があります。簡体字中国語入力システムの使い方の詳細については、『Simplified Chinese Solaris User's Guide』を参照してください。

繁体字中国語入力モード

繁体字中国語入力モードを選択するには、Compose t c を押すか、入力モード選択ウィンドウで「繁体字中国語 (T-Chinese)」を選択します。入力モード選択ウィンドウの表示方法については、「入力方式の選択」 を参照してください。

台湾製の繁体字中国語入力システムを使うには、システムに zh_TW.UTF-8 ロケールをインストールする必要があります。繁体字中国語入力システムの使い方の詳細については、『Traditional Chinese Solaris User's Guide』を参照してください。

繁体字中国語 (香港) 入力モード

繁体字中国語 (香港) 入力モードを選択するには、Compose h k を押すか、入力モード選択ウィンドウで「繁体字中国語 (香港) (T-Chinese (Hong Kong))」を選択します。入力モード選択ウィンドウの表示方法については、「入力方式の選択」 を参照してください。

香港製の繁体字中国語 (香港) 入力システムを使うには、システムに繁体字中国語 (香港) ロケールをインストールする必要があります。

Unicode 16 進数入力モード

Unicode 16 進数入力モードを選択するには、Compose u h を押すか、入力モード選択ウィンドウで「Unicode 16 進 (Unicode Hex)」を選択します。8 進数入力モードを選択するには、Compose u o を押すか、「Unicode 8 進数 (Unicode Octal)」を選択します。入力モード選択ウィンドウの表示方法については、「入力方式の選択」 を参照してください。

この入力モードを使用するには、文字の 16 進数コード値または、8 進数コード値を知っている必要があります。コード値と文字の対応については、『The Unicode Standard, Version 4.0』を参照してください。

Unicode 16 進数のコード入力モードで文字を入力する場合は、4 桁の 16 進数を入力します。次はその例です。

16 進数に使用する A、B、C、D、E、F は、大文字でも小文字でもかまいません。16 進法の代わりに 8 進法にする場合、0 から 7 までの 8 進法の数字を入力できます。間違えて入力した 16 進数は、Delete キーか Backspace キーで削除できます。

表検索入力モード

表検索入力モードを選択するには、Compose l l を押すか、入力モード選択ウィンドウで「Unicode 表から選択 (Lookup)」を選択します。入力モード選択ウィンドウの表示方法については、「入力方式の選択」 を参照してください。

2 つめの検索ウィンドウには、このグループの候補が同時に最大 80 まで表示されます。次の候補群を表示するには Control-n キーを、前の候補語を表示するには Control-p キーをそれぞれ押します。

システム環境

この節では、ロケールの環境変数、TTY 環境の設定、32 ビットおよび 64 ビット STREAMS モジュール、および端末サポートについて説明します。

ロケールの環境変数

システムに en_US.UTF-8 がインストールされていることを確認してください。さまざまなカテゴリの現在のロケール設定を調べるには、locale ユーティリティを使用します。

system% locale 
LANG=en_US.UTF-8
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_ALL=

en_US.UTF-8 ロケールデスクトップ環境を使用するには、まずロケールを選択します。TTY 環境で、まず環境変数 LANGen_US.UTF-8 に設定してこのロケールを選択します。C シェルの例を以下に示します。

system% setenv LANG en_US.UTF-8

LC_ALLLC_COLLATELC_CTYPELC_MESSAGESLC_NUMERICLC_MONETARYLC_TIME カテゴリには、何も設定されていないか、en_US.UTF-8 が設定されている必要があります。これらのカテゴリに値が設定されていると、その値が、それより優先度の低い LANG 環境変数の値の代わりに使用されます。環境変数の階層については、setlocale(3C) のマニュアルページを参照してください。

また、CDE ログイン画面の「オプション」->「言語」メニューで en_US.UTF-8 を選択することにより、en_US.UTF-8 環境を起動することもできます。

TTY 環境の設定

使用している端末や端末エミュレータによっては、コードセット固有の一定の STREAMS モジュールをストリームにプッシュする必要がある場合があります。

STREAMS モジュールの詳細および一般的なストリームについては、『STREAM Programming Guide』を参照してください。

次の表に、端末環境で en_US.UTF-8 ロケールによってサポートされる 64 ビット STREAMS モジュールを示します。詳細は、『Solaris 64 ビット 開発ガイド』を参照してください。

表 5–12 en_US.UTF-8 によりサポートされる STREAMS モジュール

32 ビット STREAMS モジュール 

説明 

/usr/kernel/strmod/sparcv9/u8lat1

UTF-8ISO8859-1 (西ヨーロッパ) のコード変換 STREAMS モジュール

/usr/kernel/strmod/sparcv9/u8lat2

UTF-8ISO8859-2 (東ヨーロッパ) のコード変換 STREAMS モジュール

/usr/kernel/strmod/sparcv9/u8koi8

UTF-8KOI8-R (キリル文字) のコード変換 STREAMS モジュール


注 –

Solaris 10 リリース以降、SPARC sun4u プラットフォーム用の 32 ビットカーネルはサポートされません。表 5–12 は、x86 プラットフォーム用の 32 ビットカーネルにだけ適用されます。詳細は、『Solaris 10 ご使用にあたって』を参照してください。


次の表に、en_US.UTF-8によってサポートされる 64 ビット STREAMS モジュールを示します。

表 5–13 en_US.UTF-8 によりサポートされる 64 ビット STREAMS モジュール

64 ビット STREAMS モジュール 

説明 

/usr/kernel/strmod/sparcv9/u8lat1

UTF-8ISO8859-1 (西ヨーロッパ) のコード変換 STREAMS モジュール

/usr/kernel/strmod/sparcv9/u8lat2

UTF-8ISO8859-2 (東ヨーロッパ) のコード変換 STREAMS モジュール

/usr/kernel/strmod/sparcv9/u8koi8

UTF-8KOI8-R (キリル文字) のコード変換 STREAMS モジュール

カーネルに STREAMS モジュールをロードする方法
  1. スーパーユーザーとして、Solaris システムが 64 ビットと 32 ビットのどちらであるかを判断します。

    system# isainfo -v
    
    • 64 ビットの Solaris システムは、次の情報を返します。

      64-bit sparcv9 applications
      32-bit sparc applications
    • 32 ビットの Solaris システムは、次の情報を返します。

      32-bit sparc applications
    • 32 ビットの x86 システムは、次の情報を返します。

      32-bit i386 applications
  2. システムにすでに STREAMS モジュールがロードされていないかを確認します。

    system# modinfo | grep modulename
    

    u8lat1 などの STREAMS モジュールがすでにインストールされている場合は、出力は次のようになります。

    system# modinfo | grep u8lat1
    89 ff798000  4b13  18   1  u8lat1 (UTF-8 <--> ISO 8859-1 module)
  3. モジュールがロードされていない場合は、modload(1M) コマンドを使用してモジュールをロードします。

    • 32 ビットのシステムの場合、次のように入力します。

      system# modload /usr/kernel/strmod/u8lat1
      
    • 64 ビットのシステムの場合、次のように入力します。

      system# modload /usr/kernel/strmod/sparcv9/u8lat1
      

      適切な u8lat1 STREAMS モジュールがカーネルにロードされ、モジュールをストリームにプッシュできるようになります。

カーネルから STREAMS モジュールをアンロードする方法
  1. スーパーユーザーとして、カーネルにモジュールがロードされていることを確認します。

    u8lat1 がロードされていることを確認するには、次のように入力します。

    system# modinfo | grep u8lat1
    89 ff798000  4b13  18   1  u8lat1 (UTF-8 <--> ISO 8859-1 module)
  2. modunload(1M) コマンドを使用して、カーネルをアンロードします。

    u8lat1 モジュールをアンロードするには、次のように入力します。

    system# modunload -i 89
    
Latin-2 端末および STREAMS モジュールを設定する方法
  1. strchg(1M) を次のように使用します (2 つめのコマンド行)。

    system% cat > tmp/mystreams 
    ttcompat
    ldterm
    u8lat1
    ptem
    ^D
    system% strchg -f /tmp/mystreams
    

    strchg(1) を使用する場合、スーパーユーザーかデバイスの所有者としてログインしていることを確認します。

  2. strconf コマンドを実行して、現在の構成を確認します。

    system% strconf
    ttcompat
    ldterm
    u8lat1
    ptem
    pts
    system%
  3. strchg コマンドを実行して、元の構成に戻します。

    system% cat > /tmp/orgstreams
    ttcompat
    ldterm
    ptem
    ^D
    system% strchg -f /tmp/orgstreams
    

UTF-8 文字の入出力が可能な dttermxterm、および端末

Solaris OS の旧リリースとは異なり、UTF-8 コードセットの入出力をサポートする dttermxterm 端末エミュレータおよびその他の端末では、ストリームに追加 STREAMS モジュールを置く必要はありません。stty(1) ユーティリティを使用して端末環境を設定した場合は、ldterm モジュールはコードセットに依存せず、Unicode/UTF-8 をサポートします。

Unicode ロケールの端末環境を設定するには、stty(1) ユーティリティを使用します。

system% /bin/stty defeucw

現在の設定を照会する場合は、次のように stty-a オプションを指定します。

system% /bin/stty -a

注 –

/usr/ucb/stty は国際化されていないので、代わりに /bin/stty を使ってください。


Latin-1、Latin-2、および KOI8-R の端末サポート

Latin-1 (ISO8859-1)、Latin-2 (ISO8859-2)、または KOI8-R だけをサポートする端末の場合、STREAMS は次のように構成されている必要があります。

head <-> ttcompat <->  ldterm <->  u8lat1 <-> TTY

これは Latin-1 をサポートする端末用の構成です。Latin-2 端末の場合は、STREAMS モジュール u8lat1u8lat2 に置き換えます。KOI8-R 端末の場合は、このモジュールを u8koi8 に置き換えます。

STREAMS モジュールがすでにカーネルにロードされていることを確認してください。

~/.cshrc への設定の保存

必要な STREAMS モジュールがカーネルにロードされたら、以下の行を .cshrc ファイル (C シェルの場合) に保存すると便利です。

setenv LANG en_US.UTF-8
if ($?USER != 0 && $?prompt != 0) then
     cat >! /tmp/mystreams$$ << _EOF
     ttcompat
     ldtterm
     u8lat1
     ptem
_EOF
     /bin/strchg -f /tmp/mystreams$$
     /bin/rm -f /tmp/mystreams$$
     /bin/stty cs8 -istrip defeucw
endif

.cshrc ファイルにこれらの行がすでにある場合は、STREAMS モジュールを使用するたびにこれらのコマンドを入力する必要はありません。2 つめの _EOF は行の先頭の位置になければなりません。

コード変換

Unicode ロケールがサポートされていることにより、iconv および sdtconvtool ユーティリティを使って、多くの国の主なコードセット間のさまざまなコード変換を行うことができるようになります。

最新の Solaris 環境では、geniconvtbl ユーティリティによって、ユーザー定義のコード変換が行えます。geniconvtbl ユーティリティを使って作成したユーザー定義コード変換は、iconv(1)iconv(3) の両方で使用できます。このユーティリティの詳細については、geniconvtbl(1)geniconvtbl(4) のマニュアルページを参照してください。

iconviconv_opensdtconvtool に適用できる fromcodetocode の名前については、付録 A 「iconv コード変換」 の表を参照してください。iconv コード変換の詳細については、iconv(1)sdtconvtool(1) のマニュアルページを参照してください。利用可能なコード変換については、iconv(5) のマニュアルページを参照してください。また、付録 A 「iconv コード変換」 も参照してください。


注 –

UCS-2、UCS-4、UTF-16、UTF-32 はすべて、Unicode 4.0 と ISO/IEC 10646-1:2000 規格で定義されているバイト順序マーク (BOM) 文字を認識する Unicode/ISO/IEC 10646 表示書式です。ただし、この文字が文字ストリームの最初の位置になければなりません。UCS-2BE、UCS-4BE、UTF-16BE、UTF-32BE など他の書式は、BOM 文字を認識しない固定幅の Unicode/ISO/IEC 10646 表示書式です。この書式のバイト順序は、ビッグエンディアンであるとみなされます。一方、UCS-2LE、UCS-4LE、UTF-16LE、UTF-32LE などの表示書式のバイト順序はリトルエンディアンであるとみなされます。また、これらの表示書式も、BOM 文字を認識しません。

対応する ISO8859–* や KO18–* のスクリプトや言語については、http://czyborra.com/charsets/iso8869.html を参照してください。


DtMail サポート

サポートするスクリプトが増えたために、en_US.UTF-8 ロケールで実行される Solaris DtMail は以下に示す各種の MIME 文字セットをサポートします。

このサポートによって、世界中のどの地域のどの文字セットで符号化された電子メールでも、ほとんどの場合は 1 つの DtMail のインスタンスだけで表示できます。DtMail は、到着した電子メールを、そこに指定されている MIME 文字セットと Content-Ttransfer-Encoding に基づいて復号化します。Windows-125x MIME 文字がサポートされています。

送信の場合は、受信者のメールユーザーエージェント (メールクライアント) が理解できる MIME 文字セットを指定する必要があります。あるいは、指定せずに、en_US.UTF-8 ロケールによって提供されるデフォルトの MIME 文字セットを使用することもできます。送信する電子メールの文字セットを切り替えるには、「新規メッセージ (New Message)」ウィンドウで Control-y キーを押すか、「書式 (Format)」メニューボタンをクリックしてから「文字セットを変更 (Change Char Set)」ボタンをクリックします。使用可能な次の文字セットが、「送信 (Send)」ボタンの上の左下隅に表示されます。

電子メールのヘッダーか本体に、その MIME 文字セットで表せない文字が含まれていると、システムはすべての文字を表せる UTF-8 文字セットに自動的に切り替わります。

メッセージに 7 ビット US-ASCII 文字しか使用されていない場合、電子メールのデフォルト MIME 文字セットは US-ASCII です。すべてのメールユーザーエージェントで文字や情報の欠落なしにメッセージを解釈できます。

複数のスクリプトの文字が含まれている電子メールの、デフォルトの MIME 文字セットは UTF-8 です。この場合、UTF-8 の 8 ビット文字はすべて Quoted-Printable エンコーディングによって符号化されます。MIME、登録されている MIME 文字セット、および Quoted-Printable エンコーディングについての詳細は、RFC 2045、2046、2047、2048、2049、2279、2152、2237、1922、1557、1555、1489 を参照してください。

図 5–9 DtMail 「新規メッセージ」ウィンドウ

この図については、前の本文中で説明しています。

プログラミング環境

正しく国際化されたアプリケーションは自動的に en_US.UTF-8 ロケールが有効になります。そのためには、アプリケーションのリソースファイルで、適切な FontSet/XmFontList を定義することが必要です。

国際化されたアプリケーションについての詳細は、『Creating Worldwide Software: Solaris International Developer's Guide』の第 2 版を参照してください。

X アプリケーションで使用されるフォントセット

X アプリケーションで使用されるフォントセットについては、「Unicode ロケール: en_US.UTF-8 サポート」 を参照してください。

Solaris デスクトップ環境では、各文字セットにフォントのセットが割り当てられています。

以下のリストは、最新の Solaris 環境でサポートされている Latin-1 のフォントです。

-dt-interface system-medium-r-normal-xxs sans utf-10-100-72-72-p-59-iso8859-1
-dt-interface system-medium-r-normal-xs sans  utf-12-120-72-72-p-71-iso8859-1
-dt-interface system-medium-r-normal-s sans  utf-14-140-72-72-p-82-iso8859-1
-dt-interface system-medium-r-normal-m sans  utf-17-170-72-72-p-97-iso8859-1
-dt-interface system-medium-r-normal-l sans  utf-18-180-72-72-p-106-iso8859-1
-dt-interface system-medium-r-normal-xl sans utf-20-200-72-72-p-114-iso8859-1
-dt-interface system-medium-r-normal-xxl sans utf-24-240-72-72-p-137-iso8859-1

-dt-interface user-*-dt-application-* 別名 (エイリアス) など、CDE 共通のフォント別名については、 『Common Desktop Environment: Internationalization Programmer's Guide』を参照してください。

en_US.UTF-8 ロケールでは、utf もこのロケールの共通フォント別名としてサポートされています。これは、X 論理フォント記述名のスタイルフィールドの追加属性として使用されています。したがって、適切なフォントセットを用意するためには、次の例のように、フォントセットの作成で追加のスタイルを指定する必要があります。

fs = XCreateFontSet(display,
"-dt-interface system-medium-r-normal-s*utf*",
 &missing_ptr, &missing_count, &def_string);

CDE/Motif アプリケーションとしての FontList 定義

フォントセット定義の場合と同じように、アプリケーションの XmFontList リソース定義にも、このロケールでサポートされる追加のスタイル属性を指定する必要があります。

*fontList:\
 -dt-interface system-medium-r-normal-s*utf*: