JavaScript is required to for searching.
ナビゲーションリンクをスキップ
印刷ビューの終了
Oracle Solaris 11.1 国際化対応言語環境の利用ガイド     Oracle Solaris 11.1 Information Library (日本語)
PDF
このドキュメントの評価
search filter icon
search icon

ドキュメントの情報

はじめに

1.  紹介

2.  Unicode と UTF-8 ロケールのサポート

3.  言語とロケールの作業

4.  デスクトップキーボードの設定と入力方式

5.  フォントの構成

6.  高度なトピック

コードセット変換

iconv ユーティリティー

Unicode 用の国際化コンポーネント

uconv ユーティリティー

ファイル検査機能 (fsexam)

エンコーディング自動検出 (auto_ef)

国際化ドメイン名のサポート

GNU IDN ライブラリ

JPRS idnkit-2 ライブラリ

印刷の拡張

mp ユーティリティー

ほかのプラットフォームとの相互運用性

NFS サーバーの考慮事項

ファイルシステムの考慮事項

ASCII 以外のファイル名を含むアーカイブ

カスタムロケールの作成

システムロケールを基にした新しいロケールの作成

カスタムロケールを作成する方法

ゼロからのロケールの作成

A.  使用可能なロケール

索引

ドキュメントの品質向上のためのご意見をください
簡潔すぎた
読みづらかった、または難し過ぎた
重要な情報が欠けていた
内容が間違っていた
翻訳版が必要
その他
Your rating has been updated
貴重なご意見を有り難うございました!

あなたの貴重なご意見はより良いドキュメント作成の手助けとなります 内容の品質向上と追加コメントのためのアンケートに参加されますか?

コードセット変換

コードセット変換、つまり文字セット (charset) 変換のサポートは、ほとんどのアプリケーションがこの機能に依存することで正しく機能しているため、オペレーティングシステムには不可欠な部分です。

Oracle Solaris の現在のリリースには、Unicode のサポート、ソフトウェアの国際化、およびソフトウェアのグローバル化のために広く使用されているライブラリとツールである、Unicode 用の国際化コンポーネント (ICU) も組み込まれています。

Oracle Solaris 11 には、コードセット変換のためのさまざまなツールとライブラリが組み込まれています。中核となるコードセット変換ユーティリティー、iconv は、Oracle Solaris libc 内の iconv ライブラリを基に構築されています。

iconv ユーティリティー

iconv(1) コマンド行ユーティリティーは、文字または文字のシーケンスを、1 つのコードセットから別のコードセットに変換します。これは広範囲のコードセットをサポートします。コードセット名はプラットフォームによって異なることがよくあるため、iconv の別名メカニズムによって多くのコードセットが複数の名前でサポートされます。システムで現在使用可能なコードセットのリストを取得するには、次のコマンドを実行します。

$ /usr/bin/iconv -l

複数のパッケージに iconv モジュールが含まれているため、追加のパッケージをインストールすることでデフォルトのリストを拡張できます。デフォルトのインストールには system/library/iconv/utf-8 パッケージが含まれ、これに、UTF-8 やその他の Unicode コードセットと選択されたほかのコードセットとの間の変換用の、iconv モジュールの基本セットが含まれています。その他のパッケージは、パッケージマネージャーの「システム/国際化」カテゴリから、または pkg(1) コマンドを使ってインストールする際に system/library/iconv/* というファイル名のパターンを使用することで入手できます。

iconv —f オプションはソースコードセットを定義し、-t オプションはターゲットコードセットを定義します。次のように、iconv を使用すると、ファイル、つまり標準入力を、標準出力に変換できます。

$ /usr/bin/iconv -f eucJP -t UTF-8 file.txt

この例では、file.txt ファイル名が eucJP コードセット (日本語 EUC、Extended UNIX Code Packed Format for Japanese) から変換され、結果が UTF-8 で標準出力に書き込まれます。

Oracle Solaris 11 では、iconv が拡張されて、これらの特殊な状況における変換の動作を変更するフラグが組み込まれました。

//ILLEGAL_DISCARD//NON_IDENTICAL_DISCARD //IGNORE、および //TRANSLIT のようなフラグも、コマンド行で使用できます。詳細は、iconv_open(3C) のマニュアルページを参照してください。


注 - Oracle Solaris の iconv モジュールのいくつかは、iconv_open(3C) のマニュアルページで説明されているフラグのサブセットのみを実行する場合があります。


iconv についての詳細は、iconv(1)iconv(3C)iconv_open(3C)、および関連のマニュアルページを参照してください。

Unicode 用の国際化コンポーネント

Oracle Solaris 11 では、使用可能なインタフェースに Unicode 用の国際化コンポーネント (ICU) の C/C++ ライブラリが追加されます。ICU は、ソフトウェアアプリケーションに Unicode とグローバル化のサポートを提供する、成熟した、幅広く使用されているライブラリのセットです。ICU には移植性があり、すべてのプラットフォーム上で、および C/C++ と Java のソフトウェアの間で、同じ結果が得られます。

ICU が提供するサービスの一部に含まれるもの:

Oracle Solaris 11 の ICU は 2 つのパッケージに分けられていて、library/icu にはライブラリのみが含まれていますが、developer/icu は、ヘッダーファイルと、uconv(1) のようないくつかのユーティリティーを提供します。

詳細は、プロジェクトの Web サイト (http://site.icu-project.org) を参照してください。libicui18n(3LIB)、libicuio(3LIB)、libicudata (3LIB)、libicule(3LIB)、 libiculx(3LIB)、libicutu (3LIB)、および libicuuc(3LIB) のマニュアルページに、Oracle Solaris でライブラリを使用する方法が記載されています。

uconv ユーティリティー

iconv(1) に加えて、Unicode 用の国際化コンポーネント (ICU) ツールセットの一部である uconv(1) コマンドも、1 つのエンコーディングから別のエンコーディングへの変換に使用できます。uconv は、229 のエンコーディングと、1000 を超える別名をサポートしています。

このツールは、デフォルトではインストールされない developer/icu パッケージの一部です。これをインストールするには、次のコマンドを発行します。

# pkg install developer/icu

cp-1252 エンコーディングのテキストを UTF-8 に変換するには、次のように入力します。

$ uconv -f cp1252 -t UTF-8 -o file_in_utf8.txt file_in_cp1252_encoding.txt

uconv のもう 1 つの機能は、ベースとなる単語を変換せずに 1 文字ごとに文字を変換する、転写です。次の例では、ギリシア語のテキストの一部がラテン語の文字に変換されます。

$ echo “Σολαρις”| uconv -x Greek-Latin -f utf-8 -t utf-8
Solaris

このツールの機能についての詳細は、uconv(1) のマニュアルページを参照してください。

ファイル検査機能 (fsexam)

ファイルエンコーディング検査機能 fsexam ユーティリティーでは、ファイルの名前、または標準テキストファイルの内容を、古い文字エンコーディングから UTF-8 エンコーディングに変換できます。fsexam ユーティリティーには次の新しい機能が含まれています。

システムに fsexam を追加するには、storage/fsexam パッケージをインストールします。詳細は、fsexam (1) および fsexam(4) のマニュアルページを参照してください。

エンコーディング自動検出 (auto_ef)

Oracle Solaris には、auto_ef(1) という、ファイルのエンコーディングを識別するためのコマンド行ユーティリティーが含まれています。auto_ef は、iconv コード変換を使用してエンコーディングを判定し、ファイルに対して特定のコード変換が成功したかどうかを判断します。これは、ファイル内に出現する文字シーケンスの頻度分析も行います。たとえば、

$ auto_ef test_file
eucJP

-a オプションを使用すると、指定されたファイルに可能なすべてのエンコーディングが表示されます。

$ auto_ef -a test_file
eucJP           0.89
zh_CN.euc       0.40
ko_KR.euc       0.01

システムに auto_ef を追加するには、text/auto_ef パッケージをインストールします。詳細は、auto_ef(1) のマニュアルページを参照してください。