Oracle® Solaris 11.2 国際化対応言語環境の利用ガイド

印刷ビューの終了

更新: 2014 年 7 月
 
 

Unicode 用の国際化コンポーネント

Oracle Solaris 11 では、使用可能なインタフェースに Unicode 用の国際化コンポーネント (ICU) の C/C++ ライブラリが追加されます。ICU は、ソフトウェアアプリケーションに Unicode とグローバル化のサポートを提供する、成熟した、幅広く使用されているライブラリのセットです。ICU には移植性があり、すべてのプラットフォーム上で、および C/C++ と Java のソフトウェアの間で、同じ結果が得られます。

ICU が提供するサービスの一部に含まれるもの:

  • コードページの変換 – Unicode や、ほとんどすべてのその他の文字セットまたはエンコーディングとの間で、テキストデータを変換します。

  • 照合 – 特定の言語、地域、または国の慣例や標準に従って、文字列を比較します。

  • 書式設定 – 選択されたロケールに応じて、数値、日付、時間、および通貨金額を書式設定します。

  • 時間計算 – 複数の種類のカレンダーとタイムゾーン計算 API の完全なセットが提供されます。

  • Unicode のサポート – ICU は、多くの Unicode 文字プロパティー、Unicode 正規化、ケースフォールディング、および Unicode 標準に規定されているその他の基本的な処理のすべてへのアクセスを容易にして、Unicode 標準を詳細に追跡します。

  • 正規表現 – ICU の正規表現は、Unicode を完全にサポートすると同時に、非常に競争力のあるパフォーマンスを提供します。

  • 双方向テキスト (Bidi) – 左から右および右から左のデータの混在を含むテキストの処理をサポートします。

  • テキスト境界 – テキストの範囲内で単語、文、および段落の位置を見つけたり、テキストを表示するときの行の折り返しに適した位置を識別したりします。

Oracle Solaris 11 の ICU は 2 つのパッケージに分けられていて、library/icu にはライブラリのみが含まれていますが、developer/icu は、ヘッダーファイルと、uconv(1) のようないくつかのユーティリティーを提供します。

詳細は、プロジェクトの Web サイト (http://site.icu-project.org) を参照してください。libicui18n(3LIB)、 libicuio(3LIB)、 libicudata(3LIB)、 libicule(3LIB)、 libiculx(3LIB)、 libicutu(3LIB)、および libicuuc(3LIB) のマニュアルページに、Oracle Solaris でライブラリを使用する方法が記載されています。

uconv ユーティリティー

iconv(1) に加えて、Unicode 用の国際化コンポーネント (ICU) ツールセットの一部である uconv(1) コマンドも、1 つのエンコーディングから別のエンコーディングへの変換に使用できます。uconv は、229 のエンコーディングと、1000 を超える別名をサポートしています。

このツールは、デフォルトではインストールされない developer/icu パッケージの一部です。これをインストールするには、次のコマンドを発行します。

# pkg install developer/icu

cp-1252 エンコーディングのテキストを UTF-8 に変換するには、次のように入力します。

$ uconv -f cp1252 -t UTF-8 -o file_in_utf8.txt file_in_cp1252_encoding.txt

uconv のもう 1 つの機能は、ベースとなる単語を変換せずに 1 文字ごとに文字を変換する、転写です。次の例では、ギリシア語のテキストの一部がラテン語の文字に変換されます。

$ echo “Σολαρις”| uconv -x Greek-Latin -f utf-8 -t utf-8
Solaris

このツールの機能についての詳細は、uconv(1) のマニュアルページを参照してください。