Transliterate

「Transliterate」プロセッサでは、ある記述体系(アラビア語など)から別の記述体系(ラテン語など)に文字列を変換します。これは大部分は音声操作で、文字列が表す発音に基づいて、元の文字列に相当する語をターゲットの記述体系で作成しようとする操作です。文字列の翻訳を試行するものではありません。たとえば、アラビア語で、音読すると「bin」のように発音し、アラビアの氏名の一般的な構成要素である文字列は、ラテン語の文字列「bin」に音訳され、文字どおりの意味である「son of」には翻訳されません。

元の記述体系の単一の文字列には、有効な音訳が複数ある可能性について注意してください。たとえば、「bin」は「ben」にも音訳できます。一部の氏名には非常に多くの代替音訳があります。「Transliterate」プロセッサでは、元の文字列に対して、可能性のあるすべての代替音訳を提供するのではなく、単一の標準形式を提供することを目指しています。代替音訳はマッチ・プロセスの一環として認識され、音訳されていない氏名の代替スペルと同様の認識方法で管理されます。

EDQの「Transliterate」プロセッサは、ICUに用意されているICU4Jライブラリを中心に構築されています。ICUは制限のないオープン・ソース・ライセンスでリリースされており、市販のソフトウェアでの使用と、他のオープン・ソースやフリー・ソフトウェアでの使用のいずれにも適しています。ICUの詳細は、ICUのWebサイトを参照してください。完全なICUライセンスを参照するには、ここをクリックしてください。

用途

「Transliterate」プロセッサは、ある記述体系から別の記述体系に発音的に適合する方法で文字列を変換するために使用します。これは、ある記述体系で提供された文字列を別の記述体系で提供された参照データと照合する場合に役立ちます。たとえば、国際的なウォッチリストはラテン語のスクリプトでのみ提供されることがよくあります。

注意: 「Transliterate」プロセッサは、EDQで代替記述体系を処理するために使用可能な唯一のツールではありません。音訳要件の複雑性とICU4Jの多様な記述体系のサポートによっては、他のアプローチのほうが確実な場合があります。たとえば、ソース記述体系とターゲット記述体系の適切な参照データ・セットとともに、「Replace」プロセッサと「Character Replace」プロセッサの組合せを使用して音訳を実装できます。

構成

入力

音訳する任意の数の文字列属性または文字列属性の配列。数値および日付属性は、すべての特有な記述体系とは独立した形式で格納されるため音訳する必要はありません。数値または日付が含まれる文字列は、最も適切な方式でターゲット記述体系に変換されますが、これは音声操作ではありません。

オプション

オプション

タイプ

目的

デフォルト値

List of possible transliteration options

標準リスト・リソース

入力の音訳に使用するソースおよびターゲットの記述体系を定義します。

デフォルトの選択は「Any to Latin」です。

出力

データ属性

データ属性

タイプ

目的

[Attribute Name].Transliterated

導出

属性値の音訳バージョン。

元の属性をターゲット記述体系に音訳した値。

フラグ

なし

ダッシュボードへの公開

なし

実行

実行モード

サポート

バッチ

Yes

リアルタイム・モニタリング

Yes

リアルタイム応答

Yes

結果ブラウザの表示

「Transliterate」プロセッサは、サマリー・データを出力しません。音訳された入力値は入力属性とともにデータ・ビューに表示されます。

出力フィルタ

なし

次の例では、入力データの氏名がギリシャ語(Original Script Name)からラテン語(Original Script Name.Transliterated)に音訳されています。

ICUライセンス

このライセンス情報は、「Transliterate」プロセッサで使用されるICUライブラリにのみ関連します。「Transliterate」プロセッサの作成に使用された追加のコードも含め、製品の他の部分に影響することはなく、他のEDQライセンスにもまったく影響しません。ICUライセンスの条項に従って、ここに完全なICUライセンスを記載しています。

ICU License - ICU 1.8.1 and later

COPYRIGHT AND PERMISSION NOTICE

Copyright (c) 1995-2009 International Business Machines Corporation and others

All rights reserved.

Permission is hereby granted, free of charge, to any person obtaining a copy of this software and associated documentation files (the "Software"), to deal in the Software without restriction, including without limitation the rights to use, copy, modify, merge, publish, distribute, and/or sell copies of the Software, and to permit persons to whom the Software is furnished to do so, provided that the above copyright notice(s) and this permission notice appear in all copies of the Software and that both the above copyright notice(s) and this permission notice appear in supporting documentation.

THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT OF THIRD PARTY RIGHTS.IN NO EVENT SHALL THE COPYRIGHT HOLDER OR HOLDERS INCLUDED IN THIS NOTICE BE LIABLE FOR ANY CLAIM, OR ANY SPECIAL INDIRECT OR CONSEQUENTIAL DAMAGES, OR ANY DAMAGES WHATSOEVER RESULTING FROM LOSS OF USE, DATA OR PROFITS, WHETHER IN AN ACTION OF CONTRACT, NEGLIGENCE OR OTHER TORTIOUS ACTION, ARISING OUT OF OR IN CONNECTION WITH THE USE OR PERFORMANCE OF THIS SOFTWARE.

Except as contained in this notice, the name of a copyright holder shall not be used in advertising or otherwise to promote the sale, use or other dealings in this Software without prior written authorization of the copyright holder.

All trademarks and registered trademarks mentioned herein are the property of their respective owners.

Oracle (R) Enterprise Data Qualityオンライン・ヘルプ バージョン8.1
Copyright (C) 2006,2011 Oracle and/or its affiliates.All rights reserved.