レプリケーションは、リレーショナル・データベース管理システム(RDBMS)やソフトウェア・エンジニアリング・ワークベンチに内蔵されていることもある、比較的単純な技術的なプロセスです。
レプリケーションを使用すると、同じ数の表と同じデータ検証ルールを持つ2つの類似したデータ・モデルの間でデータ・フローを管理することができます。データ整合性制約がソース・モデルとターゲット・モデルの両方で同一の場合は、データ・エラーは処理されません。行やレコードの数がソースとターゲット両方で同一の場合、たとえばソース上に18か月、ターゲット上に36か月の履歴レベルを持つことができません。
レプリケーション・インタフェースの作成には、アプリケーションの詳細な知識は不要です。最もよく実装されたリソースは、ファイル・コピー、ミラー・ベースのロギング、スナップショット(Oracle)などです。
データ・トランスフォーメーションの考え方を利用すると、ソースとターゲットの間のデータ・モデリングに実質的な相違を持たせることができます。この相違には、いくつかのレベルがあります。
ソースとターゲットの間で根本的に異なるデータ・モデルのタイプ(スター、スノーフレーク、正規化済など)
エラー処理とリサイクリング手順を含む整合性制約(必要に応じてRDBMSで宣言)
格納テクノロジ(ファイル、RDBMSなど)
ロギング・レベル(たとえば、ソース上では18か月、ターゲット上では36か月)
モデリングの相違は、データ・ウェアハウス、データマートおよび移行プロジェクトでは正常です。モデリングの相違は、データ検証ルールの相違、ひいては転送されたデータにエラーがある可能性を示します。
インタフェースによって実行されるトランスフォーメーションのタイプは次のとおりです。
マッピング。ターゲット情報(表の列)を、場合によっては異なる環境に由来するソース情報に、計算ルール(数値計算、連鎖計算、連結、集約など)を使用してマップすることを可能にします。
たとえば、アクティブな顧客のみを返す顧客ファイル上のフィルタのように、機能上有用なレコードのみを返すことが可能です。
増分または非同期のロード。変化のないデータを繰り返し転送しないようにすることによって、手順の高速化を可能にします。
データ・モデルのデザインを変更する場合、人工のIDコード(シーケンス)を作成する必要があることがあります。このタイプのIDコードは、移行と、スター・モデリングのデータ・ウェアハウス・プロジェクトの両方で使用されます。