ストリーミング・ハンドラを使用したPostgresSQLからSnowflakeへのデータのレプリケート
ストリーミング・ハンドラを使用して、OCI GoldenGateを使用してPostgreSQLからSnowflakeにデータをレプリケートする方法をご覧ください。
開始する前に
このクイックスタートを正常に完了するには、次が必要です:
-
OCI Database with PostgreSQLへのアクセス
-
OCI Database with PostgreSQLで使用されるVCNのセキュリティ・リストでポート5432を開きます
-
Snowflakeへのアクセス
Set up OCI Database with PostgreSQL
-
OCI Database with PostgreSQLを作成します。
-
OCI Database with PostgreSQLの場合:
-
「構成」を選択します。
-
PostgreSQL.VM.Standard.E5.Flex-14-0_51などの既存の構成を使用します。 -
「構成のコピー」を選択し、名前を変更し、「ユーザー変数」(読取り/書込み)の下に
wal_levelを追加し、「論理」に設定します。 -
「作成」を選択します。
-
詳細は、「構成のコピー」を参照してください。
-
-
DB Systemの作成時に、
wal_levelをtrueに設定した構成を使用します。詳細は、「データベース・システムの作成」を参照してください。
-
-
OCI Database with PostgreSQLに接続します。詳細は、データベースへの接続を参照してください。
-
OCI Database with PostgreSQLでGoldenGateのデータベースおよびユーザーを作成します。
-
データベース
-
データベースの作成ociggll;
-
\c ociggll。
-
スキーマsrc_ociggllを作成します。
-
-
ユーザー
-
ユーザー
ggadminをパスワード<password>で作成します。 -
データベースociggllのすべての権限をggadminに付与します。
-
ggadminへのSCHEMA src_ociggllのすべての表に対するグラント選択;
-
-
スノーフレーク・データベースの設定
-
パブリック・キーをSnowflakeユーザーに追加します(例:
ALTER USER example_user SET RSA_PUBLIC_KEY='MIIBIjANBgkqh...';)。 -
サンプル・スキーマを使用してターゲット表を作成します。
タスク1: OCI GoldenGateリソースの作成
このクイックスタートの例では、ソースとターゲットの両方のデプロイメントおよび接続が必要です。
-
GoldenGate for PostgreSQL 26aiが必要です。
-
ソースPostgreSQLデータベースのPostgreSQLデプロイメントを作成します。
-
ターゲット・スノーフレーク・データベースのビッグ・データ・デプロイメントを作成します。
-
次の値を使用してPostgreSQL接続を作成します。
-
「タイプ」で、ドロップダウンから「OCI Database with PostgreSQL」を選択します。
-
「データベース名」に、
ociggllと入力します。 -
「ユーザー名」に、
ggadminと入力します。 -
「パスワード」に、パスワードを入力します。
-
「セキュリティ・プロトコル」で、ドロップダウンから「TLS」を選択し、「優先」を選択します。
-
-
次の値を使用してスノーフレーク接続を作成します:
-
「接続URL」に、
jdbc:snowflake://<account_identifier>.snowflakecomputing.com/?warehouse=<warehouse name>&db=OCIGGLLと入力します。ノート:
<account_identifier>および<warehouse name>を適切な値に置き換えてください。 -
「認証タイプ」で、ドロップダウンから「キー・ペア認証」を選択します。
ノート:スノーフレーク・ストリーミングでサポートされている認証タイプは、キー・ペア認証のみです。
-
「ユーザー名」に、名前を入力します。
-
前に作成した秘密キーをアップロードします。
-
秘密キーのパスフレーズを「秘密キーのパスワード」フィールドに入力します。
-
-
ターゲット・ビッグ・データ・デプロイメントにGoldenGateへの接続を作成してから、ソースPostgreSQLデプロイメントにこの接続を割り当てます。
タスク2: サプリメンタル・ログの有効化
サプリメンタル・ロギングの有効化の手順:
-
PostgreSQL GoldenGateデプロイメント・コンソールを起動します:
-
「デプロイメント」ページから、PostgreSQLデプロイメントを選択してその詳細を表示します。
-
PostgreSQLデプロイメントの詳細ページで、「コンソールの起動」を選択します。
-
デプロイメント・コンソールのサインイン・ページで、タスク1のステップ1で提供されるGoldenGate管理資格証明を入力します。
ノート:デプロイメントの作成時にIAMが資格証明ストアとして選択されなかった場合は、サインインが必要です。
-
-
デプロイメント・コンソールで、左側のナビゲーションで「DB接続」を選択し、ソースPostgreSQLデータベース、「Trandata」の順に選択します。
-
「TRANDATA」ページの「TRANDATA Information」の横にある「Add TRANDATA」(プラス・アイコン)を選択します。
-
「Trandata」パネルで、「スキーマ名」に
src_ociggllと入力し、「送信」を選択します。ノート:検索フィールドを使用して
src_ociggllを検索し、表が追加されたことを確認します。
タスク3: Extractの作成
-
チェンジ・データ・キャプチャExtractを追加します。
-
左側のナビゲーションから、「Extract」を選択します。
-
「Extract」ページで、「Extractの追加」(プラス・アイコン)を選択し、次のようにフィールドに入力します。
-
「Extract Information」ページで、次の手順を実行します。
-
「Extractタイプ」で、「Change Data Capture Extract」を選択します。
-
「プロセス名」に、Extractの名前(
ECDCなど)を入力します。 -
「次へ」を選択します。
-
-
「抽出オプション」ページで、次の手順を実行します。
-
ソース資格証明の場合は、「ドメイン」ドロップダウンから「Oracle GoldenGate」を選択します
-
「別名」ドロップダウンからソースPostgreSQLデータベースを選択します。
-
「Extract Trail Name」に、2文字のトレイル名(
C1など)を入力します。 -
「次へ」を選択します。
-
-
「パラメータ」ページで、
MAP *.*, TARGET *.*;を次のように置き換えます:TABLE SRC_OCIGGLL.*;
-
-
「作成および実行」を選択します。
-
-
初期ロードExtractの追加:
-
「Extract」ページで、「Extractの追加」を選択し、「Extractの追加」フォームに次のように入力します。
-
「Extract Information」ページで、次の手順を実行します。
-
「Extractタイプ」で、「初期ロードExtract」を選択します。
-
「プロセス名」に、名前(
EILなど)を入力します。 -
「次へ」を選択します。
-
-
「抽出オプション」ページで、次の手順を実行します。
-
ソース資格証明の場合は、「ドメイン」ドロップダウンから「Oracle GoldenGate」を選択します。
-
「別名」ドロップダウンからPostgreSQLデータベースを選択します。
-
「トレイル名の抽出」に、2文字のトレイル名(
I1など)を入力します。 -
「次へ」を選択します。
-
-
「Extractパラメータ」ページで、テキスト領域の内容を次のように置き換えます。
EXTRACT EIL USERIDALIAS PostgreSQL_Compute, DOMAIN OracleGoldenGate EXTFILE I1, PURGE TABLE src_ociggll.*;ノート:移動する前に、必ず
USERIDALIASの前にあるSOURCEDBパラメータを削除してください。
-
-
「作成および実行」を選択します。
-
「Extract」ページに戻り、Extractの開始を確認できます。
タスク4: 初期ロードExtractの分散パスの作成
初期ロードExtractの分散パスを作成するには:
-
Oracle Cloudコンソールの「デプロイメント」ページで、ターゲット・ビッグ・データ・デプロイメントを選択します。
-
デプロイメントの詳細ページで、「コンソールの起動」を選択し、管理ユーザーとしてログインします。
-
IAM資格証明ストアを使用する場合は、「分散パスの作成」ステップに進みます。GoldenGate資格証明ストアを使用する場合は、ソースGoldenGateがターゲットGoldenGateへの接続に使用するユーザーを作成します。
-
ナビゲーション・メニューで、「ユーザー管理」を選択します。
-
「新規ユーザーの追加」(プラス・アイコン)を選択し、次のようにフィールドに入力します。「送信」を選択します:
-
「ユーザー名」に、
ggsnetと入力します。 -
「ロール」で、「演算子」を選択します。
-
確認のためにパスワードを2回入力します。
-
-
-
ソースのPostgreSQLデプロイメント・コンソールで、前のステップで作成したユーザーのパス接続を作成します。
-
ナビゲーション・メニューで、「パス接続」を選択します。
-
「Add Path Connection」(プラス・アイコン)を選択し、次のようにフィールドに入力して「Submit」を選択します。
-
「資格証明別名」に、
dpuserと入力します。 -
「ユーザーID」に、
ggsnetと入力します -
「パスワード」に、前のステップで使用したものと同じパスワードを入力します。
-
-
-
分散パスの作成
-
サービス・メニュー・バーで、「パス」を選択し、「分散パスの追加」(プラス・アイコン)を選択します。
-
「パスの追加」フォームに次のように入力します。
-
「パス情報」ページで、次の手順を実行します。
-
「パス名」に、このパスの名前を入力します。
-
「次へ」を選択します。
-
-
「ソース・オプション」ページで、次の手順を実行します。
-
「ソース抽出」では、空白のままにします。
-
「トレイル名」に、初期ロードExtractのトレイル名(
I1)を入力します。 -
「次へ」を選択します。
-
-
「ターゲット・オプション」ページで、次の手順を実行します。
-
「ターゲット」で、「wss」を選択します。
-
「ターゲット・ホスト」に、ターゲット・デプロイメントのURLをhttps://または後続のスラッシュなしで入力します。
-
「ポート番号」に、
443と入力します。 -
「トレイル名」に、
I1と入力します。 -
「ターゲット認証方式」で、「ユーザーID別名」を選択します。
-
「ドメイン」に、前のステップで作成したドメイン名を入力します。
-
「別名」に、前のステップで作成した別名を入力します(
dpuser)。 -
「次へ」を選択します。
-
-
-
「作成および実行」を選択します。
「Distribution Service」ページに戻り、作成したパスを確認できます。
-
-
ターゲット・デプロイメント・コンソールで、分散パスの結果として作成された受信パスを確認します:
-
「パス」を選択します。
-
パスの詳細を確認します。
-
タスク5: 初期ロードのためのReplicatの追加
-
ターゲットのビッグ・データ・デプロイメント・コンソールで、初期ロードReplicatを追加します。
-
ナビゲーション・メニューで、「Replicat」を選択し、「Replicatの追加」(プラス・アイコン)を選択します。
-
「Replicat」ページで、「Replicatの追加」フィールドに次のように入力します。
-
「レプリケーション情報」ページで、次の手順を実行します。
-
「Replicatタイプ」で、「調整Replicat」を選択します。
-
「プロセス名」に、名前(
RILなど)を入力します。 -
「次へ」を選択します。
-
-
「Replicatオプション」ページで、次の手順を実行します。
-
「Replicatトレイル名」に、タスク2からトレイルの名前(
I1)を入力します。 -
「ターゲット」で、「スノーフレーク」を選択します。
-
「ターゲット資格証明」で、スノーフレーク接続の「ドメイン」および「別名」を選択します。
-
「使用可能な別名」で、ドロップダウンから別名(スノーフレークなど)を選択します。
-
「ストリーミング」を選択します。
-
「次へ」を選択します。
-
-
「パラメータ・ファイル」ページで、次のマッピングを追加します。
INSERTALLRECORDS MAP src_ociggll.src_city, TARGET SRCMIRROR_OCIGGLL.SRC_CITY; MAP src_ociggll.src_region, TARGET SRCMIRROR_OCIGGLL.SRC_REGION; MAP src_ociggll.src_customer, TARGET SRCMIRROR_OCIGGLL.SRC_CUSTOMER; MAP src_ociggll.src_orders, TARGET SRCMIRROR_OCIGGLL.SRC_ORDERS; MAP src_ociggll.src_order_lines, TARGET SRCMIRROR_OCIGGLL.SRC_ORDER_LINES; MAP src_ociggll.src_product, TARGET SRCMIRROR_OCIGGLL.SRC_PRODUCT; -
「プロパティ」ページで、プロパティを確認し、
jvm.bootoptions= -Djdk.lang.processReaperUseDefaultStackSize=trueを追加します。 -
「作成および実行」を選択します。
-
「Replicat」ページに戻り、Replicatの詳細を確認できます。
-
-
初期ロードを確認するには、Snowflakeデータベースに接続し、次の問合せを実行します。
select * from SRCMIRROR_OCIGGLL.SRC_CITY; select * from SRCMIRROR_OCIGGLL.SRC_CUSTOMER;出力では、初期ロードの結果としてターゲット・データベース表にロードされたデータが返されます。
タスク6: 変更データ取得のための分散パスの作成
-
ソースのPostgreSQLデプロイメント・コンソールで、「分散サービス」を選択します。
-
「分散パスの追加」を選択します。
-
「パスの追加」フォームに次のように入力します。
-
「パス情報」ページで、次の手順を実行します。
-
「パス名」に、名前を入力します。
-
「次へ」を選択します。
-
-
「ソース・オプション」ページで、次の手順を実行します。
-
「ソースExtract」で、チェンジ・データ・キャプチャExtract (
ECDC)を選択します。 -
「トレイル名」で、変更データ取得のトレイル・ファイル(
C1)を選択します。 -
「次へ」を選択します。
-
-
「ターゲット・オプション」ページで、次の手順を実行します。
-
「ターゲット」で、「wss」を選択します。
-
「ターゲット・ホスト」に、ターゲット・デプロイメント・コンソールのURLを入力します(これは、デプロイメントの詳細ページでhttps://または後続のスラッシュなしで確認できます)。
-
「ポート番号」に、
443と入力します。 -
「トレイル名」に、
C1と入力します。 -
「ターゲット認証方式」で、「ユーザーID別名」を選択します。
-
「ドメイン」に、ドメイン名を入力します。
-
「別名」に、別名を入力してください。
-
-
「パスの作成」および「実行」を選択します。
-
タスク7: 変更データ取得のためのReplicatの追加
ソースPostgreSQLデータベースに対する更新を実行して、Snowflakeへのレプリケーションを確認します。
-
Replicatを追加します。
-
ターゲットのBig Dataデプロイメント・コンソールで、「Administration Service」を選択し、ナビゲーション・メニューで「Replicats」を選択します。
-
「Replicat」ページで、「Replicatの追加」(プラス・アイコン)を選択し、次のように「Replicatの追加」フォームに入力します。
- 「Replicat情報」ページで、次の手順を実行します。
-
「Replicatタイプ」で、「クラシック」または「調整済」を選択します。
-
「プロセス名」に、名前(
RCDCなど)を入力します。 -
「次へ」を選択します。
-
- 「Replicatオプション」ページで、次の手順を実行します。
-
「Replicatトレイル名」に、タスク3からのトレイルの名前(
C1)を入力します。 -
「ターゲット」で、「スノーフレーク」を選択します。
-
「ターゲット資格証明」で、スノーフレーク接続のドメインと別名を選択します。
-
「ストリーミング」を選択します。
-
-
「パラメータ・ファイル」ページで、次のマッピングを追加し、「次へ」を選択します。
INSERTALLRECORDS MAP src_ociggll.src_city, TARGET SRCMIRROR_OCIGGLL.SRC_CITY; MAP src_ociggll.src_region, TARGET SRCMIRROR_OCIGGLL.SRC_REGION; MAP src_ociggll.src_customer, TARGET SRCMIRROR_OCIGGLL.SRC_CUSTOMER; MAP src_ociggll.src_orders, TARGET SRCMIRROR_OCIGGLL.SRC_ORDERS; MAP src_ociggll.src_order_lines, TARGET SRCMIRROR_OCIGGLL.SRC_ORDER_LINES; MAP src_ociggll.src_product, TARGET SRCMIRROR_OCIGGLL.SRC_PRODUCT; -
「プロパティ」ページで、プロパティを確認し、次のマッピングを追加し、「作成および実行」を選択します。
jvm.bootoptions= -Djdk.lang.processReaperUseDefaultStackSize=true
- 「Replicat情報」ページで、次の手順を実行します。
「Replicat」ページに戻り、Replicatの詳細を確認できます。
-
-
変更データ取得の検証:
-
ソースPostgreSQLデータベースに対する更新を実行して、Snowflakeへのレプリケーションを確認します。次のスクリプトを実行して、PostgreSQLデータベースへの挿入を実行します。
Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1000,'Houston',20,743113); Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1001,'Dallas',20,822416); Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1002,'San Francisco',21,157574); Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1003,'Los Angeles',21,743878); Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1004,'San Diego',21,840689); Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1005,'Chicago',23,616472); Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1006,'Memphis',23,580075); Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1007,'New York City',22,124434); Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1008,'Boston',22,275581); Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1009,'Washington D.C.',22,688002); -
ソースのPostgreSQLデプロイメント・コンソールで、
RCDCを選択し、「統計」を選択します。src_ociggll.src_cityに10の挿入があることを確認します。ノート: Extractで挿入が行われなかった場合は、
ECDCExtractを再起動します。 -
ターゲットのビッグ・データ・デプロイメント・コンソールで、
RCDCを選択し、その「詳細」および「統計」を確認して挿入数を確認します。
-