Oracle RACでのOracle GoldenGateのトラブルシューティング
Oracle RACノードでOracle GoldenGateプロセスが正常に開始されない場合があります。問題の原因を特定するには、Oracle GoldenGate、XAGおよびCRSによって生成された複数のファイルを確認する必要があります。
重要なログ・ファイルとトレース・ファイルのリスト、その場所の例および出力例を次に示します。
XAGログ・ファイル
場所: <XAG installation directory>/log/<hostname>
場所の例: /u01/app/grid/xag/log/'hostname'
ファイル名: agctl_goldengate_grid.trc
agctlで実行されるすべてのコマンドと、CRSが実行するコマンドを含むコマンドの出力が含まれます。
例:
2022-04-18 11:52:21: stop resource success
2022-04-18 11:52:38: agctl start goldengate <instance_name>
2022-04-18 11:52:38: executing cmd: /u01/app/19.0.0.0/grid/bin/crsctl status res xag.<INSTANCE_NAME>.goldengate
2022-04-18 11:52:38: executing cmd: /u01/app/19.0.0.0/grid/bin/crsctl status res xag.<INSTANCE_NAME>.goldengate -f
2022-04-18 11:52:38: executing cmd: /u01/app/19.0.0.0/grid/bin/crsctl start resource xag.<INSTANCE_NAME>.goldengate -f
2022-04-18 11:52:45: Command output:
> CRS-2672: Attempting to start 'xag.<INSTANCE_NAME>.goldengate' on 'exadb-node1'
> CRS-2676: Start of 'xag.<INSTANCE_NAME>.goldengate' on 'exadb-node1' succeeded
>End Command output
2022-04-18 11:52:45: start resource success
XAG GoldenGateインスタンス・トレース・ファイル
場所: <XAG installation directory>/log/<hostname>
場所の例: /u01/app/grid/xag/log/'hostname'
ファイル名: <GoldenGate_instance_name>_agent_goldengate.trc
これには、agctlによって実行されたコマンドの出力、使用された環境変数、基礎となるコマンドに対して有効になっているデバッグ出力が含まれます。
例:
2022-04-18 12:14:46: Exported ORACLE_SID ggdg1
2022-04-18 12:14:46: Exported GGS_HOME /u01/oracle/goldengate/gg21c_MS
2022-04-18 12:14:46: Exported OGG_CONF_HOME /mnt/dbfs/goldengate/deployments/ggsm01/etc/conf
2022-04-18 12:14:46: Exported LD_LIBRARY_PATH
/u01/oracle/goldengate/gg21c_MS:/u01/app/19.0.0.0/grid/lib:/etc/ORCLcluster/lib
2022-04-18 12:14:46: Exported LD_LIBRARY_PATH_64 /u01/oracle/goldengate/gg21c_MS
2022-04-18 12:14:46: Exported LIBPATH /u01/oracle/goldengate/gg21c_MS
2022-04-18 12:14:46: ogg input = {"oggHome":"/u01/oracle/goldengate/gg21c_MS","serviceManager":{"oggConfHome":"/mnt/dbfs/goldengate/deployments/ggsm01/etc/conf","portNumber":9100},"username":"admin","credential":"xyz"}
2022-04-18 12:14:46: About to exec /u01/oracle/goldengate/gg21c_MS/bin/XAGTask HealthCheck
2022-04-18 12:14:47: XAGTask retcode = 0
CRSトレース・ファイル
場所: /u01/app/grid/diag/crs/<hostname>/crs/trace
例の場所: /u01/app/grid/diag/crs/'hostname'/crs/trace
ファイル名: crsd_scriptagent_oracle.trc
XAGまたはdbfs_mountなどのCRSリソース・アクション・スクリプトによって作成された出力が含まれます。このトレース・ファイルは、DBFSまたはGoldenGateがRACノードで起動しなかった理由を判断するために重要です。
例:
2022-04-18 11:52:38.634 : AGFW:549631744: {1:30281:59063} Agent received the message: RESOURCE_START[xag.<INSTANCE_NAME>.goldengate 1 1] ID 4098:4125749
2022-04-18 11:52:38.634 : AGFW:549631744: {1:30281:59063} Preparing START command for: xag.<INSTANCE_NAME>.goldengate 1 1
2022-04-18 11:52:38.634 : AGFW:549631744: {1:30281:59063} xag.<INSTANCE_NAME>.goldengate 1 1 state changed from: OFFLINE to: STARTING
2022-04-18 11:52:38.634 :CLSDYNAM:558036736: [xag.<INSTANCE_NAME>.goldengate]{1:30281:59063} [start] Executing action script: /u01/oracle/XAG_MA/bin/aggoldengatescaas[start]
2022-04-18 11:52:38.786 :CLSDYNAM:558036736: [xag.<INSTANCE_NAME>.goldengate]{1:30281:59063} [start] GG agent running command 'start' on xag.<INSTANCE_NAME>.goldengate
2022-04-18 11:52:42.140 :CLSDYNAM:558036736: [xag.<INSTANCE_NAME>.goldengate]{1:30281:59063} [start] ServiceManager fork pid = 265747
2022-04-18 11:52:42.140 :CLSDYNAM:558036736: [xag.<INSTANCE_NAME>.goldengate]{1:30281:59063} [start] Waiting for /mnt/dbfs/goldengate/deployments/ggsm01/var/run/ServiceManager.pid
2022-04-18 11:52:42.140 :CLSDYNAM:558036736: [xag.<INSTANCE_NAME>.goldengate]{1:30281:59063} [start] Waiting for SM to start
2022-04-18 11:52:42.140 :CLSDYNAM:558036736: [xag.<INSTANCE_NAME>.goldengate]{1:30281:59063} [start] ServiceManager PID = 265749
2022-04-18 11:52:43.643 :CLSDYNAM:558036736: [xag.<INSTANCE_NAME>.goldengate]{1:30281:59063} [start] XAGTask retcode = 0
2022-04-18 11:52:43.643 :CLSDYNAM:558036736: [xag.<INSTANCE_NAME>.goldengate]{1:30281:59063} [start] XAG HealthCheck after start returned 0
2022-04-18 11:52:43.643 : AGFW:558036736: {1:30281:59063} Command: start for resource: xag.<INSTANCE_NAME>.goldengate 1 1 completed with status: SUCCESS
2022-04-18 11:52:43.643 :CLSDYNAM:558036736: [xag.<INSTANCE_NAME>.goldengate]{1:30281:59063} [check] Executing action script: /u01/oracle/XAG_MA/bin/aggoldengatescaas[check]
2022-04-18 11:52:43.644 : AGFW:549631744: {1:30281:59063} Agent sending reply for: RESOURCE_START[xag.<INSTANCE_NAME>.goldengate 1 1] ID 4098:4125749
2022-04-18 11:52:43.795 :CLSDYNAM:558036736: [xag.<INSTANCE_NAME>.goldengate]{1:30281:59063} [check] GG agent running command 'check' on xag.<INSTANCE_NAME>.goldengate
2022-04-18 11:52:45.548 :CLSDYNAM:558036736: [xag.<INSTANCE_NAME>.goldengate]{1:30281:59063} [check] XAGTask retcode = 0
2022-04-18 11:52:45.548 : AGFW:549631744: {1:30281:59063} xag.<INSTANCE_NAME>.goldengate 1 1 state changed from: STARTING to: ONLINE
GoldenGateデプロイメント・ログ・ファイル
場所: <Goldengate_deployment_directory>/<instance_name>/var/log
例の場所: /mnt/dbfs/goldengate/deployments/<instance_name>/var/log
ファイル名: adminsrvr.log、recvsrvr.log、pmsrvr.log、distsrvr.log
Oracle GoldenGateデプロイメント・プロセス(管理サーバー、分散サーバー、受信サーバー、パフォーマンス・メトリック・サーバー)の開始、停止およびステータス・チェックの出力が含まれます。
例:
2022-04-18T11:52:42.645-0400 INFO | Setting deploymentName to '<instance_name>'. (main)
2022-04-18T11:52:42.665-0400 INFO | Read SharedContext from store for length 19 of file '/mnt/dbfs/goldengate/deployments/<instance_name>/var/lib/conf/adminsrvr-resources.dat'. (main)
2022-04-18T11:52:42.723-0400 INFO | XAG Integration enabled (main)
2022-04-18T11:52:42.723-0400 INFO | Configuring security. (main)
2022-04-18T11:52:42.723-0400 INFO | Configuring user authorization secure store path as '/mnt/dbfs/goldengate/deployments/<instance_name>/var/lib/credential/secureStore/'. (main)
2022-04-18T11:52:42.731-0400 INFO | Configuring user authorization as ENABLED. (main)
2022-04-18T11:52:42.749-0400 INFO | Set network configuration. (main)
2022-04-18T11:52:42.749-0400 INFO | Asynchronous operations are enabled with default synchronous wait time of 30 seconds (main)
2022-04-18T11:52:42.749-0400 INFO | HttpServer configuration complete. (main)
2022-04-18T11:52:42.805-0400 INFO | SIGHUP handler installed. (main)
2022-04-18T11:52:42.813-0400 INFO | SIGINT handler installed. (main)
2022-04-18T11:52:42.815-0400 INFO | SIGTERM handler installed. (main)
2022-04-18T11:52:42.817-0400 WARN | Security is configured as 'disabled'. (main)
2022-04-18T11:52:42.818-0400 INFO | Starting service listener... (main)
2022-04-18T11:52:42.819-0400 INFO | Mapped 'ALL' interface to address 'ANY:9101' with default IPV4/IPV6 options identified by 'exadb-node1.domain'. (main)
2022-04-18T11:52:42.821-0400 INFO | Captured 1 interface host names: 'exadb-node1.domain' (main)
2022-04-18T11:52:42.824-0400 INFO | The Network ipACL specification is empty. Accepting ANY address on ALL interfaces. (main)
2022-04-18T11:52:42.826-0400 INFO | Server started at 2022-04-18T11:52:42.827-05:00 (2022-04-18T15:52:42.827Z GMT) (main)
GoldenGateレポート・ファイル
場所: <Goldengate_deployment_directory>/<instance_name>/var/lib/report
例の場所: /mnt/dbfs/goldengate/deployments/<instance_name>/var/lib/report
GoldenGateレポート・ファイルには、Managerプロセスを含む、すべてのGoldenGateプロセスの重要な情報、警告メッセージおよびエラーが含まれています。実行中にGoldenGateプロセスのいずれかが開始に失敗したか異常終了した場合、プロセス・レポート・ファイルには、失敗の原因を特定するために使用できる重要な情報が含まれます。
Extractレポート・ファイルのエラー例:
2022-04-23 13:01:50 ERROR OGG-00446 Unable to lock file " /mnt/acfs_gg/deployments/<instance_name>/var/lib/checkpt/EXT_1A.cpe" (error 95, Operation not supported).
2022-04-23 13:01:50 ERROR OGG-01668 PROCESS ABENDING.
構成の問題の例
次に、RAC環境のGoldenGateで発生する可能性がある構成の問題と、それらの診断および解決方法を示します。
mount-dbfs.confファイルの不適切なパラメータ設定
XAGがDBFSのマウントに失敗すると、コマンドライン(手動のagctlコマンドを実行している場合)かXAGログ・ファイルのいずれかで、失敗が報告されます。
$ agctl start goldengate <instance_name> --node exadb-node1
CRS-2672: Attempting to start 'dbfs_mount' on 'exadb-node1'
CRS-2674: Start of 'dbfs_mount' on 'exadb-node1' failed
CRS-2679: Attempting to clean 'dbfs_mount' on 'exadb-node1'
CRS-2681: Clean of 'dbfs_mount' on 'exadb-node1' succeeded
CRS-4000: Command Start failed, or completed with errors.
XAGログ・ファイル(agctl_goldengate_grid.trc)には、他のログ・ファイルやトレース・ファイルの参照時に使用できるタイムスタンプが表示されるという利点があります。
2022-04-19 15:32:16: executing cmd: /u01/app/19.0.0.0/grid/bin/crsctl start resource xag.<INSTANCE_NAME>.goldengate -f -n exadb-node1
2022-04-19 15:32:19: Command output:
> CRS-2672: Attempting to start 'dbfs_mount' on 'exadb-node1'
> CRS-2674: Start of 'dbfs_mount' on 'exadb-node1' failed
> CRS-2679: Attempting to clean 'dbfs_mount' on 'exadb-node1'
> CRS-2681: Clean of 'dbfs_mount' on 'exadb-node1' succeeded
> CRS-4000: Command Start failed, or completed with errors.
>End Command output
2022-04-19 15:32:19: start resource failed rc=1
次に、CRSトレース・ファイル(crsd_scriptagent_oracle.trc)を確認します。これにはDBFSがマウントに失敗した理由が示されています。次に、mount-dbfs.confファイルの誤ったパラメータ設定によって発生するエラーの例を示します。
- 不適切なDBNAME
2022-04-19 15:32:16.679 : AGFW:1190405888: {1:30281:17383} dbfs_mount 1 1 state changed from: UNKNOWN to: STARTING 2022-04-19 15:32:16.680 :CLSDYNAM:1192507136: [dbfs_mount]{1:30281:17383} [start] Executing action script: /u01/oracle/scripts/mount-dbfs.sh[start] 2022-04-19 15:32:16.732 :CLSDYNAM:1192507136: [dbfs_mount]{1:30281:17383} [start] mount-dbfs.sh mounting DBFS at /mnt/dbfs from database ggdg 2022-04-19 15:32:17.883 :CLSDYNAM:1192507136: [dbfs_mount]{1:30281:17383} [start] ORACLE_SID is 2022-04-19 15:32:17.883 :CLSDYNAM:1192507136: [dbfs_mount]{1:30281:17383} [start] No running ORACLE_SID available on this host, exiting 2022-04-19 15:32:17.883 : AGFW:1192507136: {1:30281:17383} Command: start for resource: dbfs_mount 1 1 completed with invalid status: 2
- 不適切なMOUNT_POINT
2022-04-19 16:45:14.534 : AGFW:1734321920: {1:30281:17604} dbfs_mount 1 1 state changed from: UNKNOWN to: STARTING 2022-04-19 16:45:14.535 :CLSDYNAM:1736423168: [dbfs_mount]{1:30281:17604} [start] Executing action script: /u01/oracle/scripts/mount-dbfs.sh[start] 2022-04-19 16:45:14.586 :CLSDYNAM:1736423168: [dbfs_mount]{1:30281:17604} [start] mount-dbfs.sh mounting DBFS at /mnt/dbfs from database ggdgs 2022-04-19 16:45:15.638 :CLSDYNAM:1736423168: [dbfs_mount]{1:30281:17604} [start] ORACLE_SID is ggdg1 2022-04-19 16:45:15.738 :CLSDYNAM:1736423168: [dbfs_mount]{1:30281:17604} [start] spawning dbfs_client command using SID ggdg1 2022-04-19 16:45:20.745 :CLSDYNAM:1736423168: [dbfs_mount]{1:30281:17604} [start] fuse: bad mount point `/mnt/dbfs': No such file or directory 2022-04-19 16:45:21.747 :CLSDYNAM:1736423168: [dbfs_mount]{1:30281:17604} [start] Start - OFFLINE 2022-04-19 16:45:21.747 : AGFW:1736423168: {1:30281:17604} Command: start for resource: dbfs_mount 1 1 completed with status: FAIL
- 不適切なDBFS_USERまたはDBFS_PASSWD
2022-04-19 16:47:47.855 : AGFW:1384478464: {1:30281:17671} dbfs_mount 1 1 state changed from: UNKNOWN to: STARTING 2022-04-19 16:47:47.856 :CLSDYNAM:1386579712: [dbfs_mount]{1:30281:17671} [start] Executing action script: /u01/oracle/scripts/mount-dbfs.sh[start] 2022-04-19 16:47:47.908 :CLSDYNAM:1386579712: [dbfs_mount]{1:30281:17671} [start] mount-dbfs.sh mounting DBFS at /mnt/dbfs from database ggdgs 2022-04-19 16:47:48.959 :CLSDYNAM:1386579712: [dbfs_mount]{1:30281:17671} [start] ORACLE_SID is ggdg1 2022-04-19 16:47:49.010 :CLSDYNAM:1386579712: [dbfs_mount]{1:30281:17671} [start] spawning dbfs_client command using SID ggdg1 2022-04-19 16:47:55.118 :CLSDYNAM:1386579712: [dbfs_mount]{1:30281:17671} [start] Fail to connect to database server. Error: ORA-01017: invalid username/password; logon denied 2022-04-19 16:47:55.118 :CLSDYNAM:1386579712: [dbfs_mount]{1:30281:17671} [start] 2022-04-19 16:47:56.219 :CLSDYNAM:1386579712: [dbfs_mount]{1:30281:17671} [start] Start - OFFLINE 2022-04-19 16:47:56.220 : AGFW:1386579712: {1:30281:17671} Command: start for resource: dbfs_mount 1 1 completed with status: FAIL
- 不適切なORACLE_HOME
2022-04-19 16:50:38.952 : AGFW:567502592: {1:30281:17739} dbfs_mount 1 1 state changed from: UNKNOWN to: STARTING 2022-04-19 16:50:38.953 :CLSDYNAM:569603840: [dbfs_mount]{1:30281:17739} [start] Executing action script: /u01/oracle/scripts/mount-dbfs.sh[start] 2022-04-19 16:50:39.004 :CLSDYNAM:569603840: [dbfs_mount]{1:30281:17739} [start] mount-dbfs.sh mounting DBFS at /mnt/dbfs from database ggdgs 2022-04-19 16:50:39.004 :CLSDYNAM:569603840: [dbfs_mount]{1:30281:17739} [start] /u01/oracle/scripts/mount-dbfs.sh: line 136: /u01/app/oracle/product/19.0.0.0/rdbms/bin/srvctl: No such file or directory 2022-04-19 16:50:39.004 :CLSDYNAM:569603840: [dbfs_mount]{1:30281:17739} [start] /u01/oracle/scripts/mount-dbfs.sh: line 139: /u01/app/oracle/product/19.0.0.0/rdbms/bin/srvctl: No such file or directory 2022-04-19 16:50:39.004 :CLSDYNAM:569603840: [dbfs_mount]{1:30281:17739} [start] ORACLE_SID is 2022-04-19 16:50:39.004 :CLSDYNAM:569603840: [dbfs_mount]{1:30281:17739} [start] No running ORACLE_SID available on this host, exiting 2022-04-19 16:50:39.004 : AGFW:569603840: {1:30281:17739} Command: start for resource: dbfs_mount 1 1 completed with invalid status: 2
これらの構成の問題を解決するには、mount-dbfs.confに適切なパラメータ値を設定します。
DBFSのファイル・ロックの問題
Oracle Database 12cリリース2 (12.2)を使用している場合にnolock DBFSマウント・オプションを使用しないと、GoldenGateプロセスがチェックポイントまたは証跡ファイルをロックしようとすると問題が発生する可能性があります。バグ22646150のパッチを適用したOracle Database 11gリリース2 (11.2.0.4)または12cリリース1 (12.1)を使用している場合も、同じ問題が発生します。このパッチは、Oracle Database 12cリリース2 (12.2)に合わせて、DBFSがファイルのロックを処理する方法を変更します。nolock DBFSマウント・オプションを追加するには、データベースにバグ27056711のパッチを適用する必要があります。データベースにバグ22646150のパッチが適用されていない場合は、バグ27056711のパッチとnolockマウント・オプションは必要ありません。
次に、GoldenGate Microservices Architectureのロック問題を診断する例を示します。
XAGを使用してデプロイメントを開始すると、1つ以上のファイルでロック競合が検出されたために、1つ以上のプロセスが開始されないことがあります。これは、デプロイメントが正常に停止する機会を得られなかったRACノードのフェイルオーバー後に頻発します。
デプロイメント・サーバーのプロセスの1つの起動に失敗した場合(管理サーバー、パフォーマンス・メトリック・サーバー、分散サーバー、レシーバ・サーバーまたはサービス・マネージャ)は、そのデプロイメントのvar/logディレクトリにある特定のサーバーのログ・ファイルを確認します。
たとえば、ログ・ファイル/mnt/dbfs/goldengate/deployments/<INSTANCE_NAME>/var/log/pmsrvr.logでは、起動時に次のエラーが表示されます。
2022-04-11T12:41:57.619-0700 ERROR| SecureStore failed on open after
retrying due to extended file lock. (main)
2022-04-11T12:41:57.619-0700 ERROR| SecureStore failed to close (28771). (main)
2022-04-11T12:41:57.619-0700 INFO | Set network configuration. (main)
2022-04-11T12:41:57.619-0700 INFO | Asynchronous operations are enabled with default
synchronous wait time of 30 seconds (main)
2022-04-11T12:41:57.619-0700 INFO | HttpServer configuration complete. (main)
2022-04-11T12:42:07.674-0700 ERROR| Unable to lock process file, Error is [1454]
- OGG-01454 (main)
2022-04-11T12:42:07.675-0700 ERROR| Another Instance of PM Server is Already Running
(main)
Extractプロセスは、デプロイメント・ログ・ファイル・ディレクトリにあるER-events.logログ・ファイルで、起動の失敗を報告します。
たとえば、/mnt/dbfs/goldengate/deployments/<instance_name>/var/log/ER-events.logは次のエラーを示します。
2022-04-11T00:14:56.845-0700 ERROR OGG-01454 Oracle GoldenGate Capture for
Oracle, EXT1.prm: Unable to lock file
"/mnt/dbfs/goldengate/deployments/<instance_name>/var/run/EXT1.pce" (error 11, Resource
temporarily unavailable). Lock currently held by process id (PID) 237495.
2022-04-11T00:14:56.861-0700 ERROR OGG-01668 Oracle GoldenGate Capture for Oracle,
EXT1.prm: PROCESS ABENDING.
次に、起動に失敗するプロセスが、どのRACノードでも実行されていないことを確認します。
例:
$ ps -ef|grep EXT1|grep -v grep
プロセスが実行されていないと判断したら、デプロイメントを正常に停止し、ファイル・システムをアンマウントして、正しいDBFSパッチを適用する必要があります。
例:
$ agctl stop goldengate <INSTANCE_NAME>
$ crsctl stop resource dbfs_mount
DBFSマウント・オプションを確認します。
$ ps -ef|grep dbfs_client
oracle 204017 1 0 14:37 ?
00:00:00 /u01/app/oracle/product/19.1.0.0/dbhome_1/bin/dbfs_client dbfs@dbfs.local
-o allow_other,failover,direct_io /mnt/dbfs
明らかにnolockマウント・オプションが使用されていないため、これがロック・エラーの原因になります。
前述のガイドラインを使用して、DBFSパッチが必要かどうかを判断します。その後、デプロイメントの一部である、すべてのOracle RACノードのmount-dbfs.confファイルに、nolockマウント・オプションを追加します。
例:
MOUNT_OPTIONS=allow_other,direct_io,failover,nolock
最後に、デプロイメントを再起動します。
$ agctl start goldengate <INSTANCE_NAME>
GoldenGateの起動を妨げるクリティカルなExtract/Replicatプロセス
ExtractプロセスまたはReplicatプロセスが管理サーバー内のデプロイメントのヘルスに対してクリティカルとして設定されている場合は、そのプロセスが異常終了すると、サービス・マネージャおよびデプロイメントが停止します。
XAG (agctl start goldengate
)を使用してGoldenGateを再起動すると、次のエラーで失敗します:
$ agctl start goldengate GGNORTH --node dc1north01
CRS-2672: Attempting to start 'xag.GGNORTH.goldengate' on 'dc1north01'
CRS-2674: Start of 'xag.GGNORTH.goldengate' on 'dc1north01' failed
CRS-2679: Attempting to clean 'xag.GGNORTH.goldengate' on ' dc1north01'
CRS-2681: Clean of 'xag.GGNORTH.goldengate' on ' dc1north01' succeeded
CRS-2632: There are no more servers to try to place resource 'xag.GGNORTH.goldengate' on
that would satisfy its placement policy
CRS-4000: Command Start failed, or completed with errors.
CRSトレース・ファイル(crsd_scriptagent_oracle.trc
)では、起動失敗の原因を特定するのに十分な情報が提供されていません。
例:
2022-06-30 20:20:28.675 : AGFW:521639680: [ INFO] {1:29336:52291}
Command: start for resource: xag.GGNORTH.goldengate 1 1 completed with status: SUCCESS
2022-06-30 20:20:28.675 :CLSDYNAM:521639680: [xag.GGNORTH.goldengate]{1:29336:52291}
[check] Executing action script: /u01/oracle/XAG/bin/aggoldengatescaas[check]
2022-06-30 20:20:28.677 : AGFW:517437184: [ INFO] {1:29336:52291} Agent sending
reply for: RESOURCE_START[xag.GGNORTH.goldengate 1 1] ID 4098:178187
2022-06-30 20:20:28.827 :CLSDYNAM:521639680: [xag.GGNORTH.goldengate]{1:29336:52291}
[check] GG agent running command 'check' on xag.GGNORTH.goldengate
2022-06-30 20:20:28.978 :CLSDYNAM:521639680: [xag.GGNORTH.goldengate]{1:29336:52291}
[check] execute XAGTask HealthCheck
2022-06-30 20:20:29.779 :CLSDYNAM:521639680: [xag.GGNORTH.goldengate]{1:29336:52291}
[check] XAGTask retcode = 3
2022-06-30 20:20:29.780 : AGFW:517437184: [ INFO] {1:29336:52291}
xag.GGNORTH.goldengate 1 1 state changed from: STARTING to: FAILED
Oracle GoldenGateバージョン21.11以降では、XAGを使用すると、追加のGoldenGateステータス情報がサービス・マネージャの$OGG_VAR_HOME/log/XAGTask.log
ファイルに記録されます。
以前のリリースのOracle GoldenGateの場合は、次のコマンドを使用してXAGのCRSデバッグ・ロギングを有効にします。
$ crsctl set log res xag.GGNORTH.goldengate=5
$ agctl start goldengate GGNORTH --node dc1north01
$ crsctl set log res xag.GGNORTH.goldengate=1
障害の詳細は、サービス・マネージャの$OGG_VAR_HOME/log/XAGTask.log
またはCRSトレース・ファイル(crsd_scriptagent_oracle.trc
)を確認してください。
例:
2022-06-30 20:24:36.389 :CLSDYNAM:521639680:
[xag.GGNORTH.goldengate]{1:29336:52435} [check] Deployment: GGNORTH
2022-06-30 20:24:36.389 :CLSDYNAM:521639680: [xag.GGNORTH.goldengate]{1:29336:52435}
[check] Service: adminsrvr
2022-06-30 20:24:36.389 :CLSDYNAM:521639680: [xag.GGNORTH.goldengate]{1:29336:52435}
[check] Status: running
2022-06-30 20:24:36.389 :CLSDYNAM:521639680: [xag.GGNORTH.goldengate]{1:29336:52435}
[check] Started: 2022-07-01T03:24:35.911Z
2022-06-30 20:24:36.389 :CLSDYNAM:521639680: [xag.GGNORTH.goldengate]{1:29336:52435}
[check] Health: Failed
2022-06-30 20:24:36.389 :CLSDYNAM:521639680: [xag.GGNORTH.goldengate]{1:29336:52435}
[check] Resources: Name Type Status Health
2022-06-30 20:24:36.389 :CLSDYNAM:521639680: [xag.GGNORTH.goldengate]{1:29336:52435}
[check] -------------------------------- ---------- ---------- ------
2022-06-30 20:24:36.389 :CLSDYNAM:521639680: [xag.GGNORTH.goldengate]{1:29336:52435}
[check] REP1 replicat abended Failed
2022-06-30 20:24:36.389 :CLSDYNAM:521639680: [xag.GGNORTH.goldengate]{1:29336:52435}
[check] HealthCheck failed
ExtractプロセスまたはReplicatプロセスがクリティカルに設定されていない場合、それらはCRSトレース・ファイル内に出現しません。Replicat REP1がfailedと示されているため、これは、REP1がクリティカルに設定されておりGoldenGateの起動を妨げているということです。
Replicatに対するクリティカル設定を無効にするには、GoldenGateのサービス・マネージャおよびデプロイメントを手動で起動する必要があります。
例:
$ export OGG_ETC_HOME=/mnt/acfs/goldengate/deployments/ggsm01/etc
$ export OGG_VAR_HOME=/mnt/acfs/goldengate/deployments/ggsm01/var
$ export OGG_HOME=/u01/oracle/goldengate/ggMS_21c
$ $OGG_HOME/bin/ServiceManager --xagEnabled
管理サーバーGUIを使用して、ReplicatまたはExtractの詳細を選択し、クリティカル・フラグの設定を解除します。
クリティカル設定が無効になった後は、XAGを使用してOracle GoldenGate Microservicesを起動および停止できます。
例:
$ agctl start goldengate GGNORTH --node dc1north01
$ agctl status goldengate GGNORTH