管理エージェント・サービスのトラブルシューティング

この項では、管理エージェントおよび管理ゲートウェイを使用したインストールやアンインストールなど、管理エージェント・サービスに関連する一般的な問題および解決策について説明します。

トピック:

管理エージェントのインストールおよび構成の問題のトラブルシューティング

Oracle Management Agentのインストールおよび構成プロセス中に、様々なエラーが発生することがあります。一般的なエラーの原因と推奨措置を次に示します。

新しいエージェントをインストールする前に、エージェントをアンインストールしてサービス・ファイルを削除してください。

原因: エージェントがすでにホストにインストールされています。以前のアンインストール・プロセスによって、エージェント・サービス・ファイルが正常に削除されませんでした。

アクション:
  • rpm -e oracle.mgmt_agentを実行して、エージェントをアンインストールします。コマンドが成功したら、新しいエージェントのインストールを試行します。コマンドが機能しない場合は、次の推奨アクションを試してください。
  • ls /opt/oracle/mgmt_agentを実行して、以前のエージェントのインストールが残っているかどうかを確認します。見つかった場合は、rm -rf /opt/oracle/mgmt_agentを実行して削除します。
  • Linuxバージョンに応じて、次の場所にエージェント・サービス・ファイルがすでにあるかどうかを確認します:
    • OL7の場合(systemdを使用している場合): /etc/systemd/system/mgmt_agent.service
    • OL6の場合(initを使用している場合): /etc/init/mgmt_agent.conf

      このサービス・ファイルがあることがわかったら、rm -rf /etc/init/mgmt_agent.confを実行して削除してから、新しいエージェントのインストールを再試行してください。

Javaが64ビットJVMではありません。64ビットJVMのパスを環境変数JAVA_HOMEまたはJavaが見つかりません。任意のパスをJAVA_HOMEに設定してください。

原因: JAVA_HOME環境変数が設定されていないか、64ビットJDKの場所を指していません。

アクション: JAVA_HOME環境変数を正しいJDKバージョンに設定して、エージェントのインストールを再試行します。現在、64ビットJDKのみがサポートされています。

エージェントのインストールが次のメッセージで失敗しました: useradd: 一意のGIDを取得できません(使用可能なGIDはこれ以上ありません)

原因: 管理エージェント・インストール・プロセス中にインストール・スクリプトでユーザーおよびグループを追加できません。Linuxシステム上の使用可能なグループIDがすでに使用されているためです。

Executing install
    Unpacking software zip
    Copying files to destination dir (/opt/oracle/mgmt_agent) 
useradd: Can't get unique GID (no more available GIDs) 
useradd: can't create group 
Agent installation failed, please check log file

アクション: システム管理者に相談してから次に進みます:

  1. /etc/login.defsファイルを編集します。このファイルを編集するには、sudo権限が必要です。

    次のエントリを確認します:
    SYS_GID_MIN               nnnn
    SYS_GID_MAX               mmmm
    SYS_UID_MIN               pppp
    SYS_UID_MAX               qqqq
    ここで、nnnnおよびppppは最小値、mmmmおよびqqqqは最大値です。

    ファイルに前述のエントリが存在しない場合は、追加します。

  2. システム管理者の推奨に基づいてSYS_GID_MAXエントリの値を更新し、ファイルを保存します。

  3. sudo rpm -e oracle.mgmt_agentを実行して、失敗したエージェントのインストールを削除します。

  4. シェルからログアウトしてからログインします。

  5. エージェントのインストールを再試行します。

useradd: ディレクトリ/usr/share/mgmt_agentを作成できません

管理エージェントのインストール中にmgmt_agentユーザーが作成され、デフォルトのホーム・ディレクトリは/usr/share/mgmt_agentになります。

原因: /usr/shareに十分なファイル権限がないか、ファイル・システムが読取り専用です。

考えられるアクション:

  • デフォルトのユーザー・ホーム・ディレクトリの場所/usr/shareへのアクセス権をmgmt_agentユーザーに付与するように、ファイル権限を設定します。

  • USER_HOME_DIR_ROOT環境変数を使用して別のホーム・ディレクトリの場所を設定します(別の場所を使用する場合)。

    mgmt_agentユーザーのホーム・ディレクトリとして使用したいパスをUSER_HOME_DIR_ROOT環境変数に設定し、管理エージェント・ユーザーがそのディレクトリに対して適切なファイル権限を持つようにします。

Windows: 指定されたパスが見つかりません。エージェントのインストールに失敗しました。

エラーレベル=9009

考えられる原因:ディレクトリ/フォルダ名に空白があるため、環境変数が正しく設定されていません。

Windows環境では、ディレクトリ/フォルダ名内にスペースを使用できるため、管理エージェントのインストールに問題が発生します。これは、Windowsによって引用符が自動的に名前に追加されるためです。たとえば、Program Filesという名前のディレクトリ/フォルダがあります。この場合、Windowsでは、フォルダ名内にスペースがあるため引用符が自動挿入され、"Program Files"と表示されます。

管理エージェント・インストーラではJAVA_HOMEAGENT_INSTALL_BASEDIRなどの環境変数の引用符を使用できないため、余分な引用符によって問題が発生する可能性があります。

ノート

管理エージェント・インストーラでは、パスに次の特殊文字を使用できません: [^^"'&または]

アクション:

Windowsで環境変数を設定する方法として、「システムの詳細設定」を使用することをお薦めします。
  • Windowsタスクバーで、「Windows」アイコンを右クリックして「システム」を選択します。
  • 「Settings」ウィンドウの「Related Settings」で、「Advanced system settings」をクリックします。

    Windowsの詳細設定

  • 「詳細設定」タブで、「環境変数」をクリックします。

    Windows環境変数

  • 「新規」をクリックして、新しい環境変数を作成します。「編集」をクリックして、既存の環境変数を変更します。
  • 環境変数を作成または変更した後、「適用」をクリックし、「OK」をクリックして変更を有効にします。
    ノート

    環境変数を作成するグラフィカル・ユーザー・インタフェースは、Windowsのバージョンによってわずかに異なる場合があります。

最初のインストール後のコンソールの管理エージェント・ステータスが「使用不可」です

考えられる原因:システム・タイムスタンプが正しくありません

処置: エージェントのホストのシステム時間を確認し、必要に応じて修正できます。

構成後、管理エージェントはコンソールまたはAPIからは表示されません。

考えられる原因:管理エージェントまたは管理ゲートウェイ・エージェントを構成した後で、エージェントがOracle CloudコンソールまたはAPIで表示されない場合、ユーザーまたはユーザー・グループに正しいポリシーが設定されていない可能性があります。

処置:ユーザーまたはユーザー・グループに、管理エージェントまたはゲートウェイ・エージェントに必要なポリシーが構成されていることを確認します。ポリシーを設定するには、ユーザー・グループのポリシーの作成を参照してください。

管理エージェントを使用してモニターされているPrometheusまたはKubernetesメトリックは使用できません

考えられる原因:管理エージェントは、独自のメトリックに対して動的グループまたはポリシーを必要としませんが、PrometheusおよびKubernetesメトリックに対して必要です。ユーザーは、動的グループ内のエージェントがOCIモニタリングにメトリックを投稿できるようにする動的グループおよびポリシーを定義する必要があります。メトリックがコンパートメントまたはOCIモニタリング・ネームスペースに表示されない場合は、ポリシーおよび動的グループを確認できます。
  • (a)ポリシーがない

    アクション: 設定手順で説明されているようにポリシーが管理エージェントに追加されていることを確認します。詳細は、管理エージェント・サービスのためのOracle Cloud Infrastructureの設定を参照してください。

    ポリシーがない場合は、管理エージェント・サービスのためのOracle Cloud Infrastructureの設定を参照してください。

  • (b)ポリシーのタイポ

    アクション: ポリシー・サンプルと比較して、ポリシー構文の誤りがないかを確認します。詳細は、管理エージェント・サービスのためのOracle Cloud Infrastructureの設定を参照してください。

    たとえば、コンパートメントIDとmanagementagentリソース・タイプが適切な一重引用符で囲まれている次の構文のように、動的グループ定義が正しく定義されているかを確認します:

    ALL {resource.type='managementagent', resource.compartment.id='ocid1.compartment.oc1.examplecompartmentid'}
  • (c)動的グループ定義のコンパートメントIDが正しくない

    アクション: インストール・キーのコンパートメントIDがエージェントの動的グループ定義に指定されたコンパートメントIDと同じであることを確認します。デフォルトでは、エージェントはインストール・キーのコンパートメントに作成されます。

エージェントはOutOfMemoryExceptionに実行されます。

考えられる原因:エージェントに割り当てられている負荷をサポートするように正しくチューニングされていない場合、ヒープ・メモリーが不足することがあります。

処置:管理エージェントのヒープ・メモリー設定を更新します。

エージェントの最大ヒープの即時利用可能な構成は次のとおりです。
  • OCAプラグインとしての管理エージェント用に128MB。
  • スタンドアロン管理エージェントの場合は512MB。(管理エージェント・コンソールからダウンロードされたもの)。
ユーザーは、次を実行して、エージェントにより多くのヒープを更新および割り当てることができます。
  • ファイルを開きます: agent_inst/config/java.options
  • 上のファイルを編集します。次の行を変更してヒープ設定を更新します: -Xmx512m

    例: 前述の行は、エージェントの最大ヒープを512MBに設定します。

    ヒープを800MBに変更するには、前述の行を-Xmx800mに更新します。

  • ファイルを保存し、エージェントを再起動して変更を有効にします。

管理エージェントがWindowsホストにインストールされたときにホスト列に表示されるIPアドレス

問題: 管理エージェントがWindowsホストにインストールされ、管理エージェント・コンソールに、Windowsホストの完全修飾ドメイン名(ホスト名)を表示するかわりに、UIページにWindowsホストのIPアドレスが表示されます。

アクション:
  • Windowsホストにログインし、「コントロール・パネル」を開きます。

  • 「システムとセキュリティ」をクリックし、「システム」をクリックします。

  • 「コンピュータ名、ドメインおよびワークグループ設定」セクションを探して、このセクションの右側にある「設定の変更」をクリックします。

    「システム・プロパティ」ポップアップ・ウィンドウが表示されます。

  • デフォルトでは、「コンピュータ名」タブが選択されています。選択されていない場合は、「コンピュータ名」をクリックします。

  • 次のメッセージを探します: このコンピュータまたはそのドメインまたはワークグループの名前を変更するには、「変更」をクリックします

  • 「変更」をクリックします

    「コンピュータ名/ドメインの変更」という名前のポップアップ・ウィンドウが表示されます。

  • たとえば、WindowsホストのFQDNがFOOBAR004.subnet1ab2regsu.dummytenantreg1.abcvcn.comの場合、「コンピュータ名」というテキスト・ボックスに、Windowsホストの短いホスト名FOOBAR004を指定します。

  • 「詳細」をクリックすると、DNS接尾辞およびNetBIOSコンピュータ名という名前の別のポップアップ・ウィンドウが表示されます。

    「このコンピュータのプライマリDNS接尾辞」というテキスト・ボックスに、WindowsホストのDNS名を指定します。

    例: subnet1ab2regsu.dummytenantreg1.abcvcn.com

  • 「OK」または「適用」をクリックして、すべてのポップアップ・ウィンドウを閉じます。

  • Windowsホストを再起動します。

  • Windows端末からuninstaller.batスクリプトを実行して、既存の管理エージェントをアンインストールします。

  • 次に、管理エージェントをWindowsマシンに再度インストールします。

管理エージェントのインストールに成功し、Windowsホストの「エージェントUI」ページのFQDNがホスト列に表示されます

外部ボリュームの使用時にSELinuxで管理エージェントのインストールが失敗する

インストールの実行後にエージェント・サービスの起動に失敗します。この状況では、非稼働エージェントが発生し、次のメッセージが表示されます。
systemctl start mgmt_agent
Job for mgmt_agent.service failed because the control process exited with error code.
See "systemctl status mgmt_agent.service"and "journalctl -xeu mgmt_agent.service" for details.
確認するには、サービス・マネージャのログでエラーの詳細を確認してください。
journalctl -xeu mgmt_agent.service
...
Dec 08 15:48:19 ol9-arm systemd[1261408]: mgmt_agent.service: Failed to execute /dir1/oracle/managementagent/agent_inst/bin/agentcore: Permission denied
Dec 08 15:48:19ol9-arm systemd[1261408]: mgmt_agent.service: Failed at step EXEC spawning /dir1/oracle/managementagent/agent_inst/bin/agentcore: Permission denied
また、監査ログも確認します。
$ ausearch -ts recent -m avc -i
...
type=AVC msg=audit(12/08/202315:49:26.991:51338) : avc:  denied  { read open } for  pid=1261576comm=(gentcore) path=/dir1/oracle/managementagent/agent_inst/bin/agentcore dev="dm-0"ino=915154scontext=system_u:system_r:init_t:s0           tcontext=unconfined_u:object_r:default_t:s0 tclass=file permissive=0

前述のすべてのエラー・メッセージは、SELinuxでは、選択したフォルダでコマンドを実行できないことを示しています。

処置:システム管理者に連絡し、管理エージェントのインストールおよび実行を許可する必要なポリシーを作成してください。

RHEL 9x環境では、管理エージェントまたは管理ゲートウェイ・エージェントのインストールが失敗し、次のメッセージが表示されます: "mgmt_gatewayサービスの作成に失敗しました。理由: 検出されたLinux: またはmgmt_agentサービスの作成に失敗しました。理由: 検出されたLinux:"。

原因: Red Hatは、Red Hat Enterprise Linux (RHEL) 9ディストリビューションのchkconfigパッケージを削除しました。詳細は、Red Hatナレッジ・ベースを参照してください。その結果、インストールの失敗ログ・メッセージでエラーが確認され、設定の試行で不正なサービス・マネージャを使用してエージェントをインストールしたことが示される場合があります。

次のログ・エラー・メッセージの例を参照してください。使用している環境に応じて表示されることがあります。この問題は、agentcoreスクリプト内のルールを使用してOsFamilyが識別されず、エージェント・サービスの設定にRHEL 9xではsystemctlではなくinit.dが使用される場合に発生します。
$ rpm -ivh oracle.mgmt_gateway.231118.1208.1702955171.Linux-x86_64.rpm
Verifying... ################################# [100%]
Preparing... ################################# [100%]
Checking pre-requisites
Checking if any previous gateway service exists
Checking if OS has systemd or initd
Checking available disk space for gateway install
Checking if /opt/oracle/mgmt_agent directory exists
Checking if 'mgmt_agent' user exists
'mgmt_agent' user already exists, the gateway will proceed installation without creating a new one.
Checking Java version
Trying /omc/java/jdk1.8.0_391
Java version: 1.8.0_391 found at /omc/java/jdk1.8.0_391/bin/java
Checking agent version
Updating / installing...
1:oracle.mgmt_gateway-231118.1208.1################################# [100%]

Executing install
Unpacking software zip
Copying files to destination dir (/opt/oracle/mgmt_agent)
Initializing software from template
Checking if JavaScript engine is available to use
Creating 'mgmt_gateway' daemon
mgmt_gateway service creation failed. Reason: Detected Linux:
Installing the mgmt_gateway daemon...
ln: failed to create symbolic link '/etc/init.d/mgmt_gateway': No such file or directory
ln: failed to create symbolic link '/etc/rc3.d/K20mgmt_gateway': No such file or directory
ln: failed to create symbolic link '/etc/rc3.d/S20mgmt_gateway': No such file or directory
ln: failed to create symbolic link '/etc/rc5.d/S20mgmt_gateway': No such file or directory
ln: failed to create symbolic link '/etc/rc5.d/K20mgmt_gateway': No such file or directory
Service not installed.
warning: %post(oracle.mgmt_gateway-231118.1208.1702955171-1.x86_64) scriptlet failed, exit status 1
アクション:
  1. 次のコマンドを実行して、環境がRed Hat Enterprise Linux 9.xを使用していることを確認します。
    $ cat /etc/redhat-release
    Red Hat Enterprise Linux release 9.3 (Plow)
  2. chkconfigパッケージが欠落していることを確認します(Red Hatナレッジ・ベースの次の記事を参照)。

解決策

  1. 次のコマンドを使用して、不足しているパッケージをインストールします:
    $ dnf install chkconfig
  2. パッケージが環境内に存在することを検証します。
    $ rpm -qa | grep chkconfig
  3. 管理エージェントまたは管理ゲートウェイ・エージェントのインストールを再試行してください。

管理エージェントのアンインストールに関する問題のトラブルシューティング

このトピックでは、Oracle Management Agentの削除に関連する一般的な問題とその解決策について説明します。

エラー:… 複数のパッケージが指定されています

原因: rpmレジストリにその名前の複数のパッケージがあります。

アクション: rpm -eコマンドの実行時に--allmatchesフラグを使用します:
rpm -e oracle.mgmt_agent --allmatches

エラー: ...スクリプトレットが終了コードで失敗しました

原因: rpmが実行中のエージェントを停止できなかったか、システムからのエージェント・サービス・ファイルの削除に失敗しました。

アクション: 解決するには、エージェントの手動削除を試してください。
  • エージェントが実行中かどうかを確認します:

    OL7の場合: systemctl status mgmt_agent

    OL6の場合: /sbin/initctl status mgmt_agent

    エージェントが実行していることがわかったら停止します:

    OL7の場合: systemctl stop mgmt_agent

    OL6の場合: /sbin/initctl stop mgmt_agent

  • rpm -e oracle.mgmt_agent --noscriptsを実行してrpmを削除します。このコマンドは、すべてのrpmスクリプトをスキップし、レジストリからパッケージを削除しようとします。
  • rm -rf /opt/oracle/mgmt_agentを実行して、すべてのエージェント・ファイルを削除します。次も実行します:

    OL7の場合: rm -rf /etc/systemd/system/mgmt_agent.service

    OL6の場合: rm -rf /etc/init/mgmt_agent.conf

コンピュート・インスタンスの管理エージェントのトラブルシューティング

コンピュート・インスタンスでのOracle Management Agentのデプロイ中に、様々なエラーが発生することがあります。一般的なエラーの原因と推奨措置を次に示します。

エージェントは「使用不可」状態であり、エージェント・ログ・ファイルは「無効なタグ」とレポートします

「管理エージェント」ページにはエージェントが「使用不可」状態で表示され、mgmt_agent.logファイル(<Agent_Inst>/logsディレクトリの下)によって次のメッセージがレポートされます:

ErrorBody:{"code" : "InvalidParameter","message" : "Invalid tags: Resource creation failed because the resource requires tag value(s).次の各タグ定義に値を追加します: \nGLOBAL.ComponentType、GLOBAL.ApplicationName、

原因:

この問題は、コンパートメントがすべてのリソースに必須タグを必要とし、リソース作成リクエストにタグが含まれていない場合に発生する可能性があります。その後、アクティブ化リクエストは次のメッセージで失敗します:"無効なタグ: リソースがタグ値を必要としているためリソースの作成に失敗しました)"、エージェント・ステータスが使用不可と表示されます。

アクション:

  • 管理エージェント

    スタンドアロン管理エージェントがある場合は、アンインストールする必要があります。

    管理エージェントがRPMまたはZIPファイルを使用してインストールされた場合は、エージェント・パラメータの確認の項の説明に従って、DefinedTagsパラメータを使用してレスポンス・ファイルを指定して、アンインストールおよび再インストールする必要があります。

  • コンピュート・インスタンス上の管理エージェント
    OCAプラグインを使用してOCIコンソールで管理エージェントを有効にした場合、コンピュート・インスタンスには使用されないため、レスポンス・ファイルはありません。この場合、次を行います。
    1. 管理エージェントがデプロイされているインスタンスにログインし、コマンドを使用してoracle-cloud-agentユーザーとしてsudoを実行します:
      sudo -u oracle-cloud-agent sh
    2. agent.definedtagsファイルを /var/lib/oracle-cloud-agent/plugins/oci-managementagent/polaris/agent_inst/config/security/resource/ディレクトリの下に作成します。

    3. リソースの作成に必要な定義済タグをagent.definedtagsファイルに追加します。

      たとえば、次を追加できます:
      [{"GLOBAL":{"ComponentType":"<value>"}}, {"GLOBAL":{"ApplicationName":"<value>"}}]
    4. 次のコマンドを使用して、oracle-cloud-agentを再起動します:
      sudo systemctl restart oracle-cloud-agent

管理エージェントの設定がfork/exec oracle.polaris.oca.main: 権限が拒否されましたで失敗しました

このエラーが発生すると、管理エージェントのインストールまたは起動に失敗する可能性があります。

管理エージェント・プラグインのコンピュート・インスタンスのプラグイン・ビューに表示されるエラー・メッセージは、次のようになります。

workflow.go:23: [ERROR] step [*core.SetupImageStep] execution failed with [setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]]
mgmtagent_image.go:139: [ERROR] bootstrap workflow failed with error setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]
agent.go:74: [ERROR] failed to start agent during bootstrap with [setup image failed with [fork/exec 230821.1905/bin/oracle.polaris.oca.main: permission denied]]

考えられる原因:

この問題は、コンピュート・インスタンスがnoexecフラグを指定してtmpfsをマウントすることで、 /tmp ディレクトリからのフォーク/実行操作を許可しない場合に発生することがあります。

この考えられる原因を確認するには、次を実行します。
$ mount | grep tmpfs
tmpfs on /tmp type tmpfs (rw,nosuid,nodev,noexec,inode64)

出力には、does have the noexec flagと表示されます。

アクション:

  1. Oracle Cloud Agentを停止します。
     sudo systemctl stop oracle-cloud-agent
  2. ファイルに次の設定を追加します: /etc/oracle-cloud-agent/plugins/oci-managementagent/config.yml
    overrideTmpDir: true
  3. Oracle Cloud Agentを起動します。
    $ sudo systemctl start oracle-cloud-agent

管理ゲートウェイのトラブルシューティング

このトピックでは、管理ゲートウェイに関連する一般的な問題と解決策について説明します。

管理ゲートウェイの削除

原因: 場合によっては、再インストールするために、既存の管理ゲートウェイのインストールを削除する必要があります。

アクション:
  • ゲートウェイが実行中かどうかを確認します:

    OL7の場合: systemctl status mgmt_gateway

    OL6の場合: /sbin/initctl status mgmt_gateway

    ゲートウェイが実行している場合は停止します:

    OL7の場合: systemctl stop mgmt_gateway

    OL6の場合: /sbin/initctl stop mgmt_gateway

  • 次のコマンドを使用して、インストールされたゲートウェイRPMを削除します: rpm -e oracle.mgmt_gateway --noscripts

  • 残りのゲートウェイ・ファイルがあれば、次のコマンドを使用して削除します:

    rm -rf /opt/oracle/mgmt_agent

  • 次を実行します:

    OL7の場合: rm -rf /etc/systemd/system/mgmt_gateway.service

    OL6の場合: rm -rf /etc/init/mgmt_agent.conf

管理ゲートウェイの構成

原因:場合によっては、インストール環境でホスト名が解決されない可能性があり、インストールが失敗して次のエラー・メッセージが表示されることがあります:

インストール環境でホスト名<hostname value>を解決できませんでした。ホスト名を解決するか、レスポンス・ファイルでGatewayCertCommonNameを指定し、ゲートウェイ設定スクリプトを再実行します。」

アクション:

  • コマンド hostname -fの実行後に、環境のホスト名を確認して解決し、完全修飾doamin名(FQDN)の値を取得します
  • オプションで、ユーザーは入力レスポンス・ファイルのGatewayCertCommonNameプロパティをシードすることで、ゲートウェイ構成のカスタム完全修飾ドメイン名を指定できます。レスポンス・ファイル・パラメータを参照してください
  • ゲートウェイ構成スクリプトを再度実行します。
    sudo /opt/oracle/mgmt_agent/agent_inst/bin/setupGateway.sh opts=<user_home_directory>/gateway.rsp