ジョブ実行の開始

データ・サイエンス・ジョブ実行を使用して、作成されたジョブに様々なユースケースを適用します。

ジョブ作成で、インフラストラクチャと実際のユース・ケース・アーティファクトが設定されます。ただし、ジョブ実行で、指定したパラメータを使用してジョブが実行されます。ジョブ実行では、指定されたインフラストラクチャがプロビジョニングされ、ジョブ・アーティファクトが実行されてから、ジョブ実行が終了すると使用済リソースがプロビジョニング解除されて破棄されます。

    • 単一ノードのジョブ実行を開始する場合は、「単一ノード」のステップに従います。
    • マルチノード・ジョブ実行を開始する場合は、「マルチ・ノード」のステップに従います。

    単一ノード

    次のステップを使用して、単一ノードのジョブ実行を開始します。
    1. 「プロジェクト」リスト・ページで、作業するジョブを含むプロジェクトを選択します。リスト・ページまたはプロジェクトの検索に関するヘルプが必要な場合は、プロジェクトのリストを参照してください。
    2. プロジェクトの詳細ページで、「ジョブ」を選択します。
    3. ジョブを選択します。
    4. 「ジョブの実行」を選択します。
    5. 「ジョブ実行の開始」を選択します。
    6. 「ジョブ実行の開始」ページで、次の情報を入力します。
      • コンパートメント(オプション): ジョブ実行に別のコンパートメントを選択します。
      • 名前(オプション): ジョブ実行の名前を入力します(255文字の制限)。名前を指定しない場合、名前は自動的に生成されます。例: jobrun20210808222435
      • カスタム環境変数キー* (オプション): ジョブを制御するための環境変数
      • * (オプション): カスタム環境変数キーの値。
      • コマンドライン引数* (オプション): ジョブの実行に使用するコマンドライン引数。
      • 最大ランタイム(分)(オプション): ジョブを実行できる最大分単位。サービスは、実行時間が指定された値を超えた場合にジョブ実行を取り消します。最大実行時間は30日(43,200分)です。ランナウェイ・ジョブ実行を回避するために、すべてのジョブ実行に最大実行時間を構成することをお薦めします。
      • ネットワーキング・リソース: 関連するオプションを選択します。
        • デフォルト・ネットワーキング: トラフィックをOracleサービスのみに制限します。システムは、既存のサービス管理ネットワークを使用します。ワークロードは、セカンダリVNICを使用して、事前構成済のサービス管理型のVCNおよびサブネットにアタッチされます。提供されているこのサブネットにより、NATゲートウェイを介したパブリック・インターネットへのエグレスおよびサービス・ゲートウェイを介した他のOracle Cloudサービスへのアクセスが許可されます。

          パブリック・インターネットおよびOCIサービスのみにアクセスする必要がある場合は、このオプションを使用することをお薦めします。ネットワーキング・リソースを作成したり、ネットワーキング権限のポリシーを記述する必要はありません。

        • インターネットを使用したデフォルト・ネットワーキング: データ・サイエンスNATゲートウェイを介したアウトバウンド・インターネット・アクセスを許可します。
          ノート

          切断されたレルムおよびOracle開発テナンシでは、インターネットを使用するデフォルト・ネットワーキングを使用できません。テナンシまたはコンパートメントに、パブリック・ネットワーク・アクセスを拒否するデータ・サイエンス・セキュリティ・ゾーン・ポリシー(たとえば、deny model_deploy_public_network - データ・サイエンス・セキュリティ・ゾーン・ポリシーを参照)がある場合、サービス管理のパブリック・インターネット・アクセス・オプションは無効になります。このオプションを使用しようとすると、404 NotAuthorizedOrNotFoundエラーが表示されます。
        • Custom Networking: 使用するVCNおよびサブネット(コンパートメント別)を選択します。

          パブリック・インターネットへのエグレス・アクセスには、NATゲートウェイへのルートを持つプライベート・サブネットを使用します。

          ノート

          • ファイル・ストレージ・マウントを使用するには、カスタム・ネットワークを使用する必要があります。
          • カスタム・ネットワーキングから管理対象ネットワーキングへの切替えは、作成後はサポートされません。
          • バナーThe specified subnet is not accessible. Select a different subnet.が表示された場合は、データ・サイエンスでカスタム・ネットワーキングを使用できるようにするポリシーを作成します。ポリシーを参照してください。
      • シェイプの変更* (オプション): 「シェイプの変更」を選択してコンピュート・シェイプを変更します。次に、「コンピュート・シェイプの選択」パネルの次のステップに従います。
        • インスタンス・タイプの選択
        • シェイプ・シリーズを選択します。
        • サポートされているシリーズ内のコンピュート・シェイプのいずれかを選択します。リソースの使用方法に最適なシェイプを選択します。
        • 選択したシェイプを展開して、OCPUおよびメモリーを構成します。
          • OCPUの数
          • メモリー量(GB): OCPUごとに、最大64 GBのメモリーと最大合計512 GBを選択します。許容されるメモリーの最小容量は、1GBまたはOCPUの数に一致する値のいずれか大きい方です。
          • バースト可能なシェイプの有効化: バースト可能な仮想マシンを使用する場合に選択し、「OCPU当たりのベースライン使用率」で、通常使用するOCPUの割合を選択します。サポートされている値は、12.5%および50%です。(モデル・デプロイメントでは、50%の値のみがサポートされます。)
        • 「シェイプの選択」を選択します。
      • ストレージのオーバーライド* (オプション): ストレージ構成をオーバーライドします。50 GBから10、240 GB (10 TB)の間に使用するブロック・ストレージの量を入力します。値は1GB単位で変更できます。
      • BYOCオーバーライドの有効化 / 環境構成オーバーライド > 選択* (オプション): ジョブの定義済環境構成をオーバーライドする場合に選択します:
        • コンパートメント: リポジトリを含むコンパートメントを選択します、
        • リポジトリ: リストからリポジトリを選択してください。
        • Image: 使用するイメージを選択してください。
        • エントリポイント: エントリポイントを入力します。
        • CMD: コマンドを入力します。
          ノート

          ENTRYPOINTの引数としてCMDを使用するか、ENTRYPOINTがない場合に実行する唯一のコマンドとして使用します。
        • イメージ・ダイジェスト: イメージ・ダイジェストを入力します。
        • 署名ID: 署名検証を使用する場合は、イメージ署名のOCIDを入力します。例: ocid1.containerimagesignature.oc1.iad.aaaaaaaaab...
      • ロギングの有効化(オプション): ロギング構成をオーバーライドします。
        • ログ・グループ・コンパートメント: ログ・グループを含むコンパートメントを選択します。
        • ログ・グループ: ログのグループを選択します。
        • 自動ログ作成の有効化: ジョブの開始時にログを自動的に作成するには、このオプションを選択します。作成されたログには、すべてのstdoutおよびstderrメッセージが格納されます。
        • ログの選択: すべてのstdoutおよびstderrメッセージを格納するには、このオプションを選択(および既存のログを選択)します。
      • プローブのオーバーライド*(オプション): 起動プローブをオーバーライドします。
        1. 「選択」を選択します。
        2. 「プローブ」パネルで、次の情報を入力します。
          • コマンド
          • 初期遅延 (秒)
          • 期間
          • 失敗のしきい値
        3. 「保存」を選択します。
      • タグ(「拡張オプション」の下): ジョブ実行にタグを追加します。リソースを作成するアクセス許可がある場合、そのリソースにフリーフォーム・タグを適用するアクセス許可もあります。定義済タグを適用するには、タグネームスペースを使用する権限を持つ必要があります。タグ付けの詳細は、リソース・タグを参照してください。 タグを適用するかどうかわからない場合は、このオプションをスキップするか、管理者に問い合せてください。後でタグを適用できます。
      ノート

      フィールドのアスタリスク(*)は、マルチノード・ジョブの異なる配置を示します。マルチノード・ジョブのジョブ実行を開始する場合は、ノード・グループを編集してフィールドを検索します。「ノード・グループ構成のオーバーライド」で、ノード・グループの「アクション」メニュー(3つのドット)から、「編集」を選択します。結果のパネルにフィールドが表示されます。
    7. 「開始」を選択します。

    マルチ・ノード

    次のステップを使用して、マルチノード・ジョブ実行を開始します。
    1. 「プロジェクト」リスト・ページで、作業するジョブを含むプロジェクトを選択します。リスト・ページまたはプロジェクトの検索に関するヘルプが必要な場合は、プロジェクトのリストを参照してください。
    2. プロジェクトの詳細ページで、「ジョブ」を選択します。
    3. ジョブを選択します。
    4. 「ジョブの実行」を選択します。
    5. 「ジョブ実行の開始」を選択します。
    6. 「ジョブ実行の開始」ページで、「単一ノード」で説明されている情報を入力します。

      フィールドは単一ノードのジョブ実行と同じですが、次の違いがあります。

      • ノード・グループを編集するために、パネルにアスタリスク(*)フィールドが表示されます。
      • 次のフィールドは、ノードグループを編集するためのパネル内のマルチノードジョブでのみ使用できます。
        • レプリカ (レプリカの数)
        • 最小成功レプリカ (成功する必要があるレプリカの数)

        ノード・グループを編集するためのパネルを開くには、「ノード・グループ構成のオーバーライド」で、ノード・グループの「アクション」メニュー(3つのドット)から「編集」を選択します。

    7. 「開始」を選択します。
  • これらの環境変数は、ジョブを制御します。

    データ・サイエンスCLIを使用して、次の例のようにジョブ実行を開始します:

    1. 次を使用してジョブ実行を開始します:
      oci data-science job-run create \
      --display-name <job_run_name> \
      --compartment-id <compartment_ocid> \
      --project-id <project_ocid> \
      --job-id <job_ocid> \
      --configuration-override-details file://<optional_job_run_configuration_override_json_file> \
      --log-configuration-override-details file://<optional_job_run_logging_configuration_override_json_file>
                                      
    2. (オプション)このジョブ実行構成オーバーライドJSONファイルを使用して、親ジョブで定義された構成をオーバーライドします:
      jobEnvironmentConfigurationDetails: {
        jobEnvironmentType: "OCIR_CONTAINER",
          image: "iad.ocir.io/axoxdievda5j/odsc-byod-hello-wrld:0.1.3",
          imageDigest: "sha256",
        cmd: ["ls", "-h"],
        entrypoint: ["-l"],
          imageSignatureId: "ocid1.containerimagesignature.oc1.iad.0.ociodscdev.aaaaaaaaccutw5qdz6twjzkpgmbojdck3qotqqsbn7ph6xcumu4s32o6v5gq",
      },
          jobConfigurationDetails: {
              jobType: "DEFAULT",
              environmentVariables: <envar-list-object>},
          ...
      }
    3. (オプション)このジョブ実行ロギング構成オーバーライドJSONファイルを使用して、親ジョブで定義されたロギング構成をオーバーライドします:
      {
        "enableLogging": true,
        "enableAutoLogCreation": true,
        "logGroupId": "<log_group_ocid>"
      }
  • ADS SDKは、次のコマンドを使用してインストールできる、パブリックに使用可能なPythonライブラリでもあります:

    pip install oracle-ads

    ノートブックまたはクライアント・マシンからジョブを簡単に実行できるようにするラッパーを提供します。

    ADS SDKを使用してジョブ実行を開始します