ジョブの作成

データ・サイエンスでジョブを作成して実行します。

ジョブに必要なポリシー、認証および認可を作成していることを確認します。

始める前に:

  • ジョブ・アーティファクト・ファイルを作成するか、カスタム・コンテナを構築します。

  • ジョブ・ログを格納および管理するには、ロギングについて学習します

  • ストレージ・マウントを使用するには、オブジェクト・ストレージ・バケットまたはOCI File Storage Service (FSS)マウント・ターゲットおよびエクスポート・パスが必要です。

    FSSを使用するには、まずファイル・システムおよびマウント・ポイントを作成する必要があります。カスタム・ネットワーク・オプションを使用し、マウント・ターゲットとノートブックが同じサブネットで構成されていることを確認します。特定のポートおよびプロトコルを使用してサブネットのセキュリティ・リスト・ルールを構成します。

    サービス制限がfile-system-countおよびmount-target-countに割り当てられていることを確認します。

  • ストレージ・マウントを使用するには、オブジェクト・ストレージ・バケットまたはOCI File Storage Service (FSS)マウント・ポイントが必要です。

  • 作成するジョブの基本情報を追加します。
    1. ジョブ・リスト・ページで、「ジョブの作成」を選択します。ジョブのリストの検索に関するヘルプが必要な場合は、ジョブのリストを参照してください。
    2. ジョブに単一マシンを使用する場合は「単一ノード」を選択し、複数のノードで実行される要求ジョブの場合は「複数ノード」を選択します。
    3. (オプション)ジョブに別のコンパートメントを選択します。
    4. (オプション)ジョブの名前と説明を入力します(255文字に制限されています)。名前を指定しない場合は、名前が自動的に生成されます。

      たとえば、job20210808222435です

    5. 単一ノードまたは複数ノードの構成ステップ
    単一ノード・ジョブのコンソールの使用
    マルチ・ノード・ジョブに対するコンソールの使用
  • これらの環境変数は、ジョブを制御します。

    次の例のように、データ・サイエンスCLIを使用してジョブを作成します:

    1. 次を使用してジョブを作成します:
      oci data-science job create \
      --display-name <job_name>\
      --compartment-id <compartment_ocid>\
      --project-id <project_ocid> \
      --configuration-details file://<jobs_configuration_json_file> \
      --infrastructure-configuration-details file://<jobs_infrastructure_configuration_json_file> \
      --log-configuration-details file://<optional_jobs_infrastructure_configuration_json_file>
    2. 次のジョブ構成JSONファイルを使用します:
      {
        "jobType": "DEFAULT",
        "maximumRuntimeInMinutes": 240,
        "commandLineArguments" : "test-arg",
        "environmentVariables": {
          "SOME_ENV_KEY": "some_env_value" 
        }
      }
    3. 次のジョブ・インフラストラクチャ構成JSONファイルを使用します:
      {
        "jobInfrastructureType": "STANDALONE",
        "shapeName": "VM.Standard2.1",
        "blockStorageSizeInGBs": "50",
        "subnetId": "<subnet_ocid>"
      }
    4. (オプション)このジョブ・ロギング構成JSONファイルを使用します:
      {
        "enableLogging": true,
        "enableAutoLogCreation": true,
        "logGroupId": "<log_group_ocid>"
      }
    5. 次を使用して、作成したジョブのジョブ・アーティファクト・ファイルをアップロードします:
      oci data-science job create-job-artifact \
      --job-id <job_ocid> \
      --job-artifact-file <job_artifact_file_path> \
      --content-disposition "attachment; filename=<job_artifact_file_name>"
  • ADS SDKは、次のコマンドを使用してインストールできる、パブリックに使用可能なPythonライブラリでもあります:

    pip install oracle-ads

    ノートブックまたはクライアント・マシンでのジョブの作成と実行を容易にするラッパーを提供します。

    ADS SDKを使用してジョブを作成および実行します。