ジョブ実行の開始
データ・サイエンス・ジョブ実行を使用して、作成されたジョブに様々なユースケースを適用します。
ジョブ作成で、インフラストラクチャと実際のユース・ケース・アーティファクトが設定されます。ただし、ジョブ実行で、指定したパラメータを使用してジョブが実行されます。ジョブ実行では、指定されたインフラストラクチャがプロビジョニングされ、ジョブ・アーティファクトが実行されてから、ジョブ実行が終了すると使用済リソースがプロビジョニング解除されて破棄されます。
- 単一ノード・ジョブ実行を開始する場合は、コンソールを使用した単一ノード・ジョブ実行の開始のステップに従います。
- マルチ・ノード・ジョブ実行を開始する場合は、コンソールを使用したマルチ・ノード・ジョブ実行の開始のステップに従います。
コンソールを使用した単一ノード・ジョブ実行の開始コンソールを使用した単一ノード・ジョブ実行の開始
- ジョブ・リスト・ページで、操作するジョブの名前を選択します。ジョブのリストの検索に関するヘルプが必要な場合は、ジョブのリストを参照してください。
- 「ジョブ実行の開始」を選択します。
- (オプション)ジョブ実行に別のコンパートメントを選択します。
- (オプション)ジョブ実行の名前を入力します(255文字の制限)。名前を指定しない場合は、名前が自動的に生成されます。
たとえば、
jobrun20210808222435
です。 - (オプション)次のオプションを使用して、ジョブの作成時に定義されたデフォルトのジョブ構成を上書きします:
以下の値を入力または選択します。
- カスタム環境変数キー
-
ジョブを制御する環境変数。
- 値
-
カスタム環境変数キーの値。
「追加のカスタム環境キー」を選択して、さらに変数を指定できます。
- コマンドライン引数
-
ジョブの実行に使用するコマンドライン引数。
- 最大実行時間(分)
-
ジョブを実行できる最大分数。サービスは、実行時間が指定された値を超えた場合にジョブ実行を取り消します。最大ランタイムは30日(43,200分)です。ランナウェイ・ジョブ実行を回避するために、すべてのジョブ実行に最大実行時間を構成することをお薦めします。
- (オプション)最大ランタイム・オーバーライドの値(分)を入力します。
-
ジョブの作成時に定義されたネットワーキング・リソース構成をオーバーライドします。
ネットワーク・タイプは変更できません。
- 「デフォルト・ネットワーキング」が構成されている場合、何も上書きできません。
- カスタム・ネットワーキングが構成されている場合は、選択したVCNおよびサブネットを変更できます。
- (オプション)「シェイプの変更」を選択して、コンピュート・シェイプを変更します。次に、「コンピュートの選択」パネルの次のステップに従います。
- インスタンス・タイプの選択
- シェイプ・シリーズを選択します。
- サポートされている一連のコンピュート・シェイプのいずれかを選択します。
-
リソースの使用方法に最適なシェイプを選択します。
OCPUごとに、最大64 GBのメモリーを選択し、最大合計512 GBを選択します。許容されるメモリーの最小容量は、1GBまたはOCPUの数に一致する値のいずれか大きい方です。
-
バースト可能な仮想マシンを使用している場合は、「バースト可能」を切り替えます。
「OCPU当たりのベースライン使用率」で、通常使用するOCPUの割合を選択します。サポートされている値は、12.5%および50%です。
- 「シェイプの選択」を選択します。
- (オプション)ストレージ構成をオーバーライドします。
50 GBから10、 240 GB (10 TB)までの間に使用するブロック・ストレージの量を入力します。値は1GB単位で変更できます。
-
次のオプションを使用して、ジョブの作成時に定義された環境構成をオーバーライドします。
- 「環境構成」で、「選択」を選択します。「BYOC環境の設定」パネルが表示されます。
- 「リポジトリ」で、リストからリポジトリを選択します。リポジトリが別のコンパートメントにある場合は、「コンパートメントの変更」を選択します。
- 「イメージ」で、リストからイメージを選択します。
- (オプション)「エントリ・ポイント」にエントリ・ポイントを入力します。別のパラメータを追加するには、+Addパラメータを選択します。
- (オプション)CMDにCMDを入力します。別のパラメータを追加するには、+Addパラメータを選択します。ノート
ENTRYPOINTの引数としてCMDを使用するか、ENTRYPOINTがない場合に実行する唯一のコマンドとして使用します。 - (オプション)「イメージ・ダイジェスト」にイメージ・ダイジェストを入力します。
- (オプション)「署名ID」で、署名検証を使用する場合は、イメージ署名のOCIDを入力します。たとえば、
ocid1.containerimagesignature.oc1.iad.aaaaaaaaab...
です。 - 「選択」を選択します。
- (オプション)ロギング構成をオーバーライドします。
- リストからログ・グループを選択します。別のコンパートメントに変更して、ジョブとは異なるコンパートメントのログ・グループを指定できます。
-
次のいずれかを選択して、すべての
stdout
およびstderr
メッセージを格納します。- 自動ログ作成の有効化
-
ジョブが開始されると、データ・サイエンスによって自動的にログが作成されます。
- ログの選択
-
使用するログを選択します。
- (オプション)起動プローブをオーバーライドします。
- コマンドを入力します。
- (オプション)別のコマンドを追加するには、+Addコマンドを選択し、ステップaを繰り返します。
- (オプション)初期遅延の値(秒)を入力します。
- (オプション)期間の値を入力します。
- (オプション)失敗しきい値の値を入力します。
- 「保存」を選択します。
- (オプション)「拡張オプションの表示」を選択して、ジョブ実行にタグを追加します。
- (オプション)「タグ」セクションで、ジョブ実行に1つ以上のタグを追加します。ジョブ実行を作成する権限がある場合、そのジョブ実行にフリーフォーム・タグを適用する権限もあります。定義済タグを適用するには、タグ・ネームスペースを使用する許可が必要です。タグ付けの詳細は、リソース・タグを参照してください。タグを適用するかどうかがわからない場合は、このオプションをスキップするか、管理者に問い合せてください。タグは後で適用できます。
- 「開始」を選択します。
コンソールを使用したマルチ・ノード・ジョブ実行の開始コンソールを使用したマルチ・ノード・ジョブ実行の開始
- ジョブ・リスト・ページで、操作するジョブの名前を選択します。ジョブのリストの検索に関するヘルプが必要な場合は、ジョブのリストを参照してください。
- 「ジョブ実行の開始」を選択します。
- (オプション)ジョブ実行に別のコンパートメントを選択します。
- (オプション)ジョブ実行の名前を入力します(255文字の制限)。名前を指定しない場合は、名前が自動的に生成されます。
たとえば、
jobrun20210808222435
です。 - (オプション)最大ランタイム・オーバーライドの値(分)を入力します。
-
ジョブの作成時に定義されたネットワーキング・リソース構成をオーバーライドします。
ネットワーク・タイプは変更できません。
- 「デフォルト・ネットワーキング」が構成されている場合、何も上書きできません。
- カスタム・ネットワーキングが構成されている場合は、選択したVCNおよびサブネットを変更できます。
- (オプション)ジョブの作成時に定義されたノード・グループ構成を上書きします。
ノード・グループの「アクション」メニュー(3つのドット)をクリックし、「編集」を選択することで、各ノード・グループの構成を個別に上書きできます。
- (オプション)レプリカの数をオーバーライドします。
- (オプション)成功する必要があるレプリカの最小数をオーバーライドします。
- (オプション) ストレージをオーバーライドします。50 GBから10、 240 GB (10 TB)までの間に使用するブロック・ストレージの量を入力します。値は1GB単位で変更できます。
-
(オプション)次のオプションを使用して、デフォルトのジョブ構成をオーバーライドします。
次のいずれかの値を入力または選択します。- カスタム環境変数キー
-
ジョブを制御している環境変数。
- 値
-
カスタム環境変数キーの値。
「追加のカスタム環境変数」を選択して、さらに変数を指定できます。
- コマンドライン引数
-
ジョブの実行に使用するコマンドライン引数。
-
「シェイプの変更」を選択して、コンピュート・シェイプを変更します。次に、「コンピュートの選択」パネルの次のステップに従います。
- インスタンス・タイプの選択
- シェイプ・シリーズを選択します。
- サポートされている一連のコンピュート・シェイプのいずれかを選択します。
-
リソースの使用方法に最適なシェイプを選択します。
OCPUごとに、最大64 GBのメモリーを選択し、最大合計512 GBを選択します。許容されるメモリーの最小容量は、1GBまたはOCPUの数に一致する値のいずれか大きい方です。
-
バースト可能な仮想マシンを使用している場合は、「バースト可能」を切り替えます。
「OCPU当たりのベースライン使用率」で、通常使用するOCPUの割合を選択します。サポートされている値は、12.5%および50%です。
- 「シェイプの選択」を選択します。
- (オプション)プローブ構成をオーバーライドします。
- コマンドを入力します。
- (オプション)別のコマンドを追加するには、+Addコマンドを選択し、ステップaを繰り返します。
- (オプション)初期遅延の値(秒)を入力します。
- (オプション)期間の値を入力します。
- (オプション)失敗しきい値の値を入力します。
- 「保存」を選択します。
- (オプション)ロギング構成をオーバーライドします。
- リストからログ・グループを選択します。別のコンパートメントに変更して、ジョブとは異なるコンパートメントのログ・グループを指定できます。
-
次のいずれかを選択して、すべての
stdout
およびstderr
メッセージを格納します。- 自動ログ作成の有効化
-
ジョブの開始時に、データ・サイエンスによってログが自動的に作成されます。
- ログの選択
-
使用するログを選択します。
- (オプション)「拡張オプションの表示」を選択して、ジョブ実行にタグを追加します。
- (オプション)「タグ」セクションで、ジョブ実行に1つ以上のタグを追加します。ジョブ実行を作成する権限がある場合、そのジョブ実行にフリーフォーム・タグを適用する権限もあります。定義済タグを適用するには、タグ・ネームスペースを使用する許可が必要です。タグ付けの詳細は、リソース・タグを参照してください。タグを適用するかどうかがわからない場合は、このオプションをスキップするか、管理者に問い合せてください。タグは後で適用できます。
- 「開始」を選択します。
これらの環境変数は、ジョブを制御します。
データ・サイエンスCLIを使用して、次の例のようにジョブ実行を開始します:
-
次を使用してジョブ実行を開始します:
oci data-science job-run create \ --display-name <job_run_name> \ --compartment-id <compartment_ocid> \ --project-id <project_ocid> \ --job-id <job_ocid> \ --configuration-override-details file://<optional_job_run_configuration_override_json_file> \ --log-configuration-override-details file://<optional_job_run_logging_configuration_override_json_file>
- (オプション)このジョブ実行構成オーバーライドJSONファイルを使用して、親ジョブで定義された構成をオーバーライドします:
jobEnvironmentConfigurationDetails: { jobEnvironmentType: "OCIR_CONTAINER", image: "iad.ocir.io/axoxdievda5j/odsc-byod-hello-wrld:0.1.3", imageDigest: "sha256", cmd: ["ls", "-h"], entrypoint: ["-l"], imageSignatureId: "ocid1.containerimagesignature.oc1.iad.0.ociodscdev.aaaaaaaaccutw5qdz6twjzkpgmbojdck3qotqqsbn7ph6xcumu4s32o6v5gq", }, jobConfigurationDetails: { jobType: "DEFAULT", environmentVariables: <envar-list-object>}, ... }
- (オプション)このジョブ実行ロギング構成オーバーライドJSONファイルを使用して、親ジョブで定義されたロギング構成をオーバーライドします:
{ "enableLogging": true, "enableAutoLogCreation": true, "logGroupId": "<log_group_ocid>" }
-
次を使用してジョブ実行を開始します:
ADS SDKは、次のコマンドを使用してインストールできる、パブリックに使用可能なPythonライブラリでもあります:
pip install oracle-ads
ノートブックまたはクライアント・マシンからジョブを簡単に実行できるようにするラッパーを提供します。