自律型AIデータベースでのデータ変換によるデータの変換

Data Studioのデータ変換を使用して、Oracle Autonomous AI Databaseのグラフィカルなデータ統合および変換プロセスを設計します。データ変換では、コードを記述せずにデータ・ロードデータ・フローおよびワークフローを作成できます。

データ・ロードはソース接続からターゲット接続にデータを移動し、データ・フローはシステム間でデータを移動および変換する方法を定義し、ワークフローはデータ・フロー、データ・ロードおよびその他のステップが実行される順序を定義します。

これらのオブジェクトを実行すると、Oracle Data Transformsランタイム・エージェントによってジョブが編成され、コードが生成されます。

このトピックでは、Autonomous AI Databaseでデータ変換を使用するタイミングと方法を理解するためのエントリ・ポイントについて説明します。詳細は、Data Studioのドキュメントを参照してください。

データ変換を使用するタイミング

自律型AIデータベースのデータ統合作業を移動、変換、スケジュール、監視するための、ローコードのビジュアルな方法が必要な場合に、データ変換を使用します。

たとえば、次の目的で使用します。

  • データ・ロードを作成して、ソース接続からターゲット接続に複数のデータ・エンティティをロードします。
  • 結合、フィルタ、マッピング、制約、集計、式、ルックアップ、セット、ソート、その他のデータベース関数などのコンポーネントを使用して、システム間でデータを移動および変換するデータ・フローを作成します
  • ワークフローを作成して、複数のデータ・フロー、データ・ロード、変数およびワークフローを制御された実行シーケンスに編成します。
  • データ・フローまたはワークフローをスケジュールして、指定した時間または間隔で実行します。
  • ステータス・パネルまたはジョブ・ページから、データ・ロード、データ・フローおよびワークフローの実行ステータスをモニターします。
  • 変数を使用して、データ・フローおよびワークフローをパラメータ化します。
  • データ・フローで機械学習モデルを使用します。これには、出力をターゲット表に書き込む予測モデル・ステップが含まれます。
  • プロジェクト、接続、データ・ロード、データ・フロー、ワークフロー、スケジュールなど、データ変換オブジェクトのエクスポートとインポートを環境間で行います。

SQL、PL/SQL、DBMS_CLOUD、Oracle Data Pump、外部オーケストレーション・ツールなどの他のAutonomous AI Databaseのロードまたは変換オプションは、ビジュアルData Studioワークフローではなく、完全にスクリプト化された、管理された、またはアプリケーション主導のワークフローが必要な場合に使用します。これらのデータ・ロード・オプションについて学習するには、Autonomous AI Databaseへのデータのロードを参照してください。

Autonomous AI Databaseでのデータ変換の仕組み

データ変換は、Autonomous AI DatabaseのData Studioデータベース・アクションから使用できます。データベース・アクション・ページの「データ変換」カードまたはデータベース・アクション・セレクタのData Studioメニューから開くことができます。データ変換ツールを使用するには、ADMINユーザーまたはDATA_TRANSFORM_USERロールを持つユーザーとしてサインインします。

Data Transformsは、Data Integrator: Web Editionと呼ばれる別のOCI Marketplaceリストとしても使用できます。OCI Marketplaceからのデータ変換インスタンスがAutonomous AI Databaseに登録されている場合、Database Actionsの「データ変換」カードは、登録されているMarketplaceインスタンスを引き続きオープンします。かわりに埋込みData Transformsインスタンスを使用するには、Marketplaceインスタンスの登録を解除します。

データ変換を初めてオープンする場合は、データベース・ユーザー資格証明を指定する必要があります。サービスの開始後、「データ変換」ホーム・ページが開き、「接続」タブからAutonomous AI Database接続を表示できます。

アクセス・ステップ、必要なロール、初回サインイン動作およびマーケットプレイスの登録動作については、Data StudioからのOracle Data Transformsへのアクセスを参照してください。

開始する前に

変換を作成する前に、次のことを確認します。

  • ユーザーは、ADMINユーザーを使用していないかぎり、データベース・アクションへのアクセス権を持ち、DATA_TRANSFORM_USERロールを持ちます。
  • 必要なソース・システムとターゲット・システムは、Autonomous AI Databaseで使用されるOCIネットワークからアクセス可能です。Data Transforms接続は、OCIネットワークからアクセス可能なサポートされているテクノロジに接続するために使用されます。詳細は、接続の使用を参照してください。
  • Autonomous AI Databaseでプライベート・エンドポイントを使用する場合は、プライベート・データ・ソースが同じVCN内のクライアントからアクセス可能である必要があります。プライベート・データ・ソースおよび長時間実行ジョブのノートは、データ変換に関するノートを参照してください。
  • 使用しているData Transforms環境(Autonomous AI Databaseの埋込みData Transforms、登録済Data TransformsインスタンスまたはMarketplace Data Integrator: Web Editionリスト)を理解します。文書化された機能には、適用場所を示すバッジが付いています。

オープン・データ変換

データ変換を開くには:

  1. Autonomous AI Databaseのデータベース・アクションを開きます。
  2. 「Data Studio」を選択します。
  3. 「データ変換」を選択します。
  4. ADMINまたはDATA_TRANSFORM_USERロールを持つデータベース・ユーザーとしてサインインします。
  5. プロンプトが表示されたら、データ変換接続を使用するために必要なデータベース・ユーザー資格証明を指定します。
  6. データ変換ホーム・ページを使用して、接続、プロジェクト、データ・ロード、データ・フロー、ワークフロー、ジョブ、変数、およびインポート操作またはエクスポート操作を作成または管理します。

タスク・ステップを完了するには、次の項のData Studioドキュメント・リンクを使用します。

データ変換で実行できる操作

  • 接続: サポートされているデータベース、アプリケーション、サービス、オブジェクト・ストレージ、RESTおよびカスタムJDBCベースの接続を含む、ソースおよびターゲット・システムへの接続を作成および管理します。

    接続の作成、サポートされている接続タイプ、カスタム・コネクタ、オブジェクト・ストレージ接続、REST接続および関連する接続タスクについては、接続の操作を参照してください。

  • プロジェクト: データ・フロー、ワークフロー、変数、データ・ロードおよびジョブを論理グループに編成します。

    Data Transforms作業をプロジェクト・コンテナに編成する際のガイダンスは、プロジェクトの使用を参照してください。

  • データ・ロード: 複数のデータ・エンティティをソース接続からターゲット接続に移動し、サポートされている場合は再作成、切捨て、追加、増分追加、増分マージなどのロード・アクションを選択します。

    データ・ロードの作成方法、ソース接続とターゲット接続の選択方法、ロード処理オプションの選択方法およびデータ・ロードの実行方法を学習するには、データ・ロードの作成および実行を参照してください。

  • データ・エンティティ: インポート、作成、データ・フローでの使用および検査が可能な表形式のソース構造またはターゲット構造を表します。

    データ・ロードおよびデータ・フローで使用されるデータ・エンティティのインポート、作成および検査の詳細は、データ・エンティティの操作を参照してください。

  • データ・フロー: デザイン・キャンバスでソース、ターゲットおよび変換コンポーネントを接続して、ビジュアル変換ロジックを構築します。

    ビジュアル・データ・フローの作成と編集、コンポーネントの追加、列のマッピング、データ・フローの検証と実行についてさらに学習するには、データ・フローについてを参照してください。

  • ワークフロー: 複数のデータ・フロー、データ・ロード、変数およびワークフローを定義された順序で調整します。

    データ・フロー、データ・ロード、変数およびその他のワークフロー・ステップを順序付けするワークフローの作成および実行の詳細は、「ワークフローの概要」を参照してください。

  • スケジュール: データ・フローまたはワークフローをスケジュールして、後でまたは繰返し実行できるようにします。

    時間指定実行の変換作業をスケジュールする方法を学習するには、データ・フローまたはワークフローのスケジュールを参照してください。

  • ジョブおよび監視: 実行中および完了した実行の追跡、ジョブの詳細の確認、ジョブの再実行、ジョブの削除およびエラー詳細の検査を行います。

    ステータス・パネルおよびジョブ・リンクを使用した実行のモニターに関するガイダンスは、データ・ロード、データ・フローおよびワークフローのステータスのモニターを参照してください。

  • 変数: 実行時にデータ・フローおよびワークフローに置換できる値を格納します。

    変数を作成し、データ・フローおよびワークフローで使用する方法を学習するには、変数の作成と使用を参照してください。

  • 機械学習モデル: MLモデル・データ・エンティティを作成し、データ・フローでMLモデル・ステップを使用します。

    MLモデル・データ・エンティティの作成およびデータ・フローでのMLモデルの使用に関するガイダンスは、機械学習(ML)モデルの使用を参照してください。

  • エクスポートおよびインポート: オブジェクト・ストレージを介してオブジェクトをエクスポートおよびインポートすることで、データを環境間で変換します。

    環境間でのデータ変換オブジェクトの移動の詳細は、オブジェクトのエクスポートおよびインポートを参照してください。