自律型AIデータベースでのデータ変換によるデータの変換
Data Studioのデータ変換を使用して、Oracle Autonomous AI Databaseのグラフィカルなデータ統合および変換プロセスを設計します。データ変換では、コードを記述せずにデータ・ロード、データ・フローおよびワークフローを作成できます。
データ・ロードはソース接続からターゲット接続にデータを移動し、データ・フローはシステム間でデータを移動および変換する方法を定義し、ワークフローはデータ・フロー、データ・ロードおよびその他のステップが実行される順序を定義します。
これらのオブジェクトを実行すると、Oracle Data Transformsランタイム・エージェントによってジョブが編成され、コードが生成されます。
このトピックでは、Autonomous AI Databaseでデータ変換を使用するタイミングと方法を理解するためのエントリ・ポイントについて説明します。詳細は、Data Studioのドキュメントを参照してください。
データ変換を使用するタイミング
自律型AIデータベースのデータ統合作業を移動、変換、スケジュール、監視するための、ローコードのビジュアルな方法が必要な場合に、データ変換を使用します。
たとえば、次の目的で使用します。
- データ・ロードを作成して、ソース接続からターゲット接続に複数のデータ・エンティティをロードします。
- 結合、フィルタ、マッピング、制約、集計、式、ルックアップ、セット、ソート、その他のデータベース関数などのコンポーネントを使用して、システム間でデータを移動および変換するデータ・フローを作成します。
- ワークフローを作成して、複数のデータ・フロー、データ・ロード、変数およびワークフローを制御された実行シーケンスに編成します。
- データ・フローまたはワークフローをスケジュールして、指定した時間または間隔で実行します。
- ステータス・パネルまたはジョブ・ページから、データ・ロード、データ・フローおよびワークフローの実行ステータスをモニターします。
- 変数を使用して、データ・フローおよびワークフローをパラメータ化します。
- データ・フローで機械学習モデルを使用します。これには、出力をターゲット表に書き込む予測モデル・ステップが含まれます。
- プロジェクト、接続、データ・ロード、データ・フロー、ワークフロー、スケジュールなど、データ変換オブジェクトのエクスポートとインポートを環境間で行います。
SQL、PL/SQL、DBMS_CLOUD、Oracle Data Pump、外部オーケストレーション・ツールなどの他のAutonomous AI Databaseのロードまたは変換オプションは、ビジュアルData Studioワークフローではなく、完全にスクリプト化された、管理された、またはアプリケーション主導のワークフローが必要な場合に使用します。これらのデータ・ロード・オプションについて学習するには、Autonomous AI Databaseへのデータのロードを参照してください。
Autonomous AI Databaseでのデータ変換の仕組み
データ変換は、Autonomous AI DatabaseのData Studioのデータベース・アクションから使用できます。データベース・アクション・ページの「データ変換」カードまたはデータベース・アクション・セレクタのData Studioメニューから開くことができます。データ変換ツールを使用するには、ADMINユーザーまたはDATA_TRANSFORM_USERロールを持つユーザーとしてサインインします。
Data Transformsは、Data Integrator: Web Editionと呼ばれる別のOCI Marketplaceリストとしても使用できます。OCI Marketplaceからのデータ変換インスタンスがAutonomous AI Databaseに登録されている場合、Database Actionsの「データ変換」カードは、登録されているMarketplaceインスタンスを引き続きオープンします。かわりに埋込みData Transformsインスタンスを使用するには、Marketplaceインスタンスの登録を解除します。
データ変換を初めてオープンする場合は、データベース・ユーザー資格証明を指定する必要があります。サービスの開始後、「データ変換」ホーム・ページが開き、「接続」タブからAutonomous AI Database接続を表示できます。
アクセス・ステップ、必要なロール、初回サインイン動作およびマーケットプレイスの登録動作については、Data StudioからのOracle Data Transformsへのアクセスを参照してください。
開始する前に
変換を作成する前に、次のことを確認します。
- ユーザーは、
ADMINユーザーを使用していないかぎり、データベース・アクションへのアクセス権を持ち、DATA_TRANSFORM_USERロールを持ちます。 - 必要なソース・システムとターゲット・システムは、Autonomous AI Databaseで使用されるOCIネットワークからアクセス可能です。Data Transforms接続は、OCIネットワークからアクセス可能なサポートされているテクノロジに接続するために使用されます。詳細は、接続の使用を参照してください。
- Autonomous AI Databaseでプライベート・エンドポイントを使用する場合は、プライベート・データ・ソースが同じVCN内のクライアントからアクセス可能である必要があります。プライベート・データ・ソースおよび長時間実行ジョブのノートは、データ変換に関するノートを参照してください。
- 使用しているData Transforms環境(Autonomous AI Databaseの埋込みData Transforms、登録済Data TransformsインスタンスまたはMarketplace Data Integrator: Web Editionリスト)を理解します。文書化された機能には、適用場所を示すバッジが付いています。
オープン・データ変換
データ変換を開くには:
- Autonomous AI Databaseのデータベース・アクションを開きます。
- 「Data Studio」を選択します。
- 「データ変換」を選択します。
ADMINまたはDATA_TRANSFORM_USERロールを持つデータベース・ユーザーとしてサインインします。- プロンプトが表示されたら、データ変換接続を使用するために必要なデータベース・ユーザー資格証明を指定します。
- データ変換ホーム・ページを使用して、接続、プロジェクト、データ・ロード、データ・フロー、ワークフロー、ジョブ、変数、およびインポート操作またはエクスポート操作を作成または管理します。
タスク・ステップを完了するには、次の項のData Studioドキュメント・リンクを使用します。
データ変換で実行できる操作
-
接続: サポートされているデータベース、アプリケーション、サービス、オブジェクト・ストレージ、RESTおよびカスタムJDBCベースの接続を含む、ソースおよびターゲット・システムへの接続を作成および管理します。
接続の作成、サポートされている接続タイプ、カスタム・コネクタ、オブジェクト・ストレージ接続、REST接続および関連する接続タスクについては、接続の操作を参照してください。
-
プロジェクト: データ・フロー、ワークフロー、変数、データ・ロードおよびジョブを論理グループに編成します。
Data Transforms作業をプロジェクト・コンテナに編成する際のガイダンスは、プロジェクトの使用を参照してください。
-
データ・ロード: 複数のデータ・エンティティをソース接続からターゲット接続に移動し、サポートされている場合は再作成、切捨て、追加、増分追加、増分マージなどのロード・アクションを選択します。
データ・ロードの作成方法、ソース接続とターゲット接続の選択方法、ロード処理オプションの選択方法およびデータ・ロードの実行方法を学習するには、データ・ロードの作成および実行を参照してください。
-
データ・エンティティ: インポート、作成、データ・フローでの使用および検査が可能な表形式のソース構造またはターゲット構造を表します。
データ・ロードおよびデータ・フローで使用されるデータ・エンティティのインポート、作成および検査の詳細は、データ・エンティティの操作を参照してください。
-
データ・フロー: デザイン・キャンバスでソース、ターゲットおよび変換コンポーネントを接続して、ビジュアル変換ロジックを構築します。
ビジュアル・データ・フローの作成と編集、コンポーネントの追加、列のマッピング、データ・フローの検証と実行についてさらに学習するには、データ・フローについてを参照してください。
-
ワークフロー: 複数のデータ・フロー、データ・ロード、変数およびワークフローを定義された順序で調整します。
データ・フロー、データ・ロード、変数およびその他のワークフロー・ステップを順序付けするワークフローの作成および実行の詳細は、「ワークフローの概要」を参照してください。
-
スケジュール: データ・フローまたはワークフローをスケジュールして、後でまたは繰返し実行できるようにします。
時間指定実行の変換作業をスケジュールする方法を学習するには、データ・フローまたはワークフローのスケジュールを参照してください。
-
ジョブおよび監視: 実行中および完了した実行の追跡、ジョブの詳細の確認、ジョブの再実行、ジョブの削除およびエラー詳細の検査を行います。
ステータス・パネルおよびジョブ・リンクを使用した実行のモニターに関するガイダンスは、データ・ロード、データ・フローおよびワークフローのステータスのモニターを参照してください。
-
変数: 実行時にデータ・フローおよびワークフローに置換できる値を格納します。
変数を作成し、データ・フローおよびワークフローで使用する方法を学習するには、変数の作成と使用を参照してください。
-
機械学習モデル: MLモデル・データ・エンティティを作成し、データ・フローでMLモデル・ステップを使用します。
MLモデル・データ・エンティティの作成およびデータ・フローでのMLモデルの使用に関するガイダンスは、機械学習(ML)モデルの使用を参照してください。
-
エクスポートおよびインポート: オブジェクト・ストレージを介してオブジェクトをエクスポートおよびインポートすることで、データを環境間で変換します。
環境間でのデータ変換オブジェクトの移動の詳細は、オブジェクトのエクスポートおよびインポートを参照してください。