第II部 データ管理

Oracle AI Data Platform Workbenchにより、組織はOCI Object StorageとAutonomous Database、Kafkaなどの他の外部ソース間で、すべてのデータとメタデータを効果的に管理できます。データ・エステート全体で一元化されたメタデータを提供し、企業は構造化データ、半構造化データおよび非構造化データに対して統一されたアクセス制御を定義できます。

AI Data Platform Workbenchは、企業がデータ管理のユースケースをシームレスに解決できるよう支援します。様々なペルソナが組織内で連携して、ビジネス・リーダーに価値をもたらします。

  • データ・スチュワードは、データが存在する場所、データの構造化および使用方法を理解するためにデータ・アセットおよびエンティティを検出する必要があるため、データ/メタデータのライフサイクルを効果的に管理できます。
  • データ管理者は、データをカタログ、スキーマ、表およびボリュームに編成し、データの効率的で安全な格納、編成および取得を実現します。
  • データ・エンジニアとアナリストは、データの真の価値を引き出すために、他のアナリストやビジネス・リーダーとデータを共有する必要があります。

データの検出

AIデータ・プラットフォーム・ワークベンチのすべてのデータ・アセットは、次のものを使用してシームレスに検出できます。

  • マスターカタログエクスプローラ
  • ノートブック、sql/pythonファイルの操作中にワークスペース内のカタログ・エクスプローラ
  • SHOW、LIST、DESCRIBEなどのSQL文法
  • API

データの編成

データをカタログ、スキーマ、表、ボリュームに編成できます。

  • 標準カタログ:標準カタログはスキーマ(データベース)の論理コンテナで、ユーザーはスキーマ内に表、ビューおよびボリュームを作成できます。標準カタログは、すべての子オブジェクトのメタデータのライフサイクルを管理します。
  • 外部カタログ:外部カタログは、Autonomous Databaseなどの外部データ・ソースによってバックアップされます。外部カタログの場合、メタデータは外部ソースからのみ同期され、catalog_name.schema.name.table_nameのような3つの部分からなる名前を使用して、外部ソースに存在するデータを問い合せることができます。外部カタログの場合、メタデータ・ライフサイクルは外部ソースによって管理され、マスター・カタログはメタデータのコピーを保持します。外部カタログでは、外部ソースからメタデータのみが収集され、データはAIデータ・プラットフォームにコピーされません。

AI Data Platform Workbenchでメタデータ・ライフサイクルを管理するには、次を作成します。

  • 表とそのスキーマを定義し、OCIオブジェクト・ストレージ内の場所を参照することによって、または
  • 外部ボリューム。OCIオブジェクト・ストレージ内の場所を参照するボリュームを定義し、さらにボリュームにファイルおよびフォルダを格納します。

次のものを作成して、AI Data Platform Workbenchでデータおよびメタデータのライフサイクルを管理することもできます。

  • マネージド・テーブルとAI Data Platform Workbenchにより、お客様のテナンシのOCI Object Storageの場所を管理
  • マネージド・ボリュームおよびAI Data Platform Workbenchは、お客様のテナンシ内のOCI Object Storageの場所を管理し、ユーザーがファイルおよびフォルダ(半構造化データまたは非構造化データ)をボリュームに格納できるようにします

データ共有

AIデータ・プラットフォーム・ワークベンチのデータ共有により、ユーザーは組織内および組織外のユーザーとデータ・アセットを共有できます。AI Data Platform Workbenchのデータ共有は、オープン・ソースのDelta Shareプロトコルの上に構築され、データが安全な方法で共有されるように、受信者を共有および作成できるユーザーに権限を適用できます。

自動入力

自動移入機能は、選択した標準カタログ内のデータ・エンティティを自動的に検出および作成することで、メタデータ管理を簡素化します。これにより、ユーザーがOCI Object Storageのデータ・ロケーションを指すことでメタデータ・エクストラクタを作成できるようになり、大量の表を手動で作成するプロセスが自動化されます。