第II部 データ管理
Oracle AI Data Platform Workbenchにより、組織はOCI Object StorageとAutonomous Database、Kafkaなどの他の外部ソース間で、すべてのデータとメタデータを効果的に管理できます。データ・エステート全体で一元化されたメタデータを提供し、企業は構造化データ、半構造化データおよび非構造化データに対して統一されたアクセス制御を定義できます。
AI Data Platform Workbenchは、企業がデータ管理のユースケースをシームレスに解決できるよう支援します。様々なペルソナが組織内で連携して、ビジネス・リーダーに価値をもたらします。
- データ・スチュワードは、データが存在する場所、データの構造化および使用方法を理解するためにデータ・アセットおよびエンティティを検出する必要があるため、データ/メタデータのライフサイクルを効果的に管理できます。
- データ管理者は、データをカタログ、スキーマ、表およびボリュームに編成し、データの効率的で安全な格納、編成および取得を実現します。
- データ・エンジニアとアナリストは、データの真の価値を引き出すために、他のアナリストやビジネス・リーダーとデータを共有する必要があります。
データの検出
AIデータ・プラットフォーム・ワークベンチのすべてのデータ・アセットは、次のものを使用してシームレスに検出できます。
- マスターカタログエクスプローラ
- ノートブック、sql/pythonファイルの操作中にワークスペース内のカタログ・エクスプローラ
- SHOW、LIST、DESCRIBEなどのSQL文法
- API
データの編成
データをカタログ、スキーマ、表、ボリュームに編成できます。
- 標準カタログ:標準カタログはスキーマ(データベース)の論理コンテナで、ユーザーはスキーマ内に表、ビューおよびボリュームを作成できます。標準カタログは、すべての子オブジェクトのメタデータのライフサイクルを管理します。
- 外部カタログ:外部カタログは、Autonomous Databaseなどの外部データ・ソースによってバックアップされます。外部カタログの場合、メタデータは外部ソースからのみ同期され、catalog_name.schema.name.table_nameのような3つの部分からなる名前を使用して、外部ソースに存在するデータを問い合せることができます。外部カタログの場合、メタデータ・ライフサイクルは外部ソースによって管理され、マスター・カタログはメタデータのコピーを保持します。外部カタログでは、外部ソースからメタデータのみが収集され、データはAIデータ・プラットフォームにコピーされません。
AI Data Platform Workbenchでメタデータ・ライフサイクルを管理するには、次を作成します。
- 表とそのスキーマを定義し、OCIオブジェクト・ストレージ内の場所を参照することによって、または
- 外部ボリューム。OCIオブジェクト・ストレージ内の場所を参照するボリュームを定義し、さらにボリュームにファイルおよびフォルダを格納します。
次のものを作成して、AI Data Platform Workbenchでデータおよびメタデータのライフサイクルを管理することもできます。
- マネージド・テーブルとAI Data Platform Workbenchにより、お客様のテナンシのOCI Object Storageの場所を管理
- マネージド・ボリュームおよびAI Data Platform Workbenchは、お客様のテナンシ内のOCI Object Storageの場所を管理し、ユーザーがファイルおよびフォルダ(半構造化データまたは非構造化データ)をボリュームに格納できるようにします
データ共有
AIデータ・プラットフォーム・ワークベンチのデータ共有により、ユーザーは組織内および組織外のユーザーとデータ・アセットを共有できます。AI Data Platform Workbenchのデータ共有は、オープン・ソースのDelta Shareプロトコルの上に構築され、データが安全な方法で共有されるように、受信者を共有および作成できるユーザーに権限を適用できます。
自動入力
自動移入機能は、選択した標準カタログ内のデータ・エンティティを自動的に検出および作成することで、メタデータ管理を簡素化します。これにより、ユーザーがOCI Object Storageのデータ・ロケーションを指すことでメタデータ・エクストラクタを作成できるようになり、大量の表を手動で作成するプロセスが自動化されます。
トピック: