3 Oracle AI Data Platform Workbenchの機能
Oracle AI Data Platform Workbenchは、データの取込み、処理、分析を大規模に簡素化するために設計された最新のデータ・プラットフォームです。コンピュート、ストレージおよびカタログ機能をシームレスに統合し、効率的なデータ管理を実現します。
AI Data Platform Workbenchの主な機能は次のとおりです。
ワークスペース
AI Data Platform Workbenchのワークスペースは、ユーザーがデータ・レイク・リソース(ワークフロー、ノートブック、ライブラリなど)を管理および編成できる分離された環境として機能します。ワークスペースを使用すると、リソースを論理的にグループ化して効率的なコラボレーションおよびガバナンスが可能になります。
Compute
AI Data Platform Workbenchは、データ処理および分析ワークロードを実行するためのスケーラブルなCPUおよびGPUコンピュート・リソースを提供します。ユーザーは、Sparkベースの実行環境を利用して高パフォーマンス処理を行い、バッチおよび対話型のワークロードをサポートできます。
ノートブック
AI Data Platform Workbenchには、コードの記述と実行のための対話型開発環境としてノートブックが含まれています。PythonとSparkSQLをサポートしているため、ユーザーはAI Data Platform内でデータを直接変換、分析およびビジュアル化できます。
ワークフロー
ワークフロー・コンポーネントを使用すると、ユーザーはノートブック、Pythonタスク、if-elseおよびその他のジョブ・タスクで構成されるデータ・パイプラインを定義および編成できます。ユーザーは、ETL、データ変換および分析自動化のワークフローを作成、スケジュールおよびモニターできます。
マスター・カタログ
マスター・カタログは、AIデータ・プラットフォーム・ワークベンチ内のすべての構造化および非構造化データセットの中央メタデータ・リポジトリとして機能します。統一されたガバナンスとデータ検出により、ユーザーは様々なスキーマおよび記憶域の場所にわたってデータセットを検索および管理できます。
カタログ
AIデータ・プラットフォーム・ワークベンチのカタログは、スキーマ、表、ボリュームおよびモデルの論理グループであり、データセットを編成する構造化された方法を提供します。ユーザーは、効果的なデータ・セグメンテーションを実現するために、異なるプロジェクトまたはチームに対して複数のカタログを作成できます。
スキーマ
スキーマはカタログ内の構造を定義し、共通ネームスペースの下に表およびビューを編成します。スキーマは、様々なアプリケーションおよび分析ワークロードのデータを論理的に構造化するのに役立ちます。
表
AIデータ・プラットフォーム・ワークベンチの表は、問合せおよび処理が可能な構造化データセットを表します。表は、Delta Uniformなどの様々な記憶域形式をサポートし、複数の問合せエンジンとの互換性を確保します。
表示
ビューは、AI Data Platform Workbenchの仮想表で、基礎となる表に格納されているデータの問合せ可能な表現を提供します。ビューを使用すると、データの複製を必要とせずに、変換されたデータセットに簡単にアクセスできます。
ボリューム
ボリュームは、AI Data Platform Workbenchのストレージ抽象化であり、生データ、処理データおよびキュレートされたデータを永続化するための管理領域を提供します。効率的なデータ・アクセスおよびObject Storageとの統合がサポートされます。
自動入力
自動移入機能は、OCIオブジェクト・ストレージにある新しいデータセットを自動的に検出して登録することで、メタデータ管理を簡素化します。これにより、データ・カタログを最新の状態に保つための手作業が削減されます。
役割ベースのアクセス制御 (RBAC)
AI Data Platformは、RBACを実装して、さまざまなリソースにまたがるファイングレイン・アクセス制御を実施します。ユーザーは、ワークスペース、カタログおよびデータセットのロールおよび権限を定義して、セキュアなコラボレーションを実現できます。
監査ログ
Oracle AI Data Platform Workbenchの監査ログは、ユーザー・アクティビティの詳細なレコードを取得します。これらのログは、使用状況の監視、コンプライアンスの確保、不正アクセスや構成変更などの問題の調査に役立ちます。
3部構成のネームスペース
AI Data Platform Workbenchは、データセットにアクセスするための3つの部分からなるネームスペース(Catalog.Schema.Table)を採用し、プラットフォーム全体でデータを参照するための構造化された一貫した方法を実現します。この標準化により、相互運用性とアクセスの容易性が向上します。