1 Oracle AI Data Platform and Workbenchの概要
この章では、新規ユーザーがOracle AI Data Platform Workbenchを開始するための情報および手順について説明します。
Oracle AI Data Platform Workbenchの用途
Oracle AI Data Platform Workbenchは、データとAIワークフローを構築、オーケストレーション、運用するための統合環境を提供します。
Oracle AI Data Platform Workbenchは、次のことを必要とする企業向けに設計されています。
- データ検出とガバナンスの合理化: AI Data Platform Workbenchは、構造化データおよび非構造化データの検索可能性とガバナンスを強化する一元化されたメタデータ・リポジトリ(マスター・カタログ)を提供します。
- セキュアなデータ・コラボレーションの実現: AI Data Platform Workbenchでは、RBACベースのアクセス制御により、様々なチームが共有データセットで作業しながら、厳格なセキュリティ・ポリシーを維持できます。
- データの準備と処理の高速化:ノートブックとワークフローのオーケストレーションが組み込まれているため、ユーザーはデータを効率的にクレンジング、変換、エンリッチできます。
- 高度な分析とAI/MLのサポート: AI Data Platform WorkbenchはApache Sparkと統合されているため、データ・サイエンティストやアナリストは複雑な計算を実行し、データレイク内でトレーニングをモデル化できます。
- データ・ソース間のシームレスな統合の保証: AI Data Platform Workbenchでは、Autonomous Database (ADB)、Object Storage (OS)およびサードパーティのデータ・ソースの外部カタログがサポートされるため、ユーザーは重複することなくデータを問い合せて分析できます。
オープン・ソースとの統合の管理
Oracle AI Data Platform Workbenchは、オープンソースのテクノロジを活用および拡張して、強力で管理されたエクスペリエンスを提供します。
主要な統合には、次のものがあります。
- Apache Spark: AI Data Platform Workbenchのコンピュート・レイヤーはSparkを搭載し、スケーラブルで分散されたデータ処理を可能にします。
- Delta Lakeのサポート: AI Data Platform Workbenchは、Delta Lakeを活用して、データの信頼性、ACIDトランザクション、およびスキーマの進化を強化します。
- Delta UniformによるIcebergとHudiの互換性:Delta Uniformにより、AI Data Platform WorkbenchはApache IcebergとApache Hudiのサポートを拡張し、さまざまなストレージ形式での相互運用性を実現します。これにより、ユーザーは、効率的な問合せ実行およびデータ・ガバナンスを維持しながら、統一された表形式戦略を採用できます。
- BIツール用のJDBC統合: AI Data Platform WorkbenchはJDBCドライバを提供し、Oracle Analytics Cloud (OAC)やサードパーティのビジュアライゼーション・プラットフォームなどの外部BIツールとのシームレスな接続を可能にします。
Oracle AI Data Platformユーザーのペルソナ
Oracle AI Data Platformは、組織内の様々なロールにまたがる様々なユーザーにサービスを提供し、それぞれに固有のニーズと要件があります。
次に、AIデータ・プラットフォームと対話する主要なペルソナの概要を示します:
- データ・エンジニア - データ・エンジニアは大規模なデータ・パイプラインを操作し、RAWデータを分析に使用できる形式に変換します。データ・ワークフローを設計および管理し、様々なソースからデータを取り込み、データ品質を確保するために、AI Data Platformの堅牢な機能に依存しています。プロセスの自動化、コンピューティング・リソースの最適化、さまざまなデータ・システムのシームレスな統合に重点を置いています。
- データ・アナリスト - データ・アナリストは、AI Data Platformを使用して、データからインサイトを検出、分析、生成します。これには、大規模なデータセットを問い合せて分析するための直感的なインタフェースとツールが必要です。AI Data Platformは、インタラクティブなノートブックとビジネス・インテリジェンス(BI)ツールとのシームレスな統合により、生データを意思決定者の実用的なインサイトに変換するのに役立ちます。
- データ・サイエンティスト - データ・サイエンティストは、機械学習および高度な分析タスクにAIデータ・プラットフォームのスケーラブルなコンピュート機能を利用します。多様なデータセット、強力な処理ツール、複雑なモデルを実行する機能へのアクセスが必要です。AI Data PlatformのSpark搭載ノートブック、AI/ML統合、およびオープンソースライブラリのサポートにより、データサイエンティストはプラットフォーム内でモデルを構築、テスト、および導入できます。
- データ・スチュワード - これらのユーザーは、すべてのデータが業界の規制および組織のポリシーに準拠して処理されるようにします。データ・プライバシを維持し、アクセスを監査し、組織全体のデータ使用状況を監視することに重点を置いています。AI Data Platformは、メタデータの管理、ロールベースのアクセス制御(RBAC)の徹底、カタログ化、系統追跡、セキュリティ・ポリシーによる適切なガバナンスの確保を支援します。
Oracle AI Data Platformの一般的なユース・ケース
Oracle AI Data Platformは、業界やビジネス機能のさまざまなユースケースに対応します。
Medallionアーキテクチャ
- ブロンズ層、シルバー層、ゴールド層を備えたMedallionアーキテクチャを実装します。
- Delt@ UniformとIcebergを使用して、効率的なデータ保存とクエリの最適化を実現します。
- 外部データ・ソースへのゼロコピー・アクセスを有効にして、シームレスな分析を実現します。
ETLおよびデータ・エンジニアリング
- Sparkベースのワークフローおよびノートブックを使用して、RAWデータを処理、変換およびエンリッチします。
- ローコード/ノーコードのワークフロー・オーケストレーションにより、データ・パイプラインを自動化します。
- 大規模なバッチ処理とリアルタイムのデータ取込みを処理します。
機械学習、AIおよびデータ・サイエンス
- Sparkを搭載したノートブックを使用して、機械学習モデルをトレーニングおよびデプロイします。
- 大規模な機能エンジニアリングとデータ変換を可能にします。
- PythonおよびPySparkワークロードの管理対象実行環境を提供します。
エンタープライズ・データを活用したAIエージェントの構築
- データの取得と開発を支援する会話型AIエージェントを作成します。
エンタープライズ・データ・カタログおよびガバナンス、デルタ共有
- 構造化データおよび非構造化データの一元化されたメタデータ管理。
- セキュアなデータ・アクセスおよびコラボレーションのためのロール・ベースのアクセス制御(RBAC)。
- Autonomous Database (ADB)やObject Storageなどの外部カタログとの統合。
- Oracle AI Data Platformは、Delta Sharingをサポートし、組織の境界を越えて安全でリアルタイムで管理されたデータ共有を実現します。
分析、ビジネス・インテリジェンスおよびレポート
- Tableau、Power BIなどのJDBCを介してOCI Oracle Analytics Cloud (OAC)およびサードパーティBIツールを接続します。
マルチクラウドとハイブリッド・データ統合
- 複数のOCIサービス間でフェデレーテッド・クエリ実行を有効にします。
- サードパーティのクラウド・ストレージおよびデータベースと統合して、ハイブリッド分析を実現します。
- 複数の環境にわたってデータの主権とコンプライアンスを維持します。