1 Oracle AI Data Platform and Workbenchの概要

この章では、新規ユーザーがOracle AI Data Platform Workbenchを開始するための情報および手順について説明します。

Oracle AI Data Platform Workbenchの用途

Oracle AI Data Platform Workbenchは、データとAIワークフローを構築、オーケストレーション、運用するための統合環境を提供します。

Oracle AI Data Platform Workbenchは、次のことを必要とする企業向けに設計されています。
  • データ検出とガバナンスの合理化: AI Data Platform Workbenchは、構造化データおよび非構造化データの検索可能性とガバナンスを強化する一元化されたメタデータ・リポジトリ(マスター・カタログ)を提供します。
  • セキュアなデータ・コラボレーションの実現: AI Data Platform Workbenchでは、RBACベースのアクセス制御により、様々なチームが共有データセットで作業しながら、厳格なセキュリティ・ポリシーを維持できます。
  • データの準備と処理の高速化:ノートブックとワークフローのオーケストレーションが組み込まれているため、ユーザーはデータを効率的にクレンジング、変換、エンリッチできます。
  • 高度な分析とAI/MLのサポート: AI Data Platform WorkbenchはApache Sparkと統合されているため、データ・サイエンティストやアナリストは複雑な計算を実行し、データレイク内でトレーニングをモデル化できます。
  • データ・ソース間のシームレスな統合の保証: AI Data Platform Workbenchでは、Autonomous Database (ADB)、Object Storage (OS)およびサードパーティのデータ・ソースの外部カタログがサポートされるため、ユーザーは重複することなくデータを問い合せて分析できます。

オープン・ソースとの統合の管理

Oracle AI Data Platform Workbenchは、オープンソースのテクノロジを活用および拡張して、強力で管理されたエクスペリエンスを提供します。

主要な統合には、次のものがあります。
  • Apache Spark: AI Data Platform Workbenchのコンピュート・レイヤーはSparkを搭載し、スケーラブルで分散されたデータ処理を可能にします。
  • Delta Lakeのサポート: AI Data Platform Workbenchは、Delta Lakeを活用して、データの信頼性、ACIDトランザクション、およびスキーマの進化を強化します。
  • Delta UniformによるIcebergとHudiの互換性:Delta Uniformにより、AI Data Platform WorkbenchはApache IcebergとApache Hudiのサポートを拡張し、さまざまなストレージ形式での相互運用性を実現します。これにより、ユーザーは、効率的な問合せ実行およびデータ・ガバナンスを維持しながら、統一された表形式戦略を採用できます。
  • BIツール用のJDBC統合: AI Data Platform WorkbenchはJDBCドライバを提供し、Oracle Analytics Cloud (OAC)やサードパーティのビジュアライゼーション・プラットフォームなどの外部BIツールとのシームレスな接続を可能にします。

Oracle AI Data Platformユーザーのペルソナ

Oracle AI Data Platformは、組織内の様々なロールにまたがる様々なユーザーにサービスを提供し、それぞれに固有のニーズと要件があります。

次に、AIデータ・プラットフォームと対話する主要なペルソナの概要を示します:
  • データ・エンジニア - データ・エンジニアは大規模なデータ・パイプラインを操作し、RAWデータを分析に使用できる形式に変換します。データ・ワークフローを設計および管理し、様々なソースからデータを取り込み、データ品質を確保するために、AI Data Platformの堅牢な機能に依存しています。プロセスの自動化、コンピューティング・リソースの最適化、さまざまなデータ・システムのシームレスな統合に重点を置いています。
  • データ・アナリスト - データ・アナリストは、AI Data Platformを使用して、データからインサイトを検出、分析、生成します。これには、大規模なデータセットを問い合せて分析するための直感的なインタフェースとツールが必要です。AI Data Platformは、インタラクティブなノートブックとビジネス・インテリジェンス(BI)ツールとのシームレスな統合により、生データを意思決定者の実用的なインサイトに変換するのに役立ちます。
  • データ・サイエンティスト - データ・サイエンティストは、機械学習および高度な分析タスクにAIデータ・プラットフォームのスケーラブルなコンピュート機能を利用します。多様なデータセット、強力な処理ツール、複雑なモデルを実行する機能へのアクセスが必要です。AI Data PlatformのSpark搭載ノートブック、AI/ML統合、およびオープンソースライブラリのサポートにより、データサイエンティストはプラットフォーム内でモデルを構築、テスト、および導入できます。
  • データ・スチュワード - これらのユーザーは、すべてのデータが業界の規制および組織のポリシーに準拠して処理されるようにします。データ・プライバシを維持し、アクセスを監査し、組織全体のデータ使用状況を監視することに重点を置いています。AI Data Platformは、メタデータの管理、ロールベースのアクセス制御(RBAC)の徹底、カタログ化、系統追跡、セキュリティ・ポリシーによる適切なガバナンスの確保を支援します。

Oracle AI Data Platformの一般的なユース・ケース

Oracle AI Data Platformは、業界やビジネス機能のさまざまなユースケースに対応します。

Medallionアーキテクチャ

  • ブロンズ層、シルバー層、ゴールド層を備えたMedallionアーキテクチャを実装します。
  • Delt@ UniformとIcebergを使用して、効率的なデータ保存とクエリの最適化を実現します。
  • 外部データ・ソースへのゼロコピー・アクセスを有効にして、シームレスな分析を実現します。

ETLおよびデータ・エンジニアリング

  • Sparkベースのワークフローおよびノートブックを使用して、RAWデータを処理、変換およびエンリッチします。
  • ローコード/ノーコードのワークフロー・オーケストレーションにより、データ・パイプラインを自動化します。
  • 大規模なバッチ処理とリアルタイムのデータ取込みを処理します。

機械学習、AIおよびデータ・サイエンス

  • Sparkを搭載したノートブックを使用して、機械学習モデルをトレーニングおよびデプロイします。
  • 大規模な機能エンジニアリングとデータ変換を可能にします。
  • PythonおよびPySparkワークロードの管理対象実行環境を提供します。
エンタープライズ・データを活用したAIエージェントの構築
  • データの取得と開発を支援する会話型AIエージェントを作成します。

エンタープライズ・データ・カタログおよびガバナンス、デルタ共有

  • 構造化データおよび非構造化データの一元化されたメタデータ管理。
  • セキュアなデータ・アクセスおよびコラボレーションのためのロール・ベースのアクセス制御(RBAC)。
  • Autonomous Database (ADB)やObject Storageなどの外部カタログとの統合。
  • Oracle AI Data Platformは、Delta Sharingをサポートし、組織の境界を越えて安全でリアルタイムで管理されたデータ共有を実現します。

分析、ビジネス・インテリジェンスおよびレポート

  • Tableau、Power BIなどのJDBCを介してOCI Oracle Analytics Cloud (OAC)およびサードパーティBIツールを接続します。

マルチクラウドとハイブリッド・データ統合

  • 複数のOCIサービス間でフェデレーテッド・クエリ実行を有効にします。
  • サードパーティのクラウド・ストレージおよびデータベースと統合して、ハイブリッド分析を実現します。
  • 複数の環境にわたってデータの主権とコンプライアンスを維持します。