Oracle Autonomous Databaseでデータへの接続を識別し、グラフ分析を実行
グラフ・データベースとグラフ分析は、Oracleの統合データベース製品に不可欠です。Oracle Databaseに組み込まれたグラフ機能を使用すると、個別の単一目的のデータベースやデータのレプリケートが不要になります。アナリストや開発者は、包括的な分析を実行して、顧客の傾向や不正検知などのインサイトを得たり、スマート製造のトレーサビリティを向上させるデータ内の接続を見つけることができます。これらの分析は、エンタープライズ・グレードのセキュリティ、データの取込みのしやすさ、および様々な種類のデータ・ワークロードのサポートを得ながら実行できます。
Oracle Autonomous Database (ADB)は、Graph Studioと呼ばれる統合されたワンクリック・プロビジョニング・セルフサービス・ツールを提供し、データ・ライフサイクル全体でグラフのモデリング、管理、分析および可視化を自動化および簡素化します。Graph Studioでは、60を超える事前構築済のグラフ・アルゴリズムや、Property Graph Query Language (PGQL)というSQLのような宣言言語を含む、グラフ分析の包括的なセットにアクセスできます。Graph Studioはノートブックをサポートしています。これにより、データの愛好家や開発者は、インメモリー・グラフ分析エンジン(PGX)を使用して最高のパフォーマンスを得る一方で、段階的な分析を実行できます。
グラフは、ほとんどのデータが接続されるため、データをモデル化し、データ・エンティティ間の接続に焦点を当てる非常に直感的な方法です。グラフを使用すると、接続されたデータ・エンティティ間の移動、リンクの検索および新しい結論の描画が簡単になります。グラフの主なコンポーネントは、2つの頂点を接続する頂点(またはノード)とエッジです。グラフの一般的な例は、ソーシャル・ネットワーク、資金フロー、部品構成表、データ系統です。
次のイメージは、グラフ分析が財務トランザクションの不正を識別するのにどのように適しているかを示しています。
図graph- analysis- example.pngの説明
不正検出を簡略化するために、エンティティ間のトランザクションおよびEメール・アドレス、パスワード、アドレスなど情報を共有するエンティティからのグラフを作成できます。グラフが作成されると、単純な問合せを実行すると、類似した情報を持つアカウントを持つすべての顧客が検出され、どのアカウントが相互に資金を送っているかがわかります。
グラフの詳細および一般的な例については、eBook「グラフ・データベースおよびグラフ分析の17のユースケース」を参照してください。このリファレンス・アーキテクチャの最後にある「Explore More」セクションにあります。
- グラフ・アルゴリズムの実行
グラフアルゴリズムは、頂点間のパスと距離、頂点の重要度、または頂点のクラスタリングを分析します。これらは、次の場合に役立ちます。
- コミュニティの検出(Louvain、Labelropagationなど)
- 接続されたコンポーネントの検出(強力に接続されたコンポーネント、弱く接続されたコンポーネントなど)
- 構造の評価(循環検出、三角棚卸、到達性など)
- リンクの予測(フォロー・トゥ・フォロウなど)、グラフ内のノードのランキングとウォーキング(例: PageRank、学位中心性、近接性中心性、SALSA)
- パスの検索(Bellman- Ford、Dijkstra、Fattest Path、Hop Distanceなど)
- 問合せに一致するグラフ・パターンの実行
問合せに一致するグラフ・パターンでは、指定した制約セットに一致する頂点およびエッジ間のサイクルまたは間接依存関係などのパターンを検出できます。
アーキテクチャ
このアーキテクチャでは、複数のエンタープライズ・リポジトリおよび部門データ・ソースからデータをロードしてキュレーションした、一元化されたデータ・ウェアハウスとしてOracle Autonomous Data Warehouseを使用します。
次に、Graph Studioを使用してデータをグラフとしてモデル化します。Graph Studioの統合ノートブック・インタフェースとJava、PGQLおよびPythonのインタプリタにより、グラフ・アルゴリズムをすばやく実行し、グラフを問い合せて結果を可視化できます。このリファレンス・アーキテクチャは、グラフの使用を開始し、追加のツールやソフトウェア・コンポーネントを必要とせずにグラフ分析のためのラボ環境を作成するのに役立ちます。プロパティを含む数百万の頂点およびエッジを含むグラフを操作できます。
次の図は、参照アーキテクチャの機能表現です。
propertygraph- analysis- arch- oracle.zip
- データ精製
アーキテクチャ内の各データ・レイヤーで使用するデータを収集および調整します。シェイプは、各レベルでデータを格納および絞り込み、それらの間でデータを移動するための処理コストの違いを示すことを目的としています。
- データ永続性プラットフォーム(キュレーション情報レイヤー)
現在のビジネス・ビューを表示するデータのアクセスおよびナビゲーションが容易になります。このレイヤーでは、リレーショナル・データからグラフ・ビューまたは永続グラフ構造を作成できます。
- アクセスと解釈
コンシューマのデータの論理ビジネス・ビューを抽象化します。この抽象化により、データ分析へのアジャイルなアプローチが容易になり、キュレートされたデータに対して単一の分析レイヤーが提供されます。
アーキテクチャには次のコンポーネントがあります。
- データ統合
Oracle Autonomous Databaseには、多くの部門シナリオおよび特定の高度なユースケースのデータを取得、ロードおよび変換するために必要な埋込みツールがあります。Autonomous Data Warehouseには、ローカル・ストレージまたはオブジェクト・ストレージからデータをすばやくロードする機能が含まれています。また、Autonomous Data Transformsも含まれており、様々なソース・タイプのデータに接続してEL- Tタイプ機能にアクセスできます。
Oracle Cloud Infrastructure Data Integration Cloudサービスは、より高度なユースケースを対象としています。完全管理型のサーバーレス・ネイティブ・クラウド・サービスです。このサービスでは、様々なソースからデータを抽出、ロードおよび変換(ETL)するためのタスクを設計および実行できます。
- オブジェクト・ストレージ
Oracle Cloud Infrastructure Object Storageは、信頼性とコスト効率の高いデータ耐久性を実現するインターネット規模の高パフォーマンス・ストレージ・プラットフォームです。Oracle Cloud Infrastructure Object Storageでは、分析データなど、あらゆるコンテンツ・タイプの非構造化データを無制限に格納できます。たとえば、部門データを安全に取得し、Object Storageバケットに保持できます。その後、Autonomous Databaseのデータ・ロード・ツールを使用して、バケットからAutonomous Databaseにデータをロードできます。
- Autonomous Database (ADW、ATP)
Oracle Autonomous Databaseは、データ・ウェアハウス・ワークロード向けに最適化された、自動運転、自己保護、自己修復データベース・サービスです。ハードウェアの構成や管理、ソフトウェアのインストールを行う必要はありません。Oracle Cloud Infrastructureは、データベースの作成およびデータベースのバックアップ、パッチ適用、アップグレードおよびチューニングを処理します。Autonomous Data Warehouseでは、構造化、JSON、XML、Graph、Spatialなどの複数のフォーマットにデータをロードする柔軟性があります。このサービスとバンドルされているのは、データを表にロードし、Light ETLを効率的に処理できるようにする自律型ツールです。
- Graph Studio
Graph Studioは、共有インフラストラクチャ上のOracle Autonomous Databaseの機能です。Autonomous Transactional Processing(ATP)とAutonomous Data Warehouse(ADW)に組み込まれています。これは、グラフを使用する開発者、アナリスト、データ・エンジニアおよびデータ・サイエンティスト向けのツールを提供します。Graph Studioには、データ・ウェアハウス内の既存のリレーショナル表のグラフ・モデリング、グラフ分析の実行、グラフ・アプリケーションの開発、結果のビジュアル化および共有を自動化するローコード・ユーザー・インタフェースが含まれています。Autonomous DatabaseとGraph Studioの組合せにより、ワンクリック・プロビジョニング、統合ツールおよびセキュリティにより、完全なグラフ・データベース・プラットフォームを数分でデプロイできます。作業を開始して生産性を高めるために、データベースのエキスパートやグラフの専門家である必要はありません。
次の図は、セキュリティに関するベスト・プラクティスを使用した、Oracle Cloud Infrastructureで提供されているサービスへの前述のアーキテクチャのマッピングを示しています。
図oci- adb- graph- studio- arch.pngの説明
oci- adb- graph- studio- arch- oracle.zip
この参照アーキテクチャには、次の主なコンポーネントがあります。
- 仮想クラウド・ネットワーク(VCN)とサブネット
VCNは、Oracle Cloud Infrastructureリージョンで設定する、カスタマイズ可能なソフトウェア定義のネットワークです。従来のデータ・センター・ネットワークと同様に、CNはネットワーク環境を完全に制御できます。VCNには、VCNの作成後に変更できる複数の重複しないCIDRブロックを含めることができます。VCNをサブネットにセグメント化して、そのスコープをリージョンまたは可用性ドメインに指定できます。各サブネットは、VCN内の他のサブネットと重複しない連続した範囲のアドレスで構成されます。サブネットのサイズは、作成後に変更できます。サブネットはパブリックにもプライベートにもできます。
- 可用性ドメイン
可用性ドメインは、リージョン内の独立したスタンドアロン・データ・センターです。各アベイラビリティ・ドメインの物理リソースは、フォルト・トレランスを提供する他のアベイラビリティ・ドメインのリソースから分離されます。アベイラビリティ・ドメインは、電源や冷却、内部の可用性ドメイン・ネットワークなどのインフラを共有しません。そのため、1つの可用性ドメインでの障害が、リージョン内の他の可用性ドメインに影響しない可能性があります。
- Bastionホスト
要塞ホストは、クラウド外部からトポロジに対して制御されたセキュアなエントリ・ポイントとして機能するコンピュート・インスタンスです。要塞ホストは通常、非武装ゾーン(DMZ)でプロビジョニングされます。クラウドの外部から直接アクセスできないプライベート・ネットワークに機密リソースを配置することで、機密リソースを保護できます。トポロジには、定期的に監視および監査できる既知の単一のエントリ・ポイントがあります。そのため、トポロジへのアクセスを損なうことなく、より機密性の高いコンポーネントを公開しないようにできます。
- ネットワーク・アドレス変換(NAT)ゲートウェイ
NATゲートウェイを使用すると、VCN内のプライベート・リソースは、着信インターネット接続にそれらのリソースを公開することなく、インターネット上のホストにアクセスできます。
- インターネット・ゲートウェイ
インターネット・ゲートウェイを使用すると、VCN内のパブリック・サブネットとパブリック・インターネット間のトラフィックが許可されます。
- サービス・ゲートウェイ
The service gateway provides access from a VCN to other services, such as Oracle Cloud Infrastructure Object Storage. The traffic from the VCN to the Oracle service travels over the Oracle network fabric and never traverses the internet.
- 自動スケーリングによるAutonomous Database
このアーキテクチャでは、Oracle Autonomousは、自動スケーリングおよびプライベート・エンドポイントで構成されたAutonomous Data Warehouse (ADW)またはAutonomous Transactional Processing (ATP)のいずれかです。アプリケーション固有のデータの格納と、グラフのモデリング、作成、メンテナンス、問合せおよび可視化に使用されます。アクセス制御リスト(ACL)は、Autonomous Databaseへのネットワーク・アクセスを制限します。グラフの開発および保守およびAutonomous Databaseの埋込みツールとしてのGraph Studioの使用に必要な権限が付与された、事前作成されたアプリケーション・ユーザーがあります。サンプル・データはデータベース・ユーザー・スキーマに事前にロードされ、Graph Studioで簡単に開始できます。
推奨事項
- データ・ウェアハウス
Autonomous Database Toolsは、Oracle Autonomous Data Warehouseに埋め込まれている機能であり、ロード、変換、カタログ、インサイトの取得、およびシンプルで簡単な方法でビジネス・モデルの開発を行う機能を提供します。
- Graph StudioGraph Studioに接続する前に、次のことを推奨します。
- 必要な権限を持つデータベース・ユーザーの作成。
- 「グラフ・サイズ見積り」を使用して、グラフのサイズを見積もります。Graph Studioメモリーにロードされるグラフの最大インメモリー表現は109GBです。
ノート:
グラフが109GBを超える消費を推定される場合は、Oracle Graph ServerおよびClientツールをOracle MarketPlaceからコンピュートVMに、必要なメモリーとともにデプロイすることを検討してください。VM。Standard.E3.FlexおよびVM。Standard.E4.Flexシェイプは最大1024GBのメモリーを持つことができます。
注意事項
複数のデータベースおよびファイル・ソースから、グラフ分析に使用可能な一元化されたデータ・ウェアハウスにデータをロードおよび構成する場合は、次の実装オプションを考慮してください。
ガイダンス | データ・ウェアハウス | データ永続性プラットフォーム | アクセスと解釈 |
---|---|---|---|
推奨 | Oracle Autonomous Databaseツール | Oracle Autonomous Database (ADWまたはATP) | Oracle Graph Studio |
その他のオプション |
|
|
|
- データ重力:
グラフ分析操作をデータの近くに保持し、データ移動の高コストを制限します。
デプロイ
このリファレンス・アーキテクチャのTerraformコードは、Oracle Cloud Infrastructure Resource Managerのサンプル・スタックとして使用できます。GitHubからコードをダウンロードし、特定の要件にあわせてカスタマイズすることもできます。
- Oracle Cloud Infrastructure Resource Managerのサンプル・スタックを使用してデプロイします:
をクリックします
まだサインインしていない場合は、テナンシおよびユーザー資格証明を入力します。
- スタックをデプロイするリージョンを選択します。
- 画面上のプロンプトと手順に従ってスタックを作成します。
- スタックの作成後、「Terraformアクション」をクリックし、「プラン」を選択します。
- ジョブが完了するまで待機し、プランをレビューします。
変更するには、「スタックの詳細」ページに戻り、「スタックの編集」をクリックして必要な変更を行います。次に、「プラン」アクションを再度実行します。
- これ以上の変更が必要ない場合は、「スタックの詳細」ページに戻り、「Terraformアクション」をクリックして「適用」を選択します。
- GitHubでTerraformコードを使用してデプロイします。
- GitHubにアクセスします。
- リポジトリをローカル・コンピュータにクローニングまたはダウンロードします。
README
ドキュメントの指示に従います。
詳細の参照
このアーキテクチャの機能についてさらに学習するには、次のリソースを確認してください。
- 製品ページ: Oracle Graph Database and Graph Analytics
- e- Book: グラフ・データベースとグラフ分析の17のユース・ケース
- 技術機能の概要: Oracle Graph Technologies
- ドキュメント: Oracle Property Graph
- LiveLabsワークショップ: Oracle Autonomous DatabaseでGraph Analyticsの使用を開始
- YouTubeチャネル: Oracle SpatialおよびOracle Graph
- 「Project」ページ: 「Property Graph Query Language (PGQL)」
- Oracle Labsプロジェクト・ページ: パラレル・グラフAnalytiX (PGX)