4 Select AIの概念

Select AIに関連する概念および用語について説明します。

アクション

Select AIのアクションは、プロンプトを処理するときに異なる動作を実行するようにSelect AIに指示するキーワードです。アクションを指定することで、ユーザーはSelect AIに、自然言語プロンプトの処理によるSQLコードの生成、チャット・プロンプトへの応答、出力の解説、SQL文の表示、またはSQLコードの説明を行うように指示し、LLMを活用してデータベース環境内のデータと効率的に対話できます。

サポートされているSelect AIアクションについては、「AIキーワードを使用したプロンプトの入力」を参照してください。

AIエージェント

「Select AI Agentの概念」を参照してください。

AIモデル

テキスト生成、翻訳、画像認識などのタスクに使用される、大規模言語モデル(LLM)やトランスフォーマ(埋込みモデルとも呼ばれる)など、様々なタイプの人工知能モデルを包含する一般的な用語です。AIモデルは、データに基づいてトレーニングされたプログラムであり、パターンを検出し、新しい入力に基づいて予測または意思決定を行います。Oracleのコンテキストでは、AIモデルは特にOracleのサービスを介して利用できる様々な機械学習および大規模言語モデル(LLM)を指します。詳細は、生成AIの概念を参照してください。

AIプロファイル

AIプロファイルは、使用するAIプロバイダと、自然言語プロンプトに対する応答の生成に必要なメタデータおよびデータベース・オブジェクトに関するその他の詳細を含む仕様です。CREATE_PROFILEプロシージャおよびプロファイル属性を参照してください。

AIプロバイダ

Select AIでのAIプロバイダは、自然言語プロンプトに対する応答を処理および生成するためのLLMまたはトランスフォーマ(あるいはその両方)を提供するサービス・プロバイダを指します。これらのプロバイダは、LLMの概念が重要となるユースケースのために自然言語を解釈および変換できるモデルを提供します。サポートされているプロバイダについては、「AIプロバイダとLLMの選択」を参照してください。

チャットボット

自然言語でユーザーと対話するように設計されたAI搭載の会話エージェントは、多くの場合、カスタマ・サービスや情報検索に使用されます。Select AIのコンテキストでは、アスク・オラクル・チャットボットは、ユーザーが自然言語で質問をしたり、データベースやプライベート・コンテンツに裏付けされたAI生成の応答を受け取るのに役立ちます。このUIを使用して、ユーザーは次のことを実行できます:
  • 自然言語で質問をして、SQLを自動的に生成します(NL2SQL)。
  • Select AIを使用して、データベースの表およびビューに対して問合せを実行します。
  • 検索拡張生成(RAG)を使用して、Autonomous AI Databaseに格納されたプライベート・ドキュメント・コンテンツを含めます。
  • Select AI Agentを使用して定義したエージェント・チームを操作します。

詳細は、アスク・オラクルを参照してください。

クラウド・リンク

クラウド・リンクは、Oracle Cloud Infrastructureと外部クラウド・プロバイダまたはオンプレミス・ネットワークとの間にセキュアなプライベート接続を確立し、シームレスなデータ交換を容易にします。Select AIでは、クラウド・リンクにより、Autonomous AI Databaseは、外部公開なしで外部データをNL2SQLの会話に組み込むことができ、ユーザーは、暗号化やアクセス制御などのOracleのセキュリティ標準に準拠しながら、対話形式でハイブリッド環境に問合せを実行できるようになり、準拠したAI主導の分析を行うことができます。詳細は、Autonomous AI Databaseに対する読取り専用データ・アクセスでのクラウド・リンクの使用を参照してください。

会話

Select AIでの会話は、ユーザーとシステム間の対話型のやり取りを表し、ユーザーは一連の自然言語プロンプトを介してデータベースを問い合せたり、対話したりできます。Select AIは、セッションベースの短期的な会話を組み込んで、以前の会話に基づいて現在のプロンプトに対するコンテキストを認識した応答を生成します。短期的な会話では、現在のリクエストに以前のプロンプトが最大10個取り込まれ、LLMに送信される拡張されたプロンプトが作成されます。Select AIでは、カスタマイズ可能な長い会話の使用がサポートされており、コンテキストを混在させることなく、様々なトピックでSelect AIを使用でき、DBMS_CLOUD_AIパッケージの会話APIを介して構成できます。「Select AIの会話」を参照してください。

データベース資格証明

データベース資格証明は、データベースへのアクセスおよび操作に使用される認証資格証明です。通常、ユーザー名およびパスワードで構成され、セキュリティ・トークンなどの追加の認証ファクタによって補足されることもあります。これらの資格証明は、認可された個人またはシステムのみがデータベース内に格納されているデータにアクセスして操作できるように、アプリケーションまたはユーザーとデータベース間のセキュアな接続を確立するために使用されます。

データベース・リンク

データベース・リンクは、Oracleデータベースをリモート・データベースに接続し、外部データにローカルであるかのように透過的にアクセスできるようにします。Select AIでは、データベース・リンクがAutonomous AI DatabaseまたはオンプレミスのOracle AI Databaseと統合されて、NL2SQL機能がフェデレーテッド・ソースに拡張され、オンプレミスまたは他のクラウド環境にまたがる自然言語問合せが安全にサポートされます。詳細は、CREATE DATABASE LINKおよびAutonomous AI DATABASEでのデータベース・リンクの使用を参照してください。

埋込みモデル

入力データをベクトル埋込みに変換してセマンティックな関係をキャプチャするAIモデルで、言語理解や画像認識などのタスクでよく使用されます。Select AIは、埋込みモデルを使用して、ドキュメント、表および問合せテキストの埋込みを計算します。これらの埋込みは、Autonomous AI Database内でセマンティック検索、RAGワークフロー、類似性スコアリング、および関連性ランキングを強化します。

LLMでのハルシネーション

大規模言語モデルの文脈におけるハルシネーションとは、入力プロンプトには不正確、無意味、または無関係なテキストをモデルが生成する現象を指します。モデルで首尾一貫したテキストを生成しようとした結果ではありますが、これらの応答には、捏造された情報、誤解を招く情報、または単に想像でしかない情報が含まれている場合があります。ハルシネーションは、トレーニング・データのバイアス、適切なコンテキストの理解の欠如、またはモデルのトレーニング・プロセスの制限が原因で発生する可能性があります。

IAM

Oracle Cloud Infrastructure Identity and Access Management (IAM)を使用すると、クラウド・リソースにアクセスできるユーザーを制御できます。ユーザーのグループが保持するアクセス権のタイプとアクセスの対象となる特定のリソースを制御できます。詳細は、Identity and Access Managementの概要を参照してください。

反復絞込み

反復絞込みは、フィードバックまたは評価に基づいて調整を繰り返すサイクルによって、ソリューションまたはモデルを徐々に改善するプロセスです。初期近似から開始し、ステップごとに絞り込み、目的の精度または結果が得られるまで続行します。各反復は前の反復に基づいて構築され、修正または最適化が組み込まれて目標に近づきます。

テキスト・サマリーの生成では、大規模なファイルまたはドキュメントを処理する場合に反復絞込みが役立ちます。このプロセスでは、テキストを管理可能なサイズのチャンクに分割して(たとえば、LLMのトークン制限内に収まるように)、1つのチャンクのサマリーを生成し、次のチャンクを順次組み込んでサマリーを改善します。

反復絞込みのユースケース:

  • 複雑なテキストや高度に相互接続されたテキスト(各部分が前の部分の上に構築される)を要約する場合など、コンテキストの正確性と一貫性が重要な状況に最適です。
  • 順次処理が可能な小規模タスクに最適です。

「サマリーの手法」を参照してください。

大規模言語モデル(LLM)

大規模言語モデル(LLM)とは、大量のテキスト・データに基づいてトレーニングされ、トレーニング・データに応じて様々なユースケースがサポートされる、高度なタイプの人工知能モデルを指します。これには、人間が使用するような言語、ソフトウェア・コードおよびデータベース問合せの理解と生成が含まれます。これらのモデルでは、テキスト生成、翻訳、サマリー、質問への回答、センチメント分析など、様々な自然言語処理タスクを実行できます。通常、LLMは、入力データからパターン、コンテキストおよびセマンティクスを学習する高度なディープ・ラーニング・ニューラル・ネットワーク・モデルに基づいており、コンテキストに関連する一貫性のあるテキストを生成できます。

MapReduce

一般に、MapReduceプログラミング・モデルでは、タスクをマップとリデュースの2つのフェーズに分割することで、大量のデータを処理できます。
  • マップ: 入力データを処理し、キーと値のペアに変換します。
  • リデュース: キーに基づいてマップされたデータを集計および要約します。MapReduceは、大きいデータ・セットの並列処理を実行します。

Select AI Summarizeの場合、MapReduceはテキストを複数のチャンクに分割し、それらを並行して独立して処理し、各チャンクの個別のサマリーを生成します。これらのサマリーは結合され、まとまった全体的なサマリーが形成されます。

マップ・リデュースのユースケース:

  • 非常に大きなデータ・セットやドキュメントの要約など、速度とスケーラビリティが優先される大規模な並列タスクに最適です。
  • チャンクの独立性が許容され、サマリーを後で集計できる状況に最適です。

「サマリーの手法」を参照してください。

メタデータ

メタデータは、データを説明するデータです。Select AIの場合、メタデータはデータベース・メタデータであり、データベースの表とビューの構造、編成およびプロパティを表すデータを指します。

データベースの表およびビューの場合、メタデータには列名と型、制約とキー、ビュー定義、関係、系統、品質と鮮度のインジケータ、セキュリティ分類およびアクセス・ポリシーが含まれます。適切に管理されたメタデータにより、検出可能性、正しい使用、パフォーマンス・チューニングおよびコンプライアンスが可能になります。Select AIは、表定義(表名、列名とそのデータ型)、およびオプションで表と列のコメント、注釈および制約を含む表メタデータでNL2SQLプロンプトを拡張します。

メタデータ・クローン

メタデータ・クローンまたはAutonomous AI Databaseクローンは、データベースまたはスキーマを定義するメタデータのコピーを作成します。これには、構造のみが含まれ、実際のデータは含まれません。このクローンには、データ行のない表、索引、ビュー、統計、プロシージャおよびトリガーが含まれています。これは、開発者、テスター、またはデータベース・テンプレートを作成するユーザーの役に立ちます。詳細は、Autonomous Databaseのクローニング、移動またはアップグレードを参照してください。

メタデータのエンリッチメント

LLMが表と列の意図をよりよく理解し、ビジネスの意味を明確にし、より正確なSQLを生成できるように、高品質の説明、コメントおよび注釈を使用してデータベース・スキーマを拡張する手法です。明確な意図、関係および制約により、表名または列名が適切にドキュメント化されたアセットに変わります。

含める情報の候補:

  • 表および列の説明: 目的、ビジネス定義、単位および許可される値の範囲
  • キーと関係: 主キーと外部キー、結合パス
  • データ・セマンティクス: 時間の粒度、緩やかに変化する次元、重複除去ルール
  • 制約と品質: NULL値可能、一意性、検証ルール、データの鮮度
  • シノニムと別名: 技術名にマップされる一般的なビジネス用語
  • 例とパターン: サンプル値、共通フィルタまたは集計

Visual Studio Codeを介してOracle SQL Developer for VS Codeを使用してこのようなメタデータを追加する方法の詳細は、AIエンリッチメントの概要を参照してください。

自然言語プロンプト

自然言語プロンプトは、日常的な人間の言語(英語など)で表される指示、質問または入力文で構成され、LLMの応答をガイドします。ユーザーは、コードや特殊な構文を必要とせずに、目的を説明する文や句の入力、情報の要求、またはタスクの指定を行ってLLMと対話します。

次に例を示します:

  • 「各事業エリアでの前四半期の収益はどれくらいですか?」
  • 「育児休暇に関する社内方針は?」
  • 「この記事を要約してください」
  • 「顧客に出荷の遅延を謝罪する電子メールを書いてください」
  • 「SQLデータベースとNoSQLデータベースの主な違いは何ですか?」

これらのプロンプトは、人間の言語に関するモデルの理解を活用して、有用でコンテキストに関連する出力を生成します。自然言語プロンプトはLLMのユーザビリティの中心であり、技術的な専門知識を持たないユーザーが高度なAI機能にアクセスできるようにします。

ネットワーク・アクセス制御リスト(ACL)

ネットワーク・アクセス制御リストとは、ネットワーク・デバイス(ルーター、ファイアウォール、ゲートウェイなど)を通過できるネットワーク・トラフィックを定義する、一連のルールと権限です。ACLは、様々な条件(IPアドレス、ポート番号、プロトコルなど)に基づいて受信トラフィックと送信トラフィックを制御およびフィルタするために使用されます。それらは、管理者がネットワーク・トラフィックを管理および制限して不正アクセス、潜在的な攻撃およびデータ侵害を防止できるようにすることで、ネットワーク・セキュリティにおいて重要な役割を果たします。

NL2SQL

自然言語からのSQL (NL2SQL)は、生成AIを使用して自然言語の質問をSQL文に変換します。

Select AIは、NL2SQLをアクティブに使用して、ユーザー・プロンプトを解釈し、Autonomous AI Databaseまたは接続された外部ソースに対する正しい実行可能なSQLを生成します。これにより、ビジネス・ユーザーは「前四半期の収益を地域別に表示してください」などの質問をして、SQLの専門知識がなくても、正確なSQL問合せと結果を受け取ることができます。

ONNX

ONNX (Open Neural Network Exchange)は、機械学習とディープラーニング・モデルを表すためのオープンな標準形式です。ONNXは、フレームワーク全体で機械学習モデルの表現とやり取りを標準化し、シームレスなデプロイメントと相互運用性を実現します。詳細は、「ONNX」を参照してください。

Select AIは、ONNX形式でエクスポートされた生成AIモデルを使用して、Autonomous AI Database内で直接AIワークロードを実行したり、サポートされているランタイムを介してAIワークロードを実行することで、組織が問合せ生成などの自然言語処理タスクに事前トレーニング済モデルを活用できるようにします。ONNXモデルを使用することで、データに近い推論を維持して、データの移動を減らし、様々なツールや環境間で一貫したモデル処理を可能にして、コンプライアンスに準拠したAI運用を実現できます。

ONNX Runtime

ONNX Runtimeは、ハードウェア・プラットフォーム間でONNX形式のモデルを効率的に実行し、リアルタイムAIアプリケーションの推論を最適化します。

Select AIユーザーは、RAGをサポートするために、AIプロファイルにデータベース内のONNX形式モデルを指定できます。データベースは、ONNX RuntimeをOracle AI Database 26aiおよびAutonomous AI Databaseに埋め込みます。データベース内のONNX Runtimeを使用すると、ベクトル埋込みなどを生成するために外部エンジンにコンテンツを送信することを回避できます。ONNX Runtimeは、Autonomous AI Database内のトランスフォーマベースのモデルのランタイム評価を強化し、外部サービスにデータを送信することなく、開発者による、ONNXモデルの読み込み、高速な自然言語からのSQL (NL2SQL)の変換、埋込みの計算、データの分類、またはデータベース・エンジン内での推論の実行を容易にします。これにより、問合せのパフォーマンスが向上し、セキュリティ、レイテンシおよびガバナンスが向上します。詳細は、「例: データベース内トランスフォーマ・モデルを使用したSelect AI」および「ONNX Runtime」を参照してください。

プライベート・エンドポイント

特定のサービスまたはリソースへのアクセスを制限できる、セキュアで専用の通信ポイント。プライベート・エンドポイントは、特定のサービスまたはリソースへのアクセスを制限するセキュアな専用接続を確立し、通信を分離します。Select AIでは、組織はOracle Cloud Infrastructure (OCI)にプライベート・エンドポイントを構成して、仮想マシン(VM)上のOllamaやLlama.cppなどのプライベートでホストされたLLMに接続し、Oracle Virtual Cloud Network内でAIワークロードを処理することでセキュリティのニーズに対応できます。このセットアップには、制御されたアクセスのためのジャンプ・サーバーを備えたパブリック・サブネットと、Autonomous AI DatabaseおよびAIモデルを収容するプライベート・サブネットが含まれ、インターネットへの露出を防ぎ、すべてのコンポーネントが企業の分離要件に準拠するように維持します。詳細は、「Select AIモデルのプライベート・エンドポイント・アクセス」を参照してください。

検索拡張生成(RAG)

検索拡張生成(RAG)は、ユーザーの問合せに関連する情報を取得して、その情報を大規模言語モデル(LLM)に提供して応答を改善し、ハルシネーションを軽減する手法です。

ほとんどの場合、RAGにはベクトル検索が含まれますが、より一般的には、SQL生成のスキーマ・メタデータや明示的に問い合せたデータベース・コンテンツなど、データベース・コンテンツのプロンプトの拡張(手動または自動)が含まれます。その他の拡張形態には、グラフの分析や従来の機械学習などのテクノロジが含まれる場合があります。

セマンティック類似検索

セマンティック類似検索では、ベクトル・ストア内の特徴ベクトルを比較することで、特定の問合せにほぼ一致するデータ・ポイントを識別して取得します。

サイドカー

サイドカー・アーキテクチャでは、1つのデータベースが、ローカル・データ・ソースとリモート・データ・ソース(つまり、OracleとOracle以外の両方)の中央メタデータ・リポジトリとして機能できます。Select AIは、メタデータを活用して、ユーザーの選択したLLMに送信される拡張プロンプトを作成するためにこのアーキテクチャを使用し、その後、LLMはフェデレーテッドSQL問合せを生成します。サイドカーの主な利点は、データを元の場所に保持できるため、データの重複や複雑なETLプロセスが不要になることです。

これらのソースをAutonomous AI Databaseに安全にブリッジすることで、BigQuery、Redshift、マルチクラウド、オンプレミス・データベースなどの多様な外部システムへの統合されたアクセスをサポートします。

類似度しきい値

類似度しきい値は、2つのアイテムの関連性を分類する最小スコアを設定し、ベクトルの近接度または距離に基づいて結果をフィルタリングします。Select AIでは、類似度しきい値は、必要なセマンティック近接性レベルを下回る結果をフィルタリングするのに役立ち、関連性の高いドキュメント・チャンク、行または埋込みのみが返されるようになります。

合成データの生成

Select AIのコンテキストでは、合成データの生成は、データベース・スキーマに準拠した人工的なデータを自動的に生成する機能であり、機密データや本番データを使用せずに、開発、テスト、トレーニングまたは概念実証シナリオのために表に移入できます。Select AIには、合成データ・セットを生成するためのPL/SQLファンクションDBMS_CLOUD_AI.GENERATE_SYNTHETIC_DATAが用意されています。詳細は、「合成データの生成」を参照してください。

トランスフォーマ

ベクトル埋込みの生成、テキスト生成、翻訳など、自然言語処理タスクに一般的に使用されるディープ・ラーニング・モデル・アーキテクチャの一種です。Select AIでは、トランスフォーマベースのLLMによって、データベース内で実行できるSQL問合せへのユーザー問合せの変換が行われます。

ベクトル

セマンティック類似検索のコンテキストでは、ベクトルは、単語、文書、イメージなどのデータ・ポイントのセマンティックな意味を多次元空間に取得する数学的表現です。

Select AIのコンテキストでは、ベクトルは、テキスト・コンテンツの意味を取得することで検索拡張生成をサポートし、データベースからの高速でセマンティックな取得を可能にします。

ベクトル・データベース

ベクトル埋込みを格納するデータベース。ベクトル埋込みは、効率的なセマンティック類似検索をサポートするためにAIアプリケーションで使用されるデータ・ポイントの数学的表現です。Oracle Autonomous AI DatabaseおよびOracle AI Databaseは、最適化されたベクトル索引を持つベクトル・データベースとして機能します。

Select AIでは、ベクトル・データベース・コンポーネント(Oracle AI Vector Searchを搭載)が、企業データから生成された埋込みを索引付けします。これにより、自然言語問合せは、意味的に類似した結果を取得し、AIを活用した検索とRAGワークフローの関連性が向上し、Oracle Cloud環境とのシームレスな統合を実現できます。

ベクトル距離

ベクトル距離は、多次元空間での特徴ベクトル間の距離を計算することによって、特徴ベクトル間の類似度または非類似度を測定します。

ベクトル索引

ベクトル索引は、ベクトルを整理して格納し、関連するデータの効率的な類似検索および取得を可能にします。

ベクトル・ストア

ベクトル・ストアには、ベクトル埋込みを使用するセマンティック類似検索を格納、管理および有効化するシステムが含まれています。これには、スタンドアロンのベクトル・データベースとOracle AI Database 26ai AI Vector Searchが含まれます。