Select AIの概念

Select AIに関連する概念および用語を確認します。

処理

Select AIのアクションは、Select AIがプロンプトを操作するときに異なる動作を実行するように指示するキーワードです。アクションを指定することで、ユーザーは、Select AIに、SQLコードの生成、チャット・プロンプトへの応答、出力のナレーション、SQL文の表示またはSQLコードの説明を指示できます。LLMを活用して、データベース環境内のデータと効率的にやり取りできます。

サポートされているSelect AIアクションについては、AIキーワードを使用したプロンプトの入力を参照してください。

AIエージェント

Select AI Agent Conceptsを参照してください。

AIモデル

テキスト生成、翻訳、画像認識などのタスクに使用される、大規模言語モデル(LLM)やトランスフォーマ(埋込みモデルとも呼ばれる)など、様々なタイプの人工知能モデルを包含する一般的な用語です。AIモデルは、データに基づいてトレーニングされたプログラムであり、パターンを検出し、新しい入力に基づいて予測または意思決定を行います。Oracleのコンテキストでは、AIモデルはOracleのサービスを介して利用できる様々な機械学習および大規模言語モデル(LLM)を具体的に指します。詳細は、生成AIの概念を参照してください。

AIプロファイル

AIプロファイルは、使用するAIプロバイダと、自然言語プロンプトへのレスポンスの生成に必要なメタデータおよびデータベース・オブジェクトに関するその他の詳細を含む仕様です。「CREATE_PROFILEプロシージャ」および「プロファイル属性」を参照してください。

AIプロバイダ

Select AIのAIプロバイダとは、自然言語プロンプトに対するレスポンスを処理および生成するためにLLMまたはトランスフォーマ(あるいはその両方)を提供するサービス・プロバイダを指します。これらのプロバイダは、LLMの概念で強調表示されたユース・ケースの自然言語を解釈および変換できるモデルを提供します。サポートされているプロバイダについては、AIプロバイダおよびLLMの選択を参照してください。

チャットボット

自然言語でユーザーと対話するように設計されたAIを活用した会話エージェントで、多くの場合、顧客サービスや情報検索に使用されます。Select AIのコンテキストでは、Ask Oracleチャットボットは、ユーザーが自然言語の質問をしたり、データベースやプライベート・コンテンツに裏打ちされたAI生成レスポンスを受信したりするのに役立ちます。このUIを使用して、ユーザーは次のことができます。

  • 自然言語の質問をして、SQLが自動的に生成されます(NL2SQL)。

  • Select AIを使用して、データベース表およびビューに対して問合せを実行します。

  • Retrieval-Augmented Generation (RAG)を使用して、Autonomous AI Databaseに格納されているプライベート・ドキュメント・コンテンツを含めます。

  • Select AI Agentで定義したエージェント・チームと対話します。

詳細は、Ask Oracleを参照してください。

クラウド・リンク

クラウド・リンクは、Oracle Cloud Infrastructureと外部クラウド・プロバイダまたはオンプレミス・ネットワークとの間にセキュアなプライベート接続を確立し、シームレスなデータ交換を容易にします。Select AIでは、クラウド・リンクにより、Autonomous AI Databaseはパブリック・エクスポージャなしで外部データをNL2SQLインタラクションに組み込むことができ、暗号化やアクセス制御などのOracleのセキュリティ標準に準拠しながら、対話形式でハイブリッド環境にクエリを実行できるようになります。詳細は、Autonomous AIデータベースでの読取り専用データ・アクセスに対するクラウド・リンクの使用を参照してください。

会話

Select AIでの会話は、ユーザーとシステム間の対話型交換を表し、ユーザーは一連の自然言語プロンプトを介してデータベースを問い合せたり、対話したりできます。Select AIは、セッションベースの短期的な会話を組み込んで、以前のインタラクションに基づいて現在のプロンプトに対してコンテキスト対応のレスポンスを生成します。短期的な会話で現在のリクエストに最大10個のプロンプトが組み込まれ、LLMに送信される拡張プロンプトが作成されます。Select AIでは、カスタマイズ可能な長期会話の使用がサポートされており、コンテキストを混在させることなく、異なるトピックでSelect AIを使用でき、DBMS_CLOUD_AIパッケージの会話APIを介して構成できます。Select AI Conversationsを参照してください。

データベース資格証明

データベース資格証明は、データベースへのアクセスおよびデータベースとの対話に使用される認証資格証明です。通常、ユーザー名およびパスワードで構成され、セキュリティ・トークンなどの追加の認証ファクタによって補完されることもあります。これらの資格証明は、認可された個人またはシステムのみがデータベース内に格納されたデータにアクセスして操作できるように、アプリケーションまたはユーザーまたはユーザーとデータベース間のセキュアな接続を確立するために使用されます。

データベース・リンク

データベース・リンクは、Oracleデータベースをリモート・データベースに接続し、外部データにローカルであるかのように透過的にアクセスできるようにします。Select AIでは、データベース・リンクがAutonomous AI DatabaseまたはオンプレミスのOracle AI Databaseと統合され、NL2SQL機能をフェデレーテッド・ソースに拡張し、オンプレミスまたは他のクラウド環境に安全にまたがる自然言語クエリをサポートします。詳細は、CREATE DATABASE LINKおよびAutonomous AI DATABASEでのデータベース・リンクの使用を参照してください。

埋込みモデル

入力データをベクトル埋込みに変換してセマンティック関係を取得するAIモデル。多くの場合、言語の理解やイメージ認識などのタスクで使用されます。Select AIでは、埋込みモデルを使用して、ドキュメント、表および問合せテキストの埋込みを計算します。これらの埋込みは、自律型AIデータベース内のセマンティック検索、RAGワークフロー、類似性スコアリングおよび関連性ランキングを強化します。

GRAPH_TABLE演算子

GRAPH_TABLE演算子を使用してSQLプロパティ・グラフを問い合せると、グラフ・パターン一致問合せを表現できます。

この演算子は、グラフ・パターン一致ロジックをSQLで直接表現し、他のデータベース・オブジェクトと統合されたリレーショナル結果セットを返します。詳細は、「SQL GRAPH問合せ」を参照してください。

LLMの幻覚

大言語モデルの文脈における幻覚とは、入力プロンプトと不正確、無意味、または無関係なテキストをモデルが生成する現象を指します。モデルが一貫したテキストを生成しようとした結果であるにもかかわらず、これらのレスポンスには、製造された情報、誤解を招く情報、または純粋に想像力のある情報を含めることができます。幻覚は、トレーニング・データのバイアス、適切なコンテキストの理解の欠如、またはモデルのトレーニング・プロセスの制限が原因で発生する可能性があります。

IAM

Oracle Cloud Infrastructure Identity and Access Management (IAM)を使用すると、クラウド・リソースにアクセスできるユーザーを制御できます。ユーザーのグループが保持するアクセス権のタイプとアクセスの対象となる特定のリソースを制御できます。さらに学習するには、Identity and Access Managementの概要に関する項を参照してください。

反復絞込み

反復的改良は、フィードバックまたは評価に基づく調整の繰り返しサイクルを通じて、ソリューションまたはモデルを徐々に改善するプロセスです。最初の近似から始めて、ステップごとに調整し、目的の精度または結果が達成されるまで続行します。各反復は前の反復に基づいて構築され、目標に近づくための修正または最適化が組み込まれています。

テキスト・サマリー生成では、大規模なファイルまたはドキュメントを処理する場合に反復絞込みが役立ちます。このプロセスでは、テキストを管理可能なサイズのチャンクに分割します。たとえば、LLMのトークン制限内に収まり、1つのチャンクのサマリーを生成し、次のチャンクを順次組み込んでサマリーを改善します。

反復絞込みのユースケース:

  • 複雑なテキストや高度に相互接続されたテキストを要約する場合など、コンテキストの正確性と一貫性が重要である状況に最適です。

  • 順次処理が可能な小規模タスクに最適です。

要約方法を参照してください。

大規模な言語モデル(LLM)

大規模言語モデル(LLM)とは、高度なタイプの人工知能モデルを指し、トレーニング・データに応じて様々なユースケースをサポートするために大量のテキスト・データに基づいてトレーニングされます。これには、人間のような言語の理解と生成、ソフトウェア・コードおよびデータベース問合せが含まれます。これらのモデルは、テキスト生成、翻訳、要約、質問への回答、センチメント分析など、様々な自然言語処理タスクを実行できます。LLMは、通常、入力データからパターン、コンテキストおよびセマンティクスを学習する高度なディープ・ラーニング・ニューラル・ネットワーク・モデルに基づいており、一貫性のあるコンテキスト上の関連テキストを生成できます。

MapReduce

一般に、MapReduceプログラミング・モデルでは、タスクをMapとReduceの2つのフェーズに分割して、大量のデータを処理できます。

  • マップ: 入力データを処理し、キーと値のペアに変換します。

  • Reduce: キーに基づいてマップされたデータを集計および要約します。MapReduceは、大規模なデータ・セットのパラレル処理を実行します。

Select AI Summarizeの場合、MapReduceはテキストを複数のチャンクに分割し、それらを並行して独立して処理し、チャンクごとに個別のサマリーを生成します。これらのサマリーは、まとめてまとめてまとめた全体的なサマリーを形成します。

マップ削減のユースケース:

  • 非常に大規模なデータ・セットやドキュメントの要約など、速度とスケーラビリティが優先される大規模なパラレル・タスクに最適です。

  • チャンク独立性が許容され、サマリーを後で集計できる状況に最適です。

要約方法を参照してください。

メタデータ

メタデータは、データを記述するデータです。Select AIの場合、メタデータはデータベースメタデータであり、データベーステーブルおよびビューの構造、組織、およびプロパティーを記述するデータを指します。

データベース表およびビューの場合、メタデータには列名とタイプ、制約とキー、ビュー定義、関係、系統、品質と最新性のインジケータ、セキュリティ分類およびアクセス・ポリシーが含まれます。適切に管理されたメタデータにより、検出可能性、正しい使用状況、パフォーマンス・チューニングおよびコンプライアンスが可能になります。Select AIは、表定義(表名、列名とそのデータ型)を含む表メタデータ、およびオプションで表と列のコメント、注釈および制約を含む表メタデータでNL2SQLプロンプトを拡張します。

メタデータ・クローン

メタデータ・クローンまたはAutonomous AI Databaseクローンは、データベースまたはスキーマを定義するメタデータのコピーを作成します。これには、構造のみが含まれ、実際のデータは含まれません。このクローンには、データ行のない表、索引、ビュー、統計、プロシージャおよびトリガーが含まれます。これは、開発者、テスター、またはデータベース・テンプレートの作成に役立ちます。さらに学習するには、Autonomous AIデータベースの移動またはアップグレードのクローニングを参照してください。

メタデータ・エンリッチ

LLMが表や列の意図をよりよく理解し、ビジネス上の意味を明確にし、より正確なSQLを生成できるように、高品質の記述、コメントおよび注釈でデータベース・スキーマを拡張する手法。ベア・テーブル名または列名を、明確な意図、関係および制約のあるドキュメント化されたアセットに変換します。

含める候補者情報:

  • 表および列の説明: 目的、ビジネス定義、ユニットおよび許可される値の範囲

  • キーとリレーションシップ: 主キー/外部キー、結合パス

  • データ・セマンティクス: 時間の粒度、緩やかに変化するディメンション、重複除外ルール

  • 制約と品質: NULL性、一意性、検証ルール、データの鮮度

  • シノニムと別名: 技術名にマップされる一般的なビジネス用語

  • 例とパターン: サンプル値、共通フィルタまたは集計

Visual Studio Codeを使用したOracle SQL Developer for VS Codeを使用したメタデータの追加についてさらに学習するには、AIエンリッチメントの概要を参照してください。

自然言語プロンプト

自然言語プロンプトは、LLMの応答をガイドする、日常の人間の言語(英語など)で表される指示、質問または入力文で構成されます。ユーザーは、コードや特殊な構文を必要とするのではなく、意図を説明する文やフレーズを入力したり、情報を要求したり、タスクを指定したりしてLLMと対話します。

たとえば:

  • 「各法人地域における前四半期の収益はいくらですか?」

  • 「育児休暇に関する社内方針は?」

  • 「この記事を要約する」。

  • 「遅延出荷を謝罪する電子メールを顧客に書き込みます。」

  • 「SQLとNoSQLデータベースの主な違いは何ですか?」

これらのプロンプトは、モデルの人間の言語に対する理解を活用して、有用で状況に適した出力を生成します。自然言語プロンプトはLLMのユーザビリティの中心であり、技術的な専門知識がなくても高度なAI機能をユーザーが利用できるようにします。

ネットワーク・アクセス制御リスト(ACL)

ネットワーク・アクセス制御リストは、ルーター、ファイアウォール、ゲートウェイなどのネットワーク・デバイスを通過できるネットワーク・トラフィックを定義する一連のルールまたは権限です。ACLは、IPアドレス、ポート番号、プロトコルなどのさまざまな条件に基づいて、着信トラフィックと発信トラフィックを制御およびフィルタリングするために使用されます。管理者がネットワーク・トラフィックを管理および制限して、不正アクセス、潜在的な攻撃およびデータ侵害を防止できるようにすることで、ネットワーク・セキュリティにおいて重要な役割を果たします。

NL2SQL

自然言語からSQL (NL2SQL)は、生成AIを使用して自然言語の質問をSQL文に変換します。

Select AIは、NL2SQLをアクティブに使用して、ユーザー・プロンプトを解釈し、Autonomous AI Databaseまたは接続された外部ソースに対して、正しく実行可能なSQLを生成します。これにより、ビジネス・ユーザーは「前四半期の収益を地域別に表示」のような質問をしたり、SQLの専門知識がなくても正確なSQL問合せと結果を受け取ることができます。

ONNX

ONNX(Open Neural Network Exchange)は、機械学習およびディープラーニング・モデルを表すためのオープン標準フォーマットです。ONNXは、フレームワーク間での機械学習モデルの表現と交換を標準化し、シームレスな導入と相互運用性を実現します。詳細は、ONNXを参照してください。

Select AIは、ONNX形式でエクスポートされた生成AIモデルを使用して、自律型AIデータベース内またはサポートされているランタイムを通じてAIワークロードを直接実行できるため、組織はクエリ生成などの自然言語処理タスクに事前トレーニングされたモデルを活用できます。ONNXモデルを使用することで、データに近い推論を維持し、データ移動を削減し、さまざまなツールや環境間で一貫したモデル処理を可能にすることで、コンプライアンスに準拠したAI運用を実現できます。

ONNXランタイム

ONNX Runtimeは、ハードウェア・プラットフォーム全体でONNX形式のモデルを効率的に実行し、リアルタイムAIアプリケーションの推論を最適化します。

Select AIユーザーは、RAGをサポートするために、AIプロファイルにデータベース内のONNX形式モデルを指定できます。データベースは、Oracle AI Database 26aiおよびAutonomous AI DatabaseにONNXランタイムを埋め込みます。データベース内のONNXランタイムを使用すると、外部エンジンにコンテンツを送信して、ベクトル埋込みなどの生成を回避できます。ONNX Runtimeは、自律型AIデータベース内のトランスフォーマベースのモデルのランタイム評価を強化し、開発者は、外部サービスにデータを送信することなく、ONNXモデル、高速自然言語からSQL(NL2SQL)への変換、埋込みの計算、データの分類、データベース・エンジン内での推論の実行を容易にします。これにより、クエリのパフォーマンスが向上し、セキュリティ、レイテンシ、ガバナンスが向上します。詳細は、例: データベース内トランスフォーマ・モデルを使用したSelect AIおよびONNXランタイムを参照してください。

Oracle SQLプロパティ・グラフ

Oracle AI Database 26aiでは、リレーショナル・データをノード、エッジおよびプロパティとして表すSQLプロパティ・グラフが導入されています。

開発者は、CREATE PROPERTY GRAPH文を使用して、既存の表からグラフを定義できます。これにより、外部グラフ・エンジンを使用せずにSQLベースの問合せおよびパターン・マッチングが可能になります。詳細は、プロパティ・グラフの概要およびSQLプロパティ・グラフの作成を参照してください。

プライベート・エンドポイント

特定のサービスまたはリソースへのアクセスを制限できる、セキュアで専用の通信ポイント。プライベート・エンドポイントは、特定のサービスまたはリソースへのアクセスを制限するセキュアな専用接続を確立し、通信を分離します。Select AIでは、組織はOracle Cloud Infrastructure (OCI)のプライベート・エンドポイントを構成して、仮想マシン(VM)上のOllamaやLlama.cppなどのプライベート・ホストLLMと接続し、Oracle Virtual Cloud Network内でAIワークロードを処理することでセキュリティ・ニーズに対応できます。この設定には、制御されたアクセスのためのジャンプ・サーバーを備えたパブリック・サブネットと、Autonomous AI DatabaseおよびAIモデルを収容するプライベート・サブネットが含まれ、インターネットの露出を防止し、すべてのコンポーネントをエンタープライズの分離要件に準拠した状態に保ちます。詳細は、Select AIモデルのプライベート・エンドポイント・アクセスを参照してください。

検索拡張生成(RAG)

Retrieval Augmented Generation (RAG)は、ユーザーの問合せに関連する情報を取得し、その情報を大規模言語モデル(LLM)に提供して応答を改善し、幻覚を軽減する手法です。

通常、RAGにはベクトル検索が含まれますが、より一般的には、SQL生成用のスキーマ・メタデータや明示的に問い合せたデータベース・コンテンツなど、データベース・コンテンツのプロンプト(手動または自動)の拡張が含まれます。他の形態の拡張には、グラフ分析や従来の機械学習などのテクノロジが含まれる場合があります。

セマンティック類似性検索

セマンティック類似性検索では、ベクトル・ストア内のフィーチャ・ベクトルを比較することで、特定の問合せに厳密に一致するデータ・ポイントを識別および取得します。

サイドカー

サイドカー・アーキテクチャを使用すると、1つのデータベースがローカル・データ・ソースとリモート・データ・ソース(OracleおよびOracle以外)の中央メタデータ・リポジトリとして機能できます。Select AIは、メタデータを活用して、ユーザーが選択したLLMに送信される拡張プロンプトを構築し、フェデレーテッドSQL問合せを生成します。サイドカーの主な利点は、データの複製や複雑なETLプロセスの必要性を排除して、データを元の場所に保持できることです。

これらのソースを自律型AIデータベースに安全にブリッジすることで、BigQuery、Redshift、マルチクラウド、オンプレミス・データベースなどの多様な外部システムへのフェデレーテッド・アクセスをサポートします。

類似度しきい値

類似度しきい値は、2つのアイテムを関連アイテムとして分類するための最小スコアを設定し、ベクトルの近接度または距離に基づいて結果をフィルタリングします。Select AIでは、類似性のしきい値は、必要なセマンティック近似レベルを下回る結果のフィルタリングに役立ち、関連するドキュメント・チャンク、行または埋込みのみが返されるようにします。

合成データ生成

Select AIのコンテキストでは、合成データ生成は、データベース・スキーマに準拠した人工データを自動的に生成する機能であり、機密データや本番データを使用せずに、開発、テスト、トレーニングまたは概念実証シナリオの表を移入できます。Select AIには、合成データ・セットを生成するためのPL/SQLファンクションDBMS_CLOUD_AI.GENERATE_SYNTHETIC_DATAが用意されています。詳細は、「合成データの生成」を参照してください。

トランスフォーマ

ベクトル埋込み生成やテキスト生成および翻訳など、自然言語処理タスクに一般的に使用されるディープ・ラーニング・モデル・アーキテクチャの一種です。Select AIでは、トランスフォーマベースのLLMによって、ユーザー問合せをデータベース内で実行できるSQL問合せに変換できます。

ベクトル

セマンティック類似性検索のコンテキストでは、ベクトルは、単語、ドキュメント、イメージなどのデータ・ポイントのセマンティックな意味を多次元空間で取得する数学的表現です。

Select AIのコンテキストでは、ベクトルは、テキスト・コンテンツの意味を取得して、データベースからの高速セマンティック取得を可能にすることで、取得拡張生成をサポートします。

ベクトル・データベース

ベクトル埋込みを格納するデータベース。これは、効率的なセマンティック類似性検索をサポートするためにAIアプリケーションで使用されるデータ・ポイントの数学的表現です。Oracle Autonomous AI DatabaseとOracle AI Databaseは、最適化されたベクトルインデックスを備えたベクトルデータベースとして機能します。

Select AIでは、ベクトル・データベース・コンポーネント(Oracle AI Vector Searchを搭載)によって、エンタープライズ・データから生成された埋込みが索引付けされます。これにより、自然言語クエリは意味的に類似した結果を取得し、AIによる検索およびRAGワークフローの関連性を改善し、Oracle Cloud環境とシームレスに統合できます。

ベクトル距離

ベクトル距離は、多次元空間におけるフィーチャベクトル間の距離を計算することによって、フィーチャベクトル間の類似性または非類似性を測定します。

ベクトル索引

ベクトル索引は、ベクトルを編成および格納して、関連するデータの効率的な類似検索および取得を可能にします。

ベクトル・ストア

ベクトル・ストアには、ベクトル埋込みを含むセマンティック類似検索を格納、管理および有効化するシステムが含まれています。これには、スタンドアロン・ベクトル・データベースとOracle AI Database 26ai AI Vector Searchが含まれます。