Select AIの概念

Select AIに関連する概念および用語を確認します。

処理

Select AIのアクションは、Select AIがプロンプトを操作するときに異なる動作を実行するように指示するキーワードです。アクションを指定することで、ユーザーは、Select AIに、SQLコードの生成、チャット・プロンプトへの応答、出力のナレーション、SQL文の表示またはSQLコードの説明を指示できます。LLMを活用して、データベース環境内のデータと効率的にやり取りできます。

サポートされているSelect AIアクションについては、「AIキーワードを使用したプロンプトの入力」を参照してください。

AIエージェント

Select AI Agent Conceptsを参照してください。

AIモデル

大規模言語モデル(LLM)やトランスフォーマ(埋込みモデルとも呼ばれる)など、様々なタイプの人工知能モデルを包含する一般的な用語で、テキスト生成、翻訳、画像認識などのタスクに使用されます。AIモデルは、データに基づいてトレーニングされ、パターンを検出し、新しい入力に基づいて予測や意思決定を行うプログラムです。Oracleのコンテキスト内では、AIモデルは、Oracleのサービスを通じて利用できる様々な機械学習および大規模言語モデル(LLM)を具体的に指します。詳細は、生成AIの概念を参照してください。

AIプロファイル

AIプロファイルは、使用するAIプロバイダ、および自然言語プロンプトへのレスポンスの生成に必要なメタデータおよびデータベース・オブジェクトに関するその他の詳細を含む仕様です。CREATE_PROFILEプロシージャおよびプロファイル属性を参照してください。

AIプロバイダ

Select AIのAIプロバイダとは、自然言語プロンプトに対する応答を処理および生成するためにLLMまたはトランスフォーマ(あるいはその両方)を提供するサービス・プロバイダを指します。これらのプロバイダは、LLMの概念で強調表示されているユースケースの自然言語を解釈および変換できるモデルを提供します。サポートされているプロバイダについては、AIプロバイダおよびLLMの選択を参照してください。

チャットボット

自然言語でユーザーと対話するように設計されたAIを活用した会話型エージェントであり、多くの場合、顧客サービスや情報の取得に使用されます。Select AIのコンテキストにおいて、Ask Oracleチャットボットは、ユーザーが自然言語の質問をしたり、データベースやプライベート・コンテンツに裏打ちされたAI生成の応答を受信したりするのに役立ちます。このUIを使用して、ユーザーは次のことができます。
  • 自然言語の質問をして、SQLが自動的に生成されます(NL2SQL)。
  • Select AIを使用して、データベース表およびビューに対して問合せを実行します。
  • Retrieval-Augmented Generation (RAG)を使用して、Autonomous AI Databaseに格納されているプライベート・ドキュメント・コンテンツを含めます。
  • Select AI Agentで定義したエージェント・チームと対話します。

詳細は、Oracleに問い合せるを参照してください。

クラウド・リンク

クラウド・リンクは、Oracle Cloud Infrastructureと外部クラウド・プロバイダまたはオンプレミス・ネットワーク間のセキュアなプライベート接続を確立し、シームレスなデータ交換を促進します。Select AIでは、クラウド・リンクにより、Autonomous AI Databaseは、パブリック・エクスポージャなしでNL2SQLインタラクションに外部データを組み込むことができ、ユーザーは、暗号化やアクセス制御などのOracleのセキュリティ標準に準拠しながら、ハイブリッド環境を対話形式でクエリし、準拠したAI主導の分析を行うことができます。詳細は、Autonomous AI Databaseでの読取り専用データ・アクセスでのクラウド・リンクの使用を参照してください。

会話

Select AIでの会話は、ユーザーとシステム間の対話型交換を表し、ユーザーは一連の自然言語プロンプトを介してデータベースに対してクエリーまたは対話できます。Select AIは、セッションベースの短期的な会話を組み込み、以前のインタラクションに基づいて現在のプロンプトに対してコンテキスト対応のレスポンスを生成します。最大10個までの以前のプロンプトが、短期的な会話で現在のリクエストに組み込まれ、LLMに送信される拡張プロンプトが作成されます。Select AIでは、カスタマイズ可能な長期会話の使用がサポートされており、コンテキストを混在させずに様々なトピックでSelect AIを使用できます。これは、DBMS_CLOUD_AIパッケージの会話APIを介して構成できます。Select AI Conversationsを参照してください。

データベース資格証明

データベース資格証明は、データベースへのアクセスおよびデータベースとの対話に使用される認証資格証明です。通常、ユーザー名およびパスワードで構成され、セキュリティ・トークンなどの追加の認証ファクタによって補完されることもあります。これらの資格証明は、認可された個人またはシステムのみがデータベース内に格納されたデータにアクセスして操作できるように、アプリケーションまたはユーザーまたはユーザーとデータベース間のセキュアな接続を確立するために使用されます。

データベース・リンク

データベース・リンクは、Oracleデータベースをリモート・データベースに接続し、外部データへの透過的なアクセスをローカルであるかのように可能にします。Select AIでは、データベース・リンクがAutonomous AI DatabaseまたはオンプレミスのOracle AI Databaseと統合され、NL2SQL機能がフェデレーテッド・ソースに拡張され、オンプレミスまたは他のクラウド環境にまたがる自然言語クエリがセキュアにサポートされます。詳細は、CREATE DATABASE LINKおよびAutonomous AI DATABASEでのデータベース・リンクの使用を参照してください。

埋込みモデル

入力データをベクトル埋込みに変換してセマンティック関係を取得するAIモデル。多くの場合、言語の理解やイメージ認識などのタスクで使用されます。Select AIでは、埋込みモデルを使用して、ドキュメント、表および問合せテキストの埋込みを計算します。これらの埋込みは、自律型AIデータベース内のセマンティック検索、RAGワークフロー、類似性スコアリングおよび関連性ランキングを強化します。

LLMの幻覚

大規模言語モデルの文脈におけるハルシネーションとは、入力プロンプトと不正確、非意味、または無関係なテキストをモデルが生成する現象を指します。コヒーレント・テキストを生成するモデルの試みの結果であるにもかかわらず、これらのレスポンスには、作成、誤解を招く、または純粋に想像できる情報を含めることができます。ハルシネーションは、トレーニング・データの偏り、適切なコンテキスト理解の欠如、またはモデルのトレーニング・プロセスの制限によって発生する可能性があります。

IAM

Oracle Cloud Infrastructure Identity and Access Management (IAM)を使用すると、クラウド・リソースにアクセスできるユーザーを制御できます。ユーザーのグループが保持するアクセス権のタイプとアクセスの対象となる特定のリソースを制御できます。さらに学習するには、Identity and Access Managementの概要に関する項を参照してください。

反復絞込み

反復的改良は、フィードバックまたは評価に基づく調整の繰り返しサイクルを通じて、ソリューションまたはモデルを徐々に改善するプロセスです。最初の近似から始めて、ステップごとに調整し、目的の精度または結果が達成されるまで続行します。各反復は前の反復に基づいて構築され、目標に近づくための修正または最適化が組み込まれています。

テキスト・サマリー生成では、反復絞込みは、大きなファイルまたはドキュメントの処理に役立ちます。このプロセスは、LLMのトークン制限内に収まる管理可能なサイズのチャンクにテキストを分割し、1つのチャンクのサマリーを生成し、次のチャンクを順番に組み込むことでサマリーを改善します。

反復絞込みのユースケース:

  • 複雑なテキストや高度に相互接続されたテキストを要約する場合など、コンテキストの正確性と一貫性が重要である状況に最適です。
  • 順次処理が可能な小規模タスクに最適です。

「集計手法」を参照してください。

大規模な言語モデル(LLM)

大規模言語モデル(LLM)とは、高度なタイプの人工知能モデルを指し、トレーニング・データに応じて様々なユースケースをサポートするために大量のテキスト・データに基づいてトレーニングされます。これには、人間のような言語の理解と生成、ソフトウェア・コードおよびデータベース問合せが含まれます。これらのモデルは、テキスト生成、翻訳、要約、質問への回答、センチメント分析など、様々な自然言語処理タスクを実行できます。LLMは、通常、入力データからパターン、コンテキストおよびセマンティクスを学習する高度なディープ・ラーニング・ニューラル・ネットワーク・モデルに基づいており、一貫性のあるコンテキスト上の関連テキストを生成できます。

MapReduce

一般に、MapReduceプログラミング・モデルでは、タスクをMapとReduceの2つのフェーズに分割して、大量のデータを処理できます。
  • マップ: 入力データを処理し、キーと値のペアに変換します。
  • 削減: キーに基づいてマップされたデータを集計および要約します。MapReduceは、大規模なデータ・セットのパラレル処理を実行します。

Select AI Summarizeの場合、MapReduceはテキストを複数のチャンクに分割し、それらを並行して独立して処理し、チャンクごとに個別のサマリーを生成します。これらのサマリーは、まとめてまとめてまとめた全体的なサマリーを形成します。

マップ削減のユースケース:

  • 非常に大規模なデータ・セットやドキュメントの要約など、速度とスケーラビリティが優先される大規模なパラレル・タスクに最適です。
  • チャンク独立性が許容され、サマリーを後で集計できる状況に最適です。

「集計手法」を参照してください。

メタデータ

メタデータは、データを記述するデータです。Select AIの場合、メタデータはデータベースメタデータであり、データベーステーブルおよびビューの構造、組織、およびプロパティーを記述するデータを指します。

データベース表およびビューの場合、メタデータには列名とタイプ、制約とキー、ビュー定義、関係、系統、品質と最新性のインジケータ、セキュリティ分類およびアクセス・ポリシーが含まれます。適切に管理されたメタデータにより、検出可能性、正しい使用状況、パフォーマンス・チューニングおよびコンプライアンスが可能になります。Select AIは、表定義(表名、列名とそのデータ型)を含む表メタデータ、およびオプションで表と列のコメント、注釈および制約を含む表メタデータでNL2SQLプロンプトを拡張します。

メタデータ・クローン

メタデータ・クローンまたはAutonomous AI Databaseクローンは、データベースまたはスキーマを定義するメタデータのコピーを作成します。これには、実際のデータではなく、構造のみが含まれます。このクローンには、データ行のない表、索引、ビュー、統計、プロシージャおよびトリガーが含まれます。開発者、テスター、またはデータベース・テンプレートを構築する人には、これが役立ちます。さらに学習するには、Autonomous AI Databaseインスタンスのクローニング、移動またはアップグレードを参照してください。

メタデータ・エンリッチ

LLMが表や列の意図をよりよく理解し、ビジネス上の意味を明確にし、より正確なSQLを生成できるように、高品質の記述、コメントおよび注釈でデータベース・スキーマを拡張する手法。ベア・テーブル名または列名を、明確な意図、関係および制約のあるドキュメント化されたアセットに変換します。

含める候補者情報:

  • 表および列の説明: 目的、ビジネス定義、ユニットおよび許可される値の範囲
  • キーとリレーションシップ: 主キー/外部キー、結合パス
  • データ・セマンティクス: 時間の粒度、緩やかに変化するディメンション、重複除外ルール
  • 制約と品質: NULL性、一意性、検証ルール、データの鮮度
  • シノニムと別名: 技術名にマップされる一般的なビジネス用語
  • 例とパターン: サンプル値、共通フィルタまたは集計

Visual Studio Codeを介してOracle SQL Developer for VS Codeを使用してこのようなメタデータを追加する方法の詳細は、AIエンリッチメントの概要を参照してください。

自然言語プロンプト

自然言語プロンプトは、LLMの応答をガイドする、日常の人間言語(英語など)で表される指示、質問または入力文で構成されます。コードや特殊な構文を必要とするかわりに、ユーザーは意図を説明する文やフレーズを入力したり、情報を要求したり、タスクを指定したりしてLLMと対話します。

たとえば:

  • 「各法人地域の前四半期の収益はいくらですか?」
  • 「育児休業に関する社内方針は?」
  • 「この記事を要約する」。
  • 「配送が遅れたことをお客様に謝罪する電子メールを書いてください。」
  • SQLデータベースとNoSQLデータベースの主な違いは何ですか。

これらのプロンプトは、モデルの人間の言語に対する理解を活用して、有用で状況に適した出力を生成します。自然言語プロンプトはLLMのユーザビリティの中心であり、技術的な専門知識がなくても高度なAI機能をユーザーが利用できるようにします。

ネットワーク・アクセス制御リスト(ACL)

ネットワーク・アクセス制御リストは、ルーター、ファイアウォール、ゲートウェイなどのネットワーク・デバイスを通過できるネットワーク・トラフィックを定義する一連のルールまたは権限です。ACLは、IPアドレス、ポート番号、プロトコルなどのさまざまな条件に基づいて、着信トラフィックと発信トラフィックを制御およびフィルタリングするために使用されます。管理者がネットワーク・トラフィックを管理および制限して、不正アクセス、潜在的な攻撃およびデータ侵害を防止できるようにすることで、ネットワーク・セキュリティにおいて重要な役割を果たします。

NL2SQL

自然言語からSQL (NL2SQL)は、生成AIを使用して自然言語の質問をSQL文に変換します。

Select AIでは、NL2SQLを使用してユーザー・プロンプトを解釈し、自律型AIデータベースまたは接続された外部ソースに対して正しい実行可能なSQLを生成します。これにより、ビジネス・ユーザーは「前四半期の地域別収益を表示」などの質問をし、SQLの専門知識がなくても正確なSQL問合せと結果を受け取ることができます。

ONNX

ONNX(Open Neural Network Exchange)は、機械学習とディープラーニングモデルを表すためのオープンな標準形式です。ONNXは、フレームワーク間で機械学習モデルの表現と交換を標準化し、シームレスな導入と相互運用性を実現します。詳細は、ONNXを参照してください。

Select AIは、ONNX形式でエクスポートされた生成AIモデルを使用して、自律型AIデータベース内またはサポートされているランタイムを通じてAIワークロードを直接実行できるため、組織はクエリ生成などの自然言語処理タスクに事前トレーニングされたモデルを活用できます。ONNXモデルを使用することで、データに近い推論を維持し、データ移動を削減し、さまざまなツールや環境間で一貫したモデル処理を可能にすることで、コンプライアンスに準拠したAI運用を実現できます。

ONNXランタイム

ONNX Runtimeは、ハードウェア・プラットフォーム全体でONNX形式のモデルを効率的に実行し、リアルタイムAIアプリケーションの推論を最適化します。

Select AIユーザーは、RAGをサポートするAIプロファイルでデータベース内のONNX形式モデルを指定できます。データベースは、Oracle AI Database 26aiおよびAutonomous AI DatabaseにONNX Runtimeを埋め込みます。データベース内ONNXランタイムを使用すると、ベクトル埋込みなど、コンテンツを外部エンジンに送信して生成できなくなります。ONNX Runtimeは、Autonomous AI Database内のトランスフォーマ・ベースのモデルのランタイム評価を強化し、開発者がONNXモデル、SQLへの高速自然言語(NL2SQL)変換、埋込みの計算、データの分類、データベース・エンジン内での推論を外部サービスに送信することなく簡単にロードできるようにします。これにより、クエリーのパフォーマンスが向上し、セキュリティ、レイテンシおよびガバナンスが向上します。詳細は、例: データベース内トランスフォーマ・モデルを使用したSelect AIおよびONNXランタイムを参照してください。

プライベート・エンドポイント

特定のサービスまたはリソースへのアクセスを制限できる、セキュアで専用の通信ポイント。プライベート・エンドポイントは、特定のサービスまたはリソースへのアクセスを制限するセキュアな専用接続を確立し、分離された通信を確保します。Select AIでは、Oracle Cloud Infrastructure(OCI)のプライベート・エンドポイントを構成して、Ollamaや仮想マシン(VM)のLlama.cppなどのプライベート・ホストLLMに接続し、Oracle Virtual Cloud Network内のAIワークロードを処理することでセキュリティ・ニーズに対応できます。この設定には、制御されたアクセスのためのジャンプ・サーバーを備えたパブリック・サブネットと、自律型AIデータベースおよびAIモデルを収容するプライベート・サブネットが含まれ、インターネットの露出を防ぎ、すべてのコンポーネントを企業の分離要件に準拠させます。詳細は、Select AIモデルのプライベート・エンドポイント・アクセスを参照してください。

検索拡張生成(RAG)

Retrieval Augmented Generation (RAG)は、ユーザーの問合せに関連する情報を取得し、その情報を大規模言語モデル(LLM)に提供してレスポンスを改善し、幻覚を軽減する手法です。

通常、RAGにはベクトル検索が含まれますが、より一般的には、SQL生成用のスキーマ・メタデータや明示的に問い合せたデータベース・コンテンツなど、データベース・コンテンツのプロンプト(手動または自動)の拡張が含まれます。他の形態の拡張には、グラフ分析や従来の機械学習などのテクノロジが含まれる場合があります。

セマンティック類似性検索

セマンティック類似性検索では、ベクトル・ストア内のフィーチャ・ベクトルを比較することで、特定の問合せに厳密に一致するデータ・ポイントを識別および取得します。

サイドカー

サイドカー・アーキテクチャを使用すると、1つのデータベースがローカル・データ・ソースとリモート・データ・ソース(OracleおよびOracle以外)の中央メタデータ・リポジトリとして機能できます。Select AIは、メタデータを活用して、ユーザーが選択したLLMに送信される拡張プロンプトを構築し、フェデレーテッドSQL問合せを生成します。サイドカーの主な利点は、データの複製や複雑なETLプロセスの必要性を排除して、データを元の場所に保持できることです。

これらのソースを自律型AIデータベースに安全にブリッジすることで、BigQuery、Redshift、マルチクラウド、オンプレミス・データベースなどの多様な外部システムへのフェデレーテッド・アクセスをサポートします。

類似度しきい値

類似度しきい値は、2つのアイテムを関連アイテムとして分類するための最小スコアを設定し、ベクトルの近接度または距離に基づいて結果をフィルタリングします。Select AIでは、類似性のしきい値は、必要なセマンティック近似レベルを下回る結果のフィルタリングに役立ち、関連するドキュメント・チャンク、行または埋込みのみが返されるようにします。

合成データ生成

Select AIのコンテキストでは、合成データ生成は、データベース・スキーマに準拠した人工データを自動的に生成する機能であり、機密データや本番データを使用せずに、開発、テスト、トレーニングまたは概念実証のシナリオ用に表を移入できます。Select AIには、合成データ・セットを生成するためのPL/SQLファンクションDBMS_CLOUD_AI.GENERATE_SYNTHETIC_DATAが用意されています。詳細は、合成データの生成を参照してください。

トランスフォーマ

ベクトル埋込み生成やテキスト生成および翻訳など、自然言語処理タスクに一般的に使用されるディープ・ラーニング・モデル・アーキテクチャの一種です。Select AIでは、トランスフォーマベースのLLMによって、ユーザー問合せをデータベース内で実行できるSQL問合せに変換できます。

ベクトル

セマンティック類似性検索のコンテキストでは、ベクトルは、単語、ドキュメント、イメージなどのデータ・ポイントのセマンティックな意味を多次元空間で取得する数学的表現です。

Select AIのコンテキストでは、ベクトルは、テキスト・コンテンツの意味を取得して、データベースからの高速セマンティック取得を可能にすることで、取得拡張生成をサポートします。

ベクトル・データベース

ベクトル埋込みを格納するデータベース。これは、効率的なセマンティック類似性検索をサポートするためにAIアプリケーションで使用されるデータ・ポイントの数学的表現です。Oracle Autonomous AI DatabaseとOracle AI Databaseは、最適化されたベクトルインデックスを備えたベクトルデータベースとして機能します。

Select AIでは、ベクトル・データベース・コンポーネント(Oracle AI Vector Searchを搭載)によって、エンタープライズ・データから生成された埋込みが索引付けされます。これにより、自然言語クエリは意味的に類似した結果を取得し、AIによる検索およびRAGワークフローの関連性を改善し、Oracle Cloud環境とシームレスに統合できます。

ベクトル距離

ベクトル距離は、多次元空間におけるフィーチャベクトル間の距離を計算することによって、フィーチャベクトル間の類似性または非類似性を測定します。

ベクトル索引

ベクトル索引は、ベクトルを編成および格納して、関連するデータの効率的な類似検索および取得を可能にします。

ベクトル・ストア

ベクトル・ストアには、ベクトル埋込みを含むセマンティック類似検索を格納、管理および有効化するシステムが含まれています。これには、スタンドアロン・ベクトル・データベースとOracle AI Database 26ai AI Vector Searchが含まれます。