機械翻訳について

Select AI概念

Select AIに関連する概念と用語を確認します。

アクション

Select AIのアクションは、プロンプトを操作する際に異なる動作を実行するようにSelect AIに指示するキーワードです。 アクションを指定することで、ユーザーはSelect AIに、SQLコードの生成、チャット・プロンプトへの応答、出力のナレーション、SQL文の表示またはSQLコードの説明を行う自然言語プロンプトの処理を指示し、LLMを活用してデータベース環境内のデータを効率的に操作できます。

サポートされているSelect AIアクションについては、「AIキーワードを使用したプロンプトの入力」を参照してください。

AIエージェント

Select AI Agent Conceptsを参照してください。

AIモデル

テキスト生成、翻訳、画像認識などのタスクに使用される、大規模言語モデル(LLM)やトランスフォーマ(埋込みモデルとも呼ばれる)など、様々なタイプの人工知能モデルを包含する一般的な用語です。 AIモデルは、データに基づいてトレーニングされたプログラムであり、パターンを検出し、新しい入力に基づいて予測または意思決定を行います。 Oracleのコンテキストでは、AIモデルはOracleのサービスを介して利用できる様々な機械学習および大規模言語モデル(LLM)を具体的に指します。 詳細は、生成AIの概念を参照してください。

AIプロファイル

AIプロファイルは、使用するAIプロバイダ、および自然言語プロンプトへのレスポンスの生成に必要なメタデータおよびデータベース・オブジェクトに関するその他の詳細を含む仕様です。 「CREATE_PROFILEプロシージャ」「プロファイル属性」を参照してください。

AIプロバイダ

Select AIのAIプロバイダは、自然言語プロンプトに対するレスポンスの処理および生成のためにLLMまたはトランスフォーマ(あるいはその両方)を提供するサービス・プロバイダを指します。 これらのプロバイダは、LLMの概念で強調されたユース・ケースの自然言語を解釈および変換できるモデルを提供します。 サポートされているプロバイダについては、「AIプロバイダとLLMの選択」を参照してください。

チャットボット

自然言語でユーザーと対話するように設計されたAI搭載の会話エージェントで、多くの場合、顧客サービスや情報検索に使用されます。 Select AIのコンテキストでは、Ask Oracleチャットボットは、ユーザーが自然言語の質問をしたり、データベースやプライベート・コンテンツに裏打ちされたAI生成レスポンスを受信したりするのに役立ちます。 このUIを使用して、ユーザーは次のことができます。
  • 自然言語に関する質問をして、SQLを自動的に生成します(NL2SQL)。
  • Select AIを使用して、データベース表およびビューに対して問合せを実行します。
  • Autonomous AI Databaseに格納されたプライベート・ドキュメント・コンテンツを含めるには、Retrieval-Augmented Generation (RAG)を使用します。
  • Select AI Agentを使用して定義したエージェント・チームと対話します。

詳細は、Ask Oracleを参照してください。

クラウド・リンク

クラウド・リンクは、Oracle Cloud Infrastructureと外部クラウド・プロバイダまたはオンプレミス・ネットワークとの間にセキュアなプライベート接続を確立し、シームレスなデータ交換を容易にします。 Select AIでは、クラウド・リンクにより、Autonomous AI Databaseは、パブリック・エクスポージャなしで外部データをNL2SQLインタラクションに組み込むことができ、ユーザーは、暗号化やアクセス制御などのOracleのセキュリティ標準に準拠しながら、対話形式でハイブリッド環境にクエリを実行できるようになり、準拠したAI主導の分析を行うことができます。 詳細は、Autonomous AIデータベースでの読取り専用データ・アクセスに対するクラウド・リンクの使用を参照してください。

会話

Select AIでの会話は、ユーザーとシステム間の対話型交換を表し、ユーザーは一連の自然言語プロンプトを介してデータベースの問合せまたは対話を行うことができます。 Select AIは、セッションベースの短期的な会話を組み込み、以前のインタラクションに基づいて現在のプロンプトに対してコンテキスト対応のレスポンスを生成します。 最大10個までの以前のプロンプトが、短期的な会話で現在のリクエストに組み込まれ、LLMに送信される拡張プロンプトが作成されます。 Select AIでは、カスタマイズ可能な長期会話の使用がサポートされており、コンテキストを混在させずに様々なトピックでSelect AIを使用できます。これは、DBMS_CLOUD_AIパッケージの会話APIを介して構成できます。 Select AI Conversationsを参照してください。

データベース資格証明

データベース資格証明は、データベースへのアクセスおよび対話に使用される認証資格証明です。 通常、ユーザー名およびパスワードで構成され、セキュリティ・トークンなどの追加の認証ファクタによって補足されることがあります。 これらの資格証明は、認可された個人またはシステムのみがデータベース内に格納されているデータにアクセスして操作できるように、アプリケーションまたはユーザーとデータベース間のセキュアな接続を確立するために使用されます。

データベース・リンク

データベース・リンクは、Oracleデータベースをリモート・データベースに接続し、外部データにローカルであるかのように透過的にアクセスできるようにします。 Select AIでは、データベース・リンクがAutonomous AI DatabaseまたはオンプレミスのOracle AI Databaseと統合され、NL2SQL機能がフェデレーテッド・ソースに拡張され、オンプレミスまたは他のクラウド環境に安全に適用される自然言語クエリがサポートされます。 詳細は、CREATE DATABASE LINKおよびAutonomous AI DATABASEでのデータベース・リンクの使用を参照してください。

埋込みモデル

入力データをベクトル埋込みに変換してセマンティック関係をキャプチャするAIモデルで、言語理解や画像認識などのタスクでよく使用されます。 Select AIは、埋込みモデルを使用して、ドキュメント、表および問合せテキストの埋込みを計算します。 これらの埋め込みは、セマンティック検索、RAGワークフロー、類似性スコアリング、およびAutonomous AI Database内の関連性ランキングを強化します。

LLMのハルシネーション

大規模言語モデルの文脈におけるハルシネーションは、入力プロンプトに不正確、無意味、または無関係なテキストをモデルが生成する現象を指します。 モデルの一貫したテキスト生成の試みの結果であるにもかかわらず、これらのレスポンスには、作成、誤解を招く、または純粋に想像力のある情報を含めることができます。 ハルシネーションは、トレーニング・データの偏り、適切なコンテキスト理解の欠如、またはモデルのトレーニング・プロセスの制限のために発生します。

IAM

Oracle Cloud Infrastructure Identity and Access Management (IAM)を使用すると、クラウド・リソースにアクセスできるユーザーを制御できます。 ユーザーのグループが持つアクセスのタイプおよび特定のリソースを制御できます。 詳細は、「Identity and Access Managementの概要」を参照してください。

反復絞込み

反復的改良は、フィードバックまたは評価に基づく調整の繰り返しサイクルを通じて、ソリューションまたはモデルを徐々に改善するプロセスです。 最初の近似から始めて、ステップごとに調整し、目的の精度または結果が達成されるまで続行します。 各反復は前の反復に基づいて構築され、目標に近づくための修正または最適化が組み込まれています。

テキスト・サマリー生成では、反復絞込みは、大きなファイルまたはドキュメントの処理に役立ちます。 このプロセスは、LLMのトークン制限内に収まる管理可能なサイズのチャンクにテキストを分割し、1つのチャンクのサマリーを生成し、次のチャンクを順番に組み込むことでサマリーを改善します。

反復絞込みのユースケース:

  • 複雑なテキストや高度に相互接続されたテキストを要約する場合など、コンテキストの正確性と一貫性が重要である状況に最適です。
  • 順次処理が可能な小規模タスクに最適です。

「集計手法」を参照してください。

大規模言語モデル(LLM)

大言語モデル(LLM)とは、大量のテキスト・データに基づいてトレーニングされた高度なタイプの人工知能モデルで、トレーニング・データに応じて様々なユースケースをサポートします。 これには、人間のような言語の理解と生成、およびソフトウェア・コードとデータベース問合せが含まれます。 これらのモデルは、テキスト生成、翻訳、要約、質問回答、センチメント分析など、幅広い自然言語処理タスクを実行できます。 LLMは、通常、入力データからパターン、コンテキストおよびセマンティクスを学習する高度なディープ・ラーニング・ニューラル・ネットワーク・モデルに基づいており、一貫性のあるコンテキスト関連テキストを生成できます。

MapReduce

一般に、MapReduceプログラミング・モデルでは、タスクをMapとReduceの2つのフェーズに分割して、大量のデータを処理できます。
  • マップ: 入力データを処理し、キーと値のペアに変換します。
  • 削減: キーに基づいてマップされたデータを集計および要約します。 MapReduceは、大規模なデータ・セットのパラレル処理を実行します。

Select AI Summarizeの場合、MapReduceはテキストを複数のチャンクに分割し、それらを並行して独立して処理し、チャンクごとに個別のサマリーを生成します。 これらのサマリーは、まとめてまとめてまとめた全体的なサマリーを形成します。

マップ削減のユースケース:

  • 非常に大規模なデータ・セットやドキュメントの要約など、速度とスケーラビリティが優先される大規模なパラレル・タスクに最適です。
  • チャンク独立性が許容され、サマリーを後で集計できる状況に最適です。

「集計手法」を参照してください。

メタデータ

メタデータは、データを記述するデータです。 Select AIの場合、メタデータはデータベース・メタデータであり、データベース表およびビューの構造、編成およびプロパティを記述するデータを参照します。

データベース表およびビューの場合、メタデータには列名とタイプ、制約およびキー、ビュー定義、関係、系統、品質および鮮度インジケータ、セキュリティ分類およびアクセス・ポリシーが含まれます。 適切に管理されたメタデータにより、検出可能性、正しい使用、パフォーマンス・チューニングおよびコンプライアンスが可能になります。 Select AIは、表定義(表名、列名とそのデータ型)、およびオプションで表と列のコメント、注釈および制約を含む表メタデータでNL2SQLプロンプトを拡張します。

メタデータ・クローン

メタデータ・クローンまたはAutonomous AI Databaseクローンは、実際のデータではなく構造のみを含む、データベースまたはスキーマを定義するメタデータのコピーを作成します。 このクローンには、データ行のない表、索引、ビュー、統計、プロシージャおよびトリガーが含まれます。 開発者、テスター、またはデータベース・テンプレートの作成者は、これが役に立ちます。 さらに学習するには、Autonomous Databaseの移動またはアップグレードのクローニングを参照してください。

メタデータエンリッチメント

LLMが表と列の意図をよりよく理解し、ビジネスの意味を明確にし、より正確なSQLを生成できるように、高品質の記述、コメントおよび注釈を使用してデータベース・スキーマを拡張する手法です。 明確な意図、関係および制約により、表名または列名が適切にドキュメント化されたアセットに変わります。

含める候補者情報:

  • 表および列の説明: 目的、ビジネス定義、ユニットおよび許可される値の範囲
  • キーと関係: 主キーと外部キー、結合パス
  • データ・セマンティクス: 時間の粒度、緩やかに変化するディメンション、重複除去ルール
  • 制約と品質: nullability、一意性、検証ルール、データ鮮度
  • シノニムと別名: 技術名にマップされる一般的なビジネス用語
  • 例とパターン: サンプル値、共通フィルタまたは集計

Visual Studio Codeを介してOracle SQL Developer for VS Codeを使用してこのようなメタデータを追加する方法の詳細は、AIエンリッチメントの概要を参照してください。

自然言語プロンプト

自然言語プロンプトは、LLMの応答をガイドする、日常の人間の言語(英語など)で表される指示、質問または入力文で構成されます。 ユーザーは、コードや特殊な構文を必要とするのではなく、意図を説明する文やフレーズを入力したり、情報を要求したり、タスクを指定したりしてLLMと対話します。

たとえば:

  • 「各法人地域における前四半期の収益はいくらですか?」
  • 「育児休暇に関する社内方針は?」
  • 「この記事を要約する」。
  • 「遅延出荷を謝罪する電子メールを顧客に書き込みます。」
  • 「SQLデータベースとNoSQLデータベースの主な違いは何ですか。」

これらのプロンプトは、人間の言語に関するモデルの理解を活用して、有用でコンテキストに関連する出力を生成します。 自然言語プロンプトはLLMのユーザビリティの中心であり、技術的な専門知識を持たないユーザーが高度なAI機能にアクセスできるようにします。

ネットワーク・アクセス制御リスト(ACL)

ネットワーク・アクセス制御リストは、ルーター、ファイアウォール、ゲートウェイなどのネットワーク・デバイスを通過できるネットワーク・トラフィックを定義する一連のルールまたは権限です。 ACLは、IPアドレス、ポート番号、プロトコルなどのさまざまな条件に基づいて、受信トラフィックと送信トラフィックを制御およびフィルタリングするために使用されます。 管理者がネットワーク・トラフィックを管理および制限して、不正アクセス、潜在的な攻撃およびデータ侵害を防止できるようにすることで、ネットワーク・セキュリティにおいて重要なロールを果たします。

NL2SQL

Natural Language to SQL (NL2SQL)は、生成AIを使用して自然言語の質問をSQL文に変換します。

Select AIは、NL2SQLをアクティブに使用して、ユーザー・プロンプトを解釈し、Autonomous AI Databaseまたは接続された外部ソースに対して正しい実行可能なSQLを生成します。 これにより、ビジネス・ユーザーは「前四半期の収益を地域別に表示」のような質問をしたり、SQLの専門知識がなくても正確なSQL問合せと結果を受け取ることができます。

ONNX

ONNX(Open Neural Network Exchange)は、機械学習とディープラーニング・モデルを表すためのオープンな標準フォーマットです。 ONNXは、フレームワーク全体で機械学習モデルの表現と交換を標準化し、シームレスな導入と相互運用性を実現します。 詳細は、ONNXを参照してください。

Select AIは、ONNX形式でエクスポートされた生成AIモデルを使用して、Autonomous AI Database内で直接AIワークロードを実行したり、サポートされているランタイムを介してAIワークロードを実行したりすることで、組織はクエリ生成などの自然言語処理タスクに事前トレーニング済みモデルを活用できます。 ONNXモデルを使用することで、データに近い推論を維持し、データの移動を減らし、さまざまなツールや環境間で一貫したモデル処理を可能にすることで、コンプライアンスに準拠したAI運用を実現できます。

ONNXランタイム

ONNX Runtimeは、ハードウェア・プラットフォーム間でONNX形式のモデルを効率的に実行し、リアルタイムAIアプリケーションの推論を最適化します。

Select AIユーザーは、RAGをサポートするために、AIプロファイルにデータベース内のONNX形式モデルを指定できます。 データベースは、ONNXランタイムをOracle AI Database 26aiおよびAutonomous AI Databaseに埋め込みます。 データベース内のONNXランタイムを使用すると、外部エンジンにコンテンツを送信してベクトル埋込みなどの生成を回避できます。 ONNX Runtimeは、Autonomous AI Database内のトランスフォーマベースのモデルのランタイム評価を強化し、開発者は、外部サービスにデータを送信することなく、ONNXモデル、高速自然言語からSQLへの変換(NL2SQL)の読み込み、埋込みの計算、データの分類、データベース・エンジン内での推論の実行を容易にします。これにより、クエリのパフォーマンスが向上し、セキュリティ、レイテンシ、ガバナンスが向上します。 詳細は、例: データベース内トランスフォーマ・モデルを使用したSelect AIおよびONNXランタイムを参照してください。

プライベート・エンドポイント

特定のサービスまたはリソースへのアクセスを制限できる、セキュアで専用の通信ポイント。 プライベート・エンドポイントは、特定のサービスまたはリソースへのアクセスを制限するセキュアな専用接続を確立し、通信を分離します。 Select AIでは、組織はOracle Cloud Infrastructure (OCI)のプライベート・エンドポイントを構成して、Ollamaや仮想マシン(VM)のLlama.cppなどのプライベート・ホストLLMに接続し、Oracle Virtual Cloud Network内でAIワークロードを処理することでセキュリティのニーズに対応できます。 この設定には、制御されたアクセスのためのジャンプ・サーバーを備えたパブリック・サブネットと、Autonomous AI DatabaseおよびAIモデルを収容するプライベート・サブネットが含まれ、インターネットの露出を防ぎ、すべてのコンポーネントをエンタープライズ分離要件に準拠させ続けます。 詳細は、Select AIモデルのプライベート・エンドポイント・アクセスを参照してください。

検索拡張生成(RAG)

検索拡張生成(RAG)は、ユーザーの問合せに関連する情報を取得し、その情報を大規模言語モデル(LLM)に提供してレスポンスを改善し、ハルシネーションを減らす技術です。

ほとんどの場合、RAGはベクトル検索を伴いますが、より一般的には、SQL生成用のスキーマ・メタデータや明示的に問い合せたデータベース・コンテンツなど、データベース・コンテンツのプロンプト(手動または自動)を拡張することが含まれます。 その他の拡張形式には、グラフ・アナリティクスや従来の機械学習などのテクノロジが含まれます。

セマンティック類似性検索

セマンティック類似性検索では、ベクトル・ストア内の特徴ベクトルを比較することで、特定の問合せに厳密に一致するデータ・ポイントを識別および取得します。

Sidecar

サイドカー・アーキテクチャでは、1つのデータベースが、ローカル・データ・ソースとリモート・データ・ソース、つまりOracleと非Oracleの両方の中央メタデータ・リポジトリとして機能できます。 Select AIは、メタデータを活用して、ユーザーの選択したLLMに送信される拡張プロンプトを構築し、フェデレーテッドSQL問合せを生成します。 サイドカーの主な利点は、データを元の場所に保持できるため、データの重複や複雑なETLプロセスが不要になることです。

これらのソースをAutonomous AI Databaseに安全にブリッジすることで、BigQuery、Redshift、マルチクラウド、オンプレミス・データベースなどの多様な外部システムへのフェデレーテッド・アクセスをサポートします。

類似度しきい値

類似度しきい値は、2つのアイテムを関連として分類する最小スコアを設定し、ベクトルの近接度または距離に基づいて結果をフィルタリングします。 Select AIでは、類似度しきい値は、必要なセマンティック近接度レベルを下回る結果のフィルタ処理に役立ち、関連性の高いドキュメント・チャンク、行または埋込みのみが返されるようにします。

合成データ生成

Select AIのコンテキストでは、合成データ生成は、データベース・スキーマに準拠した人工データを自動的に生成する機能であり、機密データや本番データを使用せずに、開発、テスト、トレーニングまたは概念実証シナリオの表を移入できます。 Select AIには、合成データ・セットを生成するためのPL/SQLファンクションDBMS_CLOUD_AI.GENERATE_SYNTHETIC_DATAが用意されています。 詳細は、「合成データの生成」を参照してください。

Transformer

ベクトル埋込み生成やテキスト生成および翻訳など、自然言語処理タスクに一般的に使用されるディープ・ラーニング・モデル・アーキテクチャの一種です。 Select AIでは、トランスフォーマベースのLLMによって、データベース内で実行できるSQL問合せへのユーザー問合せの変換が促進されます。

Vector

セマンティック類似性検索のコンテキストでは、ベクトルは、単語、ドキュメント、イメージなどのデータ・ポイントのセマンティックな意味を多次元空間で取得する数学的表現です。

Select AIのコンテキストでは、ベクトルは、テキスト・コンテンツの意味を取得してデータベースからの高速セマンティック取得を可能にすることで、検索拡張生成をサポートします。

ベクトル・データベース

ベクトル埋込みを格納するデータベース。ベクトル埋込みは、効率的なセマンティック類似性検索をサポートするためにAIアプリケーションで使用されるデータ・ポイントの数学的表現です。 Oracle Autonomous AI DatabaseおよびOracle AI Databaseは、最適化されたベクトル索引を持つベクトル・データベースとして機能します。

Select AIでは、ベクトル・データベース・コンポーネント(Oracle AI Vector Searchを搭載)が、エンタープライズ・データから生成された埋込みを索引付けします。 これにより、自然言語クエリは、意味的に類似した結果を取得し、AIによる検索とRAGワークフローの関連性を向上させ、Oracle Cloud環境とのシームレスな統合を実現できます。

ベクトル距離

ベクトル距離は、多次元空間におけるそれらの間の距離を計算することによって、特徴ベクトル間の類似性または相違性を測定します。

ベクトル索引

ベクトル索引は、関連データの効率的な類似性の検索および取得を可能にするベクトルを編成および格納します。

ベクトル・ストア

ベクトル・ストアには、ベクトル埋込みを含むセマンティック類似性検索を格納、管理および有効化するシステムが含まれます。 これには、スタンドアロン・ベクトル・データベースおよびOracle AI Database 26ai AI Vector Searchが含まれます。