RAG結果を向上させるのための再ランク付けの使用
再ランク付けモデルは、検索結果の初期セットを再評価および並替えするために主に使用されます。これにより、類似検索シナリオと検索拡張生成(RAG)シナリオの両方で検索結果の関連性と品質が向上します。
RAGシナリオでは、再ランキングは、最も関連性の高いドキュメントまたはチャンクが優先されるようにすることで、LLMに取り込まれた情報の品質を向上させる上で重要な役割を果たします。これにより、ハルシネーションを減らし、生成される出力の精度を向上させることができます。再ランク付けステップは、通常、より高速であるが精度の低い埋込みモデルを使用する初期検索の後に実行されます。再ランク付けは、特定の問合せに関する最も関連性の高い情報の識別に役立ちますが、単純なベクトルの比較を超えた高度な照合方法が採用されることが多いため、リソースに関してはよりコストがかかります。
ここでは、ユースケースに応じて、DBMS_VECTOR
またはDBMS_VECTOR_CHAIN
パッケージのRERANK
ファンクションを使用できます。
Oracle AI Vector Searchは、CohereおよびVertex AIが提供する再ランク付けモデルをサポートしています。
警告:
データベースの特定の機能により、たとえば、REST APIへのアクセスを容易にするJSON仕様を使用して、第三者によって個別に提供されるサービスにアクセスできる場合があります。
お客様によるこれらの機能の使用は、お客様自身の責任においてのみ行われ、お客様は、当該第三者サービスの使用に関連するあらゆる条件を遵守する責任を負います。第三者のサービスに関するその他の条件にかかわらず、お客様は、かかるデータベース機能の使用によって、そのリスクを受諾し、当該アクセスにより生じた一切の損害について、Oracleの責任または法的責任を明示的に除外することになります。
サードパーティの再ランク付けモデルを使用して、問合せ「What are some interesting characteristics of the Jovian satellites?
」の結果を再ランク付けするには:
前述のCohereモデルを使用すると、再ランク付けされた結果が次のように表示されます:
[
{
"index" : "0",
"score" : "0.059319142",
"content" : "Jupiter boasts an impressive system of 95 known moons, including the four largest Galilean satellites."
},
{
"index" : "2",
"score" : "0.04352814",
"content" : "Io, one of Jupiter's Galilean moons, is the most volcanically active body in our solar system."
},
{
"index" : "4",
"score" : "0.04138472",
"content" : "Jupiter's composition is similar to that of the Sun, and it could have become a brown dwarf if its mass had been 80 times greater."
}
]
関連トピック
親トピック: 検索拡張生成を使用したLLMの補完