データ準備およびファインチューニングのガイドライン- 作成者ユーザー
Oracle Analytics AIアシスタントとのインタラクションの有効性を最大限に高めるには、次のガイドラインに従ってください。
- ローカル・サブジェクト領域の列数を制限します。 ローカル・サブジェクト領域に、ワークブックの機能コンテキストに使用された列または必要な列のみを含めます。 ワークブックで明示的に使用されていない場合でも、次の条件が満たされていれば、ワークブックのコンテキストに近いデータ列がローカル・サブジェクト領域の候補になる可能性があります。
- コンシューマ・ユーザーは、これらに関連する質問またはプロンプトを尋ねる可能性があります。
- ローカル・サブジェクト領域に追加しても、ローカル・サブジェクト領域にすでに存在する他の既存の列とのあいまいさは発生しません。
- ローカル・サブジェクト領域では、カーディナリティの高い列は避けてください。 1000を超える異なるメンバーを持つ可能性があるOrder_idまたはCustomer名を使用しないでください。 カーディナリティが高い列は、通常、索引付け時間が長くなり、最終的に「高レベルの」コンシューマ・ユーザー・プロンプトの多くに回答する際に重要な必要性がない場合があります。
- 単一のローカル・サブジェクト領域で複数の機能日付を使用しないでください。
- 可能な場合は、複数の機能日付階層ではなく、ローカル・サブジェクト領域に1つの機能日付(日付階層のセット)のみを含めます。 たとえば、オーダー日、出荷日および請求日はすべて、販売に関するサブジェクト領域の個別日付階層部分です。 ローカル・サブジェクト領域には、これらの階層の1つのみを含めることが理想的です。 複数の日付階層を持つと、Oracle Analytics AI Assistantのレスポンスがあいまいになる可能性があります。
- 1つのローカル・サブジェクト領域で複数の日付へのアクセス権をコンシューマ・ユーザーに付与する必要がある場合、コンシューマが時間関連の質問をするときに参照する機能日付タイプを常に指定する必要があります。 それ以外の場合、オーダー日オブジェクトと出荷日オブジェクトが両方ともローカル・サブジェクト領域に含まれている場合など、コンシューマ・ユーザーにとって、これは常に直感的とはかぎりません。
- メトリック集計ルールを正しく設定します。 メトリック・タイプの列は、Sum集計ルールでデフォルト設定されます。 メトリックが加算的でない場合(年齢など)は、ローカル・サブジェクト領域のデフォルトである集計ルールを「平均」に手動で上書きします。概要レベルでは、集計ルールの上書きが必要な一般的なオブジェクトは、カウント、個別カウントおよび平均です。 比率計算であるメトリックは、ローカル・サブジェクト領域に「平均」集計ルールがある分子および分母で上書きする必要があります。
- 列名と説明に注意してください。 必要に応じて、列名をよりわかりやすい値に変更します。 シノニムを追加するよりも、列名の方が効果的です。 シノニムを追加すると、適切な列名がLLM解像度に大きく影響します。
- ローカル・サブジェクト領域をライブ・データ・アクセス・モードに設定します。 これにより、ユーザー・データ・セキュリティ基準を問合せに渡すことができます。
- ローカル・サブジェクト領域に複雑な集計ルールがあるサブジェクト領域列は避けてください。 できるだけ、ローカルサブジェクトエリアで簡単な追加基準を使用してください。