慎重な索引付けとデータの整理により、Oracle Analytics AIアシスタントからの結果を改善できます。
Oracle Analytics AIアシスタントは、大規模言語モデル(LLM)を搭載しています。LLMは、数値よりもテキストを理解する方が適切であるため、データセット内のnull値を「不明」や「使用できません」などの意味のあるテキストに変更します。顧客を総売上に基づくグループにビン化したり、オーダー金額を小、中、大の範囲にビン化するなど、数値をビン化することで結果を最適化することもできます。データ準備時のビン列の作成を参照してください。
Oracle Analyticsからの提案でデータをエンリッチおよび変換すると、アシスタントにより優れたコンテキストを提供できます。たとえば、数値の日付から曜日を抽出するデータ部分抽出を含めるようにデータセットを変換すると、アシスタントは、「2024年のすべての金曜日の売上を表示する」のようなプロンプトにより正確に応答できます。データのエンリッチおよび変換を参照してください。
読む人が理解できる明白な列名を指定し、重複名を避け、シノニムを活用することで、索引付けされたデータのあいまいさを低減できます。たとえば、多くの場合、データセットには複数の日付フィールド(発注日、出荷日、請求日)があります。これは、「月別の売上を表示する」などの質問がされたときに混乱の原因となる可能性があります。これを回避するには、デフォルトの日付として割り当てる列に「日付」というシノニムを作成します。データセット列のシノニムの指定を参照してください。
データを索引付けする場合は、索引付けする列を慎重に選択します。メトリック、地域、日付など、インサイトとビジュアライゼーションを提供するようにアシスタントに依頼する可能性が最も高い列を検討します。顧客ID、SKU、住所などのカーディナリティの高い列は、アシスタントのインサイトを強化せずに複雑さを増す可能性があるため、索引付けしないでください。まず、データセットを索引付けするときに「推奨索引設定の使用」を選択し、そこから検索索引を最適化するために個々の列の選択を絞り込みます。推奨インデックス設定についてを参照してください。