ユーザーの行動、入力、フィードバックはどのようにモデルに組み込まれていますか?
機械学習モデルでは、新しいデータや変更されたデータを取り込んで、ユーザーの行動と入力を毎日トレーニングします。 継続的な再トレーニングにより、モデルは使用から学習し、最適な結果を提供します。
ノート: 組織のフィードバック・データは分離され、共有モデルには組み込まれません。
また、Oracleは製品の使用状況に関するテレメトリ・データを収集し、ユーザーの行動や入力を組み込みます。次に例を示します:
- テレメトリ・メトリックを評価して、出力の最適化に必要なデータ機能およびモデル構成を決定します。 テレメトリ・データは、モデルや機能の強化につながる可能性のあるパターンの識別にも使用されます。
- テレメトリ・データは、ユーザーの行動の変化を特定するためにも使用されます。 モデルの重み付けを適応させ、ユーザーの行動表示の進化する実際のデータ・パターンに基づいて出力を最適化します。
- テレメトリ・データは、一部の出力を昇格または降格するためにも使用されます。 たとえば、推奨が「いいね」、「受け入れた」または「使用された」場合は、正のスコアが与えられ、そうでない場合は負のスコアが与えられます。 また、「いいね」ボタンをクリックするよりもパッシブなインジケータも監視します。 たとえば、自動生成されたレスポンスに対する変更の数や、暗黙的な類似または不一致の導出に使用されるタスクに費やされた時間などです。
Oracle Fusion Applications Cloudが使用する大規模言語モデル(LLM)は、それ以上のトレーニングや微調整が行われていない基本モデルです。 しかし、LLMの出力を評価してスコアを格納することで、LLMのパフォーマンスを監視します。 また、ユーザーがLLMの出力を受け入れるか変更するかも記録します。これは、ユーザーのパースペクティブからLLMのレスポンスの品質を示します。 モデルのアップグレードを検討する際に、モデルのパフォーマンスを評価します。