في Oracle Analytics، يمكنك إجراء تحليل تشابه على بياناتك باستخدام مجموعة متنوعة من نماذج تضمين المتجه. يتيح لك تحليل التشابه إمكانية قياس مدى وجود كائنين أو أكثر أو مجموعات بيانات أو مستندات أو أنماط على حد سواء (متشابهة) استنادًا إلى معايير أو مقاييس محددة.
على سبيل المثال، قد تريد الإجابة عن الأسئلة مثل:
- أي من المرضى يعانون من أعراض مشابهة لمريض معين؟
- مَن العملاء الذين لديهم ملف تعريف مشابه لعميل معين؟
- أي من مطالبات التأمين متشابهة في ملف التعريف لمطالبة تأمين معينة؟
كيف يعمل؟
يدعم Oracle Database V23ai بحث المتجهات ووظائف SQL لحساب المسافة بين المتجهات المستخدمة لتحديد درجة التشابه بين سجلات البيانات. يستخدم Oracle Analytics بحث المتجهات خلف الكواليس لإجراء تحليل التشابه في مجموعات البيانات.
اعتبارات الأداء
يختلف وقت المعالجة لتحليل التشابه استنادًا إلى:
- عدد الصفوف في مجموعة البيانات المصدر لديك.
- عدد الأعمدة التي تحددها للاستخدام في تدفق بياناتك. لاحظ أنه لن يتم استخدام كل الأعمدة في مجموعة البيانات المصدر في نموذج تحليل التشابه. نوصي باستخدام ما بين 10 و15 عمودًا. يمكن أن يؤثر تحديد أكثر من 15 عمودًا سلبًا على أداء تدفق البيانات الذي تستخدمه لتطبيق النموذج.
- عدد وحدات ECPU المخصصة لمثيل Oracle Autonomous AI Lakehouse.
تشتمل تدفقات البيانات على حد انتهاء مهلة يبلغ ساعتين ونصف الساعة، مما يحدد مقدار البيانات التي يمكن معالجتها.