تتيح وظائف تحليلات قاعدة البيانات لك تنفيذ تحليلات متقدمة وتحليلات التنقيب في البيانات، على سبيل المثال، اكتشاف القيم الشاذة وتجميع البيانات وبيانات العينات وتحليل التقارب. تتوفر وظائف Analytics عند الاتصال بقاعدة بيانات Oracle أو Oracle Autonomous Data Warehouse.
للتمكن من عرض خطوة تحليلات قاعدة البيانات في محرر تدفق البيانات، يلزم الاتصال بقاعدة بيانات أوراكل أو Oracle Autonomous Data Warehouse.
أنواع الوظائف | الوصف |
---|---|
اكتشاف القيم الشاذة الديناميكية |
اكتشاف القيم الشاذة في بيانات الإدخال دون نموذج محدد مسبقًا. على سبيل المثال، قد تريد تمييز المعاملات المالية غير المعتادة. عند نشر هذه الوظيفة في مجموعات بيانات كبيرة، قم بتكوين أعمدة القسم لتعزيز الأداء للحد الأقصى. |
التجميع الديناميكي |
تجميع بيانات الإدخال دون نموذج محدد مسبقًا. على سبيل المثال، قد تريد اكتشاف شرائح العملاء وتحديدها لأغراض التسويق. عند نشر هذه الوظيفة في مجموعات بيانات كبيرة، قم بتكوين أعمدة القسم لتعزيز الأداء للحد الأقصى. |
مجموعة العناصر المتكررة |
اكتشف العلاقات في بياناتك من خلال تحديد مجموعات العناصر التي تظهر معًا غالبًا. أسلوب التنقيب عن البيانات هذا معروف أيضًا بتعليم قاعدة الاقتران، أو تحليل التقارب أو في مجال البيع التجزئة كتحليل سلة السوق. إذا استخدمت مجموعة العناصر المتكررة كأداة تحليل سلة السوق، فقد تحتاج إلى العثور على العملاء الذين يشترون الشامبو وبلسم الشعر. تستهلك هذه العملية الكثير من الموارد ويعتمد أداؤها على عدة عوامل مثل حجم مجموعة بيانات الإدخال وأصلية معرف المعاملة وأصلية عمود قيمة العنصر. لتجنب التراجع المحتمل للأداء في قاعدة البيانات، جرب استخدام قيمة أعلى للحد الأدنى لنسبة الدعم (القيمة الافتراضية 0.25) وتدريجيًا، تقليلها لتقبل المزيد من مجموعات العناصر في مخرجاتك. |
أخذ عينات البيانات |
تحديد نسبة عينة بيانات عشوائية من جدول. ما عليك سوى تحديد نسبة البيانات التي تريد أخذ عينة منها. على سبيل المثال، قد تريد أخذ عينة عشوائية بنسبة عشرة في المائة من بياناتك. |
تعيين رموز مميزة للنص |
تحليل البيانات السياقية من خلال تقسيمها إلى كلمات مميزة وعد مرات تكرار كل كلمة. عند تشغيل تدفق البيانات، يقوم Oracle Analytics بإنشاء جدول في قاعدة بيانات بالاسم DR$IndexName$I، يحتوي على نص الرمز المميز والتفاصيل المتعلقة بعدد الرموز المميزة. استخدام جدول DR$IndexName$I لتكوين مجموعة بيانات.
يتطلب اتصال البيانات الذي تستخدمه لتدفق البيانات الخاص بك امتيازات قاعدة بيانات خاصة. تأكد من المسؤول لديك:
|
السلسلة الزمنية |
السلسلة الزمنية هي أسلوب لاستخراج البيانات ويتنبأ بالقيمة الهدف بناءً على محفوظات معروفة للقيم الهدف. الإدخال في تحليل السلسلة الزمنية هو تسلسل القيم الهدف. يوفر تقديرات للقيمة الهدف لكل فترة زمنية يمكن أن تتضمن حتى 30 مدة بخلاف البيانات القديمة. كما يحسب النموذج إحصائيات متعددة تقيس ملاءمتها للبيانات القديمة. تتوفر هذه الإحصائيات كمجموعة بيانات مخرجات إضافية عبر إعداد المعلمة. ملاحظة: لا تتوفر خوارزمية السلسلة الزمنية إلا من قاعدة بيانات Oracle الإصدار 18c أو أعلى. |
تحويل البيانات لأسطر |
تحويل البيانات المخزنة في أعمدة إلى تنسيق صف. على سبيل المثال، قد تريد تحويل عدة أعمدة تعرض قيمة قياس إيرادات لكل سنة إلى عمود إيرادات واحد بعدة صفوف قيم لبعد السنة. ما عليك سوى تحديد أعمدة القياسات المطلوب تحويلها وتحديد اسم للعمود الجديد. وتحصل على مجموعة بيانات جديدة بأعمدة أقل وصفوف أكثر. |
ملاحظة: لاستخدام الوظائف التحليلية، تأكد من أن المسؤول قام بتمكين وظائف التحليلات (اطلع على وحدة التحكم وإعدادات النظام المتقدمة والأداء والتوافق وتمكين نقطة توصيل تحليلات قاعدة البيانات في تدفقات البيانات).