وظائف تحليلات قاعدة البيانات

تتيح وظائف تحليلات قاعدة البيانات لك تنفيذ تحليلات متقدمة وتحليلات التنقيب في البيانات، على سبيل المثال، اكتشاف القيم الشاذة وتجميع البيانات وبيانات العينات وتحليل التقارب. تتوفر وظائف Analytics عند الاتصال بقاعدة بيانات Oracle أو Oracle Autonomous Data Warehouse.

أيقونة مادة تعليمية LiveLabs Sprint

للتمكن من عرض خطوة تحليلات قاعدة البيانات في محرر تدفق البيانات، يلزم الاتصال بقاعدة بيانات أوراكل أو Oracle Autonomous Data Warehouse.

أنواع الوظائف الوصف

اكتشاف القيم الشاذة الديناميكية

اكتشاف القيم الشاذة في بيانات الإدخال دون نموذج محدد مسبقًا. على سبيل المثال، قد تريد تمييز المعاملات المالية غير المعتادة.

عند نشر هذه الوظيفة في مجموعات بيانات كبيرة، قم بتكوين أعمدة القسم لتعزيز الأداء للحد الأقصى.

التجميع الديناميكي

تجميع بيانات الإدخال دون نموذج محدد مسبقًا. على سبيل المثال، قد تريد اكتشاف شرائح العملاء وتحديدها لأغراض التسويق.

عند نشر هذه الوظيفة في مجموعات بيانات كبيرة، قم بتكوين أعمدة القسم لتعزيز الأداء للحد الأقصى.

مجموعة العناصر المتكررة

اكتشف العلاقات في بياناتك من خلال تحديد مجموعات العناصر التي تظهر معًا غالبًا. أسلوب التنقيب عن البيانات هذا معروف أيضًا بتعليم قاعدة الاقتران، أو تحليل التقارب أو في مجال البيع التجزئة كتحليل سلة السوق. إذا استخدمت مجموعة العناصر المتكررة كأداة تحليل سلة السوق، فقد تحتاج إلى العثور على العملاء الذين يشترون الشامبو وبلسم الشعر.

تستهلك هذه العملية الكثير من الموارد ويعتمد أداؤها على عدة عوامل مثل حجم مجموعة بيانات الإدخال وأصلية معرف المعاملة وأصلية عمود قيمة العنصر. لتجنب التراجع المحتمل للأداء في قاعدة البيانات، جرب استخدام قيمة أعلى للحد الأدنى لنسبة الدعم (القيمة الافتراضية 0.25) وتدريجيًا، تقليلها لتقبل المزيد من مجموعات العناصر في مخرجاتك.

أخذ عينات البيانات

تحديد نسبة عينة بيانات عشوائية من جدول. ما عليك سوى تحديد نسبة البيانات التي تريد أخذ عينة منها. على سبيل المثال، قد تريد أخذ عينة عشوائية بنسبة عشرة في المائة من بياناتك.

تعيين رموز مميزة للنص

تحليل البيانات السياقية من خلال تقسيمها إلى كلمات مميزة وعد مرات تكرار كل كلمة. عند تشغيل تدفق البيانات، يقوم Oracle Analytics بإنشاء جدول في قاعدة بيانات بالاسم DR$IndexName$I، يحتوي على نص الرمز المميز والتفاصيل المتعلقة بعدد الرموز المميزة. استخدام جدول DR$IndexName$I لتكوين مجموعة بيانات.

  • في المخرجات، استخدم خيار إنشاء بالقرب من كل حقل لتحديد الأعمدة المطلوب فهرستها.

  • في المعلمات، ثم نص العمود، انقر على تحديد عمود لتحديد الحقل الذي تريد تقسيمه إلى كلمات منفصلة. استخدم خيارات رقم العمود المرجعي<> لتضمين عمود أو أكثر في مجموعة بيانات المخرجات. استخدم خيار استخدام معجم اللغة الخاص لتحديد اللغات الخاصة مثل الصينية والدنماركية والإنجليزية والفنلندية والألمانية والنرويجية واليابانية والكورية والسويدية للمعاجم الخاصة. اطلع على وثائق Oracle database لمزيد من التفاصيل حول اللغات المدعومة.

يتطلب اتصال البيانات الذي تستخدمه لتدفق البيانات الخاص بك امتيازات قاعدة بيانات خاصة. تأكد من المسؤول لديك:
  • أن حساب قاعدة البيانات الخاص بك يضمن منح EXECUTE في CTXSYS.CTX_DDL لاسم مخطط قاعدة البيانات.
  • أنك تستخدم اتصال Oracle Analytics باسم المستخدم ذاته مثل المخطط حيث يوجد جدول المصدر. هذه هي أفضل ممارسة لتجنب مشاكل الامتيازات عند تشغيل تدفق البيانات.
  • عمود جدول قاعدة البيانات الذي تقوم بتحليله لا يحتوي على فهرس CONTEXT حالٍ. في حالة وجود فهرس CONTEXT في جدول قاعدة البيانات الذي تقوم بتحليله، قم بإزالة هذا الفهرس قبل تشغيل تدفق بيانات تعيين رموز مميزة للنص.

السلسلة الزمنية

السلسلة الزمنية هي أسلوب لاستخراج البيانات ويتنبأ بالقيمة الهدف بناءً على محفوظات معروفة للقيم الهدف. الإدخال في تحليل السلسلة الزمنية هو تسلسل القيم الهدف. يوفر تقديرات للقيمة الهدف لكل فترة زمنية يمكن أن تتضمن حتى 30 مدة بخلاف البيانات القديمة.

كما يحسب النموذج إحصائيات متعددة تقيس ملاءمتها للبيانات القديمة. تتوفر هذه الإحصائيات كمجموعة بيانات مخرجات إضافية عبر إعداد المعلمة.

ملاحظة: لا تتوفر خوارزمية السلسلة الزمنية إلا من قاعدة بيانات Oracle الإصدار 18c أو أعلى.

تحويل البيانات لأسطر

تحويل البيانات المخزنة في أعمدة إلى تنسيق صف. على سبيل المثال، قد تريد تحويل عدة أعمدة تعرض قيمة قياس إيرادات لكل سنة إلى عمود إيرادات واحد بعدة صفوف قيم لبعد السنة. ما عليك سوى تحديد أعمدة القياسات المطلوب تحويلها وتحديد اسم للعمود الجديد. وتحصل على مجموعة بيانات جديدة بأعمدة أقل وصفوف أكثر.

ملاحظة: لاستخدام الوظائف التحليلية، تأكد من أن المسؤول قام بتمكين وظائف التحليلات (اطلع على وحدة التحكم وإعدادات النظام المتقدمة والأداء والتوافق وتمكين نقطة توصيل تحليلات قاعدة البيانات في تدفقات البيانات).