פונקציות אנליטיות של מסד נתונים מאפשרות לבצע ניתוח מתקדם וניתוח כריית נתונים, למשל גילוי חריגים, קיבוץ נתונים באשכולות, דגימת נתונים וניתוח זיקה. פונקציות אנליטיות זמינות כאשר אתה מתחבר למסד נתונים של Oracle או ל-Oracle Autonomous Data Warehouse.
כדי להציג את השלב Analytics של מסד נתונים בעורך זרימת הנתונים, עליך להתחבר למסד נתונים של Oracle ו ל-Oracle Autonomous Data Warehouse.
סוגי פונקציות | תיאור |
---|---|
גילוי דינמי של חריג |
אתר חריגים בנתוני הקלט שלך ללא מודל מוגדר מראש. לדוגמה, תרצה אולי להדגיש תנועות כספיות יוצאות דופן. כאשר אתה פורס פונקציה זו עם סלי נתונים גדולים, הגדר את עמודות המחיצה באופן הממרב ביצועים. |
קיבוץ דינמי באשכולות |
קבץ את נתוני הקלט שלך באשכולות ללא מודל מוגדר מראש. לדוגמה, תרצה אולי לאפיין ולגלות פלחי לקוחות למטרות שיווק. כאשר אתה פורס פונקציה זו עם סלי נתונים גדולים, הגדר את עמודות המחיצה באופן הממרב ביצועים. |
סל פריטים שכיחים |
גלה קשרים בנתונים שלך על ידי זיהוי סלים של פריטים שמופיעים ביחד לעתים קרובות. שיטה זו של כריית נתונים ידועה גם כלמידת כללי שיוך, ניתוח זיקה או בענף הקמעונות כניתוח סל שוק. אם אתה משתמש בסל פריטים שכיחים ככלי לניתוח סל שוק, תמצא למשל שלקוחות שקונים שמפו קונים גם מייצב שער. פעולה זו צורכת משאבים רבים והביצועים שלה תלויים במספר גורמים, כמו נפח סל נתוני הקלט, קרדינליות מזהה התנועה, וקרדינליות עמודת ערכי הפריטים. כדי למנוע ירידה אפשרית בביצועים במסד הנתונים, נסה עם ערך גבוה יותר של אחוז תמיכה מזערי (ברירת המחדל היא 0.25) והקטן אותו בהדרגה כדי לאפשר יותר סלי פריטים בפלט שלך. |
דגימת נתונים |
בוחר אחוז מדגם אקראי של נתונים מטבלה. אתה פשוט מציין את אחוז הנתונים שברצונך לדגום. לדוגמה, תרצה אולי לדגום באופן אקראי עשרה אחוז מהנתונים שלך. |
טוקניזציה של טקסט |
נתח נתוני טקסט על ידי פיצולם למילים נבדלות וספירת מספר המופעים של כל מילה. כשאתה מריץ את זרימת הנתונים שלך, Oracle Analytics יוצר במסד הנתונים טבלה בשם DR$IndexName$I, שמכילה את טקסט האסימונים ופרטים הקשורים לספירת האסימונים. השתמש בטבלה DR$IndexName$I כדי ליצור סל נתונים.
החיבור למסד הנתונים שבו אתה משתמש לזרימות הנתונים שלך זקוק להרשאות מיוחדות של מסד הנתונים. וודא עם המנהלן שלך ש:
|
סדרת זמן |
סדרת זמן היא טכניקת כריית נתונים אשר חוזה את ערך היעד על סמך היסטוריה ידועה של ערכי יעד. הקלט לניתוח סדרות זמן הוא רצף של ערכי יעד. הוא מספק הערכות של ערך היעד עבור כל תקופה של חלון זמן שיכול לכלול עד 30 תקופות מעבר לנתונים ההיסטוריים. המודל גם מחשב נתונים סטטיסטיים שונים המודדים את טובת ההתאמה לנתונים היסטוריים. נתונים סטטיסטיים אלה זמינים כסל נתונים נוסף של פלט באמצעות הגדרת פרמטר. הערה: אלגוריתם סדרת הזמן זמין רק מגרסה 18c של מסד הנתונים של Oracle ואילך. |
ביטול הסיבוב על ציר (Un-pivoting) של נתונים |
סדר נתונים המאוחסנים בעמודות בפורמט שורות. לדוגמה, תרצה אולי להפוך עמודות מרובות המציגות ערך מדד הכנסה לכל שנה לעמודת הכנסה אחת עם שורות ערכים רבות לממד השנה. אתה פשוט בוחר את העמודות המדד להעברה ומציין שם לעמודה החדשה. תקבל סל נתונים חדש עם פחות עמודות ויותר שורות. |
הערה: כדי להשתמש בפונקציות אנליטיות, ודא שהמנהלן אפשר פונקציות אנליטיות (דרך הקונסולה, מערכות המערכת, ביצועים ותאימות, אפשר צומת ניתוחי מידע של מסד נתונים בזרמי נתונים).