פונקציות אנליטיות של מסד נתונים

פונקציות אנליטיות של מסד נתונים מאפשרות לבצע ניתוח מתקדם וניתוח כריית נתונים, למשל גילוי חריגים, קיבוץ נתונים באשכולות, דגימת נתונים וניתוח זיקה. פונקציות אנליטיות זמינות כאשר אתה מתחבר למסד נתונים של Oracle או ל-Oracle Autonomous Data Warehouse.

איקון מערך הדרכה LiveLabs Sprint

כדי להציג את השלב Analytics של מסד נתונים בעורך זרימת הנתונים, עליך להתחבר למסד נתונים של Oracle ו ל-Oracle Autonomous Data Warehouse.

סוגי פונקציות תיאור

גילוי דינמי של חריג

אתר חריגים בנתוני הקלט שלך ללא מודל מוגדר מראש. לדוגמה, תרצה אולי להדגיש תנועות כספיות יוצאות דופן.

כאשר אתה פורס פונקציה זו עם סלי נתונים גדולים, הגדר את עמודות המחיצה באופן הממרב ביצועים.

קיבוץ דינמי באשכולות

קבץ את נתוני הקלט שלך באשכולות ללא מודל מוגדר מראש. לדוגמה, תרצה אולי לאפיין ולגלות פלחי לקוחות למטרות שיווק.

כאשר אתה פורס פונקציה זו עם סלי נתונים גדולים, הגדר את עמודות המחיצה באופן הממרב ביצועים.

סל פריטים שכיחים

גלה קשרים בנתונים שלך על ידי זיהוי סלים של פריטים שמופיעים ביחד לעתים קרובות. שיטה זו של כריית נתונים ידועה גם כלמידת כללי שיוך, ניתוח זיקה או בענף הקמעונות כניתוח סל שוק. אם אתה משתמש בסל פריטים שכיחים ככלי לניתוח סל שוק, תמצא למשל שלקוחות שקונים שמפו קונים גם מייצב שער.

פעולה זו צורכת משאבים רבים והביצועים שלה תלויים במספר גורמים, כמו נפח סל נתוני הקלט, קרדינליות מזהה התנועה, וקרדינליות עמודת ערכי הפריטים. כדי למנוע ירידה אפשרית בביצועים במסד הנתונים, נסה עם ערך גבוה יותר של אחוז תמיכה מזערי (ברירת המחדל היא 0.25) והקטן אותו בהדרגה כדי לאפשר יותר סלי פריטים בפלט שלך.

דגימת נתונים

בוחר אחוז מדגם אקראי של נתונים מטבלה. אתה פשוט מציין את אחוז הנתונים שברצונך לדגום. לדוגמה, תרצה אולי לדגום באופן אקראי עשרה אחוז מהנתונים שלך.

טוקניזציה של טקסט

נתח נתוני טקסט על ידי פיצולם למילים נבדלות וספירת מספר המופעים של כל מילה. כשאתה מריץ את זרימת הנתונים שלך, Oracle Analytics יוצר במסד הנתונים טבלה בשם DR$IndexName$I, שמכילה את טקסט האסימונים ופרטים הקשורים לספירת האסימונים. השתמש בטבלה DR$IndexName$I כדי ליצור סל נתונים.

  • תחת ערכי פלט, השתמש באפשרות צור ליד כל שדה כדי לבחור את העמודות שיש למפתח.

  • תחת פרמטרים, אחר כך עמודת טקסט, לחץ על בחר עמודה כדי לבחור את השדה שאתה רוצה לפרק למילים נפרדות. השתמש באפשרויות מספר<עמודות לייחוס> כדי לכלול עמודה אחת או יותר בסל הנתונים פלט.

החיבור למסד הנתונים שבו אתה משתמש לזרימות הנתונים שלך זקוק להרשאות מיוחדות של מסד הנתונים. וודא עם המנהלן שלך ש:
  • לחשבון מסד הנתונים שלך יש הענק EXECUTE על CTXSYS.CTX_DDL לשם סכמה.
  • אתה משתמש בחיבור ל-Oracle Analytics עם אותו שם משתמש כמו הסכמה שבה קיימת טבלת המקור. זוהי הדרך המומלצת למניעת בעיות של הרשאת גישה כאשר זרימת הנתונים רצה.
  • לעמודת טבלת הנתונים שאתה מנתח אין אינדקס CONTEXT קיים. אם ישנו אינדקס CONTEXT קיים בטבלת מסד הנתונים שאתה מנתח, הסר אינדקס זה לפני שאתה מריץ את זרימת הנתונים של טוקניזציית טקסט.

סדרת זמן

סדרת זמן היא טכניקת כריית נתונים אשר חוזה את ערך היעד על סמך היסטוריה ידועה של ערכי יעד. הקלט לניתוח סדרות זמן הוא רצף של ערכי יעד. הוא מספק הערכות של ערך היעד עבור כל תקופה של חלון זמן שיכול לכלול עד 30 תקופות מעבר לנתונים ההיסטוריים.

המודל גם מחשב נתונים סטטיסטיים שונים המודדים את טובת ההתאמה לנתונים היסטוריים. נתונים סטטיסטיים אלה זמינים כסל נתונים נוסף של פלט באמצעות הגדרת פרמטר.

הערה: אלגוריתם סדרת הזמן זמין רק מגרסה 18c של מסד הנתונים של Oracle ואילך.

ביטול הסיבוב על ציר (Un-pivoting) של נתונים

סדר נתונים המאוחסנים בעמודות בפורמט שורות. לדוגמה, תרצה אולי להפוך עמודות מרובות המציגות ערך מדד הכנסה לכל שנה לעמודת הכנסה אחת עם שורות ערכים רבות לממד השנה. אתה פשוט בוחר את העמודות המדד להעברה ומציין שם לעמודה החדשה. תקבל סל נתונים חדש עם פחות עמודות ויותר שורות.

הערה: כדי להשתמש בפונקציות אנליטיות, ודא שהמנהלן אפשר פונקציות אנליטיות (דרך הקונסולה, מערכות המערכת, ביצועים ותאימות, אפשר צומת ניתוחי מידע של מסד נתונים בזרמי נתונים).