מבט כללי לניתוח OCI Data Flow SQL (תצוגה מקדימה)

משתמשים ב-Oracle Analytics Cloud כדי לנתח נתונים מנקודות קצה SQL של זרימת נתוני OCI באחסון אובייקטים, אגמי נתונים ויישומים.

נקודות קצה SQL של זרימת נתונים מיועדות למפתחים, מדעני נתונים ואנליסטים מתקדמים על מנת לבצע שאילתות אינטראקטיבית ישירות על נתונים חיים באגם הנתונים.

היתרונות של שימוש בנקודות קצה SQL בזרימת נתונים של OCI

  • אתה יכול לנתח נפחים גדולים של נתוני אירועים וסדרה עתית במקום הנוכחי באגם הנתונים מבלי שתצטרך לזוז ולסכם אותם בשביל ביצועים.
  • אתה יכול לאחד נתונים ממספר יישומים ומאגרי נתונים (לדוגמה, בתכנון משאבי ארגון) למחסן אובייקטים ולבצע שאילתות אד-הוק ללא קשר למקור הנתונים.
  • אתה יכול לחלק עם נתונים שנשלפו וסכימה מראש ולעבוד על נתונים חיים בכל רמת פירוט. אז לא רק שאתה יכול לחסוך זמן ומאמץ בעת הכנת הנתונים, גם יש לך יכולות ניתוח חזקות יותר.
שיטות עבודה מומלצות לביצועים


  • כדי לנצל את היתרונות של מפתוח וכתיבה למטמון ברמת אשכול Spark, צור סל נתונים המבוסס על טבלה או תצוגה בודדת. יש תמיכה בסלי נתונים המבוססים על צירוף ריבוי טבלאות נתמכות, אך זה אינו מומלץ.
  • כשתגדיר תצורה לאשכול נקודות הקצה SQL של זרימת נתוני OCI, הגדר את incrementalCollect כ-true, לדוגמה:

    spark.sql.thriftServer.incrementalCollect=true;

המחשה גרפית של נתונים מנקודות קצה SQL בזרימת נתונים של OCI

בעורך חוברות העבודה של Oracle Analytics Cloud, הוסף טבלאות או קוביות מרובות של נקודות קצה SQL בזרימת נתונים של OCI. כאשר אתה בוחר טבלה או קובייה, אתה יכול להוסיף עמודות ממד ועמודות מדד לסלי הנתונים שלך לצורך ניתוח.