יצירת פרופיל הנתונים והמלצות סמנטיות

כאשר אתה יוצר סל נתונים, Oracle Analytics מבצע בניית פרופיל ברמת העמודה כדי לייצר סל של המלצות סמנטיות לתיקון או העשרת הנתונים שלך. בעת יצירת חוברות עבודה, תוכל לכלול גם העשרות ידע בהמחשות הגרפיות שלך, על-ידי הוספה שלהן מלוח הנתונים.

הערה :

העשרות ידע בדרך כלל אפשריות לפי ברירת המחדל, אולם עורכי חוברת עבודה יכולים לאפשר או לחסום אותן לסלי נתונים אם הסלים בבעלותם או אם יש להם הרשאות עריכה לסלים. Oracle Analytics לא מספק באופן אוטומטי המלצות העשרה לסלי נתונים שנוצרו מזרימת נתונים. במקרה זה, הבעלים או המנהלן של סל הנתונים חייבים קודם לאפשר את האפשרות 'העשרות ידע' לסל הנתונים. ראה אפשר העשרות ידע לסלי נתונים.

המלצות אלה מבוססות על הגילוי האוטומטי על-ידי המערכת של סוג סמנטי ספציפי במהלך שלב הפרופיל. לדוגמה, פרופילי סלי נתונים המבוססים על תחומי נושא מקומיים נוצרים באמצעות דוגמה פשוטה של N הטובים ביותר.

קיימות קטגוריות של סוגים סמנטיים כגון מיקומים גיאוגרפיים המזוהים לפי שמות ערים; תבנית ניתנות לזיהוי כגון בכרטיסי אשראי, כתובות דוא"ל ומספרי ביטוח לאומי, תאריכים וגם תבניות חוזרות. אתה יכול ליצור גם סוגים סמנטיים מותאמים אישית משלך.

קטגוריות סוגים סמנטיים

יצירת פרופיל מוחלת על סוגים סמנטיים שונים.

פרופילים של קטגוריות סוגים סמנטיים נוצרים כדי לזהות:

  • מיקומים גיאוגרפיים כמו שמות ערים.
  • תבניות ניתנות לזיהוי כמו אלה המופיעות במספרי כרטיסי אשראי או כתובות דוא"ל.
  • תבניות חוזרות כמו נתוני ביטויים מחוברים במקפים.

המלצות מסוג סמנטי

המלצות לתיקון, שיפור או העשרה של סל הנתונים נקבעות לפי סוג הנתונים.

דוגמאות להמלצות על סוגים סמנטיים:

  • העשרות - הוספה לנתונים שלך של עמודה חדשה המתאימה לסוג ספציפי שהתגלה, כגון מיקום גיאוגרפי. לדוגמה, הוספת נתוני אוכלוסייה של עיר.
  • שרשורי עמודות - כאשר בסל הנתונים מתגלות שתי עמודות, אחת המכילה שמות פרטיים ושנייה המכילה שמות משפחה, המערכת ממליצה על שרשור השמות לעמודה אחת. לדוגמה, עמודת שם פרטי ושם משפחה.
  • חילוצים סמנטיים - כאשר סוג סמנטי מורכב מתת-סוגים, לדוגמה מספר טלפון בארה"ב שמכיל את אזור החיוג, המערכת ממליצה לחלץ את תת הסוג לעמודה משלו.
  • חילוץ חלק - כאשר בנתונים מתגלה מפריד תבנית כללי, המערכת ממליצה לחלץ חלקים מהתבנית. למשל, אם המערכת מגלה בנתונים שימוש חוזר במקפים לחיבור חלקים, היא ממליצה לחלץ את החלקים לעמודות נפרדות כדי להקל על ניתוח הנתונים.
  • חילוצי תאריכים - כאשר מתגלים תאריכים, המערכת ממליצה לחלץ חלקים של התאריך שעשויים להוסיף לניתוח הנתונים. לדוגמה, תוכל לחלץ את נתוני היום בשבוע מחשבונית או מתאריך רכישה.
  • ערפול/מיסוך/מחיקה מלאים וחלקיים - כאשר מתגלים שדות רגישים כגון מספר כרטיס אשראי, המערכת ממליצה על מיסוך מלא או חלקי של העמודה, או אפילו הסרה.

סוגים סמנטיים מבוססי-תבנית מזוהה

סוגים סמנטיים מזוהים על סמך תבניות שקיימות בנתונים שלך.

המלצות מסופקות לסוגים הסמנטיים הבאים:

  • תאריכים (ביותר מ-30 פורמטים)
  • מספרי ביטוח סוציאלי של ארה"ב (SSN)
  • מספרי כרטיסי אשראי
  • תכונות כרטיסי אשראי (קוד ביטחון CVV ותאריך תפוגה)
  • כתובות דוא"ל
  • מספרי טלפון של התוכנית הצפון-אמריקאית
  • כתובות בארה"ב

סוגים סמנטיים המבוססים על הפניה

הכרת סוגים סמנטיים נקבעת לפי ידע טעון של הפניה שסופק עם השירות.

המלצות מבוססות-הפניה מסופקות לסוגים הסמנטיים הבאים:

  • שמות ארצות
  • קודי ארצות
  • שמות מדינות (פרובינציות)
  • קודי מדינות
  • שמות מחוזות (תחומי שיפוט)
  • שמות ערים (שמות מקומיים)
  • מספרי מיקוד

העשרות מומלצות

העשרות מומלצות מבוססות על הסוגים הסמנטיים.

העשרות נקבעות בהתבסס על היררכיית המיקומים הגיאוגרפיים:

  • ארץ
  • פרובינציה (מדינה)
  • תחום שיפוט (מחוז)
  • קו אורך
  • קו רוחב
  • אוכלוסייה
  • גובה (במטרים)
  • אזור זמן
  • קודי ארצות לפי ISO
  • Federal Information Processing Series (FIPS)
  • שם ארץ
  • עיר בירה
  • יבשת
  • מזהי שמות גיאוגרפיים
  • שפות מדוברות
  • קידומת בינלאומית
  • פורמט מיקוד
  • תבנית מיקוד
  • קידומת בינלאומית
  • שם מטבע
  • קיצור מטבע
  • דומיין רמה עליונה גיאוגרפי (GeoTLD)
  • ק"מ רבוע

ספים דרושים

תהליך יצירת הפרופיל עושה שימוש בספים ספציפיים כדי לקבל החלטות לגבי סוגים סמנטיים ספציפיים.

ככלל אצבע, 85% מערכי הנתונים בעמודה חייבים לעמוד בקריטריונים לסוג סמנטי יחיד כדי שהמערכת תבצע את קביעת הסיווג. כתוצאה מכך, עמודה שמכילה 70% שמות פרטיים ו-30% 'אחרים' לא עומדת בדרישות הסף ולכן אין המלצות.

המלצות לידע מותאם אישית

השתמש בהמלצות על ידע מותאם אישית לשיפור ידע מערכת ה-Oracle Analytics. ידע מותאם אישית מאפשר למגדיר הפרופיל הסמנטי של Oracle Analytics לזהות יותר סוגים סמנטיים ייחודיים לעסק ולתת המלצות העשרה יותר רלוונטיות ומפוקחות.. למשל, אתה יכול להוסיף הפניה לידע מותאם אישית שמסווגות תרופות מרשם בקטגוריות ה-USP 'משככי כאבים' או א'ופיאויד'.

איקון מערך הדרכה הדרכה

בקש מהמנהלן שלך לטעון קובצי ידע מותאם אישית ל-Oracle Analytics. כאשר מעשירים סלי נתונים, Oracle Analytics מציג המלצות העשרה המבוססות על נתונים סמנטיים אלה. בעת יצירת חוברות עבודה, תוכל לכלול גם העשרות ידע בהמחשות הגרפיות שלך, על-ידי הוספה שלהן מלוח הנתונים.

יצירת קובצי ידע מותאם אישית משלך

בעת יצירת קבצים סמנטיים, פעל בהתאם להנחיות הבאות:

  • צור קובץ נתונים בפורמט CSV או Microsoft Excel (XLSX). גודל הקובץ המקסימלי שאתה יכול להעלות הוא 250 MB.
  • אכלס את העמודה הראשונה עם המפתח בו משתמש Oracle Analytics לקביעת פרופיל הנתונים. לדוגמה, המפתח יכול להיות תאריך עם הפירוט של היום כדי לאפשר ניתוח נתונים לפי שנת כספים.
  • אכלס את העמודות האחרות עם ערכי ההעשרה.

בקש מהמנהלן שלך לטעון את קובץ הידע המותאם אישית שלך ל-Oracle Analytics.

דוגמה - שילוב מסגרות זמן עסקיות בנתונים שלך

דוגמה זו ממחישה כיצד תוכל להוסיף מסגרות זמן עסקיות לנתוני מכירות ולאפשר ניתוח של מכירות לפי שנת כספים אם סל הנתונים המקורי לא מכיל נתונים כספיים.

ההמחשה הגרפית לדוגמה מראה מכירות לפי רבעון בשנים 2019, 2020, 2021, 2022 ו-2023, כאשר כל שנה מיוצגת בצבע אחר. אין לך נתונים כספיים בנתוני המכירות המקוריים שלך, לכן עליך לפרוס ידע מותאם אישית נוסף כדי להוסיף נתונים כספיים לערכת הנתונים שלך.

ראשית, אתה מכין נתונים כספיים בקובץ כספי Calendar.xlsx. הקובץ שלך מכיל תאריך (dd-mm-yyyy), שנת כספים, חודש כספים ושבוע כספים. לדוגמה, קובץ המקור שלך יכול לכלול 01-23-2025 בעמודת התאריך, 2025 בעמודת שנת הכספים והתכונות להשלמת העמודות הנותרות.

בקש מהמנהלן לטעון את Fiscal Calendar.xlsx לאזור הידע המותאם אישית בקונסולה.

לאחר מכן אתה יוצר סל נתונים המכיל מכירות ו-ORDER_DATE, ובעורך סל הנתונים בחר העשר את ORDER_DATE עם שנת כספים והעשר את ORDER_DATE עם חודש כספים בהמלצות ההעשרה. Oracle Analytics מוסיף את שתי ההעשרות האלו לסל הנתונים.

לבסוף, אתה יוצר חוברת עבודה ומוסיף שנת כספים ורבעון כספים (תחת ORDER_DATE) ומכירות להמחשה גרפית. הערה: באפשרותך להוסיף שנת כספים ורבעון כספים ישירות מבלי להוסיף את העמודה המקורית ORDER_DATE.