העשרה וטרנספורמציה של הפניה

מידע לייחוס זה יעזור לך להעשיר את הנתונים שלך ולבצע בהם טרנספורמציה.

בצע טרנספורמיצה להפניה

גלה על אפשרויות טרנספורמיצה שאליהם אתה יכול לגשת בעורך הטרנספורמציה על-ידי לחיצה ימנית על עמודת סל נתונים. לדוגמה, כדי לסווג זמני הקפה של מירוץ בעמודת סל נתונים, תוכל ללחוץ לחיצה ימנית על העמודה 'זמן הקפה' ולבחור תיבה.

אפשרות תיאור
חלק לתאים יוצר קבוצות מותאמות אישית משלך לטווחי מספרים. למשל, תוכל ליצור תאים לעמודה 'גיל' עם טווחי גיל מחולקים לתאים טרום-בגרות, צעיר, מבוגר או קשיש על בסיס דרישות מותאמות אישית.
המר לתאריך משנה את סוג הנתונים של העמודה לתאריך ומוחק מהעמודה כל ערך שאינו תאריך.
המר למספר משנה את סוג הנתונים של העמודה למספר, מה שמוחק מהעמודה כל ערך שאינו מספר.
המר לטקסט הופך את סוג הנתונים של עמודה לטקסט.
צור יוצר עמודה המבוססת על פונקציה.
שכפל יוצר עמודה עם תוכן זהה לזה של העמודה שנבחרה.
ערוך ערוך את העמודה. לדוגמה, תוכל לשנות את השם, לבחור עמודה אחרת או לעדכן פונקציות.
קבוצה, קבוצת תנאי בחר קבץ כדי ליצור קבוצות מותאמות אישית משלך. לדוגמה, תוכל לקבץ מדינות יחד עם אזורי מכס, ותוכל לסווג סכומי כסף בקבוצות המציינות קטנים, בינוניים וגדולים.
הסתר מסתירה את העמודה בלוח נתונים ובהמחשות הגרפיות. אם ברצונך לראות את העמודות המוסתרות, לחץ על עמודות מוסתרות (איקון רפאים) בכותרת התחתונה של הדף. תוכל אז לבטל את ההסתרה של עמודות יחידות או לבטל את ההסתרה של כולן בבת אחת.
לוגריתם מחשב את הלוגריתם הטבעי של ביטוי.
אותיות קטנות מעדכן את התוכן של עמודה עם הערכים באותיות קטנות בלבד.
חזקה מעלה את הערכים של עמודה לחזקה שאתה מציין. ברירת המחדל לחזקה היא 2.
שנה שם מאפשר לך לשנות את השם של עמודה כלשהי.
החלף הופך טקסט ספציפי בעמודה שנבחרה לערך כלשהו שאתה מציין. למשל, תוכל לשנות את כל המופעים של מר בעמודה לאדון..
אות רישית בתחילת משפט מעדכן את התוכן של עמודה כך שהאות הראשונה במילה הראשונה של משפט תהיה רישית.
פצל מפצל ערך עמודה ספציפי לחלקים. למשל, תוכל לפצל עמודה בשם 'שם' לשם פרטי ושם משפחה.
שורש ריבועי יוצר עמודה המאוכלסת בשורש הריבועי של הערך בעמודה שנבחרה.
אותיות רישיות מעדכן את התוכן של עמודה עם הערכים באותיות רישיות בלבד.

יצירת פרופיל הנתונים והמלצות סמנטיות

כאשר אתה יוצר סל נתונים, Oracle Analytics מבצע בניית פרופיל ברמת העמודה כדי לייצר סל של המלצות סמנטיות לתיקון או העשרת הנתונים שלך. בעת יצירת חוברות עבודה, תוכל לכלול גם העשרות ידע בהמחשות הגרפיות שלך, על-ידי הוספה שלהן מלוח הנתונים.

המלצות אלה מבוססות על הגילוי האוטומטי על-ידי המערכת של סוג סמנטי ספציפי במהלך שלב הפרופיל. לדוגמה, פרופילי סלי נתונים המבוססים על תחומי נושא מקומיים נוצרים באמצעות דוגמה פשוטה של N הטובים ביותר.

קיימות קטגוריות של סוגים סמנטיים כגון מיקומים גיאוגרפיים המזוהים לפי שמות ערים; תבנית ניתנות לזיהוי כגון בכרטיסי אשראי, כתובות דוא"ל ומספרי ביטוח לאומי, תאריכים וגם תבניות חוזרות. אתה יכול ליצור גם סוגים סמנטיים מותאמים אישית משלך.

קטגוריות סוגים סמנטיים

יצירת פרופיל מוחלת על סוגים סמנטיים שונים.

פרופילים של קטגוריות סוגים סמנטיים נוצרים כדי לזהות:

  • מיקומים גיאוגרפיים כמו שמות ערים.
  • תבניות ניתנות לזיהוי כמו אלה המופיעות במספרי כרטיסי אשראי או כתובות דוא"ל.
  • תבניות חוזרות כמו נתוני ביטויים מחוברים במקפים.

המלצות מסוג סמנטי

המלצות לתיקון, שיפור או העשרה של סל הנתונים נקבעות לפי סוג הנתונים.

דוגמאות להמלצות על סוגים סמנטיים:

  • העשרות - הוספה לנתונים שלך של עמודה חדשה המתאימה לסוג ספציפי שהתגלה, כגון מיקום גיאוגרפי. לדוגמה, הוספת נתוני אוכלוסייה של עיר.
  • שרשורי עמודות - כאשר בסל הנתונים מתגלות שתי עמודות, אחת המכילה שמות פרטיים ושנייה המכילה שמות משפחה, המערכת ממליצה על שרשור השמות לעמודה אחת. לדוגמה, עמודת שם פרטי ושם משפחה.
  • חילוצים סמנטיים - כאשר סוג סמנטי מורכב מתת-סוגים, לדוגמה מספר טלפון בארה"ב שמכיל את אזור החיוג, המערכת ממליצה לחלץ את תת הסוג לעמודה משלו.
  • חילוץ חלק - כאשר בנתונים מתגלה מפריד תבנית כללי, המערכת ממליצה לחלץ חלקים מהתבנית. למשל, אם המערכת מגלה בנתונים שימוש חוזר במקפים לחיבור חלקים, היא ממליצה לחלץ את החלקים לעמודות נפרדות כדי להקל על ניתוח הנתונים.
  • חילוצי תאריכים - כאשר מתגלים תאריכים, המערכת ממליצה לחלץ חלקים של התאריך שעשויים להוסיף לניתוח הנתונים. לדוגמה, תוכל לחלץ את נתוני היום בשבוע מחשבונית או מתאריך רכישה.
  • ערפול/מיסוך/מחיקה מלאים וחלקיים - כאשר מתגלים שדות רגישים כגון מספר כרטיס אשראי, המערכת ממליצה על מיסוך מלא או חלקי של העמודה, או אפילו הסרה.

סוגים סמנטיים מבוססי-תבנית מזוהה

סוגים סמנטיים מזוהים על סמך תבניות שקיימות בנתונים שלך.

המלצות מסופקות לסוגים הסמנטיים הבאים:

  • תאריכים (ביותר מ-30 פורמטים)
  • מספרי ביטוח סוציאלי של ארה"ב (SSN)
  • מספרי כרטיסי אשראי
  • תכונות כרטיסי אשראי (קוד ביטחון CVV ותאריך תפוגה)
  • כתובות דוא"ל
  • מספרי טלפון של התוכנית הצפון-אמריקאית
  • כתובות בארה"ב

סוגים סמנטיים המבוססים על הפניה

הכרת סוגים סמנטיים נקבעת לפי ידע טעון של הפניה שסופק עם השירות.

המלצות מבוססות-הפניה מסופקות לסוגים הסמנטיים הבאים:

  • שמות ארצות
  • קודי ארצות
  • שמות מדינות (פרובינציות)
  • קודי מדינות
  • שמות מחוזות (תחומי שיפוט)
  • שמות ערים (שמות מקומיים)
  • מספרי מיקוד

העשרות מומלצות

העשרות מומלצות מבוססות על הסוגים הסמנטיים.

העשרות נקבעות בהתבסס על היררכיית המיקומים הגיאוגרפיים:

  • ארץ
  • פרובינציה (מדינה)
  • תחום שיפוט (מחוז)
  • קו אורך
  • קו רוחב
  • אוכלוסייה
  • גובה (במטרים)
  • אזור זמן
  • קודי ארצות לפי ISO
  • Federal Information Processing Series (FIPS)
  • שם ארץ
  • עיר בירה
  • יבשת
  • מזהי שמות גיאוגרפיים
  • שפות מדוברות
  • קידומת בינלאומית
  • פורמט מיקוד
  • תבנית מיקוד
  • קידומת בינלאומית
  • שם מטבע
  • קיצור מטבע
  • דומיין רמה עליונה גיאוגרפי (GeoTLD)
  • ק"מ רבוע

ספים דרושים

תהליך יצירת הפרופיל עושה שימוש בספים ספציפיים כדי לקבל החלטות לגבי סוגים סמנטיים ספציפיים.

ככלל אצבע, 85% מערכי הנתונים בעמודה חייבים לעמוד בקריטריונים לסוג סמנטי יחיד כדי שהמערכת תבצע את קביעת הסיווג. כתוצאה מכך, עמודה שמכילה 70% שמות פרטיים ו-30% 'אחרים' לא עומדת בדרישות הסף ולכן אין המלצות.

המלצות לידע מותאם אישית

השתמש בהמלצות על ידע מותאם אישית לשיפור ידע מערכת ה-Oracle Analytics. ידע מותאם אישית מאפשר למגדיר הפרופיל הסמנטי של Oracle Analytics לזהות יותר סוגים סמנטיים ייחודיים לעסק ולתת המלצות העשרה יותר רלוונטיות ומפוקחות.. למשל, אתה יכול להוסיף הפניה לידע מותאם אישית שמסווגות תרופות מרשם בקטגוריות ה-USP 'משככי כאבים' או א'ופיאויד'.

איקון מערך הדרכה הדרכה

אתה יכול להשתמש בקבצים סמנטיים קיימים כמו קובצי Unsupervised Semantic Parsing (USP), ואתה גם יכול ליצור קבצים סמנטיים משלך. בקש מהמנהלן שלך לטעון קובצי ידע מותאם אישית ל-Oracle Analytics. כאשר מעשירים סלי נתונים, Oracle Analytics מציג המלצות העשרה המבוססות על נתונים סמנטיים אלה. בעת יצירת חוברות עבודה, תוכל לכלול גם העשרות ידע בהמחשות הגרפיות שלך, על-ידי הוספה שלהן מלוח הנתונים.

יצירת קובצי ידע מותאם אישית משלך

בעת יצירת קבצים סמנטיים משלך, פעל בהתאם להנחיות הבאות:

  • צור קובץ נתונים בפורמט CSV או Microsoft Excel (XLSX). גודל הקובץ המקסימלי שאתה יכול להעלות הוא 250 MB.
  • אכלס את העמודה הראשונה עם המפתח בו משתמש Oracle Analytics לקביעת פרופיל הנתונים.
  • אכלס את העמודות האחרות עם ערכי ההעשרה.

בקש מהמנהלן שלך לטעון את קובץ הידע המותאם אישית שלך ל-Oracle Analytics.

מחרוזות תבנית מותאמת אישית כללית

אתה יכול להשתמש במחרוזות פורמט מותאמות אישיות כלליות כדי ליצור פורמטים מותאמים אישית של שעה או תאריך.

הטבלה מציגה את מחרוזות התבניות המותאמות אישית הכלליות ואת התוצאות שהן מציגות. הן מאפשרות להציג את שדה התאריך ואת שדה השעה בהתאם להגדרות האזור של המשתמש.

מחרוזת תבנית כללית תוצאה

[FMT:dateShort]

מעצב את התאריך בתבנית התאריך הקצרה של הגדרות האזור. אפשר להקליד גם [FMT:date].

[FMT:dateLong]

מעצב את התאריך בתבנית התאריך הארוכה של הגדרות האזור.

[FMT:dateInput]

מעצב את התאריך בתבנית הקבילה כקלט בחזרה למערכת.

[FMT:time]

מעצב את השעה בתבנית השעה של הגדרות האזור.

[FMT:timeHourMin]

מעצב את השעה בתבנית השעה של הגדרות האזור, אך משמיט את השניות.

[FMT:timeInput]

מעצב את השעה בתבנית הקבילה כקלט בחזרה למערכת.

[FMT:timeInputHourMin]

מעצב את השעה בתבנית הקבילה כקלט בחזרה למערכת, אבל משמיט את השניות.

[FMT:timeStampShort]

שווה ערך להקלדת [FMT:dateShort] [FMT:time]. מעצב את התאריך בתבנית התאריך הקצרה של הגדרות האזור ואת השעה בתבנית השעה של הגדרות האזור. אפשר להקליד גם [FMT:timeStamp].

[FMT:timeStampLong]

שווה ערך להקלדת [FMT:dateLong] [FMT:time]. מעצב את התאריך בתבנית התאריך הארוכה של הגדרות האזור ואת השעה בתבנית השעה של הגדרות האזור.

[FMT:timeStampInput]

שווה ערך ל-[FMT:dateInput] [FMT:timeInput]. מעצב את התאריך ואת השעה בתבנית הקבילה כקלט בחזרה למערכת.

[FMT:timeHour]

מעצב את שדה השעה בלבד בתבנית הגדרות האזור, למשל 8 PM.

YY or yy

מציג את שתי הספרות האחרונות של השנה, לדוגמה, 11 ל-2011.

YYY או yyy

מציג את שלוש הספרות האחרונות של השנה, לדוגמה, 011 ל-2011.

YYYY או yyyy

מציג שנה בארבע ספרות, לדוגמה, 2011

M

מציג את החודש המספרי, לדוגמה, 2 לפברואר.

MM

מציג את החודש המספרי, עם אפס משמאל, כאשר מדובר בחודשים חד-ספרתיים, לדוגמה, 02 לפברואר.

MMM

מציג את השם המקוצר של החודש לפי הגדרות האזור של המשתמש, לדוגמה, פבר.

MMMM

מציג את השם המלא של החודש לפי הגדרות האזור של המשתמש, לדוגמה, פברואר.

D או d

מציג את היום בחודש, לדוגמה, 1.

DD או dd

מציג את היום בחודש, עם אפס משמאל, כאשר מדובר בימים חד-ספרתיים, לדוגמה, 01.

DDD או ddd

מציג את השם המקוצר של היום בשבוע לפי הגדרות האזור של המשתמש, לדוגמה, יום ה' ליום חמישי.

DDDD או dddd

מציג את השם המלא של היום בשבוע לפי הגדרות האזור של המשתמש, לדוגמה, יום חמישי.

DDDDD או ddddd

מציג את האות הראשונה של היום בשבוע לפי הגדרות האזור של המשתמש, לדוגמה, ה ליום חמישי.

r

מציג את היום בשנה, לדוגמה, 1.

rr

מציג את היום בשנה, עם אפס משמאל בימים בשנה חד-ספרתיים, לדוגמה, 01.

rrr

מציג את היום בשנה, עם אפסים משמאל בימים בשנה חד-ספרתיים, לדוגמה, 001.

w

מציג את השבוע בשנה, לדוגמה, 1.

ww

מציג את השבוע בשנה, עם אפס משמאל בשבועות חד-ספרתיים, לדוגמה, 01.

q

מציג את הרבעון בשנה, לדוגמה, 4.

h

מציג את השעה בתבנית 12 שעות, לדוגמה 2.

H

מציג את השעה בתבנית 24 שעות, לדוגמה 23.

hh

מציג את השעה בתבנית 12 שעות, עם אפס משמאל, כאשר מדובר בשעות חד-ספרתיות, לדוגמה, 01.

HH

מציג את השעה בתבנית 24 שעות, עם אפס משמאל, כאשר מדובר בשעות חד-ספרתיות, לדוגמה, 23.

m

מציג את הדקות, לדוגמה, 7.

mm

מציג את הדקות, עם אפס משמאל, כאשר מדובר בדקות חד-ספרתיות, לדוגמה, 07.

s

מציג את השניות, לדוגמה, 2.

אפשר גם לכלול ספרות עשרוניות במחרוזת, למשל as s.# או s.00 (כאשר # הוא ספרה אופציונלית ו-0 הוא ספרה נדרשת).

ss

מציג את השניות, עם אפס משמאל, כאשר מדובר בשניות חד-ספרתיות, לדוגמה, 02.

אפשר גם לכלול ספרות עשרוניות במחרוזת, למשל as ss.# או ss.00 (כאשר # הוא ספרה אופציונלית ו-0 הוא ספרה נדרשת).

S

מציג את המילישניות, לדוגמה, 2.

SS

מציג את המילישניות, עם אפס משמאל, כאשר מדובר במילישניות חד-ספריות, לדוגמה, 02.

SSS

מציג את המילישניות, עם אפסים משמאל, כאשר מדובר במילישניות חד-ספריות, לדוגמה, 002.

tt

מציג את הקיצור של לפני הצהרים או אחרי הצהרים בהתאם להגדרות האזור של המשתמש, לדוגמה, pm.

gg

מציג את העידן שבהגדרות האזור של המשתמש.