增強和轉換參考

您可以使用此參考資訊增強及轉換資料。

轉換參考

若要瞭解轉換編輯器中提供哪些資料轉換選項,請對資料集資料欄按一下滑鼠右鍵。例如,若要分類資料集資料欄中的比賽單圈時間,可以對「單圈時間」資料欄按一下滑鼠右鍵,然後選取儲格

選項 描述
儲格 建立您自己的數字範圍自訂群組。例如,您可以為年齡資料欄建立儲格,根據自訂需求將年齡範圍分成少年、青年、壯年或老年儲格。
轉換為日期 將資料欄的資料類型變更為日期,並從資料欄中刪除不是日期的所有值。
轉換為數字 將資料欄的資料類型轉換為數字,這將刪除資料欄中不是數字的所有值。
轉換為文字 將資料欄的資料類型變更為文字。
建立 根據函數建立資料欄。
製作複本 建立與所選資料欄內容完全相同的資料欄。
編輯 編輯資料欄。例如,可以變更名稱、選取其他資料欄或更新函數。
群組、條件群組 選取群組即可建立自己的自訂群組。例如,您可以將州/省與自訂區域組成群組,並可將金額分成小、中、大等群組
隱藏 隱藏資料面板和視覺化項目中的資料欄。如果您想要看到隱藏的資料欄,請按一下頁尾上的隱藏的資料欄 (幽靈圖示)。然後就可以將個別資料欄取消隱藏,或將所有隱藏的資料欄同時取消隱藏。
對數 可計算表示式的自然對數 (Natural Logarithm)。
小寫 將資料欄的內容更新成全小寫字母的值。
乘冪 將資料欄的值依您指定的乘冪相乘。預設乘冪為 2。
重新命名 可讓您變更任何資料欄的名稱。
取代 將所選資料欄中的特定文字變更為您指定的任何值。例如,您可以將資料欄中的所有 Mister 都變更為 Mr.
句首大寫 更新資料欄的內容,使句首單字的第一個字母變成大寫。
分割 將特定資料欄值分割成數個部分。例如,您可以將「姓名」資料欄分割成名字和姓氏。
平方根 建立內容是以所選資料欄中值的平方根填入的資料欄。
大寫 將資料欄的內容更新成全大寫字母的值。

資料分析和語意建議

建立資料集時,Oracle Analytics 會執行資料欄層級的分析,以產生一組用以修復或增強資料的語意建議。在建立工作簿時,您也可以從「資料面板」新增知識增強項目,以在您的視覺化中包含知識增強項目。

這些建議所根據的是系統在分析步驟自動偵測特定語意類型。例如,以本機主題區域為基礎的資料集會使用簡單的「前 N 項」範例進行分析。

語意類型有多個類別,例如以縣/市名稱識別的地理位置、可辨識樣式 (例如信用卡、電子郵件地址及社會安全號碼中的樣式)、日期及重複出現的樣式。您也可以建立自己的自訂語意類型。

語意類型類別

分析適用於各種語意類型。

分析語意類型類別可識別:

  • 地理位置,例如縣/市名稱。
  • 樣式,例如信用卡號碼或電子郵件地址的樣式。
  • 反覆出現的樣式,例如以連字號連接的詞組資料。

語意類型建議

對於修復、強化或增強資料集的建議取決於資料類型。

語意類型建議範例:

  • 增強 - 為資料新增與偵測到的特定類型 (例如地理位置) 對應的新資料欄。例如,新增縣/市的人口資料。
  • 資料欄串接 - 若在資料集內偵測到一個包含名字和另一個包含姓氏的資料欄,系統會建議將它們串接成單一資料欄。例如,first_name_last_name 資料欄。
  • 語意擷取 - 語意類型若是由子類型 (例如包含區碼的 us_phone 號碼) 所組成時,系統會建議將子類型擷取至其自己的資料欄。
  • 部分擷取 - 在資料中偵測到一般樣式區隔符號時,系統會建議擷取該樣式的各個部分。例如,如果系統在資料中偵測到重複的連字情況,就會建議將各個部分擷取至個別的資料欄,讓資料對分析來說更具實用性。
  • 日期擷取 - 偵測到日期時,系統會建議擷取日期中可能增強資料分析的部分。例如,擷取發票或購買日期中的星期幾。
  • 完整和部分遮蔽/遮罩/刪除 - 偵測到機密欄位 (例如信用卡號碼) 時,系統會建議將該資料欄完全或部分遮蔽,或甚至是移除。

以辨識樣式為基礎的語意類型

語意類型根據您資料中發現的樣式來識別。

系統提供以下語意類型的建議:

  • 日期 (超過 30 種格式)
  • 美國社會安全號碼 (SSN)
  • 信用卡號碼
  • 信用卡屬性 (CVV 和到期日)
  • 電子郵件地址
  • 北美方案電話號碼
  • 美國地址

參照型語意類型

語意類型的認可是由隨服務提供的載入參照知識所決定。

系統提供以下語意類型的參照型建議:

  • 國家/地區名稱
  • 國碼
  • 州/省名稱
  • 州/省代碼
  • 縣/市名稱 (管轄區)
  • 縣/市名稱 (本地化名稱)
  • 郵遞區號

建議的增強項目

建議的增強項目以語意類型為依據。

增強項目則是依據地理位置階層決定:

  • 國家/地區
  • 省 (州)
  • 管轄區 (縣/市)
  • 經度
  • 緯度
  • 人口數
  • 海拔 (公尺)
  • 時區
  • ISO 國碼
  • 聯邦資訊處理系列 (FIPS)
  • 國家/地區名稱
  • 首都
  • GeoNames ID
  • 使用語言
  • 電話國碼
  • 郵遞區號格式
  • 郵遞區號樣式
  • 電話國碼
  • 幣別名稱
  • 幣別縮寫
  • 地理最上層網域 (GeoLTD)
  • 平方公里

所需臨界值

分析處理作業使用特定臨界值決定特定的語意類型。

基本原則是,資料欄中 85% 的資料值必須符合單一語意類型準則,以便讓系統進行分類判斷。因此,某個內容由 70% 的名字和 30% 其他項目組成的資料欄,並不符合臨界值要求,所以不會對其提供建議。

自訂知識建議

您可以使用自訂知識建議增強 Oracle Analytics 的系統知識。Oracle Analytics 語意分析工具可使用自訂知識識別更多業務特定語意類型,並提供更多相關且受管理的增強建議。例如,您可以新增自訂知識參考,將處方藥分類為 USP 的「鎮痛劑」或「類鴉片」藥物類別。

教學課程圖示 教學課程

您可以使用現有的語意檔案 (例如,未受監督語意剖析 (USP) 檔案),或者建立自己的語意檔案。要求您的管理員將自訂知識檔案上傳至 Oracle Analytics。當您增強資料集時,Oracle Analytics 會根據此語意資料提供增強建議。在建立工作簿時,您也可以從「資料面板」新增知識增強項目,以在您的視覺化中包含知識增強項目。

建立自己的自訂知識檔案

建立自己的語意檔案時,請遵循下列準則:

  • 建立 CSV 或 Microsoft Excel (XLSX) 格式的資料檔。
  • 在第一個資料欄填入索引鍵,Oracle Analytics 會使用該索引鍵分析資料。
  • 在其他資料欄填入增強值。

要求管理員將您的自訂知識檔案上傳至 Oracle Analytics。

一般自訂格式字串

您可以使用一般自訂格式字串建立自訂時間或日期格式。

此表格顯示一般自訂格式字串與它們所顯示的結果。這些字串可以使用者的地區設定顯示日期和時間欄位。

一般格式字串 結果

[FMT:dateShort]

將日期的格式設成地區設定的簡短日期格式。您也可以輸入 [FMT:date]

[FMT:dateLong]

將日期格式設成地區設定的完整日期格式。

[FMT:dateInput]

將日期格式設成可輸入回系統的格式。

[FMT:time]

將時間格式設成地區設定的時間格式。

[FMT:timeHourMin]

將時間格式設成地區設定的時間格式,但省略秒的部分。

[FMT:timeInput]

將時間格式設成可輸入回系統的格式。

[FMT:timeInputHourMin]

將時間格式設成可輸入回系統的格式,但省略秒的部分。

[FMT:timeStampShort]

等同於輸入 [FMT:dateShort] [FMT:time]。可將日期格式設成地區設定的簡短日期格式,將時間格式設成地區設定的時間格式。您也可以輸入 [FMT:timeStamp]

[FMT:timeStampLong]

等同於輸入 [FMT:dateLong] [FMT:time]。可將日期格式設成地區設定的完整日期格式,將時間格式設成地區設定的時間格式。

[FMT:timeStampInput]

等同於 [FMT:dateInput] [FMT:timeInput]。可將日期與時間格式設成可輸入回系統的格式。

[FMT:timeHour]

只將小時欄位的格式設成地區設定的格式,例如 8 PM。

YY 或 yy

顯示年份的最後兩個數字,例如 11 代表 2011。

YYY 或 yyy

顯示年份的最後三個數字,例如 011 代表 2011。

YYYY 或 yyyy

顯示四位數年份,例如 2011

M

以數值顯示月份,例如 2 代表二月。

MM

以數值顯示月份,月份若為一位數則在左邊補零,例如 02 代表二月。

MMM

以使用者的地區設定顯示月份的縮寫名稱,例如 Feb

MMMM

以使用者的地區設定顯示完整的月份名稱,例如 February

D 或 d

顯示月份的天次,例如 1

DD 或 dd

顯示月份的天次,天次若為一位數則在左邊補零,例如 01

DDD 或 ddd

以使用者的地區設定顯示星期幾的縮寫名稱,例如 Thu 代表星期四。

DDDD 或 dddd

以使用者的地區設定顯示星期幾的完整名稱,例如 Thursday

DDDDD 或 ddddd

以使用者的地區設定顯示星期幾名稱的第一個字母,例如 T 代表星期四。

r

顯示年份的天次,例如 1。

rr

顯示年份的天次,天次若為一位數則在左邊補零,例如 01。

rrr

顯示年份的天次,天次若為一位數則在左邊補零,例如 001。

w

顯示年份的週次,例如 1。

ww

顯示年份的週次,週次若為一位數則在左邊補零,例如 01。

q

顯示年份的季別,例如 4。

h

以 12 小時制顯示小時,例如 2

H

以 24 小時制顯示小時,例如 23

hh

以 12 小時制顯示小時,小時若為一位數則在左邊補零,例如 01

HH

以 24 小時制顯示小時,小時若為一位數則在左邊補零,例如 23

m

顯示分鐘,例如 7

mm

顯示分鐘,分鐘若為一位數則在左邊補零,例如 07

s

顯示秒,例如 2

您也可以在字串中包含小數,例如 s.# 或 s.00 (其中的 # 表示選擇性的位數,0 表示必要的位數)。

ss

顯示秒,秒若為一位數則在左邊補零,例如 02

您也可以在字串中包含小數,例如 ss.# 或 ss.00 (其中的 # 表示選擇性的位數,0 表示必要的位數)。

S

顯示毫秒,例如 2。

SS

顯示毫秒,毫秒若為一位數則在左邊補零,例如 02。

SSS

顯示毫秒,毫秒若為一位數則在左邊補零,例如 002。

tt

以使用者的地區設定顯示上午或下午縮寫,例如 pm

gg

以使用者的地區設定顯示紀元。