10 使用範本與使用者協同合作

透過使用 Oracle Machine Learning 記事本樣板,您可以共用您的工作、將工作發佈為報表,以及從樣板建立記事本,與其他使用者協同合作。您可以將筆記型電腦儲存為範本、共用筆記型電腦,以及提供樣本範本給其他使用者。

附註:

您也可以提供工作區的存取權,與其他 Oracle Machine Learning 筆記型電腦使用者協同作業。認證的使用者接著可以存取您工作區中的專案,以及存取您的筆記型電腦。存取層次取決於授予的權限類型 - 管理員、開發人員或檢視者。如需有關使用者協同合作的詳細資訊,請參閱如何在 Oracle Machine Learning Notebooks 中協同合作

10.1 使用個人範本

個人樣板列出您建立的記事本樣板。

您可以執行下列工作:
  • 以唯讀模式檢視選取的樣板。

  • 從選取的樣板建立新的記事本。

  • 編輯選取的樣板。

  • 共用樣板中共用選取的記事本樣板。

  • 刪除選取的記事本樣板。

10.1.1 從樣板建立記事本

您可以從現有樣板建立新的記事本,並將它們儲存在個人樣板中供日後使用。

您必須選取一個筆記型電腦樣板。
若要從樣板建立新的記事本,請執行下列動作:
  1. 個人樣板頁面上,選取您要建立記事本的樣板,然後按一下新記事本
    建立記事本對話方塊將會開啟。
  2. 在「名稱」欄位中,提供記事本的名稱。
  3. 附註欄位中輸入附註 (如果有的話)。
  4. 在「專案」欄位中,選取要儲存筆記型電腦的專案。
  5. 在「連線」欄位中,選取預設連線。
  6. 按一下確定。
記事本已建立,可在記事本頁面中取得。

10.1.2 共用記事本樣板

您可以從個人範本共用範本。您也可以共用要編輯的範本。

共用樣板:
  1. 個人樣板中選取記事本樣板,然後按一下共用
    儲存至共用樣板對話方塊便會開啟。
  2. 名稱欄位中輸入樣板的新名稱。
  3. 註解欄位中,提供註解 (如果有)。
  4. 標記欄位中,輸入以逗號分隔的標記。如果要方便搜尋,請使用描述性標記。
  5. 按一下確定。
順利建立和共用樣板之後,就會顯示訊息,說明在共用中建立樣板。

10.1.3 編輯記事本樣板設定值

您可以在個人樣板中修改現有記事本樣板的設定值。

若要編輯記事本範本設定,請執行下列動作:
  1. 在「個人樣板」中選取記事本樣板,然後按一下編輯設定值
    編輯範本對話方塊便會開啟。
  2. 名稱欄位中,視需要編輯名稱。
  3. 註解欄位中,編輯註解 (如果有的話)。
  4. 標記欄位中,視需要編輯標記。
  5. 按一下確定。

10.2 使用共用樣板

共用樣板中,您可以與所有已認證的使用者共用記事本樣板,以及您從樣板中可用的現有記事本建立的記事本樣板。

當您執行下列動作時,共用樣板頁面會追蹤記事本樣板:
  • 類似範本

  • 從樣板建立記事本

  • 檢視樣板

共用樣板頁面會顯示下列樣板的相關資訊:
  • 樣板名稱

  • 描述

  • 讚數

  • 建立數

  • 靜態檢視次數

您可以執行下列工作:
  • 按一下新記事本來建立樣板

  • 按一下編輯設定值來編輯樣板設定值

  • 按一下刪除,刪除任何選取的樣板

  • 依名稱、標記、作者搜尋範本

  • 依名稱、日期、作者、喜愛、已檢視、已使用排序範本

  • 按一下僅顯示已相似項目僅顯示我的項目來檢視樣板

10.2.1 從樣板建立記事本

您可以從現有樣板建立新的記事本,並將它們儲存在個人樣板中供日後使用。

您必須選取一個筆記型電腦樣板。
若要從樣板建立新的記事本,請執行下列動作:
  1. 個人樣板頁面上,選取您要建立記事本的樣板,然後按一下新記事本
    建立記事本對話方塊將會開啟。
  2. 在「名稱」欄位中,提供記事本的名稱。
  3. 附註欄位中輸入附註 (如果有的話)。
  4. 在「專案」欄位中,選取要儲存筆記型電腦的專案。
  5. 在「連線」欄位中,選取預設連線。
  6. 按一下確定。
記事本已建立,可在記事本頁面中取得。

10.2.2 編輯記事本樣板設定值

您可以在個人樣板中修改現有記事本樣板的設定值。

若要編輯記事本範本設定,請執行下列動作:
  1. 在「個人樣板」中選取記事本樣板,然後按一下編輯設定值
    編輯範本對話方塊便會開啟。
  2. 名稱欄位中,視需要編輯名稱。
  3. 註解欄位中,編輯註解 (如果有的話)。
  4. 標記欄位中,視需要編輯標記。
  5. 按一下確定。

10.3 使用範例樣板

範例樣板頁面會列出預先填入的 Oracle Machine Learning 筆記型電腦樣板。您可以檢視並使用這些樣板來建立您的記事本。

範例樣板頁面會顯示下列樣板的相關資訊:
  • 樣板名稱

  • 描述

  • 讚數。按一下喜愛項目,將它標示為喜愛項目。

  • 靜態檢視次數

  • 使用數

您無法更改範例樣板頁面中的任何樣板。搜尋選項包括:
  • 依名稱、標記、作者搜尋範本

  • 依名稱、日期、作者、喜愛、已檢視、已使用排序範本

  • 按一下僅顯示已相似項目來檢視喜歡的樣板

10.3.1 從範例樣板建立記事本

您可以使用 Oracle Machine Learning 範例樣板,從可用的樣板建立記事本。

若要建立記事本:
  1. 範例樣板頁面中,選取您要建立記事本的樣板。
  2. 按一下新建記事本
    建立記事本對話方塊將會開啟。
  3. 建立記事本對話方塊中,會顯示所選樣板的名稱。在名稱欄位中,您可以變更記事本名稱。
    「建立記事本」對話方塊
  4. 註解欄位中,如果樣板有可用的註解,就會顯示註解。您可以編輯註解。
  5. 專案欄位中,按一下編輯圖示 編輯
  6. 選取您要儲存記事本的專案。
  7. 在「連線」欄位中,選取預設連線。
  8. 按一下確定。
記事本已建立,可在記事本頁面中取得。

10.3.2 範例樣板

Oracle Machine Learning Notebooks 提供基於不同機器學習演算法和語言的筆記型電腦範例範本,例如 Python、R 和 SQL。範例範本是在 Oracle Autonomous Database 中處理。

您可以根據下列任一 Oracle Machine Learning for R 範例範本筆記型電腦,建立自己的可編輯和可執行的 Oracle Machine Learning 筆記型電腦:
  • OML 匯出與匯入序列化模型:使用此筆記型電腦,可使用 DBMS_DATA_MINING.EXPORT_SERMODELDBMS_DATA_MINING.IMPORT_SERMODEL 程序來匯出與匯入原生序列化模型。Oracle Machine Learning 提供 API,簡化跨資料庫和平台移轉模型的程序。
  • OML Wiki ESA 模型:透過計算文件與一組由人類明確定義及描述之主題之間的語意相關性 (這表示兩個字或文字彼此相似) 來使用此筆記型電腦進行文字文件分類。Oracle Machine Learning for SQL 函數 ESA、Oracle Machine Learning for Python 函數 oml.esa 和 Oracle Machine Learning for R 函數 ore.odmESA 會從文件庫擷取文字型功能,並執行文件相似性比較。在此記事本中,會將 Wiki ESA 模型匯入 Autonomous Database,以搭配下列 OML 樣板記事本範例使用:
    • OML4SQL 功能擷取 ESA Wiki 模型
    • OML4Py 功能擷取 ESA Wiki 模型
    • OML4R 功能擷取 ESA Wiki 模型
  • OML 服務批次評分:使用此筆記型電腦透過 OML 服務的 REST 介面執行批次評分工作。OML 服務支援迴歸、分類、叢集以及功能擷取的批次評分。
    • 認證資料庫使用者並取得權杖
    • 建立批次計分工作
    • 檢視批次計分工作的明細與輸出
    • 更新、停用及刪除批次計分工作
  • OML 服務資料監督:使用此記事本來執行資料監督。此記事本執行會透過 REST 介面提供您資料監控工作流程步驟,其中包括:
    • 認證資料庫使用者並取得權杖
    • 建立資料監督工作
    • 檢視資料監督工作的詳細資訊和輸出
    • 更新、停用及刪除資料監控工作
  • OML 服務模型監督:使用此筆記型電腦瞭解並執行模型監督。此記事本執行會透過 REST 介面提供您模型監控工作流程步驟,其中包括:
    • 認證資料庫使用者並取得權杖
    • 建立模型監控工作
    • 檢視模型監控工作的詳細資訊和輸出
    • 更新、停用及刪除模型監控工作
  • OML 協力廠商套件 - 環境建立:使用此筆記型電腦下載並啟用 Conda 環境,以及在筆記型電腦階段作業中使用程式庫。Oracle Machine Learning Notebooks 提供 Conda 解譯器,可在 Conda 環境中安裝第三方 Python 和 R 程式庫,供在 Oracle Machine Learning Notebooks 階段作業以及 Oracle Machine Learning for PythonOracle Machine Learning for R 內嵌執行呼叫中使用。

    安裝在 Oracle Machine Learning Notebooks 中的第三方程式庫可用於:

    • 標準 Python
    • 標準 R
    • 從 Python、SQL 和 REST API 執行內嵌的 Oracle Machine Learning for Python Python
    • 從 R、SQL 和 REST API 內嵌的 R 執行 Oracle Machine Learning for R

    附註:

    Conda 環境由具備 OML_SYS_ADMIN 角色的 ADMIN 使用者安裝及管理。管理員可以建立共用環境,以及新增或刪除其中的套裝軟體。Conda 環境儲存在與 Autonomous Database 關聯的物件儲存的儲存桶中。

    Conda 是開放原始碼套件和環境管理系統,可運用包含第三方 R 和 Python 套裝軟體的虛擬環境。有了 conda 環境,您就可以安裝和更新套裝軟體及其相依性,並在環境之間切換,以使用專案特定的套裝軟體。

    此範本筆記型電腦 OML 第三方套件 - 環境建立包含一般工作流程,可在 Oracle Machine Learning Notebooks 中建立第三方環境和套裝程式安裝。

    • 第 1 節包含建立和測試 Conda 環境的命令。
    • 第 2 節包含建立 Conda 環境、安裝套裝程式以及將 conda 環境上傳至與 Oracle Autonomous Database 關聯之物件儲存的儲存桶的命令。

    圖 10-1 Conda 範例樣板

    Conda 範例樣板
  • OML 第三方套件 - Python 環境用途:使用此範本筆記型電腦瞭解 Oracle Machine Learning Notebooks 中使用 Python 和 Oracle Machine Learning for Python 的第三方環境典型工作流程。您可以下載並使用 Conda 環境中先前建立並儲存至與 Autonomous Database 關聯之 Object Storage 儲存桶資料夾的程式庫。
    此筆記型電腦包含下列指令:
    • 列出儲存於物件儲存中的所有環境
    • 列出儲存在物件儲存中的具名環境
    • 下載並啟用 mypyenv 環境
    • 列出 Conda 環境中可用的套裝程式
    • 匯入 Python 程式庫
    • 載入資料集
    • 建立模型
    • 分數模型
    • 建立 Python 使用者定義的函數 (UDF)
    • 在 Python 中執行使用者定義的函數 (UDF)
    • 在 SQL 和 REST API 中建立和執行使用者定義的函數,以執行內嵌的 Python 執行
    • 使用 SQL API 建立及執行內嵌 Python 執行的 Python 使用者定義函數 - 非同步模式
  • OML 第三方套件 - R 環境用途:使用此範本筆記型電腦來瞭解 Oracle Machine Learning for R 中第三方環境用途的一般工作流程。
    此筆記型電腦包含下列指令:
    • 列出儲存於物件儲存中的所有環境
    • 列出儲存在物件儲存中的具名環境
    • 下載並啟用 myrenv 環境
    • 顯示可用的 OML4R Conda 環境清單
    • 匯入 R 程式庫
    • 載入和準備資料
    • 建立模型
    • 分數模型
    • 建立 R 使用者定義的函數 (UDF)
    • 在 R 中執行使用者定義函數 (UDF)
    • 將使用者定義函數 (UDF) 儲存至命令檔儲存區域
    • 在 SQL 和 REST API 中執行 R 使用者定義的函數,以執行內嵌 R 執行
    • 新增 OML 使用者至「存取控制清單」
    • 使用 REST API 以同步模式執行內嵌 R,執行 R 使用者定義的函數
  • OML4R-1:簡介:使用此筆記型電腦瞭解如何:
    • 載入 ORE 程式庫
    • 建立資料庫表格
    • 使用透明層
    • 使用資料庫內屬性重要性演算法排列預測值的屬性等級
    • 建立預測模型並
    • 使用這些模型評分資料

    圖 10-2 Oracle Machine Learning for R 範例樣板

    OML4R 範例樣板
  • OML4R-2:資料選擇與操控:使用此筆記型電腦來瞭解有關資料選擇與操控的透明層功能。
  • OML4R-3:資料存放區和命令檔儲存區域:您可以使用此筆記型電腦來瞭解 OML4R 的資料存放區和命令檔儲存區域功能。
  • OML4R-4:內嵌 R 執行:使用此筆記型電腦來瞭解 OML4R 內嵌 R 執行。首先,直接在 R 中建置線性模型,然後建立使用者定義的 R 函數來建置線性模型,然後將函數儲存至命令檔儲存區域,並使用 Oracle Autonomous Database 環境產生的 R 引擎平行評分資料。此記事本也示範如何使用 SQL 介面和 REST API for R 搭配內嵌 R 執行來呼叫這些命令檔。

    附註:

    若要使用 SQL API 進行內嵌 R 執行,使用者定義的 R 函數必須位於 OML4R 命令檔儲存區域中,並且必須提供 Oracle Machine Learning (OML) 雲端帳戶 USERNAME、PASSWORD 以及 URL 以取得認證權杖。
  • OML4R Anomaly Detection Support Vector Machine (SVM):您可以使用此筆記型電腦建立一流的 SVM 模型,然後用它來標記異常或可疑的記錄。
  • OML4R 關聯規則 Apriori:使用此筆記型電腦,利用 A Priori 演算法和 SH 綱要 (SH.SALES) 的資料來建立關聯規則模型。所有計算都發生在 Oracle Autonomous Database 內。
  • OML4R 屬性重要性最小描述長度 (MDL):使用此記事本來計算「屬性重要性」(使用「最小描述長度」演算法) 在 SH 綱要資料上。所有功能都會在 Oracle Autonomous Database 內執行。Oracle Machine Learning 支援「屬性重要性」來識別關鍵因素,例如對目標屬性有最大影響的屬性、預測程式、變數。
  • OML4R 分類一般化線性模型 (GLM):使用此筆記型電腦預測客戶最有可能成為 Affinity Card 忠誠度方案的正面回應者。此記事本使用「銷售歷史記錄 (SH)」綱要資料建置並套用分類一般化線性模型。所有處理都會在 Oracle Autonomous Database 內進行。
  • OML4R 分類 Naive Bayes (NB):使用此筆記型電腦預測客戶最有可能成為 Affinity Card 忠誠度方案的正面回應者。此記事本使用「銷售歷史記錄 (SH)」綱要資料建置並套用分類決策樹狀結構模型。所有處理都會在 Oracle Autonomous Database 內進行。
  • OML4R Classification Random Forest (RF): 使用此筆記型電腦在 OML4R 中使用 Random Forest 演算法進行分類,然後預測客戶最有可能成為 Affinity Card 忠誠度方案的正面回應者。
  • OML4R 使用支援向量機 (SVM) 預測目標客戶的分類模型:使用此筆記型電腦來使用「分類」模型,使用「支援向量機型」預測目標客戶。
  • OML4R 叢集 - 使用預期最大化叢集識別客戶區隔:使用此記事本瞭解如何使用 SH 綱要中的 CUSTOMERS 資料集,使用非監督式學習預期最大化 (EM) 演算法識別客戶的自然叢集。資料探索、準備和機器學習是在 Oracle Autonomous Database 中執行。
  • OML4R 叢集 - 使用 K-Means 叢集識別客戶區隔: 使用此記事本瞭解如何使用非監督式學習 K-Means (KM) 演算法,從 SH 綱要設定 CUSTOMERS 資料,識別客戶的自然叢集。資料探索、準備和機器學習是在 Oracle Autonomous Database 中執行。
  • OML4R 叢集 - 正交分割叢集 (OC):使用此記事本瞭解如何使用 SH 綱要中的 CUSTOMERS 資料集,使用非監督式學習 k-Means 演算法識別客戶的自然叢集。資料探索、準備和機器學習是在 Oracle Autonomous Database 內執行。
  • OML4R 資料清除異常值:使用此筆記型電腦瞭解並排除使用 OML4R 的極端值記錄。
  • OML4R 資料清除 - 重新編碼同義字值:使用此記事本使用 OML4R 重新編碼同義字值。
  • OML4R 資料集建立:使用此記事本載入範例資料集 MTCARSIRIS,並使用 ore.create() 函數將它們匯入您的 Oracle Autonomous Database 執行處理。

附註:

下列以星號 (*) 開頭的範本記事本範例,請使用 CUSTOMER_INSURANCE_LTV 資料集。此資料集是由 OML Run-me-first 筆記型電腦所產生。因此,您必須執行「範例樣板」下的 OML Run-me-first 筆記型電腦。
  • * OML4R 資料清除遺漏的資料:使用此筆記型電腦來執行遺漏的值取代 (使用 OML4R)。
  • * OML4R 資料清除重複項移除:使用此筆記型電腦移除使用 OML4R 的重複記錄。
  • * OML4R 資料轉換儲格:使用此記事本來儲格數值資料欄 (使用 OML4R)。
  • * OML4R 資料轉換類別記錄:使用此記事本將類別字串變數重新編碼為數值變數,並使用 OML4R 重新編碼字串至字串。
  • * OML4R 資料轉換:標準化與調整規模:使用此筆記型電腦,使用 OML4R 將資料標準化與調整。
  • * OML4R 資料轉換:單熱編碼:使用此筆記型電腦來執行使用 OML4R 的單熱編碼。
  • * OML4R 功能選擇 - 監督演算法:使用此筆記型電腦,使用資料庫內監督的演算法,使用 OML4R 來執行功能選擇。此筆記型電腦示範如何建立隨機森林模型,以預測客戶是否會購買保險,然後使用「特徵重要性」來執行特徵選擇。
  • * OML4R 使用摘要統計資料的功能選擇:使用此記事本使用 OML4R 的摘要統計來執行功能選擇。此記事本示範如何使用 OML4R,根據相異值數目、空值、常數值比例來選取功能。
  • OML4R 功能工程聚總:使用此筆記型電腦執行使用 OML4R 的最小值、最大值、平均值和計數聚總。此範本使用 SH 綱要中的 SALES 表格,並顯示如何聚總每個客戶與產品組的銷售金額來建立功能。
  • OML4R 功能擷取明確語意分析 (ESA) Wiki 模型:此記事本使用維基百科模型作為範例。您可以使用此筆記型電腦來使用 Oracle Machine Learning for R 函數 ore.odmESA,從文件庫擷取文字型功能,並執行文件相似性比較。所有處理都會在 Oracle Autonomous Database 內進行。

    附註:

    預先建立的 Wikipedia 模型必須安裝在您的 Autonomous Database 執行處理中,才能執行此筆記型電腦。
  • OML4R 資料轉換日期資料類型:使用此筆記型電腦,可使用 Oracle Machine Learning for R 的資料庫表格代理主機物件,針對日期和時間資料執行各種作業。
  • OML4R 功能擷取單一值分解 (SVD):使用此筆記型電腦來使用資料庫內 SVD 進行功能擷取。此記事本使用 Oracle Machine Learning for R 函數 ore.odmSVD 建立使用單一值分解 (SVD) 演算法進行特徵擷取的模型。
  • OML4R 分割模型支援向量機 (SVM):使用此筆記型電腦建置 SVM 模型,以預測客戶駐留的年數,但依客戶性別分割。接著會使用模型預測目標,然後以預測詳細資訊預測目標。
  • OML4R 迴歸一般化線性模型 (GLM):您可以使用此筆記型電腦瞭解如何使用多重迴歸預測數值。此筆記型電腦使用「一般化線性模型」演算法。
  • OML4R 迴歸類神經網路 (NN):使用此筆記型電腦瞭解如何使用多重迴歸預測數值。此記事本使用「神經網路」演算法。
  • OML4R 迴歸支援向量機 (SVM):使用此筆記型電腦瞭解如何使用多重迴歸預測數值。此記事本使用「支援向量機器」演算法。
  • OML4R REST API:使用此筆記型電腦瞭解如何使用 OML4R REST API 呼叫使用者定義的 R 函數,以及列出 R 命令檔儲存區域中可用的函數。

    附註:

    若要執行命令檔,它必須位於 R 命令檔儲存區域中。必須提供 Oracle Machine Learning 雲端服務帳戶使用者名稱和密碼以進行認證。
  • OML4R 統計函數:使用此筆記型電腦來瞭解和使用各種統計函數。此記事本使用從 SH 綱要到 OML4R 通透層的資料。
  • OML4R 文字探勘支援向量機 (SVM):使用此筆記型電腦瞭解如何使用非結構化文字資料來建置機器學習模型、運用 Oracle Text、使用 Oracle Machine Learning 資料庫內演算法預測功能,以及從文字資料欄擷取功能。

    此筆記型電腦建置支援向量機 (SVM) 模型,以預測最有可能成為 Affinity Card 忠誠度方案正面回應客戶的客戶。資料來自包含使用者產生之備註的文字欄。

Oracle Machine Learning for Python 範例樣板

您可以根據下列任一 Oracle Machine Learning for Python 範例範本來建立 Oracle Machine Learning 筆記型電腦:

圖 10-3 Oracle Machine Learning for Python 範例樣板

OML4Py 範例樣板
  • 我的第一個記事本:使用「我的第一個記事本」記事本來檢視基本機器學習功能、資料選取以及資料檢視。此樣板使用 SH 綱要資料。
  • OML4Py -0- 導覽:此筆記型電腦是 0 到 5 系列的第一款筆記型電腦,旨在透過簡短範例向您介紹 OML4Py 的功能範圍。
  • OML4Py -1- 簡介:此筆記型電腦概述如何載入 OML 程式庫、建立資料庫表格、使用通透層、使用資料庫內屬性重要性演算法的預測值排名屬性、建置預測模型,以及使用這些模型評分資料。
  • OML4Py -2 - 資料選擇與操控:使用此筆記型電腦學習如何與資料選擇與操控有關的透明層搭配運作。
  • OML4Py -3- 資料存放區:您可以使用此記事本瞭解如何使用資料存放區、在資料存放區與 Python 階段作業之間移動物件、管理資料存放區權限、儲存資料存放區中的模型物件和 Python 物件、刪除資料存放區等等。
  • OML4Py -4- 內嵌 Python 執行:使用此筆記型電腦瞭解內嵌的 Python 執行。在本筆記型電腦中,線性模型是直接在 Python 中建置,然後建立一個使用 Autonomous Database 環境所產生之 Python 引擎的函數。
  • OML4Py -5- AutoML:使用此筆記型電腦來瞭解 OML4Py 中的 AutoML 工作流程。在此筆記型電腦中,會使用 scikit-learn 的 WINE 資料集。此處的 AutoML 用於 target 資料欄的分類,以及用於 alcohol 資料欄的迴歸。

附註:

下列以星號 (*) 開頭的範本記事本範例,請使用 CUSTOMER_INSURANCE_LTV_PY 資料集。此資料集具有由 OML4SQL Noise 筆記型電腦人工產生的重複值。因此,您必須先執行 OML4SQL 噪音,才能執行筆記型電腦。
  • * OML4Py 資料清除重複項移除:使用此筆記型電腦瞭解如何使用 OML4Py 移除重複記錄。此筆記型電腦使用包含客戶財務資訊、終身價值,以及客戶是否購買保險的客戶保險終身價值資料集。
  • * OML4Py 資料清除遺漏的資料:使用此筆記型電腦瞭解如何使用 OML4Py 填入遺漏的值。此筆記型電腦使用包含客戶財務資訊、終身價值,以及客戶是否購買保險的客戶保險終身價值資料集。
  • * OML4Py 資料清除重新編碼同義字值:使用此筆記型電腦瞭解如何使用 OML4Py 重新編碼同義字值。此筆記型電腦使用包含客戶財務資訊、終身價值,以及客戶是否購買保險的客戶保險終身價值資料集。
  • OML4Py 資料清除極端值移除:使用此筆記型電腦來瞭解如何清除資料以移除極端值。此筆記型電腦使用 CUSTOMER_INSURANCE_LTV 資料集,其中包含客戶財務資訊、終身價值,以及客戶是否購買保險。在資料集 CUSTOMER_INSURANCE_LTV 中,焦點是在數值上、下 5% 值的記錄移除。
  • OML4Py 資料轉換儲格:使用此筆記型電腦瞭解如何將數值資料欄儲格並視覺化分配。
  • OML4Py 資料轉換類別 - 將類別變數轉換成數值變數:使用此記事本瞭解如何使用 OML4Py 將類別變數轉換成數值變數。記事本示範如何將每個不同層次 / 值的分類變數轉換為整數資料類型。
  • OML4Py 資料轉換標準化與調整規模:使用此筆記型電腦瞭解如何使用 z 分數 (平均值與標準差)、最小調整規模及日誌調整功能來標準化及調整資料規模。

    附註:

    使用資料庫內 Oracle Machine Learning 演算法建置或套用模型時,自動資料準備會視需要依特定演算法自動將資料標準化。
  • OML4Py Data Transformation One Hot Encoding:使用此筆記型電腦瞭解如何使用 OML4Py 執行一個熱編碼。機器學習演算法無法直接使用分類資料。分類資料必須轉換為數字。此筆記型電腦使用包含客戶財務資訊、終身價值,以及客戶是否購買保險的客戶保險終身價值資料集。

    附註:

    如果您打算使用資料庫內演算法,系統會自動為需要熱編碼的演算法套用一個熱編碼。資料內演算法會自動利用分類欄,並在內部準備的資料中將模型放入模型。
  • OML4Py 異常偵測:使用此筆記型電腦偵測資料中的異常記錄、客戶或交易。此範本使用非監督式學習演算法「1 級支援向量機」。筆記本範本會建立一流的支援向量機 (SVM) 模型。
  • OML4Py 關聯規則:使用此筆記型電腦分析您的資料,或偵測資料中的共同發生項目、失敗項目或事件。此樣板使用 SH 綱要資料 (SH.SALES) 的 apriori Association Rules 模型。
  • OML4Py 屬性重要性:使用此記事本來識別對目標屬性有最大影響力的索引鍵屬性。監督模型之組建資料中的目標屬性是您要預測的屬性。範本會使用 SH 綱要資料建立「屬性重要性」模型。
  • OML4Py 分類:使用此筆記型電腦來預測客戶行為和類似的預測。範本會根據預測程式值與目標值之間的關係,建立並套用分類演算法「決策樹」來建立「分類」模型。範本使用 SH 綱要資料。
  • OML4Py 叢集:使用此記事本來識別資料中的自然叢集。記事本範本在 SH 綱要資料上使用非監督式學習 k- Means 演算法。
  • OML4Py 資料轉換:使用此記事本,可使用 OML4Py 將分類變數轉換為數值變數。此樣板顯示如何轉換分類變數,並將每個不同的層次 / 值編碼為整數資料類型。
  • OML4Py 資料集建立:使用此筆記型電腦,利用 OML4Py 建立從 sklearn 套裝程式到 OML 資料框架的資料集。
  • OML4Py 功能工程聚總:使用此記事本樣板,使用 OML4Py 填入遺漏的值。此筆記型電腦使用 SH 綱要 SALES 表格,其中包含每個客戶和購買產品的交易記錄。功能是透過聚總每個客戶與產品組的銷售金額來建立。
  • OML4Py 功能選擇監督演算法型:使用此筆記型電腦,使用 OML4Py 的資料庫內監督演算法來執行功能選擇。
  • OML4Py 功能選擇摘要統計資料:您可以使用此記事本樣板,使用 OML4Py 的摘要統計資料來執行功能選擇。記事本顯示如何使用 OML4Py,根據相異值數目、空值、常數值比例來選取功能。此處使用的資料集 CUSTOMER_INSURANCE_LTV_PY 具有人工 OML4SQL Noise 筆記型電腦所產生的空值。您必須先執行 OML4SQL 噪音筆記型電腦,才能執行 OML4Py 功能選擇摘要統計資料筆記型電腦。
  • OML4Py 分割模型:使用此筆記型電腦建立分割的模型。此筆記型電腦會建立 SVM 模型,以預測客戶駐留的年數,但依客戶性別分割。它使用模型來預測目標,然後使用預測詳細資料預測目標。

    Oracle Machine Learning 可自動建立由多個子模型組成的組譯模型,每個資料分割區一個子模型。子模型存在且用作一個模型,因此僅使用最上層模型來簡化評分。系統會根據要評分的資料列中的分割區值,選擇適當的子模型。分割模型可透過多個目標模型提高準確性。

  • OMP4Py REST API:使用此筆記型電腦來呼叫內嵌的 Python 執行。OML4Py 包含 REST API,可執行儲存在指令碼儲存庫中的使用者定義 Python 函數。有利於在從屬端與資料庫伺服器之間進行區隔時,會使用 REST API。使用 OML4Py REST API 建置、訓練、部署及管理命令檔。

    附註:

    若要執行命令檔,它必須位於 OML4Py 命令檔儲存區域中。必須提供 Oracle Machine Learning 雲端服務帳戶使用者名稱和密碼以進行認證。
  • OML4Py 預測數值的迴歸模型:使用此筆記型電腦可預測使用多重迴歸的數值。
  • OML4Py 統計函數:使用此筆記型電腦來使用各種統計函數。統計函數使用 SH 綱要透過 OML4Py 透明層的資料。
  • OML4Py 文字探勘:使用此筆記型電腦在 Oracle Machine Learning 中使用文字探勘功能建置模型。

    在此筆記型電腦中,SVM 模型是為了預測客戶最有可能成為 Affinity Card 忠誠度方案的正面回應者而打造。資料會隨附包含使用者產生之註解的文字資料欄。除了一些額外的設定,演算法會自動使用文字資料欄,並在結構化資料與非結構化文字上建立模型。

Oracle Machine Learning for SQL 範例樣板

您可以根據下列任一 Oracle Machine Learning for SQL 範例範本來建立 Oracle Machine Learning 筆記型電腦:

圖 10-4 Oracle Machine Learning for SQL 範例樣板

OML4SQL 範例樣板
  • OML4SQL 異常偵測:使用此記事本來偵測異常或罕見事件。Oracle Machine Learning 支援異常偵測,使用半監督式學習演算法 One-Class Support Vector Machine 來識別資料中的罕見或異常記錄 (客戶、交易等)。此筆記型電腦會建置 1Class-SVM 模型,然後用來標示異常或可疑的記錄。整個機器學習方法是在 Oracle Autonomous Database 內部執行。
  • OML4SQL 關聯規則:使用此筆記型電腦來套用 Association Rules 機器學習技術 (亦稱為「購物籃分析」),以尋找共生項目、導致失敗的狀態或非明顯事件。此筆記型電腦使用 Priori 演算法與 SH 綱要中的 SH.SALES 資料來建立關聯規則模型。所有計算都發生在 Oracle Autonomous Database 內。
  • OML4SQL 屬性重要性 - 識別主要因素:使用此記事本來識別主要因素,亦稱為屬性、預測因素、對目標屬性有最大影響的變數。此記事本使用 SH 綱要資料建立「屬性重要性」模型,此模型使用「最小描述長度」演算法。所有功能都會在 Oracle Autonomous Database 內執行。
  • OML4SQL 分類 - 預測目標客戶:使用此筆記型電腦預測最有可能成為 Affinity Card 忠誠度方案回應客戶的客戶。此記事本使用 SH 綱要資料建置及套用分類決策樹模型。所有處理都會在 Oracle Autonomous Database 內進行。
  • OML4SQL 叢集 - 識別客戶區隔:使用此筆記型電腦來識別客戶的自然叢集。Oracle Machine Learning 支援使用數種演算法進行叢集化,包括 k-Means、O-Cluster 以及 Expectation Maximization。此記事本使用 SH 綱要中的 CUSTOMERS 資料集,並使用非監督式學習 k-Means 演算法。資料探索、準備和機器學習是在 Oracle Autonomous Database 內執行。
  • OML4SQL 資料清除 - 移除重複項目:使用此記事本移除使用 Oracle SQL 的重複記錄。筆記型電腦使用包含客戶財務資訊、終身價值,以及客戶是否購買保險的客戶保險終身價值資料集。資料集 CUSTOMER_INSURANCE_LTV_SQL 具有 OML4SQL Noise 筆記型電腦所產生的重複值。

    附註:

    您必須先執行 OML4SQL 噪音筆記型電腦,才能執行 OML4SQL 資料清除筆記型電腦。
  • OML4SQL 資料清除 - 遺漏資料:使用此樣板取代使用 Oracle SQL 和 DBMS_DATA_MINING_TRANSFORM 套裝程式遺漏的值。資料集 CUSTOMER_INSURANCE_LTV_SQL 遺漏 OML4SQL Noise 筆記型電腦人工產生的值。您必須先執行 OML4SQL 噪音筆記型電腦,才能執行 OML4SQL 資料清除筆記型電腦。

    附註:

    使用資料庫內 Oracle Machine Learning 演算法建置或套用模型時,如果啟用自動資料準備,可能不需要個別執行此作業。自動資料準備會以模式自動以分類屬性的平均值和遺漏值取代遺漏的數值屬性值。
  • OML4SQL 資料清除極端值移除:使用此記事本移除使用 Oracle SQL 和 DBMS_DATA_MINING_TRANSFORM 套裝程式的極端值。筆記型電腦使用客戶保險終身價值資料集,其中包含客戶財務資訊、終身價值,以及客戶是否購買保險。在資料集 CUSTOMER_INSURANCE_LTV 中,會將焦點放在數值,並移除頂端和底端 5% 值的記錄。
  • OML4SQL 資料清除重新編碼同義字值:使用此記事本來重新編碼使用 Oracle SQL 之資料欄的同義字值。筆記型電腦使用客戶保險終身價值資料集,其中包含客戶財務資訊、終身價值,以及客戶是否購買保險。資料集 CUSTOMER_INSURANCE_LTV_SQL 已重新編碼由 OML4SQL Noise 筆記型電腦產生的值。您必須先執行 OML4SQL 噪音筆記型電腦,才能執行 OML4SQL 資料清除 - 重新編碼同義字值筆記型電腦。
  • OML4SQL 資料轉換儲格:使用此記事本來使用 Oracle SQL 和 DBMS_DATA_MINING_TRANSFORM 套裝程式儲格數值資料欄。此記事本顯示如何將數值資料欄儲格,並以視覺化方式呈現分配。
  • OML4SQL 資料轉換類別:使用此記事本將類別變數轉換成使用 Oracle SQL 的數值變數。記事本顯示如何轉換分類變數,並將每個不同的層次 / 值編碼為整數,以及如何根據簡單述詞建立指標變數。
  • OML4SQL 資料轉換標準化與調整:使用此筆記型電腦,使用 Oracle SQL 與 DBMS_DATA_MINING_TRANSFORM 套件來標準化與調整資料。此記事本顯示如何使用 z 分數 (平均值和標準差)、最小調整規模以及日誌調整功能將資料標準化。使用資料庫內 Oracle Machine Learning 演算法建置或套用模型時,自動資料準備會視需要依特定演算法自動將資料標準化。
  • OML4SQL 維度縮減 - 非負數矩陣係數化:使用此筆記型電腦,可使用資料庫內非負數矩陣係數化演算法來執行維度縮減。此記事本顯示如何將含有許多資料欄的表格轉換成減少的功能集。非負矩陣因數分解能產生非負值係數。
  • OML4SQL 維度縮減 - 單一值分解:使用此筆記型電腦,可使用資料庫內單一值分解 (SVD) 演算法執行維度縮減。
  • OML4SQL:匯出序列化模型:使用此筆記型電腦將序列化模型匯出至 Oracle Cloud Object Storage。此筆記型電腦會建立 Oracle Machine Learning 迴歸與分類模型,並以序列化格式匯出模型,以便使用 Oracle Machine Learning (OML) Services REST API 進行評分。OML 服務提供 Oracle Autonomous Database 上代管的 REST API 端點。這些端點可儲存 Oracle Machine Learning 模型及其描述資料,並為模型建立評分端點。OML 服務的 REST API 支援 Oracle Machine Learning 模型和 ONNX 格式模型,並啟用認知文字功能。
  • OML4SQL 功能工程聚總與時間:使用此筆記型電腦產生聚總功能,以及使用 Oracle SQL 擷取日期與時間功能。記事本也會顯示如何從 TIME_ID 欄位擷取日期與時間功能。
  • OML4SQL 功能選擇演算法型:使用此記事本,即可使用資料庫內監督的演算法來執行功能選擇。筆記本會先建立隨機的森林模型來預測客戶是否會購買保險,然後再使用「特徵重要性」值進行特徵選擇。然後,它會為相同的分類任務建立決策樹模型,並取得分割節點。對於支援最高的最上層分割節點,會選取與這些節點相關的功能。
  • OML4SQL 功能選擇非監督屬性重要性:使用此筆記型電腦,使用資料庫內非監督演算法 Expectation Maximization (EM) 來執行功能選擇。此記事本說明使用 CREATE_MODEL 函數,它利用設定值表格與其他記事本中使用的 CREATE_MODEL2 函數相反。
  • OML4SQL 使用摘要統計資料的功能選擇:使用此記事本使用 Oracle SQL 的摘要統計來執行功能選擇。資料集 CUSTOMER_INSURANCE_LTV_SQL 具有人工 OML4SQL Noise 筆記型電腦所產生的空值。您必須先執行 OML4SQL 噪音筆記型電腦,才能執行使用摘要統計資料的 OML4SQL 功能選擇。
  • OML4SQL 噪音:使用此筆記型電腦以空值取代一般值,並新增重複的資料列。在此記事本中,會準備「資料準備」記事本所使用的資料集,尤其是資料清除和功能選擇的資料集。它使用包含客戶財務資訊、終身價值以及客戶是否購買保險的客戶保險終身價值資料集。

    附註:

    在資料準備筆記型電腦之前執行 OML4SQL 噪音筆記型電腦。
  • OML4SQL 分割模型:使用此筆記型電腦建立分割的模型。分割模型可透過多個目標模型提高準確性。此筆記型電腦會建立 SVM 模型,以預測客戶駐留的年數,但依客戶性別分割。接著,模型會先用來預測目標,然後再以預測詳細資料預測目標。
  • OML4SQL 文字探勘:使用此筆記型電腦建立使用文字探勘功能的模型。Oracle Machine Learning 處理結構化資料和非結構化文字資料。透過運用 Oracle Text,Oracle Machine Learning 資料庫內演算法會自動從文字資料欄擷取預測功能。

    此筆記型電腦建置 SVM 模型,可預測客戶最有可能成為 Affinity Card 忠誠度方案的正面回應者。資料會隨附包含使用者產生之註解的文字資料欄。除了一些額外的設定,演算法會自動使用文字資料欄,並在結構化資料與非結構化文字上建立模型。

  • OML4SQL 迴歸:使用此筆記型電腦來預測數值。此範本使用多個迴歸演算法,例如「一般化線性模型 (GLM)」。
  • OML4SQL 統計函數:使用此筆記型電腦來取得描述性與比較統計函數。記事本樣板使用 SH 綱要資料。
  • OML4SQL 時間序列:使用此筆記型電腦,在您的時間序列資料上建置用於預測的時間序列模型。此筆記型電腦是以指數平滑演算法為基礎。此筆記型電腦中的銷售預測範例是以 SH.SALES 資料為基礎。所有運算都是在 Oracle Autonomous Database 內完成。