關於自治式 AI 資料庫的資料管線

自治式 AI 資料庫資料管線為載入管線或匯出管線。

載入管線提供從外部來源持續增量資料載入 (當資料到達物件存放區時,會載入至資料庫表格)。匯出管線提供連續增量資料匯出至物件存放區 (當新資料顯示在匯出至物件存放區的資料庫表格中時)。管線會使用資料庫排程器來持續載入或匯出增量資料。

自治式 AI 資料庫資料管線提供下列各項:

資料管線生命週期

DBMS_CLOUD_PIPELINE 套裝程式提供建立、設定、測試及啟動管線的程序。負載和匯出管線的管線生命週期和程序相同。

pipeline_lifecycle.png 圖解描述

對於任一種管線類型,您可以執行下列步驟來建立及使用管線:

  1. 建立並設定管線。請參閱建立及設定管線以瞭解詳細資訊。

  2. 測試新管線。如需詳細資訊,請參閱測試管線

  3. 開始業務進程。請參閱啟動管線以瞭解詳細資訊。

此外,您可以監督、停止或刪除管線:

載入管線

使用載入管線從物件存放區中的外部檔案連續增量資料載入至資料庫表格。載入管線會定期識別物件存放區中的新檔案,並將新資料載入資料庫表格中。

載入管線運作方式如下 (部分功能可使用管線屬性進行設定):

影像的描述如下

load-pipeline.svg 圖解描述

從非 Oracle 資料庫移轉是負載管線的其中一個可能使用案例。當您需要將資料從非 Oracle 資料庫移轉至專用 Exadata 基礎架構上的 Oracle Autonomous AI Database 時,可以擷取資料並將其載入至自治式 AI 資料庫 (Oracle Data Pump 格式無法用於從非 Oracle 資料庫移轉)。透過使用一般檔案格式 (例如 CSV) 從非 Oracle 資料庫匯出資料,您可以將資料儲存至檔案並將檔案上傳至物件存放區。接著,建立將資料載入自治式 AI 資料庫的管線。使用負載管線來載入一組大型 CSV 檔案,提供諸如容錯以及繼續和重試作業等重要優點。對於具有大型資料集的移轉,您可以為非 Oracle 資料庫檔案建立多個管線,每個表格一個管線,以將資料載入至 Autonomous AI Database。

匯出管線

使用匯出管線將資料從資料庫持續增量匯出至物件存放區。匯出管線會定期識別候選資料並將資料上傳至物件存放區。

有三個匯出管線選項 (可使用管線屬性設定匯出選項):

匯出管線具有下列功能 (部分功能可使用管線屬性進行設定):

Oracle 維護的管線

專用 Exadata 基礎架構上的自治式 AI 資料庫提供內建管線,以 JSON 格式將特定日誌匯出至物件存放區。這些管線會預先設定,並由 ADMIN 使用者啟動及擁有。

「Oracle 維護」管線包括:

設定及啟動 Oracle 管理的管線:

  1. 決定您要使用的 Oracle Managed Pipeline:ORA$AUDIT_EXPORTORA$APEX_ACTIVITY_EXPORT

  2. 設定 credential_namelocation 屬性。

    注意: credential_name 是專用 Exadata 基礎架構上自治式 AI 資料庫的必要值。

    舉例而言:

     BEGIN
       DBMS_CLOUD_PIPELINE.SET_ATTRIBUTE(
         pipeline_name => 'ORA$AUDIT_EXPORT',
         attribute_name => 'credential_name',
         attribute_value => 'DEF_CRED_OBJ_STORE'
       );
       DBMS_CLOUD_PIPELINE.SET_ATTRIBUTE(
         pipeline_name => 'ORA$AUDIT_EXPORT',
         attribute_name => 'location',
         attribute_value => 'https://objectstorage.us-phoenix-1.oraclecloud.com/n/namespace-string/b/bucketname/o/'
       );
     END;
     /
    

    資料庫的日誌資料會匯出至您指定的物件存放區位置。

    請參閱 SET_ATTRIBUTE 以取得詳細資訊。

  3. 選擇性地設定 intervalformatpriority 屬性。

    請參閱 SET_ATTRIBUTE 以取得詳細資訊。

  4. 開始業務進程。

    請參閱 START_PIPELINE 以取得詳細資訊。

相關內容

DBMS_CLOUD_PIPELINE 套裝程式