使用 OCI Speech 轉譯自然語言

Oracle Cloud Infrastructure (OCI) Speech 是數種雲端原生 AI 服務之一。您可以使用 Speech 服務將音訊檔案轉換成儲存在 JSON 格式的可讀文字。

Speech 利用口語語言的強大功能,讓您輕鬆將包含人類語音的音訊檔案轉換為高度精確的文字轉錄內容。此服務是 OCI 原生應用程式,您可以使用 Web 應用程式、REST API、SDK、CLI 或主控台進行存取。

Speech 使用自動語音辨識 (ASR) 技術,以文法正確的方式提供視訊和音訊檔案的轉錄。Speech 處理低精確度的錄音內容,並轉錄充滿挑戰的錄音內容,例如會議或客服中心通話。您可以使用 Speech 將儲存在 OCI Object Storage 的檔案或資料資產轉換為精確、標準化、時戳及獲利篩選的文字。下游服務提供此功能。例如,您可以使用其他服務 (例如語言和預測) 來分析通話情感、廣告目標內容、編製媒體資料夾索引,以及使用 Oracle Cloud Infrastructure Lakehouse 建立媒體搜尋引擎。

架構

此架構示範一般系統中,有 OCI Speech 的核心元件之間的關係。

此架構可套用至許多類型的應用程式。例如,Web 應用程式可以記錄諮詢中心代表與回報問題之客戶的對話。對話的音訊檔會儲存至發出新音訊檔事件的 OCI Object StorageOCI 事件會觸發 OCI 函數應用程式,此應用程式會使用對 OCI Speech 服務的 REST API 呼叫來建立轉譯要求。Speech 從 OCI Object Storage 取得工作、擷取音訊檔案、將檔案饋送至預先訓練的聲學和語言模型,然後將輸出傳輸至 JSON 文字檔。JSON 檔案儲存在 OCI 物件儲存中。OCI Object Storage 會偵測新的文字檔並發出事件。OCI 事件會觸發 OCI 函數,以提取文字檔並將文字和描述資料上傳至 MySQL 資料庫。OCI 事件也會觸發 OCI 通知,在成績單準備就緒時發布訊息,通知 Web 應用程式訂閱事件。Web 應用程式會在票證中顯示已建立諮詢中心代表的成績單。

Web 應用程式可以選擇性地擷取音訊檔案中繼資料,例如音訊檔案持續時間、大小、開始日期和時間,並將其儲存在諮詢中心服務單中。

儲存在 OCI Object Storage 中的音訊和文字檔可以使用 Oracle Cloud Infrastructure Lakehouse (圖中未顯示) 饋送至下游分析工具。

下圖說明此參照架構。

architecture-ai-speech.png 的說明如下
architecture-ai-speech.png 圖解描述

架構 -ai-speech-oracle.zip

此架構具有下列元件:

  • 地區

    Oracle Cloud Infrastructure 區域是包含一或多個資料中心 (稱為可用性網域) 的本地化地理區域。區域與其他區域無關,且遠距離可加以區分 (跨國家,甚至是大陸)。

  • 可用性網域

    可用性網域是區域內的獨立獨立資料中心。每個可用性網域中的實體資源會與其他可用性網域中的資源隔離,提供容錯能力。可用性網域不共用基礎架構 (例如電源或冷卻系統) 或內部可用性網域網路。因此,一個可用性網域發生故障不應影響區域中的其他可用性網域。

  • 容錯域

    網域是可用性網域內的一組硬體和基礎架構。每個可用性網域都有三個容錯域,分別具備獨立的電源和硬體。當您將資源分配給多個容錯域時,您的應用程式可以容忍容錯域內的實體伺服器失敗、系統維護,以及電源失敗。

  • 虛擬雲端網路 (VCN) 和子網路

    VCN 是您在 Oracle Cloud Infrastructure 區域中設定的可自訂軟體定義網路。就像傳統的資料中心網路一樣,VCN 也可讓您控制網路環境。VCN 可以有多個非重疊的 CIDR 區塊,您可以在建立 VCN 之後加以變更。您可以將 VCN 分割成子網路,子網路可以限定為區域或可用性網域。每個子網路都是由不與 VCN 中其他子網路重疊的連續位址範圍所組成。您可以在建立子網路後變更其大小。子網路可以是公用或專用。

  • 區間

    區間是 Oracle Cloud Infrastructure 租用戶內的跨區域邏輯分割區。使用區間組織您在 Oracle Cloud 中的資源、控制對資源的存取,以及設定使用配額。若要控制對指定區間中資源的存取,您必須定義原則,指定能夠存取資源的人員及其可執行的動作。

  • 負載平衡器

    Oracle Cloud Infrastructure Load Balancing 服務提供從單一進入點到後端多部伺服器的自動流量分配。

  • 安全清單

    您可以為每個子網路建立安全規則,指定子網路中必須允許進出的流量來源、目的地和類型。

  • Identity and Access Management (IAM)

    Oracle Cloud Infrastructure Identity and Access Management (IAM) 是 Oracle Cloud Infrastructure (OCI) 和 Oracle Cloud Applications 的存取控制層。IAM API 和使用者介面可讓您管理識別網域和識別網域內的資源。每個 OCI IAM 識別網域都代表一個獨立的識別和存取管理解決方案,或是不同的使用者群體。

  • 物件儲存

    物件儲存可讓您快速存取各種內容類型的大量結構化和非結構化資料,包括資料庫備份、分析資料,以及豐富的內容 (例如影像和影片)。您可以安全地儲存資料,然後直接從網際網路或雲端平台內擷取資料。您可以擴展儲存體,而不會發生任何效能或服務可靠性的降低。針對快速、立即且經常存取的「熱」儲存體,使用標準儲存體。將封存儲存用於保留很長一段時間、極少或極少存取的「冷」儲存。

  • 功能

    Oracle Cloud Infrastructure Functions 是一個完全託管的多租戶,可高度擴展,隨選 Functions-as-a-Service (FaaS) 平台。它由 Fn Project 開放原始碼引擎提供技術支援。函數可讓您部署程式碼,並直接呼叫或觸發程式碼以回應事件。Oracle Functions 使用 Oracle Cloud Infrastructure Registry 中代管的 Docker 容器。

  • 事件

    Oracle Cloud Infrastructure 服務會發出事件,這些事件是描述資源變更的結構化訊息。系統會發出事件來建立、讀取、更新或刪除 (CRUD) 作業、資源週期狀態變更,以及影響雲端資源的系統事件。

  • 監督

    Oracle Cloud Infrastructure Monitoring 服務使用指標主動和被動監控您的雲端資源,以監控資源和警報,在這些指標符合警報指定的觸發器時通知您。

  • 稽核

    Oracle Cloud Infrastructure Audit 服務會自動將所有支援之 Oracle Cloud Infrastructure 公用應用程式設計介面 (API) 端點的呼叫記錄為日誌事件。目前,所有服務都支援由 Oracle Cloud Infrastructure Audit 進行記錄。

  • 通知

    Oracle Cloud Infrastructure Notifications 服務會透過發布 / 訂閱模式將訊息廣播至分散式元件,為 Oracle Cloud Infrastructure 代管的應用程式提供安全、極為可靠、低延遲及持久的訊息。

  • Oracle Cloud Infrastructure Speech

    Oracle Cloud Infrastructure Speech 是一項新的 AI 服務,使用自動語音辨識 (ASR) 將語音轉換成文字。

  • Oracle MySQL Database Service

    Oracle MySQL Database Service 是完全託管的 Oracle Cloud Infrastructure (OCI) 資料庫服務,可讓開發人員快速開發及部署安全的雲端原生應用程式。Oracle MySQL Database Service 是 OCI 和 MySQL 工程團隊所建構、管理及支援的 100%,在 OCI 中已針對其進行最佳化並獨佔使用。

    Oracle MySQL Database Service 具有整合式高效能分析引擎 (HeatWave),可直接對作業 MySQL 資料庫執行複雜的即時分析。

建議

您的需求可能與此處描述的架構不同。使用下列建議作為起點。

  • VCN

    建立 VCN 時,請根據計畫要連附至 VCN 中子網路的資源數目,決定所需的 CIDR 區塊數目和每個區塊的大小。使用標準專用 IP 位址空間內的 CIDR 區塊。

    選取未與任何其他網路 (在 Oracle Cloud Infrastructure 中、您的內部部署資料中心或其他雲端提供者) 重疊的 CIDR 區塊,以設定專用連線。

    建立 VCN 之後,您可以變更、新增及移除其 CIDR 區塊。

    設計子網路時,請考慮流量和安全性需求。將特定層或角色內的所有資源連附至相同的子網路,以作為安全界限。

  • 安全

    使用 Oracle Cloud Guard 主動監控及維護 Oracle Cloud Infrastructure 中資源的安全性。Cloud Guard 使用偵測器處方,您可以定義這些處方來檢查資源是否有安全漏洞,以及監控操作員和使用者是否有危險的活動。偵測到任何組態錯誤或不安全的活動時,Cloud Guard 會建議更正動作,並根據您可以定義的回應器處方協助採取這些動作。

    對於需要最高安全性的資源,Oracle 建議您使用安全區域。安全區域是與以最佳做法為基礎之 Oracle 定義的安全原則處方關聯的區間。舉例來說,安全區域中的資源不得從公用網際網路存取,而必須使用客戶管理的金鑰加密。當您在安全區域中建立及更新資源時,Oracle Cloud Infrastructure 會根據安全區域處方中的原則驗證作業,並拒絕違反任何原則的作業。

  • 雲端保全

    複製並自訂 Oracle 提供的預設處方,以建立自訂偵測器和回應器處方。這些處方可讓您指定哪些類型的安全違規會產生警告,以及允許對它們執行哪些動作。例如,您可能會想要偵測可見性設為公用物件儲存的儲存桶。

    在租用戶層級套用 Cloud Guard 以涵蓋最廣泛的範圍,並降低維護多個組態的管理負擔。

    您也可以使用「受管理清單」功能,將特定組態套用至偵測器。

  • 安全區域

    複製並自訂 Oracle 提供的預設處方,以建立自訂偵測器和回應器處方。這些處方可讓您指定哪些類型的安全違規會產生警告,以及允許對它們執行哪些動作。例如,您可能會想要偵測可見性設為公用物件儲存的儲存桶。

    在租用戶層級套用 Cloud Guard 以涵蓋最廣泛的範圍,並降低維護多個組態的管理負擔。

    您也可以使用「受管理清單」功能,將特定組態套用至偵測器。

  • 負載平衡器頻寬

    建立負載平衡器時,您可以選取提供固定頻寬的預先定義資源配置,或指定自訂彈性資源配置,供您設定頻寬範圍,並讓服務根據流量模式自動調整頻寬。無論使用哪一種方法,您都可以在建立負載平衡器後隨時變更資源配置。

注意事項

  • 效能

    使用 Oracle 雲端原生服務 - 事件、函數、通知以及 AI Speech,部署可根據工作負載自動調整的無伺服器應用程式。服務由 Oracle 管理。

    AI 語音工作會以嚴格的先進先出方式進行處理。您可以在用戶層次建立最多 10,000 個作業的工作佇列。如果您送出的工作超過作業上限,該工作就會失敗。工作會保留 90 天。

  • 存取

    OCI Speech 支援透過 OCI 主控台、Java 和 Python SDK 從屬端及 OCI CLI 進行存取。測試時,建議使用 CLI 工具或主控台。

  • 使用狀態

    在此範例中,資料庫無法使用。對於重要應用程式,請考慮以 3 個複本的高可用性模式執行 MySQL Database Service。

  • 成本

    使用 Oracle 雲端原生服務 - 事件、函數、通知及 AI Speech,部署不會產生固定成本的無伺服器應用程式。您只需在使用服務要求時支付費用。

認可

  • 作者Wei Han, Zaid Al Qaddoumi
  • 貢獻者Sreya Dutta

變更日誌

此日誌列出重大變更: