Uso de Live Transcribe

Cree y gestione trabajos de transcripción en directo en el servicio Speech.

La función de transcripción en vivo proporciona transcripción en tiempo real, lo que le permite enviar transmisiones de audio y recibir resultados de texto en tiempo real. La transcripción en tiempo real es necesaria para muchos casos de uso en sectores como la atención médica, los centros de llamadas y los medios de comunicación. Por ejemplo, los médicos y el personal de enfermería utilizan dictado médico, lo que requiere capacidades en tiempo real y aumenta la eficiencia laboral. Con el lanzamiento de la transcripción en vivo, puede obtener una transcripción precisa en su aplicación en menos de unos segundos. Puede utilizar la ventana de texto embebido para probar la transcripción en directo o consultar el documento de API para obtener información sobre cómo integrarse mediante programación con el servicio de transcripción en tiempo real de OCI.

Creación de una sesión de transcripción en directo

Crea y envía una sesión de transcripción en vivo de Speech para transcribir una transmisión de audio en vivo al texto.

Abra el menú de navegación y haga clic en Análisis y AI. En Servicios AI, haga clic en Hablar.
En el menú de navegación de la izquierda, haga clic en Live transcribe (Transcripción activa).
En Ámbito de lista, seleccione el compartimento en el que desea trabajar.
(Opcional) En la sección Configurar transcripción, para personalizar la transcripción, seleccione valores para una o más de las siguientes opciones:
- Seleccionar tipo de modelo: seleccione el modelo de voz que se utilizará para la transcripción.
- Seleccionar dominio: seleccione el dominio del modelo de voz que se va a utilizar.
- Seleccionar idioma: seleccione el idioma en el que desea transcribir.
- Puntuación: configure la puntuación en las transcripciones generadas. Hay tres opciones disponibles: Ninguno para que no haya puntuación (el valor predeterminado), Automático para insertar la puntuación automáticamente y Hablado para insertar la puntuación cuando se hablan verbalmente.
- (Solo para el modelo de Oracle) Umbral de silencio parcial: introduzca cuánto tiempo, en milisegundos, el servicio espera más voz, después de que deje de detectar actividad de voz, antes de finalizar el reconocimiento de voz.
- (Solo para el modelo de Oracle) Umbral de silencio final: introduzca cuántos milisegundos de silencio después de que se diga una palabra que el servicio espera para finalizar la sesión.
- (Solo para el modelo de Oracle) Estabilidad parcial de resultados: seleccione la cantidad de confianza necesaria para los tokens más recientes antes de devolverlos como parte de un nuevo resultado parcialmente.
- (Solo para el modelo de Oracle)Activar personalizaciones: seleccione esta casilla de control para personalizar la sesión.
  - Seleccione la personalización que desea utilizar. Cambie los compartimentos si es necesario.
  - Haga clic en Sustituir entidades. Solo se pueden sustituir personalizaciones que contengan diversas listas de entidad
Para iniciar una sesión, haga clic en Iniciar sesión y empiece a hablar.
Para parar una sesión, deje de hablar y, a continuación, haga clic en Parar sesión.
(Opcional) Para ver el archivo JSON, haga clic en Ver JSON.
(Opcional) Para restablecer la sesión, haga clic en Restablecer.

Documentación de Oracle Cloud Infrastructure

Uso de Live Transcribe

Creación de una sesión de transcripción en directo