Utilisation de Live Transcribe

Créez et gérez des travaux de transcription en direct dans le service Speech.

La fonction de transcription en direct fournit une transcription en temps réel, qui vous permet d'envoyer des flux audio et de recevoir des résultats de texte en temps réel. La transcription en temps réel est requise pour de nombreux cas d'utilisation dans des secteurs tels que les soins de santé, les centres d'appels et les médias. Par exemple, les médecins et le personnel infirmier utilisent la dictée médicale, ce qui nécessite des capacités en temps réel et augmente l'efficacité du travail. Avec la publication de la transcription en direct, vous pouvez obtenir une transcription précise dans votre application en moins de quelques secondes. Vous pouvez utiliser la fenêtre de texte intégrée pour essayer la transcription en direct ou vous référer au document d'API pour obtenir des informations sur l'intégration par programmation au service de transcription en temps réel OCI.

Création d'un travail de retranscription en direct

Créez et soumettez un travail de transcription en direct Speech pour transcrire un flux audio en direct au texte.

  1. Ouvrez le menu de navigation et cliquez sur Analytics et IA. Sous Services AI, cliquez sur Discours.
  2. Dans le menu de navigation de gauche, cliquez sur Transcrire en direct.
  3. Sous Portée de la liste, sélectionnez le compartiment dans lequel travailler.
  4. (Facultatif) Dans la section Configurer la transcription, pour personnaliser la transcription, sélectionnez des valeurs pour une ou plusieurs des options suivantes :
    • Choisir un domaine : sélectionnez le domaine du modèle de discours à utiliser.
    • Choisir une langue : sélectionnez la langue dans laquelle effectuer la transcription.
    • Punctuation : configurez la ponctuation dans les transcriptions générées. Trois options sont disponibles, Aucun pour l'absence de ponctuation (valeur par défaut), Auto pour insérer automatiquement la ponctuation et Parlé pour insérer la ponctuation lorsqu'elle est verbalement prononcée.
    • Seuil de silence partiel : entrez la durée, en millisecondes, pendant laquelle le service attend une parole supplémentaire, après avoir arrêté de détecter l'activité vocale, avant de mettre fin à la reconnaissance vocale.
    • Seuil de silence final : entrez le nombre de millisecondes de silence après l'expression d'un mot que le service attend pour mettre fin à la session.
    • Stabilité du résultat partiel : sélectionnez le niveau de confiance requis pour les derniers sèmes avant de les renvoyer dans le cadre d'un nouveau résultat partiel.
    • Activer les personnalisations : cochez cette case pour personnaliser la session.
      • Sélectionnez la personnalisation à utiliser. Modifiez les compartiments si nécessaire.
      • Cliquez sur Remplacer les entités. Seules les personnalisations avec plusieurs listes d'entités peuvent être remplacées
  5. Pour démarrer une session, cliquez sur Démarrer la session et commencez à parler.
  6. Pour arrêter une session, arrêtez de parler, puis cliquez sur Arrêter la session.
  7. (Facultatif) Pour afficher le fichier JSON, cliquez sur Afficher le fichier JSON.
  8. (Facultatif) Pour réinitialiser la session, cliquez sur Réinitialiser.