Utilisation de Live Transcribe

Créez et gérez des travaux de transcription en direct dans le service Speech.

La fonction de transcription en direct fournit une transcription en temps réel, qui vous permet d'envoyer des flux audio et de recevoir des résultats de texte en temps réel. La transcription en temps réel est requise pour de nombreux cas d'utilisation dans des secteurs tels que les soins de santé, les centres d'appels et les médias. Par exemple, les médecins et le personnel infirmier utilisent la dictée médicale, ce qui nécessite des capacités en temps réel et augmente l'efficacité du travail. Avec la publication de la transcription en direct, vous pouvez obtenir une transcription précise dans votre application en moins de quelques secondes. Vous pouvez utiliser la fenêtre de texte intégrée pour essayer la transcription en direct ou vous référer au document d'API pour obtenir des informations sur l'intégration par programmation au service de transcription en temps réel OCI.

Création d'une session de retranscription en direct

Créez et soumettez une session de transcription en direct Speech pour transcrire un flux audio en direct en texte.

Ouvrez le menu de navigation et cliquez sur Analytics et IA. Sous Services AI, cliquez sur Discours.
Dans le menu de navigation de gauche, cliquez sur Transcrire en direct.
Sous Portée de la liste, sélectionnez le compartiment dans lequel travailler.
(Facultatif) Dans la section Configurer la transcription, pour personnaliser la transcription, sélectionnez des valeurs pour une ou plusieurs des options suivantes :
- Choisir un type de modèle : sélectionnez le modèle vocal à utiliser pour la transcription.
- Choisir un domaine : sélectionnez le domaine du modèle de discours à utiliser.
- Choisir une langue : sélectionnez la langue dans laquelle effectuer la transcription.
- Punctuation : configurez la ponctuation dans les transcriptions générées. Trois options sont disponibles, Aucun pour l'absence de ponctuation (valeur par défaut), Auto pour insérer automatiquement la ponctuation et Parlé pour insérer la ponctuation lorsqu'elle est verbalement prononcée.
- (seulement pour le modèle Oracle) Seuil de silence partiel : entrez la durée, en millisecondes, pendant laquelle le service attend plus de parole, après avoir arrêté de détecter l'activité vocale, avant de mettre fin à la reconnaissance vocale.
- (seulement pour le modèle Oracle) Seuil de silence final : entrez le nombre de millisecondes de silence après qu'un mot a été prononcé que le service attend pour mettre fin à la session.
- (uniquement pour le modèle Oracle) Stabilité partielle des résultats : sélectionnez le niveau de confiance requis pour les derniers jetons avant de les renvoyer dans le cadre d'un nouveau résultat partielle.
- (uniquement pour le modèle Oracle)Activer les personnalisations : cochez cette case pour personnaliser la session.
  - Sélectionnez la personnalisation à utiliser. Modifiez les compartiments si nécessaire.
  - Cliquez sur Remplacer les entités. Seules les personnalisations contenant plusieurs listes d'entités peuvent être remplacées
Pour démarrer une session, cliquez sur Démarrer la session et commencez à parler.
Pour arrêter une session, arrêtez de parler, puis cliquez sur Arrêter la session.
(Facultatif) Pour afficher le fichier JSON, cliquez sur Afficher le fichier JSON.
(Facultatif) Pour réinitialiser la session, cliquez sur Réinitialiser.

Documentation Oracle Cloud Infrastructure

Utilisation de Live Transcribe

Création d'une session de retranscription en direct