Utiliser la transcription en temps réel

Créez et gérez des travaux de transcription en direct dans le service Speech.

La fonction de transcription en direct fournit une transcription en temps réel, ce qui vous permet d'envoyer des flux audio et de recevoir des résultats de texte en temps réel. La transcription en temps réel est requise pour de nombreux cas d'utilisation dans des secteurs tels que les soins de santé, les centres d'appels et les médias. Par exemple, les médecins et les infirmières utilisent la dictée médicale, ce qui nécessite des capacités en temps réel et augmente l'efficacité du travail. Avec la sortie de la transcription en direct, vous pouvez obtenir une transcription précise dans votre application en moins de quelques secondes. Vous pouvez utiliser la fenêtre de texte intégrée pour essayer la transcription en direct ou vous référer au document d'API pour obtenir des informations sur l'intégration par programmation au service de transcription en temps réel OCI.

Créer une session Live Transcribe

Créez et soumettez une session de transcription en direct Speech pour transcrire un flux audio en direct en texte.

Ouvrez le menu de navigation et cliquez sur Analyse et intelligence artificielle. Sous Services d'intelligence artificielle, cliquez sur Parole.
Dans le menu de navigation de gauche, cliquez sur Transcription en direct.
Sous Portée de la liste, sélectionnez le compartiment à utiliser.
(Facultatif) Dans la section Configurer la transcription, pour personnaliser la transcription, sélectionnez des valeurs pour une ou plusieurs des options suivantes :
- Sélectionner un type de modèle : Sélectionnez le modèle vocal à utiliser pour la transcription.
- Sélectionner un domaine : Sélectionnez le domaine du modèle de langage à utiliser.
- Sélectionner la langue : Sélectionnez la langue dans laquelle transcrire.
- Punctuation : Configurez la ponctuation dans les transcriptions générées. Trois options sont disponibles : Aucune pour aucune ponctuation (valeur par défaut), Automatique pour insérer automatiquement la ponctuation et Parlé pour insérer la ponctuation lorsqu'elles sont prononcées verbalement.
- (Seulement pour le modèle Oracle) Seuil de silence partiel : Entrez la durée, en millisecondes, pendant laquelle le service attend plus de parole, après l'arrêt de la détection de l'activité vocale, avant de mettre fin à la reconnaissance vocale.
- (Seulement pour le modèle Oracle) Seuil de silence final : Entrez le nombre de millisecondes de silence après qu'un mot est prononcé pendant lequel le service attend la fin de la session.
- (Uniquement pour le modèle Oracle) Stabilité partielle des résultats : Sélectionnez la quantité de confiance requise pour les derniers jetons avant de les retourner dans le cadre d'un nouveau résultat partiel.
- (Uniquement pour le modèle Oracle)Activer les personnalisations : Cochez cette case pour personnaliser la session.
  - Sélectionnez la personnalisation à utiliser. Modifiez les compartiments si nécessaire.
  - Cliquez sur Remplacer les entités. Seules les personnalisations contenant plusieurs listes d'entité peuvent être remplacées
Pour démarrer une session, cliquez sur Démarrer la session et commencez à parler.
Pour arrêter une session, arrêtez de parler, puis cliquez sur Arrêter la session.
(Facultatif) Pour voir le fichier JSON, cliquez sur Voir JSON.
(Facultatif) Pour réinitialiser la session, cliquez sur Réinitialiser.

Documentation sur Oracle Cloud Infrastructure

Utiliser la transcription en temps réel

Créer une session Live Transcribe