Création d'une tâche de transcription

Créez et soumettez une tâche pour transcrire un ou plusieurs fichiers multimédias dans des fichiers texte du service Speech.

Avant de commencer

Stockez les fichiers multimédias à transcrire dans un seau de stockage d'objets.
Pour comparer les modèles Whisper et ASR Oracle pour la création de tâches de transcription, voir Comparaison des modèles Whisper et ASR Oracle.

Pour créer une tâche de transcription :
1. Ouvrez le menu de navigation et cliquez sur Analyse et intelligence artificielle. Sous Services d'intelligence artificielle, cliquez sur Parole.
2. Dans le menu de navigation de gauche, cliquez sur Tâches de transcription.
3. Sous Portée de la liste, sélectionnez le compartiment dans lequel vous voulez travailler.
4. Cliquez sur Créer une tâche.
5. Dans la page d'informations de base, entrez un nom unique (255 caractères maximum) pour le projet. Le nom doit inclure un ou plusieurs caractères alphanumériques, tirets ou traits de soulignement dans n'importe quel ordre. Si vous n'indiquez pas de nom, un nom est automatiquement généré.
  
  Par exemple :
  
  AiSpeechTranscriptionJob20220804134759
6. (Facultatif) Entrez la description (400 caractères maximum) de la tâche.
7. Sélectionnez le compartiment dans lequel créer la tâche, s'il est différent de celui affiché.
8. Sous Entrée, sélectionnez un seau d'entrée de données qui contient le fichier multimédia que vous voulez transcrire.
  
  Si le seau que vous voulez ne se trouve pas dans le compartiment sélectionné, modifiez-le.
9. Sous Sortie, sélectionnez l'emplacement où vous voulez stocker les fichiers de sortie, soit dans le seau d'entrée, soit dans un autre seau. Pour utiliser un autre seau, sélectionnez-le.
10. (Facultatif) Entrez un préfixe de sortie pour séparer et trier les fichiers dans le seau.
  
  Par exemple, vous pouvez entrer call_ctr pour les fichiers multimédias du centre d'appels.
  
  Vous pouvez également créer un dossier de sortie dans votre seau à l'aide d'une barre oblique (/). Par exemple, MyResults/ stocke tous les fichiers transcrits dans un dossier MyResults du seau.
11. Sélectionnez le type de modèle de la tâche que vous créez.
  
  Note
  
  Les types de modèle pris en charge sont Oracle, Whisper Medium, Whisper Large V2 (sur demande de service) et Whisper Large V3 Turbo (nouveau). Voir Comparaison des modèles Whisper et ASR Oracle pour déterminer le type de modèle à utiliser.
12. Sélectionnez la langue du fichier multimédia.
  
  Vous pouvez rechercher la langue appropriée par langue. L'anglais (US English for ORACLE) est la valeur par défaut.
  
  Les modèles Whisper prennent en charge l'identification de la langue et peuvent être utilisés en sélectionnant auto comme code de langue dans la liste déroulante.
13. (Facultatif) Pour inclure à la fois les formats SRT et JSON dans la transcription, sélectionnez Obtenir le format de transcription SRT.
14. Si vous ne voulez pas que votre transcription soit ponctuée, désactivez l'option Activer la ponctuation.
  
  Note
  
  L'option Activer la ponctuation est sélectionnée pour les modèles Whisper et ne peut pas être effacée.
15. (Facultatif) Pour identifier les haut-parleurs dans le fichier d'entrée, sélectionnez Activer la diarisation.
  
  Vous pouvez laisser le service Speech détecter automatiquement le nombre de haut-parleurs uniques dans le fichier d'entrée ou vous pouvez entrer un nombre. Le nombre minimum de haut-parleurs est de 2 et le maximum est de 16.
  
  Note
  
  L'utilisation de la diarisation augmente la latence des tâches de transcription, c'est pourquoi cette option est désactivée par défaut.
16. Pour ajouter des filtres afin de modifier la façon dont le fichier de sortie est généré, cliquez sur Ajouter un filtre.
  
  Sélectionner un type de filtre. La valeur par défaut est Profanity.
  
  Sélectionnez le mode de filtrage :
  
  Par exemple, le filtre de profanité offre les modes suivants :
  
  Masquer : Toute profanité détectée est masquée dans la transcription avec des astérisques, à l'exception de la première lettre.
  
  Supprimer : Toute profanité détectée est remplacée par un astérisque dans la transcription.
  
  Marqueur : La rentabilité n'est pas masquée ou supprimée, mais elle est marquée comme TYPE: "Profanity" dans la transcription.
17. (Facultatif) Pour ajouter d'autres paramètres, cliquez sur Ajouter des paramètres supplémentaires, puis entrez une clé et sa valeur.
  Exemple :
  
  Clé : Il s'agit de la valeur de clé, par exemple whisperPrompt.
  Vous pouvez ajouter autant de clés que nécessaire. Pour supprimer une clé, sélectionnez le X à côté du champ Valeur.
  Si le modèle Whisper est sélectionné, ce champ peut être utilisé pour transmettre une invite pour faciliter la transcription. La seule clé prise en charge est whisperPrompt. Si d'autres clés sont transmises, la demande échoue car elle est considérée comme une entrée non valide.
  La longueur maximale de l'invite de valeur est de 4000 caractères, autorise uniquement les caractères alphanumériques et la ponctuation (. ,!? - :; ' "), et est spécifique à Whisper. La validation est effectuée en arrière-plan et la tâche échoue si l'invite est plus longue que cette limite.
  
  Valeur : Il s'agit d'une valeur d'invite qui peut être composée de plusieurs mots. Le champ est un exemple pour afficher tout le texte entré.
  
  Note
  
  L'ajout d'une invite au modèle Whisper peut parfois produire des résultats inattendus.
18. (Facultatif) Cliquez sur Afficher les options avancées pour affecter des marqueurs au travail. Les marqueurs vous aident à localiser et à suivre facilement les ressources en sélectionnant un espace de noms de marqueurs, puis en entrant la clé et la valeur.
  
  Le marquage décrit les différents marqueurs que vous pouvez utiliser pour organiser et trouver des ressources, y compris des marqueurs de suivi des coûts.
19. Cliquez sur Suivant pour sélectionner les fichiers pour le travail.
20. Cochez les cases des fichiers multimédias à transcrire ou sélectionnez-les tous en cochant la case à côté de Nom.
  
  Note
  
  La taille maximale du fichier est de 2 Go.
  
  La durée du fichier est de 4 heures au maximum.
21. Cliquez sur Soumettre pour démarrer la tâche.
  
  Un travail peut s'exécuter en secondes ou en heures, selon la taille et le nombre de fichiers sélectionnés. Lors de l'exécution, la tâche est en cours et passe à Réussite ou Échec à la fin. Vous pouvez sélectionner un travail pour accéder à sa page de détails.
  
  Chaque tâche peut comporter jusqu'à 100 tâches.
  
  Les emplois sont conservés pendant 90 jours.
Utilisez la commande create et les paramètres requis pour créer une tâche de transcription.
```
oci speech transcription-job create [OPTIONS]
```
Évitez d'entrer des informations confidentielles.

Pour la liste complète des indicateurs et des options de variable pour les commandes de l'interface de ligne de commande, voir Informations de référence sur les commandes de l'interface de ligne de commande.
Utilisez les opérations CreateTranscriptionJob et ChangeTranscriptionJobCompartment pour créer une tâche.

Documentation sur Oracle Cloud Infrastructure

Création d'une tâche de transcription