Création d'un travail de retranscription
Créez et soumettez un travail pour transcrire un ou plusieurs fichiers multimédias dans des fichiers texte du service Speech.
Avant de commencer
-
Stockez les fichiers multimédias à transcrire dans un bucket Object Storage.
-
Afin de comparer les modèles Whisper et Oracle ASR pour la création de travaux de transcription, reportez-vous à Comparaison des modèles Whisper et Oracle ASR.
Comparaison des modèles Whisper et Oracle ASR
Comparez le modèle Whisper et le modèle Oracle ASR pour créer des travaux de transcription.
Outre le modèle vocal Oracle ASR natif, Speech prend en charge le modèle Whisper à partir de OpenAI. Whisper est formé sur un grand nombre de données multilingues collectées sur le Web et prend en charge la transcription vocale-texte basée sur des fichiers pour plus de 50 langues. Ce modèle utilise les mêmes adresses de service et interfaces d'API et de kit SDK que le modèle Oracle ASR pour vous offrir flexibilité et compatibilité. En outre, le modèle Whisper utilise la diarisation pour étiqueter les haut-parleurs individuels dans l'enregistrement.
Utilisez la comparaison suivante des modèles Whisper et Oracle ASR pour choisir le modèle approprié lors de la création d'un travail de transcription.
Caractéristique | Modèle ASR Oracle | Modèle Whisper dans OCI Speech |
---|---|---|
Transcriptions en temps réel | Prise en charge | Non pris en charge |
Taille de fichier volumineuse | Jusqu'à 2 Go | Jusqu'à 2 Go |
Horodatage au niveau du mot | pris en charge | pris en charge |
Format de fichier | AAC, AC3, AMR, AU, FLAC, M4A, MKV, MP3, MP4, OGA, OGG, OPUS, WAV, WEBM | AAC, AC3, AMR, AU, FLAC, M4A, MKV, MP3, MP4, OGA, OGG, OPUS, WAV, WEBM |
Support multilingue | Anglais, espagnol, français, allemand, italien, portugais et hindi | Identique au modèle Oracle ASR plus 50 autres langues* |
Diarisation | pris en charge | pris en charge |
Pour créer une tâche de transcription, procédez comme suit : Utilisez la commande create et les paramètres requis pour créer un travail de transcription.
oci speech transcription-job create [OPTIONS]
Evitez de saisir des informations confidentielles.
Afin d'obtenir la liste complète des indicateurs et des options de variable pour les commandes d'interface de ligne de commande, reportez-vous à Référence de commande d'interface de ligne de commande.
Utilisez les opérations CreateTranscriptionJob et ChangeTranscriptionJobCompartment pour créer un travail.